原文链接:http://www.west263.com/www/info/22308-1.htm
在xml中,所有的数据都是以文本的形式来显示,但是二进制数据不能直接以文本格式来表示,那xml又是怎么处理二进制数据的呢?下面就来探讨一下。
为了简单和通用性,xml被设计成了以文本的格式来表示数据。在xml中,所有的数据都是以文本的格式来存储,二进制数据也不例外。在xml中,二进制数据也要被编码成文本的格式,发送到目的方。目的方接收到这个文本二进制数据以后,再以相同的解码程序解成相应的二进制数据,当然数据原来的格式,名称等辅助信息一定要当作相关信息一起发送。一般二进制数据编码成base64格式,它的优点是容易易于编码和解码,缺点是比纯的二进制多占用33%的存储空间。下面是具体的程序实现:
<%@ page contenttype="text/html; charset=gb2312" %>
<%@ page import="java.io.*" %>
<%
string ret=new string();
try{
inputstream in=new fileinputstream("c:\aaa.doc");
byte[] bytes=new byte[in.available()];
in.read(bytes);
ret=new sun.misc.base64encoder().encode(bytes); //具体的编码方法
in.close();
}
catch(filenotfoundexception e) {
e.printstacktrace();
}
catch(java.io.ioexception ex) {
ex.printstacktrace();
}
%>
ret就是最后的结果,编码以后就可以用标准的xml方式发送了。发送到目的方以后,还要对数据进行相应的解码,才能得到原来的二进制文件,解码的代码如下:
<%@ page contenttype="text/html; charset=gb2312" %>
<%@ page import="java.io.*" %>
<%
byte[] bytes = new sun.misc.base64decoder().decodebuffer(ret);
java.io.bytearrayinputstream instream=new java.io.bytearrayinputstream(bytes);
byte[] buffer =new byte[1444];
fileoutputstream fs=new fileoutputstream( "d:\aaa.doc");
int bytesum=0;
int byteread=0;
while ((byteread=instream.read(buffer))!=-1) {
bytesum+=byteread;
fs.write(buffer,0,byteread);
}
%>
base64可以处理不太大的数据,如果要移动大量的数据,且要考虑空间/时间效率时,要采用其他的替代方法。
小龙评论:xml是一种很友好的数据存储介质,如果能实现二进制数据的处理,再加上本身对文本的支持,基本上就能应付常见的数据格式了,一些数据交换中间件巧妙的运用了xml的特性,实现了数据跨平台的传输