Buffer对象是Node.js用来处理二进制数据的一个接口。JavaScript比较擅长处理Unicode数据,对于处理二进制格式的数据(比如TCP数据流),就不太擅长。Buffer对象就是为了解决这个问题而提供的。该对象也是一个构造函数,它的实例代表了V8引擎分配的一段内存,基本上是一个数组,成员都为整数值。
一、Buffer结构
buffer是一个像Array的对象,但它主要用于操作字节。下面我们从模块结构的对象结构的层面上来认识它。
1.模块结构
Buffer是一个典型的javascript与C++结合的模块,它将性能相关部分用C++实现,将非性能相关的部分用javascript实现。
Buffer所占用的内存不是通过V8分配的,属于堆外内存。由于V8垃圾回收性能的影响,将常用的操作对象用更高效和专有的内存分配回收策略来管理是个不错的思路。
由于Buffer太过常见,Node在进程启动时就已经加载了它,并将其放在全局对象(global)。所以在使用Buffer时,无须通过require()即可直接使用。
二、Buffer对象
Buffer对象类似于数组,它的元素为16进制的两位数,即0到255的数值。示例代码:
var str = "深入浅出node.js"; var buf = new Buffer(str,'utf-8'); console.log(buf); //=> <Buffer e6 b7 b1 e5 85 a5 e6 b5 85 e5 87 ba 6e 6f 64 65 2e 6a 73>
由上面的示例可见,不同编码的字符串占用的元素个数各不相同,上面代码中的中文字在UTF-8编码下占用3个元素,字母和半角标点符号占用1个元素。
Buffer受Array类型的影响很大,可以访问length属性得到长度,也可以通过下标访问元素,在构造对象时也十分相似,代码如下:
var buf = new buffer(100); console.log(buf.length);// =>100
二、Buffer类型转换
Buffer对象可以与字符串之间相互转换。目前支持的字符串编码类型有:
ASCII UTF-8 UTF-16LE/UCS-2 Base64 Binary(二进制) Hex(十六进制)
字符串转Buffer
字符串转Buffer对象主要是通过构造函数完成的:
new Buffer(str,[encoding]);
通过构造函数转换的Buffer对象,存储的只能是一种编码类型。encoding参数不传递时,默认按UTF-8编码进行转码和存储。
一个Buffer对象可以存储不同编码类型的字符串转码的值,调用write()方法可以实现该目的,代码如下:
buf.write(string,[offset],[length],[encoding])
buf = new Buffer(1234); buf.length // 1234 buf.write("some string", 0, "ascii"); buf.length // 1234
由于可以不断写入内容到Buffer对象中,并且每次写入可以指定编码,所以Buffer对象中可以存在多钟编码转化后的内容。需要小心的是,每种编码所用的字节长度不同,将Buffer反转回字符串需要谨慎处理。
三、Buffer转字符串
实现Buffer向字符串的转换十分简单,Buffer对象的toString()可以将Buffer对象转换为字符串,代码如下:
buf.toString([encoding],[start],[end])
可以设置encoding(默认为UTF-8)、start、end这3个参数实现整体或局部的转换。如果Buffer对象由多种编码写入,就需要在局部指定不同的编码,才能转换回正常的编码。
例子1:
var hello = new Buffer('Hello'); hello // <Buffer 48 65 6c 6c 6f> hello.toString() // "Hello"
例子2:
var buf = new Buffer('just some data'); console.log(buf.toString('ascii', 4, 9)); // "some"
四、Buffer转字符串
目前,Node的Buffer对象支持的编码类型有限,只有少数的几种编码类型可以在字符串和Buffer之间转换。为此,Buffer提供了一个isEncoding()函数来判断编码是否支持转换。
Buffer.isEncoding(encoding); //返回ture则支持
参考资料:
Buffer对象 http://javascript.ruanyifeng.com/nodejs/buffer.html#toc11