zoukankan      html  css  js  c++  java
  • javascript 类型数组读取二进制数据

    先建一个文件,按UTF-16大端 BOM 格式保存一个字符串:hi aleck,

    使用 file API 把他按二进制方式读取到浏览器。

    文件读取方法在这里:

    http://hi.baidu.com/ecalf830/item/e3b2d2c9b1003222a0b50a39

    简单介绍一下 file api 的相关用法

    1、在浏览器中打开文件

    <input type="file" id="f" multiple="multiple"/> 

    当 file 控件 有 mutiple 属性时,可以上传多个文件,文件打开后保存在 file 控件的  files 属性,这个例子中只打开一个文件,获取的文件的方式是 :

    var file = document.getElementById("f").files[0];

     

    2、Blob 与文件读取类 FileReader 

    二进制对象 Blob (binary large object) 用于存储二进制字节数据,

    创建一个 blob 对象: var blob  = new Blob();  该对象的size属性表示文件的字节数,类似于数组的length,slice 可以从文件中复制出一段二进制数据,用法类似于数组的 silce,复制得到的数据也是 Blob 对象。

    FileReader 类用于读取 Blob  数据对象。

    创建一个文件读取 对象 :var reader = new FileReader();

    浏览器打开的文件 file 继承于 Blob (thefile instanceof Blob == true),因此可以使用 FileReader  打开 file 对象。

     

    FileReader 对象的属性、方法及在打开Blob数据过程中可以使用的回调函数(试在 firebug 下查看 FileReader 的属性和方法 console.log(new FileReader())):

        error: null
    
        onabort: null
    
        onerror: null
    
        onload: null //读取成功调用
    
        onloadend: function(){...} //读取完毕调用,即使读取失败也会调用
    
        onloadstart: null //开始打开文件时调用
    
        onprogress: null  //文件打开过程中,反复调用直至文件读取完毕
    
        readyState: 2
    
        result: "þÿhi aleck" //文件读取结果得到的字符串
    
        __proto__: FileReader
    
        DONE: 2
    
        EMPTY: 0
    
        LOADING: 1
    
        abort: function abort() { [native code] }
    
        addEventListener: function addEventListener() { [native code] }
    
        constructor: function FileReader() { [native code] }
    
        dispatchEvent: function dispatchEvent() { [native code] }
    
        readAsArrayBuffer: function readAsArrayBuffer() { [native code] }  //读取为二进制字节缓冲
    
        readAsBinaryString: function readAsBinaryString() { [native code] } //读取为二进制数据
    
        readAsDataURL: function readAsDataURL() { [native code] } //读取为base64数据
    
        readAsText: function readAsText() { [native code] } //读取为普通字符串
    
        removeEventListener: function removeEventListener() { [native code] }
    
        __proto__: Object
     

    可以在 onloadend 事件内绑定处理打开的文件数据的回调函数,然后打开文件,

    这里将文件以二进制方式打开:reader.readAsBinaryString();

    查 看 reader.result 可以看到读取结果。由于javascript 没有二进制数据类型,因此,二进制数据按每个字节的8位二进制数对应 的 unicode 编码的字符显示出来,因此二进制数据实际被显示为一串 ascii 字符,如果要读取的文件是英文格式的, 那么这个二进制数据看起 来跟实际的字符串很相似。

    本例中 UTF-16 BOM 大端格式的 字符串  "hi aleck" 打开为二进制后得到:

     reader.result = "þÿhi aleck" //注意 reader.result.length 为 18, 这其中包含了空字符 \0 和标记字节流存储顺序的“零宽空格”

    每个字节的8位二进制转为二位十六进制为:

     reader.result.split('').map(function(v){ return  ('0'+v.charCodeAt(0).toString(16)).slice(-2); })

    得到:

    ["fe", "ff", "00", "68", "00", "69", "00", "20", "00", "61", "00", "6c", "00", "65", "00", "63", "00", "6b"]

     

    由于是UTF-16编码,每个字符占二字节,feff 是用于字节序标记的字符"零宽空格",其余字符编码由于只需要一个字节,高位字节用 0 补足,unicode 编码为0 的字符为空字符 \0 。

    例如 0068 是字母 h 的 2 字节(16位二进制转4位16进制)编码格式:

    String.fromCharCode(parseInt('0068',16)) //h

     

    3、字节数组缓冲 ArrayBuffer 和 类型数组

     ArrayBuffer 类的对象指向一段定长的内存空间,其属性 byteLength  表示对象的字节长度,slice 对象类似于 Blob 和数组的 slice 用于拷贝出一定字节长度的缓冲数据并创建成新的 ArrayBuffer 对象。

    ArrayBuffer 缓冲字节数据对象只是一段内存空间,不能直接访问,需要通过 DataView 对象(DataView 有点类似一个混合类型数组的元素组成的 list,其元素可以是几种类型数组中的任一种,这里不细述)或类型数组访问内存的数据,他们的关系有点像 Blob 与 FileReader .

    其中 javascript 类型数组有下面几种:

    Float32Array 
    
    Float64Array 
    
    Int8Array
    
    Int16Array 
    
    Int32Array 
    
    Uint8Array 
    
    Uint16Array 
    
    Uint32Array 
    
    Uint8ClampedArray
     可以访问下面的网站了解这些数据类型

    http://www.javascripture.com/DataView

    本例中使用存储无符号整数的 Uint8Array、 Uint16Array、 Uint32Array 

    Uint8Array 每个元素为一字节,表达范围为 0-255,Uint16Array 每元素 2字节,Uint32Array 每个元素4字节。

    如果想要将 缓冲字节 ArrayBuffer 对象读入到类型数组中,比如可以这样

    var buff = new ArrayBuffer(16); //创建一段16字节大小的内存缓冲空间
    
    var u8 = new Uint8Array(buff,8); //创建一个8位无符号整形类型数组,并指向 buff 对象的前 8 个字节。
    
    var u16 = new Uint16Array(buff,8); //16 位类型数组
    
    var u32 = new Uint32Array(buff,8); //32为类型数组

    组要注意的是,类型数组并没有拷贝出 ArrayBuffer 对象的内容,而是指向对应的内存空间,因此 u8、u16、u32 这几个数组访问的是同一块内存,这意味着通过 u8 修改了内容后,u16 和 u32 将访问到改变后的内容。

    现在 u8、u16 、u32 指向同一块 8 字节长度的内存,因此 u8 有8 个元素,u16 有4个元素,u32 则只有2个元素。

     

    将上面打开文件得到的字节的前8个通过u8数组逐个存入 buff 内

    ["fe","ff","00","68","00","69","00","20"].forEach(function(v,i){  u8[i] = parseInt(v,16);});

    有:

    u8 = [254, 255, 0, 104, 0, 105, 0, 32]
    
    u16 =  [65534, 26624, 26880, 8192]
    
    u32 = [1744895998, 536897792]
     
     查看数组的元素:
    ('00'+u8[0].toString(16)).slice(-2) // "fe"
    ('00'+u8[1].toString(16)).slice(-2) // "ff"
    ('00'+u8[2].toString(16)).slice(-2) // "00"
    ('00'+u8[3].toString(16)).slice(-2) // "68"
    ('00'+u8[4].toString(16)).slice(-2) // "00"
    ('00'+u8[5].toString(16)).slice(-2) // "69"
    ('00'+u8[6].toString(16)).slice(-2) // "00"
    ('00'+u8[7].toString(16)).slice(-2) // "20"
    
     
    ('0000'+u16[0].toString(16)).slice(-4) // "fffe"
    ('0000'+u16[1].toString(16)).slice(-4) // "6800"
    ('0000'+u16[2].toString(16)).slice(-4) // "6900"
    
    ('0000'+u16[3].toString(16)).slice(-4) // "2000"
    
     
    ('00000000'+u32[0].toString(16)).slice(-8) // "6800fffe"
    ('00000000'+u32[1].toString(16)).slice(-8) // "20006900"
     

    可以看到,读取 Blob 对象时,在多字节类型数组中( u16 2字节的元素 和 u32 4字节的元素), 元素的字节是按低位在前的顺序存储的,即小端方式。

     我们也可以直接把通过 FileReader 的 readAsArrayBuffer() 方法将 Blob 对象读取到 ArrayBuffer 对象中,然后在 类型数组中访问字节:

    reader.readAsArrayBuffer(blob);
    
    var u16 = new Uint16Array(reader.result); 
    
    u16 为 [65534, 26624, 26880, 8192, 24832, 27648, 25856, 25344, 27392]
     

    类型数组的数据溢出问题:

    因 为数组元素类型决定其在内存中占据的字节长度,其数值表达范围是按不同类型是不同的,如果存储的数值超出其表达范围便发生溢出,例 如, Uint8Array 类型的数组元素只占据一个字节,元素值的表达范围是 8位2进制, 即 0~255 ,如果试图存储 257 将发生溢出, 实际会得到取模后的值

    var uint8 = new Uint8Array(10);
    uint8[0] //0
    uint8[0]=257; 
    
    uint8[0]; //1  257%256 = 1
    uint8[0] = -1;
    uint8[0]; //255   -1+256=255
    
    uint8[0] = x;  则   uint8[0] == (x%256+256)%256 ; //true
    
     
    Uint8ClampedArray 跟 Uint8Array 不同,如果给 Uint8ClampedArray 类型的数组元素赋值超出范围,则取最靠近所赋值的合法的值,
    这个数组可以用于处理图像的颜色数据,例如 canvas 的 image.data
    
    
    var context = document.createElement("canvas").getContext("2d");
    
    var imageData = context.createImageData(16, 16);
    
    console.log(imageData); //ImageData {height: 16,  16, data: Uint8ClampedArray[1024]}
    
    console.log(imageData.data instanceof Uint8ClampedArray)//true
    
    
    
    
    
    var cint8 = new Uint8ClampedArray(10);  // [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    cint8[0]=257; // [255, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    cint8[0]= -2; //[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    
    cint8[0] = x;则 cint8[0] == Math.min(Math.max(0,x),255)
  • 相关阅读:
    百度关键词搜索量查询,百度,谷歌关键词查询工具
    推荐免费服务免费空间服务器检测
    如何成为能让大家尊重的程序员
    四天玩转windows phone开发视频之第二天总结
    用三张图片详解Asp.Net 全生命周期
    程序员该如何规划自己的人生
    博客正式开通啦!
    技术与创业不矛盾(两者是先后关系)
    工作五年的感悟
    委托与事件以及应用
  • 原文地址:https://www.cnblogs.com/ecalf/p/2787219.html
Copyright © 2011-2022 走看看