zoukankan      html  css  js  c++  java
  • ByteBuffer 理解


    先列点代码片段:
    // ...
    //
    // 此段代码功能为从 t.txt 里复制所有数据到 out_j.txt:
    //
    ...
    1 FileChannel fcin = new FileInputStream( "d:/t.txt" ).getChannel();
    2 FileChannel fcout = new FileOutputStream( new File( "d:/out_j.txt" )).getChannel();
    3 ByteBuffer buff = ByteBuffer.allocate( 1024 );
    4 long t1 = System.currentTimeMillis();
    5
    6 while( fcin.read( buff ) != -1 )
    7 {
    8   buff.flip();
    9   fcout.write( buff );
    10   buff.clear();
    11 }
    12
    13 long t2 = System.currentTimeMillis();
    14 long size = fcin.size();
    15 javax.swing.JOptionPane.showMessageDialog( null, size + " 字节, 耗时 " + ( t2 - t1 + 1 ) + " ms." );
    ...

    ----------------------------------------------------------------------------------------------------

    SDK 文档里对 ByteBuffer 的说明为:

    public abstract class ByteBuffer
    extends Buffer
    implements Comparable <ByteBuffer>

    这说明 ByteBuffer 是继承于 Buffer 的抽象类, 实现了两个接口.

    行3 通过 allocate() 分配了一块 1024 字节的缓冲区, 并返回一个 ByteBuffer 对象. (抽象类不能直接 new)
    行6 fcin.read() 将数据读入到 buff. 此处的 read() 是 FileChannel 类的一个虚函数.
    行8 buff.flip() 这个调用就是开头一直无法理解的部分.

    ----------------------------------------------------------------------------------------------------

    SDK 文档里的对 flip() 的说明是:

    public final Buffer flip()
    反转此缓冲区。首先对当前位置设置限制,然后将该位置设置为零。如果已定义了标记,则丢弃该标记。
    当将数据从一个地方传输到另一个地方时,经常将此方法与 compact 方法一起使用。

    我最终的理解是: 文档翻译得太差了, 把不应该翻译的内容也译成了中文, 所以反而不容易理解.
    关键就在以下 2 处:

    当前位置: 这个可以直观地理解为缓冲区中的当前数据指针, 或是 SQL 中的游标, 记为 curPointer.
    限制: 这个可以理解成实际操作的缓冲区段的结束标记, 记为 endPointer.
    反转: 这个完全是对 flip 这个词不负责的翻译, 如果参照 DirectX 里的 flip() 而译为翻转/翻页, 那就好理解得多, 就像写信/看信, 写/看完一页后, 翻到下一页, 眼睛/笔从页底重新移回页首.
    这个翻转背后的操作其实就是 "把 endPointer 定位到 curPointer 处, 并把 curPointer 设为 0".

    关于标记, 在这里不涉及. 下一句说到常与 compact 方法一起使用, 是可以想像的, 因为 compact 方法对数据进
    行了压缩, 有效数据的真实长度发生了变化, 肯定需要用 flip 重新定位结束标记.

    在填充, 压缩等数据操作时, curPointer 估计都是自动更新了位置的, 总是指向最后一个有效数据, 所以每次调
    用 flip() 后, endPointer 就指向了有效数据的结尾, 而 curPointer 指向了 0 (缓冲起始处).

    举个图例:
    (c 和 e 分别代表 curPointer 和 endPointer 两个指针)

    * 先是一个空的 ByteBuffer (大小为 10 字节)
    -------------------
    -------------------
    c
    e


    * 然后填充 5 字节数据
    -------------------
    0 1 2 3 4
    -------------------
    e       c
    此时, endPointer 尚在 0 处, curPointer 移到了数据结尾.
    经测试, 此时若取数据, 将得到 5 个字节, 内容通常为 0 (也有可能是未知), 因为实际上取到的是从 c 处到缓冲
    区实际结束处的 5 个未初始化的字节.
    (QZone 字体处理不正确, 此处 c 是在 4 的下面, e 在 0 的下面)

    * 调用一次 flip() 后
    -------------------
    0 1 2 3 4
    -------------------
    c       e
    此时, endPointer 先被移到 curPointer, 然后 curPointer 移到 0.
    通过测试可见, ByteBuffer 取数据时, 是从 curPointer 起, 到 endPointer 止, 若 curPointer > endPointer, 则取到缓冲区结束.
    (QZone 字体处理不正确, 此处 c 是在 0 的下面, e 在 4 的下面)

    再看上面代码的关键片段, 行 8 处调用 flip() 即有两个作用, 一是将 curPointer 移到 0, 二是将 endPointer 移到有效数据结尾.

    此行可由以下两行代替:
    buff.limit( buff.position());
    buff.position( 0 );

    可见对其工作原理的理解, 应该是正确的.

    ----------------------------------------------------------------------------------------------------

    总结如下:
    1. put 数据时, 不会自动清除缓冲区中现有的数据.
    2. 每一次 get 或 put 后, curPointer 都将向缓冲区尾部移动, 移动量=操作的数据量.
    3. get/put 均是从 curPointer 起, 到 curPointer + 操作的数据长度止.
    4. get/put 操作中, 若 curPointer 超过了 endPointer 或缓冲区总长度, 将抛出 java.nio.BufferUnderflowException 异常.

    注: curPointer 和 endPointer 只是为文中方便描述命名的, 实际分别对应到 ByteBuffer.position() 和 ByteBuffer.limit() 两个方法.

    ----------------------------------------------------------------------------------------------------

    疑惑:
    curPointer 是用 ByteBuffer.position() 取值, 用 ByteBuffer.position( int ) 赋值, 不知道 JDK 为什么要用多态来实现这两个功能, 按我的想法, 设计成 getPosition(), setPosition() 不是要好看好记得多啊.

    ----------------------------------------------------------------------------------------------------

    跟 C++ 的简单比较:
    C++ 里面没有类似 ByteBuffer 的现成实现, 实现上述类似的文件复制功能, 通常要自己创建管理缓冲区. C++ 里读写文件通常用 FileRead(), FileWrite() 函数, 在读/写的时候, 可以直接指定读/写的数据长度, 相比下显得
    直观方便些, 但 JDK 这个 ByteBuffer 的方式, 确实更方便好用.

    ByteBuffer 作为继承自 Buffer 的抽象类, 实现了对 Byte 型缓冲的管理, 同时 JDK 里还有对应其他数据类型的
    继承自 Buffer 的抽象类, 分别实现对应类型的缓冲管理. 这种设计减少了编程时的工作. 如果在 C++ 中, 调用
    读/写函数时, 还需要考虑传入数据的类型, 通常用传入 sizeof(数据类型) 的方式指定, 除了函数调用时增加耗
    费外, 灵活性也更差些.

    反过来再想, 为什么 C 要用这种方式? 个人认为, 这是 C 标准库的实现方式, 因为在不同 OS 平台上, 对文件和
    设备的访问方法在系统层不一定相同, 同时硬件平台(主要是 CPU)上基本数据类型宽度也有可能不同, 标准库通过
    sizeof 这个宏在编译时才能确定数据宽度, 所以标准 C 代码通常可以在不同平台上重新编译.

    再想 C++ 为什么要用这种方式? 首先, C++ 里沿用 C 标准库的模式是可以理解的, 其次, 也许只是 C++ 标准库
    里没有类似的设计, 说不定早就有第三方通过模板实现的了.

    个人认为, ByteBuffer 在实现上, 可以算是一种数据结构, 在类设计上, 可以算是一种设计模式了.

  • 相关阅读:
    bzoj1014: [JSOI2008]火星人prefix
    bzoj1934: [Shoi2007]Vote 善意的投票&&bzoj2768:[JLOI2010]冠军调查
    bzoj2705: [SDOI2012]Longge的问题
    bzoj4653: [Noi2016]区间
    bzoj2456: mode
    bzoj5018: [Snoi2017]英雄联盟
    关于树论【左偏树】
    caioj1522: [NOIP提高组2005]过河
    caioj1421&&hdu2167: [视频]【状态压缩】选数
    Linux下全局安装composer方法
  • 原文地址:https://www.cnblogs.com/feiling/p/2733053.html
Copyright © 2011-2022 走看看