zoukankan      html  css  js  c++  java
  • NIO和IO(转)

    java NIO由以下几个核心部分组成:

    • Channels(通道)
    • Buffers(缓冲区)
    • Selectors(选择器)
    • 其他

    Channel和Buffer:

    所有的IO再NIO中都从一个Channel开始.Channel有点像流,数据可以从Channel读到Buffer中,也可以从Buffer写到Channel中:

    Channel的主要实现如下:

    • FileChannel
    • DatagramChannel
    • SocketChannel
    • ServerSocketChannel

    这些通道覆盖了UDP和TCP网络IO

    Buffer的实现:

    • ByteBuffer
    • CharBuffer
    • DoubleBuffer
    • FloatBuffer
    • intBuffer
    • LongBuffer
    • ShortBuffer

    这些Buffer覆盖了通过IO发送的基本数据类型(JAVA NIO还有个MappedByteBuffer,表示内存映射文件)

    Selector

    Selector允许单线程处理多个Channel,如果你的应用打开了多个连接(通道),每个连接的流量都很低,使用selector就会很方便,如:在一个聊天服务器中.如下图,一个selector处理3个Channel的问题

    使用selector,得向selector注册Channel,然后调用它的select(),这个方法会一直阻塞到某个注册的通道事件就绪.一旦这个方法返回,线程就可以处理这些事件,事件的例子就是新连接进来,数据接收等.

    Java NIO vs. IO

    我应该何时使用IO,何时使用NIO呢?在本文中,我会尽量清晰地解析Java NIO和IO的差异、它们的使用场景,以及它们如何影响您的代码设计。
    

     下表总结了java NIO和IO之间的主要差别,我会更详细的描述表中每部分的差异.

    IO NIO
    Stream oriented Buffer Oriented
    Blocking IO Non Blocking IO
      Selectors

    面向流和面向缓冲

    Java NIO和IO之间最大的区别是:IO是面向流的,NIO是面向缓冲区的.java IO面向流意味着每次从流中读一个或多个字节,直至读取所有字节,他们没有被缓存在任何地方.此外,它不能前后移动流中的数据,如果徐亚前后移动从流中读取的数据,需要先将它缓存到一个缓冲区. Java NIO的缓冲导向方法略有不同,数据读取到一个它稍后处理的缓冲区,需要时在缓冲区中前后移动,这就增加了处理过程中的灵活性,但是,还需要检查是否该缓冲区中包含所有您需要处理的数据,而且,需要确保当更多的数据读入缓冲区时,不要覆盖缓冲区里面尚未处理的数据.

    阻塞与非阻塞IO

    Java IO的各种流是阻塞的,这意味着,当一个线程调用read()或者write()时,该线程被阻塞,直到有一些数据被读取,或数据完全写入,该线程在此期间不能再干任何事情.Java NIO的非阻塞模式,使一个线程从某通道发送请求读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用,就什么都不会获取.而不是保持线程阻塞,所有直至数据变的可以读取之前,该线程可以继续做其他事情,非阻塞写也是如此,一个线程请求希尔一些数据到通道,但不需要等待它完全写入,这个线程同时可以去做别的事,线程同城将非阻塞IO的空闲时间用于在其他通道执行IO操作,所以一个单独的线程现在可以管理多个输入和输出通道.

    选择器(Selectors)

    选择器允许一个单独的线程来监听多个输入通道,你可以注册多个通道使用一个选择器,然后使用一个单独的线程来"选择"通道:这些通道里已经有可以处理的输入,或者选择已准备写入的通道.这种选择机制,使一个单独的线程很容易管理多个通道.

    NIO和IO如何影响应用程序的设计

    • 对NIO或IO类API的调用(IO从一个InputStream逐字读取,NIO是数据必须先读入缓冲区再处理)
    • 数据处理
    • 用来处理数据的线程数

    数据处理

    使用纯粹的NIO设计相较IO设计,数据处理也受到影响。

    在IO设计中,我们从InputStream或 Reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如:

    代码
    Name: Anna  
    Age: 25  
    Email: anna@mailserver.com  
    Phone: 1234567890  
    

     该文本行的流可以这样处理:

    Java代码

    InputStream input = … ; // get the InputStream from the client socket  
    BufferedReader reader = new BufferedReader(new InputStreamReader(input));  
          
    String nameLine   = reader.readLine();  
    String ageLine    = reader.readLine();  
    String emailLine  = reader.readLine();  
    String phoneLine  = reader.readLine();  
    

     
    请注意处理状态由程序执行多久决定。换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,这就是原因。你也知道此行包含名称;同样,第二个readline()调用返回的时候,你知道这行包含年龄等。 正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如 此)。下图也说明了这条原则:


    从一个阻塞的流中读数据



    而一个NIO的实现会有所不同,下面是一个简单的例子:

    Java代码
    ByteBuffer buffer = ByteBuffer.allocate(48);  
    int bytesRead = inChannel.read(buffer);  
    

     
    注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。
    假设第一次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。

    所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不仅效率低下,而且可以使程序设计方案杂乱不堪。例如:

    Java代码
    ByteBuffer buffer = ByteBuffer.allocate(48);  
        int bytesRead = inChannel.read(buffer);  
        while(! bufferFull(bytesRead) ) {  
        bytesRead = inChannel.read(buffer);  
    }  
    

     
    bufferFull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,那么表示缓冲区满了。

    bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用之前状态相同。如果没有,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却是需要注意的又一问题。

    如果缓冲区已满,它可以被处理。如果它不满,并且在你的实际案例中有意义,你或许能处理其中的部分数据。但是许多情况下并非如此。下图展示了“缓冲区数据循环就绪”:


    从一个通道里读数据,直到所有的数据都读到缓冲区里



    总结

    NIO可让您只使用一个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从一个阻塞流中读取数据更复杂。

    如果需要管理同时打开的成千上万个连接,这些连接每次只是发送少量的数据,例如聊天服务器,实现NIO的服务器可能是一个优势。同样,如果你需要 维持许多打开的连接到其他计算机上,如P2P网络中,使用一个单独的线程来管理你所有出站连接,可能是一个优势。一个线程多个连接的设计方案如下图所示:


    单线程管理多个连接



    如果你有少量的连接使用非常高的带宽,一次发送大量的数据,也许典型的IO服务器实现可能非常契合。下图说明了一个典型的IO服务器设计:


    一个典型的IO服务器设计:一个连接通过一个线程处理

    Channel(通道)

    Java NIO的通道类似流,但又有些不同:

    • 既可以从通道中读取数据,又可以写数据到通道。但流的读写通常是单向的。
    • 通道可以异步地读写。
    • 通道中的数据总是要先读到一个Buffer,或者总是要从一个Buffer中写入。

    正如上面所说,从通道读取数据到缓冲区,从缓冲区写入数据到通道。如下图所示:



    Channel的实现

    这些是Java NIO中最重要的通道的实现:

    • FileChannel:从文件中读写数据。
    • DatagramChannel:能通过UDP读写网络中的数据。
    • SocketChannel:能通过TCP读写网络中的数据。
    • ServerSocketChannel:可以监听新进来的TCP连接,像Web服务器那样。对每一个新进来的连接都会创建一个SocketChannel。

    基本的 Channel 示例

    下面是一个使用FileChannel读取数据到Buffer中的示例:

    Java代码
        RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");  
        FileChannel inChannel = aFile.getChannel();  
          
        ByteBuffer buf = ByteBuffer.allocate(48);  
          
        int bytesRead = inChannel.read(buf);  
        while (bytesRead != -1) {  
          
        System.out.println("Read " + bytesRead);  
        buf.flip();  
          
        while(buf.hasRemaining()){  
        System.out.print((char) buf.get());  
        }  
          
        buf.clear();  
        bytesRead = inChannel.read(buf);  
        }  
        aFile.close();  
    

     
    注意 buf.flip() 的调用,首先读取数据到Buffer,然后反转Buffer,接着再从Buffer中读取数据。下一节会深入讲解Buffer的更多细节。

    Buffer(缓存区)

    Buffer的基本用法

    使用Buffer读写数据一般遵循以下四个步骤:

    1. 写入数据到Buffer
    2. 调用flip()方法
    3. 从Buffer中读取数据
    4. 调用clear()方法或者compact()方法

    当向buffer写入数据时,buffer会记录下写了多少数据。一旦要读取数据,需要通过flip()方法将Buffer从写模式切换到读模式。在读模式下,可以读取之前写入到buffer的所有数据。

    一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用clear()或compact()方法。 clear()方法会清空整个缓冲区。compact()方法只会清除已经读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区 未读数据的后面。

    下面是一个使用Buffer的例子:

    RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
    FileChannel inChannel = aFile.getChannel();
    
    //create buffer with capacity of 48 bytes
    ByteBuffer buf = ByteBuffer.allocate(48);
    
    int bytesRead = inChannel.read(buf); //read into buffer.
    while (bytesRead != -1) {
    
      buf.flip();  //make buffer ready for read
    
      while(buf.hasRemaining()){
          System.out.print((char) buf.get()); // read 1 byte at a time
      }
    
      buf.clear(); //make buffer ready for writing
      bytesRead = inChannel.read(buf);
    }
    aFile.close();
    
     

    Buffer的capacity,position和limit

    缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问该块内存。

    为了理解Buffer的工作原理,需要熟悉它的三个属性:

    • capacity
    • position
    • limit

    position和limit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式,capacity的含义总是一样的。

    这里有一个关于capacity,position和limit在读写模式中的说明,详细的解释在插图后面。

    capacity

    作为一个内存块,Buffer有一个固定的大小值,也叫“capacity”.你只能往里写capacity个byte、long,char等类型。一旦Buffer满了,需要将其清空(通过读数据或者清除数据)才能继续写数据往里写数据。

    position

    当你写数据到Buffer中时,position表示当前的位置。初始的position值为0.当一个byte、long等数据写到Buffer 后, position会向前移动到下一个可插入数据的Buffer单元。position最大可为capacity – 1.

    当读取数据时,也是从某个特定位置读。当将Buffer从写模式切换到读模式,position会被重置为0. 当从Buffer的position处读取数据时,position向前移动到下一个可读的位置。

    limit

    在写模式下,Buffer的limit表示你最多能往Buffer里写多少数据。 写模式下,limit等于Buffer的capacity。

    当切换Buffer到读模式时, limit表示你最多能读到多少数据。因此,当切换Buffer到读模式时,limit会被设置成写模式下的position值。换句话说,你能读到之前 写入的所有数据(limit被设置成已写数据的数量,这个值在写模式下就是position)

    Buffer的类型

    Java NIO 有以下Buffer类型

    • ByteBuffer
    • MappedByteBuffer
    • CharBuffer
    • DoubleBuffer
    • FloatBuffer
    • IntBuffer
    • LongBuffer
    • ShortBuffer

    p<>
    如你所见,这些Buffer类型代表了不同的数据类型。换句话说,就是可以通过char,short,int,long,float 或 double类型来操作缓冲区中的字节。

    MappedByteBuffer 有些特别,在涉及它的专门章节中再讲。

    Buffer的分配

    要想获得一个Buffer对象首先要进行分配。 每一个Buffer类都有一个allocate方法。下面是一个分配48字节capacity的ByteBuffer的例子。

    1 ByteBuffer buf = ByteBuffer.allocate(48);

    这是分配一个可存储1024个字符的CharBuffer:

    1 CharBuffer buf = CharBuffer.allocate(1024);

    向Buffer中写数据

    写数据到Buffer有两种方式:

    • 从Channel写到Buffer。
    • 通过Buffer的put()方法写到Buffer里。

    从Channel写到Buffer的例子

    1 int bytesRead = inChannel.read(buf); //read into buffer.

    通过put方法写Buffer的例子:

    1 buf.put(127);

    put方法有很多版本,允许你以不同的方式把数据写入到Buffer中。例如, 写到一个指定的位置,或者把一个字节数组写入到Buffer。 更多Buffer实现的细节参考JavaDoc。

    flip()方法

    flip方法将Buffer从写模式切换到读模式。调用flip()方法会将position设回0,并将limit设置成之前position的值。

    换句话说,position现在用于标记读的位置,limit表示之前写进了多少个byte、char等 —— 现在能读取多少个byte、char等。

    从Buffer中读取数据

    从Buffer中读取数据有两种方式:

    1. 从Buffer读取数据到Channel。
    2. 使用get()方法从Buffer中读取数据。

    从Buffer读取数据到Channel的例子:

    1 //read from buffer into channel.
    2 int bytesWritten = inChannel.write(buf);

    使用get()方法从Buffer中读取数据的例子

    1 byte aByte = buf.get();

    get方法有很多版本,允许你以不同的方式从Buffer中读取数据。例如,从指定position读取,或者从Buffer中读取数据到字节数组。更多Buffer实现的细节参考JavaDoc。

    rewind()方法

    Buffer.rewind()将position设回0,所以你可以重读Buffer中的所有数据。limit保持不变,仍然表示能从Buffer中读取多少个元素(byte、char等)。

    clear()与compact()方法

    一旦读完Buffer中的数据,需要让Buffer准备好再次被写入。可以通过clear()或compact()方法来完成。

    如果调用的是clear()方法,position将被设回0,limit被设置成 capacity的值。换句话说,Buffer 被清空了。Buffer中的数据并未清除,只是这些标记告诉我们可以从哪里开始往Buffer里写数据。

    如果Buffer中有一些未读的数据,调用clear()方法,数据将“被遗忘”,意味着不再有任何标记会告诉你哪些数据被读过,哪些还没有。

    如果Buffer中仍有未读的数据,且后续还需要这些数据,但是此时想要先先写些数据,那么使用compact()方法。

    compact()方法将所有未读的数据拷贝到Buffer起始处。然后将position设到最后一个未读元素正后面。limit属性依然像clear()方法一样,设置成capacity。现在Buffer准备好写数据了,但是不会覆盖未读的数据。

    mark()与reset()方法

    通过调用Buffer.mark()方法,可以标记Buffer中的一个特定position。之后可以通过调用Buffer.reset()方法恢复到这个position。例如:

    1 buffer.mark();
    2  
    3 //call buffer.get() a couple of times, e.g. during parsing.
    4  
    5 buffer.reset();  //set position back to mark.

    equals()与compareTo()方法

    可以使用equals()和compareTo()方法两个Buffer。

    equals()

    当满足下列条件时,表示两个Buffer相等:

    1. 有相同的类型(byte、char、int等)。
    2. Buffer中剩余的byte、char等的个数相等。
    3. Buffer中所有剩余的byte、char等都相同。

    如你所见,equals只是比较Buffer的一部分,不是每一个在它里面的元素都比较。实际上,它只比较Buffer中的剩余元素。

    compareTo()方法

    compareTo()方法比较两个Buffer的剩余元素(byte、char等), 如果满足下列条件,则认为一个Buffer“小于”另一个Buffer:

    1. 第一个不相等的元素小于另一个Buffer中对应的元素 。
    2. 所有元素都相等,但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。

    (译注:剩余元素是从 position到limit之间的元素)

  • 相关阅读:
    设备管理器里“SM总线控制器”、“其它PCI桥设备”驱动有问题
    MapReduce实现两表的Join--原理及python和java代码实现
    Calendar类经常用法 日期间的转换 set方法有巨坑
    Java 装饰模式(4.4)
    LoadRunner访问Mysql数据库(转)
    linux下定时执行任务的方法
    docker 常用命令
    Docker exec与Docker attach
    docker容器跨服务器的迁移方式export和save(转)
    cpu时间 / cpu利用率计算
  • 原文地址:https://www.cnblogs.com/gudulijia/p/5667062.html
Copyright © 2011-2022 走看看