zoukankan      html  css  js  c++  java
  • Java中的IO流

    一、Java中IO流按不同的特点有以下区分:

    • 按照流的流向分: 分为 输入流 输出流
    • 按照操作单元划分,分为 字节流  字符流
    • 按照流的角色划分,分为 节点流 处理流
    字节与字符:
    
    bit(位)是最小的二进制单位,是计算机的操作部分。取值0或1
    byte(字节)是计算机操作数据的最小单位,由8 bit 组成,取值(-128~127char(字符)是用户可读写的最小单位,在Java中由16 bit组成,取值(0-65535)
    
    总结如下:
    1 byte = 8 bit
    1 char = 16 bit

    注:
    输入流是把数据写入存储介质的。
    输出流是从存储介质中把数据读取出来的

    1、字节流(InputStream、OutputStream)

    操作byte类型的数据,不用缓冲区,直接对文件本身操作

    2、字符流(Reader、Writer)

    操作字符(char)类型类型数据,使用缓冲区缓冲字符,不关闭流就不会输出任何内容

    3、相互转换(用于字节和字符流的转换)

    OutputStreamWriter:是 Writer 的子类,将输出的字符流变为字节流,即将一个字符流的输出对象变为字节流输出对象。

    InputStreamReader:是 Reader 的子类,将输入的字节流变为字符流,即将一个字 节流的输入对象变为字符流的输入对象。

    二、同步 / 异步,阻塞 / 非阻塞

    1、同步与异步描述的是被调用者的

    如 A 调用 B
    如果是同步,B 在接到 A 的调用后,会立即执行要做的事。A 的本次调用可以得到结果。
    
    如果是异步,B 在接到 A 的调用后,不保证会立即执行要做的事,但是保证会去做,B在做好了之后会通知 A。
    A 的本次调用得不到结果,但是 B 执行完之后会通知 A。

    2、阻塞和非阻塞描述的是调用者的

    如 A 调用 B:
    如果是阻塞,A 在发出调用后,要一直等待,等着 B 返回结果。
    如果是非阻塞,A 在发出调用后,不需要等待,可以去做自己的事情。

    3、同步不一定阻塞、异步也不一定非阻塞。他们之间没有必然联系

    举个简单的例子,老张烧水。
    1. 老张把水壶放到火上,一直在水壶旁等着水开。(同步阻塞);
    2. 老张把水壶放到火上,去客厅看电视,时不时去厨房看看水开没有。(同步非阻塞);
    3. 老张把响水壶放到火上,一直在水壶旁等着水开。(异步阻塞) ;
    4. 老张把响水壶放到火上,去客厅看电视,水壶响之前不再去看它了,响了再去拿壶。(异步非阻塞)。

    1 和 2 的区别是,调用方在得到返回之前所做的事情不一样。 1 和 3 的区别是,被调 用方对于烧水的处理不一样。

    三、Linux 5 种IO模型

    1、BIO(阻塞式IO,Blocking IO)

    最传统的一种 IO 模型,即在读写数据过程中会发生阻塞现象。
    当用户线程发出 IO 请求之后,内核会去查看数据是否就绪,如果没有就绪就会等待数 据就绪,而用户线程就会处于阻塞状态,用户线程交出 CPU。当数据就绪之后,内核会将 数据拷贝到用户线程,并返回结果给用户线程,用户线程才解除 block 状态。

    典型的阻塞 IO 模型的例子为: data = socket.read(); 如果数据没有就绪,就会一直阻塞在 read 方法。

    2、NIO(非阻塞式IO, Non-bloking IO)

    当用户线程发起一个read操作后,并不需要等待,而是马上就得到了一个结果。
    如果结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。 一旦内核中的数据准备好了,并且又再次收到了用户线程的请求,那么它马上就将数据拷贝到了用户线程,然后返回。 所以事实上,在非阻塞IO模型中,用户线程需要不断地询问内核数据是否就绪,也就说非阻塞IO不会交出CPU,而会一直占用CPU。

    在 Java 1.4 中引⼊了 NIO 框架,对应 java.nio 包,提供了 Channel , Selector,Buffer 等抽象
    它⽀持⾯向缓冲的,基于通道的 I/O 操作⽅法。
    NIO 提供了与传统 BIO 模型中的 Socket 和 ServerSocket 相对应的 SocketChannel 和ServerSocketChannel
    两种不同的套接字通道实现,两种通道都至此阻塞和非阻塞两种模式

    典典型的非阻塞IO模型一般如下:

    
    
    while(true){
        data = socket.read();
        if(data!= error){
            处理数据
            break;
        }
    }

    但是对于非阻塞IO就有一个非常严重的问题,在while循环中需要不断地去询问内核数据是否就绪,这样会导致CPU占用率非常高,因此一般情况下很少使用while循环这种方式来读取数据。

    NIO与BIO之间最重要的区别是数据打包和传输的方式。原来的 I/O 以流的方式处理数据,而 NIO 以块的方式处理数据。

    3、IO多路复用(IO multiplexing)

    多路复用IO模型是目前使用得比较多的模型。Java NIO实际上就是多路复用IO。

    在多路复用IO模型中,会有一个线程不断去轮询多个socket的状态,只有当socket真正有读写事件时,才真正调用实际的IO读写操作。因为在多路复用IO模型中,只需要使用一个线程就可以管理多个socket,系统不需要建立新的进程或者线程,也不必维护这些线程和进程,并且只有在真正有socket读写事件进行时,才会使用IO资源,所以它大大减少了资源占用。

    在Java NIO中,是通过selector.select()去查询每个通道是否有到达事件,如果没有事件,则一直阻塞在那里,因此这种方式会导致用户线程的阻塞。

    也许有朋友会说,我可以采用 多线程+ 阻塞IO 达到类似的效果,但是由于在多线程 + 阻塞IO 中,每个socket对应一个线程,这样会造成很大的资源占用,并且尤其是对于长连接来说,线程的资源一直不会释放,如果后面陆续有很多连接的话,就会造成性能上的瓶颈。

    而多路复用IO模式,通过一个线程就可以管理多个socket,只有当socket真正有读写事件发生才会占用资源来进行实际的读写操作。因此,多路复用IO比较适合连接数比较多的情况。

    另外多路复用IO为何比非阻塞IO模型的效率高是因为在非阻塞IO中,不断地询问socket状态是通过用户线程去进行的,而在多路复用IO中,轮询每个socket状态是内核在进行的,这个效率要比用户线程要高的多。

    不过要注意的是,多路复用IO模型是通过轮询的方式来检测是否有事件到达,并且对到达的事件逐一进行响应。因此对于多路复用IO模型来说,一旦事件响应体很大,那么就会导致后续的事件迟迟得不到处理,并且会影响新的事件轮询。

    4、AIO((异步IO,Asynchronous I/O)

    AIO 也就是 NIO 2。在 Java 7 中引⼊了 NIO 的改进版 NIO 2,它
    是异步⾮阻塞的 IO 模型。异步 IO 是基于事件和回调机制实现的,也就是应⽤操作之后会直
    接返回,不会堵塞在那⾥,当后台处理完成,操作系统会通知相应的线程进⾏后续的操作。
    AIO 是异步 IO 的缩写,虽然 NIO 在⽹络操作中,提供了⾮阻塞的⽅法,但是 NIO 的 IO ⾏
    为还是同步的。对于 NIO 来说,我们的业务线程是在 IO 操作准备好时,得到通知,接着就
    由这个线程⾃⾏进⾏ IO 操作,IO 操作本身是同步的。查阅⽹上相关资料,我发现就⽬前来
    说 AIO 的应⽤还不是很⼴泛,Netty 之前也尝试使⽤过 AIO,不过⼜放弃了。

     四、BIO、NIO、AIO区别

    BIO (Blocking I/O):
    同步阻塞I/O模式,数据的读取写入必须阻塞在一个线程内等待其完成。
    这里假设一个烧开水的场景,有一排水壶在烧开水,BIO的工作模式就是, 叫一个线程停留在一个水壶那,
    直到这个水壶烧开,才去处理下一个水壶。但是实际上线程在等待水壶烧开的时间段什么都没有做。 NIO (New I
    /O):同时支持阻塞与非阻塞模式,但这里我们以其同步非阻塞I/O模式来说明,那么什么叫做同步非阻塞?
    如果还拿烧开水来说,NIO的做法是叫一个线程不断地轮询每个水壶的状态,看看是否有水壶的状态发生了改变,从而进行下一步的操作。 AIO ( Asynchronous I
    /O):异步非阻塞I/O模型。异步非阻塞与同步非阻塞的区别在哪里?
    异步非阻塞无需一个线程去轮询所有IO操作的状态改变,在相应的状态改变后,系统会通知对应的线程来处理。
    对应到烧开水中就是,为每个水壶上面装了一个开关,水烧开之后,水壶会自动通知我水烧开了。

    五、各自适应的场景

    BIO方式适用于连接数目比较小且固定的架构,这种方式对服务器资源要求比较高,并发局限于应用中
    JDK1.4以前的唯一选择,但程序直观简单易理解。 NIO方式适用于连接数目多且连接比较短(轻操作)的架构,比如聊天服务器,并发局限于应用中,编程比较复杂,
    JDK1.4开始支持。 AIO方式适用于连接数目多且连接比较长(重操作)的架构,比如相册服务器,充分调用OS参与并发操作,
    编程比较复杂,JDK7开始支持
    [ 版权声明 ]: 本文所有权归作者本人,文中参考的部分已经做了标记! 商业用途转载请联系作者授权! 非商业用途转载,请标明本文链接及出处!
  • 相关阅读:
    python gevent(协程模块)
    python基础之socket与socketserver
    python 使用 with open() as 读写文件
    Python logger模块
    python二维码操作:QRCode和MyQR入门
    常见的端口号及其用途
    python中hasattr()、getattr()、setattr()函数的使用
    mysql数据库自带数据库介绍
    关于BeautifulSoup4 解析器的说明
    学习opencv(1)
  • 原文地址:https://www.cnblogs.com/gslgb/p/14641082.html
Copyright © 2011-2022 走看看