zoukankan      html  css  js  c++  java
  • 教你如何理解JAVA的I/O类库

    花括号MC(huakuohao-mc):关注JAVA基础编程及大数据,注重经验分享及个人成长。

    Java 的 I/O 流,说简单也简单,说复杂也复杂。复杂是因为进行一次常规的文件 I/O 操作通常要用到很多 I/O 基础类,这很容易让新手产生困惑。简单是因为它的设计思想其实很简单。只要理解了它的设计思想就很容易知道如何使用它们。

    Java 的 I/O 类库最基本的思想就是流的概念。你可以把它类比成水流,我们把数据从一个地方搬运到另一个地方就是一次 I/O 操作。比如读取文件 'A' 的内容,存入文件 'B' 就是一次文件 I/O 操作; 通过监听键盘输入,然后将内容存储到磁盘上也是一次 I/O 操作; 当然通过网络带宽把服务器 'A' 的内容发送到 'B' 服务也叫做一次 I/O 操作。

    Java 的 I/O 流分为 输入流 和 输出流 。跟读相关的都叫输入流,跟写相关的都叫输出流。 Java 的 I/O 不光分为输入流跟输出流,按照流的性质还分为 字节流 和 字符流 。所有继承自抽象类 InputStream 和 OutPutStream 的流都是字节流,所有继承自抽象类 Reader 和 Writer 的流都是字符流。这两种不同性质的流都能进行 I/O 操作。

    为什么要分为字节流跟字符流。

    所谓的字节流,就是里面流淌的都是字节,也就 byte 。字符流呢,里面流淌的就是字符,也就是 char 。字符是由字节通过特定的编码组成的,比如 GBK 编码, ASCII 编码等等。同样的字节,使用不同的编码得到的内容可能不一样,这也就是编程中经常遇到的乱码问题。关于字符编码问题,这里不做深入展开,后续有机会可以单独写一下。

    JDK最开始支持的都是字节流,因为计算机就认字节。但是计算机是为人服务的,我们更喜欢看字符,比如‘A’,‘B’,‘C’,‘中’,‘国’,这些都叫字符。如果我们每次按字节 I/O 读取内容,然后在展示出来,是需要做编码转化的,所以为了方便程序员使用,JDK增加了字符流的相关类库,JDK底层帮我们完成转换工作。

    新的字符类库继承体系相比于老的字节流继承体系,有如下增强,支持国际化也就是支持16位的 Unicode 字符,老的I/O流仅支持8位的的字节流,而且在性能上也会有一定提升。在进行 I/O操作的时候,应该优先使用字符流,当字符流不能满足我们的时候,才转化到字节流,比如进行GZIP操作的时候,就需要使用字节流。

    字节流I/O

    先来认识一下字节流的 I/O 类库。

    所有的跟输入相关的字节流都继承自抽象类 InputStream 。它有几个比较常用的直接子类,每个直接子类代表了一个数据源,比如 ByteArrayInputStream 表示将内存缓冲区中的字节数组当作输入源。 StringBufferInputStream 表示将 String 对象作为输入源,现在已经不推荐使用了,推荐使用 StringReader 读取 String 对象。后面介绍字符流的时候还会说到这个类。 FileInputStream 表示将文件作为数据源,这也是大家平时用的比较多的。

    这些类的继承关系大概是这个样子

    其中标红的直接子类 FilterInputStream 比较特殊。要想理解这个类存在的意义,需要对 装饰者模式 有一定了解。

    俗话说的好,光说不练假把式,下面来看个小例子,看看如何进行字节流的文件 I/O 操作。

     1try {
     2         //打开输入流
     3         InputStream in = new FileInputStream(new File("test-io.tmp"));
     4         //打开输入流
     5         OutputStream out = new FileOutputStream(new File("test-io.md"));
     6         int length;
     7         byte[] buffer = new byte[1024];
     8         //输入流不断的读取,每次读取1024字节,直到文件末尾。
     9         while ((length = in.read(buffer)) != -1) {
    10              out.write(buffer,0,length);
    11         }
    12         in.close();
    13         out.close();
    14     } catch (FileNotFoundException e) {
    15         e.printStackTrace();
    16     } catch (IOException e) {
    17         e.printStackTrace();
    18     }
    

    在真正的项目中很少看到这样的 I/O 操作,因为效率比较低。都2020年了,要是还进行非缓冲的 I/O 操作,估计会被同行狠狠的鄙视。我们针对上面的例子做一个小小的改动,使其变成带缓冲功能的 I/O 操作。主要的类就是 BufferedInputStream .

    看代码

     1try {
     2    InputStream in = new BufferedInputStream(new FileInputStream(new File("test-io.tmp")));
     3    OutputStream out = new BufferedOutputStream(new FileOutputStream(new File("test-buffer-io.md")));
     4    int lenght;
     5    byte[] buffer = new byte[1024];
     6    while ((lenght = in.read(buffer)) != -1){
     7        out.write(buffer,0,lenght);
     8    }
     9    in.close();
    10    out.close();
    11    } catch (FileNotFoundException e) {
    12       e.printStackTrace();
    13    } catch (IOException e) {
    14       e.printStackTrace();
    15    }
    

    装饰者模式的应用

    上面这段带缓存功能的 I/O 操作跟不带缓存的 I/O 操作唯一的区别就是把 FileInputStream用 BufferedInputStream 给包装(装饰)了一下。下面看一下 BufferedInputStream 的继承关系。

    FileterInputStream :JDK官方文档是这样介绍这个类的。

    把一个真正的带有数据源的输入流包装进来,并为其提供格外的功能,这个额外的功能要其子类去实现。

    这是典型的装饰者模式。

    大家可能会问,为什么不能直接让 BufferedInputStream 继承自 FileInputStream ,而偏偏引入个装饰者模式呢。

    我们假设让 BufferedInputStream 继承自 FileInputStream ,那么当需要对 ByteArrayInputStream 进行缓存读取的时候自然也需要在实现一个 ByteBufferedInputStram ,这样类库就会变得异常复杂跟臃肿。这也是装饰者模式比继承的方式更灵活的地方。如果你还是一头雾水的话,建议去深入的理解一下装饰者模式吧。

    字节流的 I/O 操作基本就这样了,下面看一下字符流。

    字符流I/O

    所有跟输入相关的字符流都继承自抽象类 Reader ,跟输出相关的都继承自抽象类 Writer 。

    我们先看个小例子,假设不使用字符流而是使用字节流读取文件内容,然后将内容输出到控制台,看看应该怎样操作。

     1public static void readFileStreamToChar(){
     2        /**
     3         * UTF-8编码英文字符占一个字节,
     4         * 数字占一个字节,
     5         * 有的汉字占三个字节,有的占用四个字节。
     6         * 拉丁文,希腊文占两个字节。
     7         */
     8
     9        try {
    10            InputStream in = new FileInputStream(new File("test-io.tmp"));
    11            int length;
    12            byte[] buffer = new byte[4];
    13            while ((length = in.read(buffer)) != -1) {
    14                System.out.println("the length of bytes is " + length);
    15                //编码转化
    16                String content = new String(buffer, 0, length, Charset.forName("utf-8"));
    17                System.out.println("the content is " + content);
    18            }
    19            in.close();
    20        } catch (FileNotFoundException e) {
    21            e.printStackTrace();
    22        } catch (IOException e) {
    23            e.printStackTrace();
    24        }
    25    }
    

    输出结果

    1the length of bytes is 4
    2the content is word
    3the length of bytes is 4
    4the content is 
    5世
    6the length of bytes is 3
    7the content is 界
    

    说明: test-io.tmp 里面的内容为两行,第一行内容是'word' (没拼错,故意找的这个单词),第二行内容是'世界'

    从代码中可以看到,将内容输出到控制台的时候必须进行编码转换。大家可以尝试把 buffer的大小调整为2个字节看一下效果。懒得尝试的同学,就别试了,结论是中文字符会乱码,原因我已经在代码注释中说了,一个中文字符占三个字节。

    假设JDK只提供基于字节流操作,那么每次都要进行字节到字符的转换操作,很麻烦,所以JDK就直接提供了字符流的操作。

    下面来具体看看字符流类库的设计,我们还是以输入流举例,因为输出流跟输入流是一一对应关系。

    抽象类 Reader 同样有几个比较常用的直接子类。

    BufferedReader :带缓冲功能的字符流,用的比较多。

    CharArrayReader :跟 ByteArrayInputStream 对应,读取内存中的字符数组。

    StringReader :跟 StringBufferInputStream 对应,读取 String 对象,这是读取 String 对象的推荐用法。

    Reader 有个比较特殊的直接子类,就是 InputStreamReader 。这是个适配器,可以把字节流转换为字符流。 FileReader 就继承自该类, FileReader 跟字节流的 FileInputStream 对应,表示从文件读取字符。

    下面来看简单看一下类的继承关系。

    了解完类的继承关系之后,我们看个小例子,看看如何使用字符流的方式读取文件内容。注意我注释掉的代码。

     1try {
     2
     3            //通过 InputStreamReader 适配器,将字节流FileInputStream按照制定的编码方式转换为字符流
     4            // BufferedReader in = new BufferedReader(
     5            //        new InputStreamReader(
     6            //                new FileInputStream(
     7            //                        new File("test-io.tmp")), "utf-8"));
     8
     9            //不直接使用适配器,使用FileReader,将使用系统默认的编码
    10            BufferedReader in = new BufferedReader(new FileReader(new File("test-io.tmp")));
    11            String s;
    12            StringBuilder sb = new StringBuilder();
    13
    14            //按字符读
    15            int value;
    16            while ((value = in.read()) != -1) {
    17                char c = (char) value;
    18                System.out.println(c);
    19            }
    20
    21            //按行读取
    22            //while ((s = in.readLine()) != null){
    23            //    sb.append(s);
    24            //}
    25            //System.out.println(sb.toString());
    26            in.close();
    27        } catch (FileNotFoundException e) {
    28            e.printStackTrace();
    29        } catch (IOException e) {
    30            e.printStackTrace();
    31        }
    32}
    

    Java的普通 I/O 就介绍到这里了。Java的 I/O 类库用到了两个经典设计模式,装饰器跟适配器。如果想更深入的理解Java I/O 类库除了多读源码外(感兴趣的读者可以去看看底层源码,JDK如何实现字节到字符的转换的)还需要深入的理解设计模式。

    希望这篇文章对你理解Java I/O 有一定帮助,下一篇打算写一下Java的NIO。

  • 相关阅读:
    zlib编译不过(Error A2070)解决方法(转)
    error C2440: 'static_cast' : cannot convert from 'UINT (__thiscall CStaticLink::* )(CPoint)' to 'LRESULT (__thiscall CWnd::* )(CPoint) (转)
    MFC does not support WINVER less than 0x0501 解决方案(转)
    【程序打包工具 Inno Setup】转
    【Visual Studio】简单内存泄漏检测方法 解决 Detected memory leaks! 问题(转)
    各种版本QT下载地址与VS2013+QT5.3.1环境搭建过程(转)
    【Windows Message】MFC 通过F5,刷新桌面
    [bzoj]3343 教主的魔法
    NOIP2012 国王游戏
    NOIP模拟赛 路面修整
  • 原文地址:https://www.cnblogs.com/java1024/p/12378036.html
Copyright © 2011-2022 走看看