Java之IO(九)其它字节流

zoukankan html css js c++ java

Java之IO(九)其它字节流
　　转载请注明源出处：http://www.cnblogs.com/lighten/p/7063161.html

1.前言

　　之前的章节已经介绍了java的io包中所有成对（输入、输出对应）的字节流，本章介绍剩余的一些字节流，包括：LineNumberInputStream、SequenceInputStream、StringBufferInputStream。在JDK8的版本中，只有中间的SequenceInputStream没有被废弃，其它两个都被指出已废弃了。

2.LineNumberInputStream

　　这个输入流通过添加函数功能，能保持对输入流的行数的追踪。行号从0开始，每次增加1。顺便说一下，这个类是在JDK1.0就存在了。被废弃的原因在类的注释中也给出了：这个类错误地假设bytes能够足够表示characters。在JDK1.1中，也就是此类后面的版本，更好的方式来操作字符流就是创建一个新的字符流，这个流中包含了一个用于计算行号的类。这也就是在JDK1.1中出现的LineNumberReader，此节不讲，是字符流的内容。

　　LineNumberInputStream继承于FilterInputStream，类结构如下：

　　可以看出，对于抽象父类InputStream，其多了set和get行号的两个方法。下面先看基本的数据流的方法实现。

　　之前看的结构图有四个变量，两个一组应该很好理解，mark开头的主要是让Inputstream的mark()方法使用，记录一下。lineNumber就是记录的行号了，pushBack有什么作用呢？看上图的read逻辑。pushBack默认情况下为-1，-1的时候就读取一个，不是-1的时候就返回这个暂存的值。读取一个字节会判断其是否是，是行号就直接加1了，如果是，就让pushBack再读一个，如果是就重置为-1。这段写的很绕，通俗的说就是：read()方法是读取一个字节，我们都知道流读取了就不能再读取，但是判断换行符的时候就麻烦了，的时候需要判断一下下一个是否是，所以需要再读取一个字节，这个时候就要保存一下这个字节了，就存在pushback中，pushback一般都是-1，意味着直接读一个就可以了，不是-1的时候就是说之前判断的是，但下一个不是，所以保存了一下这个非的字符，本次就直接返回了。上面有一个坑的地方，其判断了之后就还会执行，因为没有break。这会造成下例效果：
@Test public void test() throws IOException { ByteArrayInputStream bais = new ByteArrayInputStream("123 456 789 ".getBytes()); LineNumberInputStream lnis = new LineNumberInputStream(bais); byte[] buffer = new byte[1024]; ByteArrayOutputStream baos = new ByteArrayOutputStream(); int length; while((length = lnis.read(buffer)) != -1) { baos.write(buffer, 0, length); } System.out.println(new String(baos.toByteArray())); System.out.println(lnis.getLineNumber()); }
　　多出现了一个空行。实际上面确实，这个产生了两个回车，实际上直接输出也是两个回车。（-。-）！！！可能废弃的真正原因就如上所说的byte不能表示所有的字符吧。

3.SequenceInputStream

　　一个SequenceInputStream表示其他输入流的逻辑连接。它从一个有序的输入流开始，从第一个开始直到到达文件的末尾，然后从第二个文件中读取，以此类推，直到最后一个包含的输入流到达文件的末尾。

　　这个流很简单，结构如下：

　　就是接受了一组有序的输入流，读取的时候，一个个读到为罢了。

　　像接力棒一样，读完一个又接一个，知道全部读取完毕。
@Test public void test2() throws IOException { ByteArrayInputStream bais = new ByteArrayInputStream("你好".getBytes()); ByteArrayInputStream bais2 = new ByteArrayInputStream(",张三".getBytes()); SequenceInputStream sis = new SequenceInputStream(bais, bais2); byte[] buffer = new byte[1024]; ByteArrayOutputStream baos = new ByteArrayOutputStream(); int length; while((length = sis.read(buffer)) != -1) { baos.write(buffer, 0, length); } System.out.println(new String(baos.toByteArray())); }
4.StringBufferInputStream

　　这个流也是一个废弃的方法，其理由是：这个类不能正确地将字符转换成字节。在JDK 1.1中，从字符串创建流的首选方法是通过StringReader类。

　　这个类允许应用程序创建一个输入流，其中读取的字节是由字符串的内容提供的。应用程序还可以使用ByteArrayInputStream从字节数组中读取字节。这个类只使用字符串中每个字符的低8位。结构也很简单：

　　buffer就是缓存的字符串，count就是这个字符串的长度了。read()方法就是将字符串按字节读取：

　　官方虽然给出了这两个流被废弃的原因，就是字符和字节之间的转换问题，但是个人还是不明白哪里会出问题，对编码还是所知甚少，目前最大的困惑就是所有的流都是以-1为结束标志符，C语言的文件流EOF也是-1，为什么不怕中间有个字节正好是-1呢？这里有篇文章说了一下这个问题：http://blog.csdn.net/jkler_doyourself/article/details/5645925。没有完全理解，但是-1是0xFFFFFFFF，而很多流读取的时候都&0xFF，测试如下：
@Test public void test3() { byte[] a = new byte[]{-1}; ByteArrayInputStream bis = new ByteArrayInputStream(a); System.out.println(bis.read()); }
　　-1读出来是255。问题的根本在于并不是说读取到-1，主要的判断还是是否结束了，即再取值是否能取到，或者是已知其是否结束。这个方法才是判断流是否结束了，返回-1。而其它情况&0xFF之后就不会表现成-1了，-1是0xFFFFFFFF。这也是一个比较重要的手段。当然实际上值并没有改变，因为你再强转成byte又回到了-1，这里返回int也就规避了这个问题，取了int的0~255范围，所以你能够通过使用read()!=-1来判断结尾，再通过强转回byte变成原有的值。我个人是这么理解的。如有错误，请指教一下。
查看全文

相关阅读:
【洛谷4657】[CEOI2017] Chase（一个玄学的树形DP）
Tarjan在图论中的应用（二）——用Tarjan来求割点与割边
 Tarjan在图论中的应用（一）——用Tarjan来实现强连通分量缩点
 jquery放大镜
 自定义上传按钮样式
 一些设计理论资料
 jquery滚动条
 全栈工程师到底有什么用（转）
巧用CSS文件愚人节恶搞(转)
仿双色球-随机产生7个数字

原文地址：https://www.cnblogs.com/lighten/p/7063161.html

Java之IO(九)其它字节流

1.前言

2.LineNumberInputStream

3.SequenceInputStream

4.StringBufferInputStream