一、字符流和字节流的区别
拿一下上一篇文章的例子:
1 package com.demo.io; 2 3 import java.io.File; 4 import java.io.FileReader; 5 import java.io.FileWriter; 6 import java.io.Reader; 7 import java.io.Writer; 8 9 public class FileReaderWriterTest { 10 11 public static void main(String[] args) throws Exception{ 12 File file = new File("D:/Files/writer.txt"); 13 Writer out = new FileWriter(file); 14 // 声明一个String类型对象 15 String str = "Hello World!!!"; 16 out.write(str); 17 out.close(); 18 19 //读文件操作 20 Reader in = new FileReader(file); 21 // 开辟一个空间用于接收文件读进来的数据 22 char c0[] = new char[1024]; 23 int i = 0; 24 // 将c0的引用传递到read()方法之中,同时此方法返回读入数据的个数 25 i = in.read(c0); 26 in.close(); 27 if(i==-1){ 28 System.out.println("文件中无数据"); 29 }else{ 30 System.out.println(new String(c0,0,i)); 31 } 32 } 33 }
第17行"out.close()"注释掉可以看一下效果,"writer.txt"一定是空的,控制台上输出的是"文件中无数据",说明一下原因。
字符流和字节流非常相似,但也有区别,从网上找了一张图:
从图上看,字符流和字节流最大的区别在于,字节流在操作时本身不会用到缓冲区(内存),是文件本身直接操作的,而字符流操作时使用了缓冲区,通过缓冲区再操作文件。这也解释了上面程序的那个问题,为什么不对资源进行close()就无法写入文件的原因。因为在关闭字符流时会强制性地将缓冲区中的内容进行输出,但是如果没有关闭,缓冲区中的内容是无法输出的。
什么是缓冲区?简单理解,缓冲区就是一块特殊的内存区域。为什么要使用缓冲区?因为如果一个程序频繁操作一个资源(文件或数据库),则性能会很低,为了提升性能,就可以将一部分数据暂时读入到内存的一块区域之中,以后直接从此区域读取数据即可,因为读取内存的速度要快于读取磁盘中文件内容的速度。
在字符流的操作中,所有的字符都是在内存中形成的,在输出前会将所有的内容暂时保存在内存之中,所以使用了缓冲区。
如果不想在关闭时再输出字符流的内容也行,使用Writer的flush()方法就可以了。
二、字符流的原理
Java支持字符流和字节流,字符流本身就是一种特殊的字节流,之所以要专门有字符流,是因为Java中有大量对于字符的操作,所以专门有字符流。字节流和字符流的转换是以InputStreamReader和OutputStreamWriter为媒介的,InputStreamReader可以将一个字节流中的字节解码成字符,OutputStreamWriter可以将写入的字符编码成自节后写入一个字节流。
InputStreamReader中的解码字节,是由StreamDecoder完成的,StreamDecoder是Reader的实现类,定义在InputStreamReader的开头:
public class InputStreamReader extends Reader { private final StreamDecoder sd;
同样,OutputStreadWriter中的编码字节,是由StreamEncoder完成的,StreamEncoder是Writer的实现类,定义在OutputStreamWriter的开头:
public class OutputStreamWriter extends Writer { private final StreamEncoder se;
假如不对StreamDecoder和StreamEncoder指定Charset编码格式,将使用本地环境中的默认字符集,例如中文环境中将使用GBK编码。
InputStreamReader有两个主要的构造函数:
1、InputStreamReader(InputStream in)
2、InputStreamReader(InputStream in, String charsetName)
OutputStreamWriter也有两个主要的构造函数:
1、OutputStreamWriter(OutputStream out)
2、OutputStreamWriter(OutputStream out, String charsetName)
从构造函数就可以看出,字符流是利用字节流实现的。InputStreamReader和OutputStreamWriter的两个构造函数的区别在于,一个是使用的默认字符集,一个可以指定字符集名称。其实FileReader和FileWriter可以看一下源码,很简单,只有构造函数,里面都是分别根据传入的文件绝对路径或者传入的File实例,new出FileInputStream和FileOutputStream,在调用InputStreamReader和OutputStreamWriter的构造方法。这么做,帮助开发者省去了实例化FileInputStream和FileOutputStream的过程,让开发者可以直接以fileName或file作为构造函数的参数。
三、BufferedWriter、BufferedReader
为了达到最高的效率,避免频繁地进行字符与字节之间的相互转换,最好不要直接使用FileReader和FileWriter这两个类进行读写,而使用BufferedWriter包装OutputStreamWriter,使用BufferedReader包装InputStreamReader。同样,在D盘Files文件夹下没有"buffered"这个文件,代码示例为:
package com.demo.io; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileReader; import java.io.FileWriter; import java.io.Reader; import java.io.Writer; public class BufferedWriterReaderTest { public static void main(String[] args) throws Exception{ File file = new File("D:/Files/buffered.txt"); Writer writer = new FileWriter(file); BufferedWriter bw = new BufferedWriter(writer); bw.write("1234 "); bw.write("2345 "); bw.write("3456 "); bw.write(" "); bw.write("4567 "); bw.close(); writer.close(); if (file.exists() && file.getName().endsWith(".txt")){ Reader reader = new FileReader(file); BufferedReader br = new BufferedReader(reader); String str = null; while ((str = br.readLine())!= null){ System.out.println(str); } reader.close(); br.close(); } } }
运行一下,首先D盘Files文件夹下多出了"buffered.txt"这个文件,文件中的内容为:
然后看一下控制台的输出结果:
1234 2345 3456 4567
没什么问题,输出了文件中的内容。注意两点:
1、利用BufferedWriter进行写操作,写入的内容会放在缓冲区内,直到遇到close()、flush()的时候才会将内容一次性写入文件。另外注意close()的顺序,一定要先关闭BufferedWriter,再关闭Writer,不可以倒过来,因为BufferedWriter的写操作是通过Writer的write方法写的,如果先关闭Writer的话,就无法将缓冲区内的数据写入文件了,会抛出异常。
2、利用BufferedReader进行读操作,不可以用父类Reader指向它,因为readLine()这个方法是BufferedReader独有的,readLine()的作用是逐行读取文件中的内容。