1. 本周学习总结
**1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容。 **
2. 书面作业
将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。
**1.字符流与文本文件:使用 PrintWriter(写),BufferedReader(读) **
**1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号) **
**1.2 生成文件大小多少?分析该文件大小 **
- 生成文件的大小为84字节。
- 生成文件:
3
Carl Cracker|女|1987|12|15
Harry Hacker|男|1989|10|1
Tony Tester|女|1990|3|15
所以:数量3占1个字节,行末尾占2个字节,第一行为3个字节。
name:12个字节,sex:2个字节,birthday:8个字节,分隔符(4个):4个字节,行末尾:2个字节,第二行为28个字节。
name:12个字节,sex:2个字节,birthday:7个字节,分隔符(4个):4个字节,行末尾:2个字节,第二行为27个字节。
name:11个字节,sex:2个字节,birthday:7个字节,分隔符(4个):4个字节,行末尾:2个字节,第二行为26个字节。
**1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么? **
- 文件大小为0字节
- 因为当我们使用close()关闭之后存在于缓冲区之内的数据会被输出。但是此时我们没有使用close(),则将不能被存在缓冲区的数据输出,即会有数据丢失。
**2.缓冲流 **
**2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间 **
- 使用BufferedReader快。
- 因为BufferedReader是用于字符流中读取文本,缓冲各个字符。它使用到了缓冲区,缓冲的使用让它能够减少I/O操作的次数,所以速度要比Scanner快。而且BufferedReader的缓冲区的大小很大,也可以自己设置大小。
**2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因 **
- 参考:本题具体要求见流与文件实验任务书-题目1-2.1到2.3
- 速度有提升。
- 因为BufferedWriter是带有可以任意设定缓冲大小的缓冲区,它可以减少I/O操作的次数,提高效率,提升了速度。
**3.字符编码 **
**3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号) **
-
会,因为问题出在FileReader读取文件的过程中,虽然FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码。
-
解决办法:用InputStreamReader代替FileReader,
InputStreamReader isr=new InputStreamReader(fis,"UTF-8");
这样读取文件就会直接用UTF-8解码,将不会再出现乱码。
**3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。 **
- 参考:InputStreamReaderTest.java与教学PPT
**4.字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream **
**4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号) **
**4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么? **
-
生成的文件有92字节
-
第一行:name:12字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。
第二行:name:12字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。
第三行:name:11字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。 -
虽然输出的结果和题目1有些不一样,但是可以看出是比题目1大了。
-
因为这时候,中文的每一个字是3个字节,int型为4个字节,不再是一个数字一个字节了。
**4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。 **
在文件中的存储:
- Carl Cracker:
- 女
- 1987
- 12
- 15
- Harry Hacker
- 男
- 1989
- 10
- 1
- Tony Tester
- 女
- 1990
- 3
- 15
**4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录 **
- 参考:本题具体要求见流与文件实验任务书-题目1-1
**5.基本概念 **
**编写public static List<Student> readStudents(String fileName);
从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由。 **
- 实验文件:Students.txt
- 参考:TextFileTest目录下TextFileTest.java
- 使用到了BufferedInputStream类,使用缓冲区,提高运行速度。
- 因为本题使用的数据来自文件student.txt,所以需要使用FileInputStream类。
- 因为本题需要读UTF-8格式文件,所以需要进行转换,因此要使用到InputStreamReader类。
**6.选做:RandomAccessFile **
**6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号) **
**6.2 分析文件大小 **
-
生成的文件有92字节
-
第一行:name:12字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。
第二行:name:12字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。
第三行:name:11字节,sex:3个字节,year:4个字节,month:4个字节,day:4个字节,字符串标示符(共2个):4个字节,共31个字节。
**7.文件操作 **
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
**7.1 编写public static void findFile(String path,String filename)
函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号) **
**7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1) **
**7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。 **
- 参考代码:FindDirectories.java
- 参考:本题具体要求见流与文件实验任务书-题目2
**8.正则表达式 **
**8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号) **
**8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。 **
- 参考:本题具体要求见流与文件实验任务书-题目3
**8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。 **
- 正则表达式参考文章
3. 码云及PTA
**3.1. 码云代码提交记录 **
- 在码云的项目中,依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图