20191218 2021-2022-1-diocs第二周学习笔记
一、任务内容
- 自学教材第九章,提交学习笔记(10分)
本章是复习C语言中的文件操作内容,结构化从文本文件操作,二进制文件操作两个大内容考虑,以前可能只关注文本文件的操作,我们以后更多的是操作二进制文件。 文本文件中考虑字符读写,行读写,任意位置读写等 文件操作都有什么? 二进制文件和文本文件如何转换? 数据结构如何读写? ... - 知识点归纳以及自己最有收获的内容 (3分)
- 问题与解决思路(2分)
- 实践内容与截图,代码链接(3分)
- ...(知识的结构化,知识的完整性等,提交markdown文档,使用openeuler系统等)(2分)
二、教材内容归纳
(一)思维导图
(二)知识点整理
0.概述
- I/O库函数的作用、特点及其相对于系统调用的优势;
- I/O库函数的算法,包括fread、fwrite和fclose的算法,重点介绍了它们与read、write和close系统调用的交互
- I/O库函数的不同模式(包括字符模式、行模式、结构化记录模式和格式化IO操作)
- 文件流缓冲方案
- 阐释了有不同参数的函数以及如何使用stdarg宏访问参数。
1.I/O库函数的算法
-
fread()算法
(1)在第一次调用fread()时,FILE结构体的缓冲区是空的,fread()使用保存的文件描述符fd发出一个n = read(fd, fbuffer, BLKSIZE);
系统调用,用数据块填充内部的fbuf[]。然后,它会初始化fbu[]的指针、计数器和状态变量,以表明内部缓冲区中有一个数据块。接着,通过将数据复制到程序的缓冲区,尝试满足来自内部缓冲区的fread()调用。如果内部缓冲区没有足够的数据,则会再发出一个read()系统调用来填充内部缓冲区,将数据从内部缓冲区传输到程序缓冲区,直到满足所需的字节数(或者文件无更多数据)。将数据复制到程序的缓冲区之后,它会更新内部缓冲区的指针、计数器等,为下一个 fread()请求做好准备。然后,它会返回实际读取的数据对象数量。
(2)在随后的每次fread()调用中,它都尝试满足来自FILE结构体内部缓冲区的调用。当缓冲区变为空时,它就会发出read()系统调用来重新填充内部缓冲区。因此,fread()一方面接受来自用户程序的调用,另一方面向操作系统内核发出 read()系统调用。除了read()系统调用之外,所有fread()处理都在用户模式映像中执行。它只在需要时才会进入操作系统内核,并且以一种最高效匹配文件的方式进人。它会提供自动缓冲机制。
-
fwrite()算法
fwrite()算法与fread()算法相似,只是数据传输方向不同。最开始,FILE结构体的内部缓冲区是空的。在每次调用fwrite()时,它将数据写入内部缓冲区,并调整缓冲区的指针、计数器和状态变量,以跟踪缓冲区中的字节数。如果缓冲区已满,则发出 write()系统调用,将整个缓冲区写入操作系统内核。 -
fclose()算法
若文件以写的方式被打开,fclose()会先关闭文件流的局部缓冲区。然后,它会发出一个close(fd)系统调用来关闭FILE结构体中的文件描述符。最后,它会释放FILE结构体,并将FILE指针重置为NULL。
2.I/O库函数和系统调用的关系
-
系统调用
可以理解是操作系统为用户提供的一系列操作的接口(API),这些接口提供了对系统硬件设备功能的操作。这么说可能会比较抽象,举个例子,我们最熟悉的 hello world 程序会在屏幕上打印出信息。程序中调用了 printf() 函数,而库函数 printf 本质上是调用了系统调用 write() 函数,实现了终端信息的打印功能。 -
库函数
库函数可以理解为是对系统调用的一层封装。系统调用作为内核提供给用户程序的接口,它的执行效率是比较高效而精简的,但有时我们需要对获取的信息进行更复杂的处理,或更人性化的需要,我们把这些处理过程封装成一个函数再提供给程序员,更方便于程序员编码。 -
关系
库函数有可能包含有一个系统调用,有可能有好几个系统调用,当然也有可能没有系统调用,比如有些操作不需要涉及内核的功能。
系统调用实际上就是指最底层的一个调用,在linux程序设计里面就是底层调用的意思。面向的是硬件。而库函数调用则面向的是应用开发的,相当于应用程序的API。
在 fread()和 fwrite()的一些实现中,例如在GNU libc库中,如果请求的大小以BLKSIZE为单位,它们可以使用系统调用将以BLKSIZE为单位的数据直接从内核传输到用户指定的缓冲区。即便如此,使用IO库函数仍然需要其他的函数调用。因此,使用系统调用的程序实际上比使用I/O库函数的程序更高效。但是,如果不是以BLKSIZE为单位进行读/写,那么fread()和 fwrite()可能更高效。
3.I/O库模式
-
模式参数
fopen()中的模式参数可以指定为:"r"、"w"、"a",分别代表读、写、追加。
每个模式字符串可包含一个+号,表示同时读写,或者在写入、追加情况下,如果文件不存在则创建文件。- "r+":表示读/写,不会截断文件。
- "w+":表示读/写,但是会先截断文件;如果文件不存在,会创建文件。
- "a+":表示通过追加进行读/写;如果文件不存在,会创建文件。
-
字符模式
int fgetc(FILE *fp); //get a char from fp, cast to int int ungetc(int c, FILE *fp); //push a previously char got by fgetc() back to stream int fput(int c, FILE *fp); //put a char to fp
注意,fgetc()返回的是整数,而不是字符。这是因为它必须在文件结束时返回文件结束符。文件结束符通常是一个整数-1,将它与文件流中的任何字符区分开。
对于fp=stdin或stdout,可能会使用c=getchar(); putchar(c);来代替。对于运行时效来说,getchar()和putchar()通常不是getc()和 putc()的缩小版本。相反,可以将它们实现为宏,以避免额外的函数调用。
-
行模式
char *fgets(char *buf, int sizr, FILE *fp); //从fp中读取最多为一行(以 结尾)的字符 int fputs(char *buf, FILE *fp); //将buf中的一行写入fp中
当fp是stdin或stdout时,也可以使用以下函数,但它们并非fgets()和 fputs()的缩减版本。
gets (char *buf) ; //input line from stdin but without checking length
puts(char *buf) ; // write line to stdout
-
格式化I/O
FMT为格式字符串-
格式化输入
scanf (char *FMT, &items) ; //from stdin fscanf(fp, char *FMT, &items) ; //from file stream
-
格式化输出
printf(char *FMT, items); //to stdout fprintf(fp, char *FMT, items); //to file stream
-
-
内存中的转换函数
sscanf(buf,FMT,&items); //input from buf[ ] in memory sprintf(buf,FMT,items); //print to buf[ ] in memroy
注意,sscanf()和 sprintf()并非IO函数,而是内存中的数据转换函数。例如,atoi()是一个标准库函数,将一串ASCII数字转换成整数,但是大多数Unix/Linux系统没有itoA()函数,因为转换可由sprintf()完成,所以不需要它。
4.文件缓冲流
每个文件流都有一个FILE结构体,其中包含一个内部缓冲区。对文件流进行读写需要遍历FILE结构体的内部缓冲区。文件流可以使用三种缓冲方案中的一种。
-
无缓冲:从非缓冲流中写入或读取的字符将尽快单独传输到文件或从文件中传输。例如,文件流stderr通常无缓冲。到 stderr 的所有输出都会立即发出。
-
行缓冲:遇到换行符时,写人行缓冲流的字符以块的形式传输。例如,文件流stdout通常是行缓冲,逐行输出数据。
-
全缓冲:写入全缓冲流或从中读取的字符以块大小传输到文件或从文件传输。这是文件流的正常缓冲方案。
通过fopen()创建文件流之后,在对其执行任何操作之前,用户均可发出一个setvbuf(FTLE *stream,char *buf, int node, int size)
调用来设置缓冲区(buf)、缓冲区大小(size)和缓冲方案(mode),它们必须是以下一个宏: -
_IONBUF:无缓冲。
-
_IOLBUF:行缓冲。
-
_IOFBUF:全缓冲。
对于行缓冲流或全缓冲流,可用fflush(stream)立即清除流的缓冲区。
5.变参函数
目前,C语言和C++会强制执行类型检查,但这两种语言仍然允许参数数量可变的函数。这些函数必须至少使用一个参数进行声明,后跟3个点,如
int func(int m, int n ...) //n = last specified parameter
在函数内部,可以通过C语言库宏访问参数:
void va_start(va_list ap,last); // start param list from last parameter
type va_arg(va_list ap, type); // type = next parameter type
va_end(va_list ap); // clear parameter list
三、实践过程
(1)OpenEuler-20.03-LTS-SP2-x86的安装
首先在官网上下载对应版本镜像
![OpenEuler镜像下载官网](https://repo.openeuler.org/openEuler-20.03-LTS-SP2/ISO/x86_64/)
在命令行中输入如下命令进行sah256的生成
certutil -hashfile filename sha256
我们要就校验的文件名为openEuler-20.03-LTS-SP2-x86_64-dvd.iso
校验发现结果一致,文件完整。
后续在安装过程中网络设置出现问题,由于时间关系先在此占位,之后完成再接着进行记录。
(2)C语言文件操作
通过查找资料,我了解到C语言中没有输入输出语句,所有的输入输出功能都用 ANSI C提供的一组标准库函数来实现。
C语言文件操作部分知识整理思维导图
常见文件操作标准库函数整理
内容实验代码链接
文件内容显示(动手实现cat命令)
文件内容写入加显示
将数据格式化写入文件
以十进制显示文件内容
文件的复制
将整数以二进制形式存入文件
文件状态检查