第十章 系统级I/O
注:因上周主要是学习、总结教材第十章的知识点和练习教材上的代码,本周则主要是精化上周所学内容、总结老师上节课所讲的跟进程有关的知识点及代码。
一、教材第十章知识点总结
(一)Unix I/O
Unix I/O:简单低级的应用接口,使所有输入输出都以统一的方式执行。
- 打开文件。一个应用程序通过要求内核打开相应文件,来宣告它想要访问一个I/O设备,内核返回描述符(小的非负整数)。每个进程开始时都有三个打开的文件:标准输入(描述符为0)、标准输出(描述符为1)、标准错误(描述符为2)。
- 改变当前的文件位置。每个打开的文件内核保持着一个文件位置k,初始为0。
- 读写文件。读操作就是从文件拷贝n>0个字节到存储器,从当前文件位置k开始将k增加到k+n。
- 关闭文件。将描述符恢复到可用的描述池中。
(二)打开和关闭文件
1. open:进程通过调用open函数来打开一个已存在的文件或创建一个新文件。
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
int open(char *filename, int flags, mode_t mode);
返回:若成功则为新文件描述符,若出错则为-1。
open函数将filename转换为一个文件描述符,并返回描述符数字。返回的描述符是在进程中当前没有打开的最小描述符。
flags参数指明进程打算如何访问这个文件:
- O_RDONLY:只读
- O_WRONLY:只写
- O_RDWR:可读可写
以只读的方式打开一个已存在的文件:
fd = Open("foo.txt, O_RDONLY, 0");
打开一个已存在的文件,并在后面添加一些数据:
fd = Open("foo.txt, O_WRONLY|O_APPEND, 0");
2. close:进程通过调用close函数关闭一个打开的文件。
#include<unistd.h>
int close(int fd);
返回:若成功则为0,若出错则为-1。
关闭一个已关闭的描述符会出错。
(三)读和写文件
1. read和write函数:应用程序通过分别调用read和write函数来执行输入和输出。
#include<unistd.h>
ssize_t read(int fd, void *buf, size_t n);
返回:若成功则为读的字节数,若EOF则为0,若出错则为-1。
ssize_t write(int fd, const void *buf, size_t n);
返回:若成功则为写的字节数,若出错则为-1。
- read函数从描述符为fd的当前位置拷贝最多n个字节到存储器位置buf。
- write函数从存储器位置buf拷贝至多n个字节到描述符fd的当前文件位置。
注:"csapp.h"是《深入理解计算机系统》这本书写的头文件,运行代码时需要将该头文件下载并移到/usr/include中。
2. ssize_ t 和 size_t 的区别
- size_t:read函数的输入参数,定义为unsigned int
- ssize_t:read函数的返回值,定义为int。因为出错时必须返回-1。
(四)用RIO包健壮地读写
1. RIO包:自动处理不足值,提供两类不同的函数
- 无缓冲的输入输出函数:直接在存储器和文件之间传送数据。
- 带缓冲的输入函数:高效地从文件中读取文本行和二进制数据。
2. RIO的无缓冲的输入输出函数
应用程序通过调用rio_ readn和rio_ writen函数可以在存储器和文件之间直接传送数据。
#include"csapp.h"
ssize_ t rio_ readn(int fd, void *usrbuf, size_t n);
ssize_ t rio_ writen(int fd, void *usrbuf, size_t n);
返回:若成功则为传送的字节数,若EOF则为0(只对rio_ readn而言),若出错则为-1。
rio_ readn函数从描述符fd的当前文件位置最多传送n个字节到存储器位置usrbuf。rio_ writen函数从存储器位置usrbuf传送n个字节到描述符fd。
3. RIO的带缓冲的输入函数
一个文本行就是一个由换行符结尾的ASCII码字符序列。
调用包装函数rio_ readlineb,从一个内部读缓冲区拷贝一个文本行,当缓冲区变空时会自动调用read重新填满缓冲区。
#include"csapp.h"
void rio_ readlineb(rio_t *rp, int fd);
ssize_ t rio_ readlineb(rio_t *rp, void *usrbuf, size_t maxlen);
ssize_ t rio_ readnb(rio_t *rp, void *usrbuf, size_t n);
返回:若成功则为读的字节数,若EOF则为0,若出错则为-1。
- rio_ readlineb函数从文件rp读出一个文本行(包括结尾的换行符),将它拷贝到存储器位置usrbuf,并用空(零)字符结束这个文本行。rio_ readlineb函数最多读maxlen-1个字节,余下一个字符留给结尾的空字符。
- rio_ readnb函数从文件rp最多读n个字节到存储器位置usrbuf。对同一描述符,对rio_ readlineb和rio_ readnb的调用可以任意交叉进行。
(五)读取文件元数据
1. 应用程序能通过调用stat和fstat函数检索到关于文件的信息(元数据)。
#include<unistd.h>
#include<sys/stat.h>
int stat(const char *filename, struct stat *buf);
int fstat(int fd, struct stat *buf);
返回:若成功则为0,若出错则为-1。
2. stat数据结构成员:st_ mode、st_ size……
st_ size成员包含了文件的字节数大小,st_ mode成员编码了文件访问许可位和文件类型。
(六)共享文件
1. 内核用三个相关的数据结构来表示打开的文件:
- 描述符表
- 文件表
- v-node表
多个描述符可以通过不同的文件表表项来引用同一个文件。每个描述符都有它自己的文件位置,所以对不同描述符的读操作可以从文件的不同位置获取数据。
调用fork后,子进程有一个父进程描述符表的副本,共享相同的文件位置。在内核删除相应文件表项之前,父子进程必须都关闭它们的描述符。
(七)I/O重定向
I/O重定向操作符:允许用户将磁盘文件和标准输入输出联系起来。I/O重定向可使用dup2函数工作。
#include<unistd.h>
int dup2(int oldfd, int newfd);
返回:若成功则为非负的描述符,若出错则为-1。
dup2函数拷贝描述符表表项oldfd到描述符表表项newfd,覆盖描述符表表项newfd以前的内容。如果newfd已经打开了,dup2会在拷贝oldfd之前关闭newfd。
(八)标准I/O
标准I/O库提供打开和关闭文件的函数(fopen和fclose)、读和写字节的函数(fread和fwrite)、读和写字符串的函数(fgets和fputs),以及复杂的格式化的I/O函数(scanf和printf)。
(九)错误处理
1. 错误处理包装函数
定义:给定某个基本的系统级函数foo,定义一个有相同参数、只不过开头字母大写的包装函数Foo。包装函数调用基本函数并检查错误。如果包装函数发现错误,则打印一条信息并终止进程。否则它返回到调用者。
2. Unix系统中的错误处理
三种风格:
- Unix风格的错误处理:遇到错误返回-1,成功则返回有用的结果。
- Posix风格的错误处理:只用返回值来表明成功(0)或者失败(非0)
- DNS风格的错误处理:失败时返回NULL指针,并设置全局变量h_errno
3. 错误处理包装函数
-
Unix风格:
pid_t Wait(int *status) { pid_t pid; if(pid = wait(status)<0) unix_error("wait error"); return pid; }
-
Posix风格:
void Pthread_detach(pthread_t tid) { int rc; if(rc=pthread_detach(tid) != 0) posix_error(rc,"Pthread_detach error"); }
-
DNS风格:
struct hostent *Gethostbyname(const char *name) { struct hostname *p; if((p = gethostbyname(name)) == NULL) dns_error("Gethostbyname error"); return p; }
二、课堂知识点总结
(一)进程的定义
1. 进程:一个执行中的程序的实例。系统中每个程序都运行在某个进程的上下文中。
2. 进程提供给应用程序的关键抽象
- 一个独立的逻辑控制流
- 一个私有的地址空间
(二)并发
1. 并发的定义:多个流并发的执行的一般现象称为并发(一段时间内P1、P2交替运行)
2. 并行流:并发流的真子集,两个流并发地运行在不同的处理器核或计算机上,并行地运行且并行地执行。
(三)进程控制
1. 获取进程ID
#include<sys/types.h>
#include<unistd.h>
pit_t getpid(void);//返回调用进程的PID
pit_t getppid(void);//返回它的父进程的PID
2. 创建和终止进程
进程三种状态:
- 运行
- 停止(进程的执行被挂起且不会被调度)
- 终止(原因:①收到一个默认行为是终止进程的信号 ②从主程序返回 ③调用exit函数)
父进程通过调用fork函数创建一个新的运行子程序
#include<sys/types.h>
#include<unistd.h>
pid_t fork(void);
子进程返回0,父进程返回子进程的PID(大于0),出错返回-1。
注:父进程调用fork时,子进程可以读写父进程中打开的任何文件,父进程和新建的子进程最大的区别在于他们有不同的PID。
3. fork函数
特点:
- 只被调用一次,返回两次。一次在调用父进程中,返回子进程的PID;一次在新建的子进程中,返回0。
- 并发执行:父进程和子进程是并发运行的独立进程,内核能以任意方式交替执行它们逻辑控制流中的指令。
- 相同但独立的地址空间。
- 共享文件
4. execvp函数
定义:执行文件函数。该函数调用进程时会将原来的覆盖。
三、参考资料
- 《深入理解计算机系统》
- 《嵌入式Linux应用程序开发标准教程》
四、心得体会
本周的学习任务主要是精化并复习上周所学的教材第十章系统级I/O内容,巩固知识点。同时总结老师上课所讲的进程这部分的概念,尤其是fork函数、execvp函数的具体用法,进一步理解代码运行的过程和结果。因为结合实践,亲手打代码并运行加深了我对本章内容的理解,对于之后第八章的学习打下基础,总的来说收益颇丰。感谢老师的悉心教导!