信息安全系统设计基础第九周学习总结
【学习时间:4小时】
【学习内容:第十章——系统级I/O】
一、学习过程
1.所有的I/O设备都被模型化为文件,所有的输入输出都被当作对对应文件的读写来执行。unix内核引出一个简单的应用接口——unixI/O来统一地执行I/O操作。
2.unix系统中输入输出的操作:
- 打开文件:一个应用程序通过要求内核打开相应的文件,来宣告它想要访问一个I/O设备,内核返回一个小的非负整数,叫做描述符。unix系统创建每个进程的时候都有三个打开的文件:标准输入;标准输出,标准错误。
- 改变当前的文件位置。对于每个打开的文件,内核保持着一个文件位置k(从文件开头起始的字节偏移量)。应用程序可以通过执行seek操作,显式地设置当前文件位置为K。
- 读写文件。读操作就是从文件拷贝n>0个字节到存储器,从当前文件位置k开始,然后将k增加到k+n。当k>=m时,会触发EOF条件。
- 关闭文件。应用通知内核关闭这个文件;作为响应,内核释放文件打开时创建的数据结构,并将这个描述符恢复到可用的描述符池当中。
3.进程通过调用open函数打开一个已存在的文件或者是创建一个新文件。
-
代码:
int open(char *filename,int flags,mode_t mode);
-
作用:将filename转换为一个文件描述符,并且返回描述符数字(当前进程没有打开的最小描述符数字)。
- 参数意义:
- flags:指明了进程打算如何访问这个文件(只读,只写,可读可写)
- mode:指明了新文件的访问权限位。作为上下文的一部分,,每个进程都有一个umask;当进程通过带某个带mode参数的open函数用来创建一个新文件的时候,文件的访问权限位被设置为mode & ~umask。
4.读写文件
- 代码:
- (读)ssize_t read(int fd,void *buf,size_t n);//成功则返回n;EOF返回0;出错返回-1
- (写)ssize_t write(int fd,const void *buf,size_t n);
- 含义:read函数从当前描述符为fd的文件位置拷贝最多n个字节到存储器位置buf。wirte函数与之相反。
- 注意:ssizet和sizet的区别?【前者是int型,可以是负数;后者是unsigned int,是非负数。】
- 例外:某些情况下,这两个函数返回的值比应用程序要求的(n)要少;并不是出现了错误。原因可能如下:
- 读时遇到EOF:可以读到的实际值比要求的少;
- 从终端读取文本行:如果打开的文件是与终端相关联的,那么每个read函数将一次传送一个文本行,不足值等于文本行大小;
- 读和写网络套接字
5.RIO包
- 目的:有效处理不足值的问题;
- 类型:
- 无缓冲的输入输出函数:直接在存储器和应用程序之间传送数据;
- 有缓冲的输入输出函数:高效、安全(可以交叉调用)地从文件中读取文本行和二进制数据;这些内容储存在应用及缓冲区中。
6.RIO无缓冲的输入输出函数
ssize_t rio_writen(int fd,const void *usrbuf,size_t n);
ssize_t rio_writen(int fd,const void *usrbuf,size_t n);
rio__writen函数遇到EOF的时候返回0;
rio__readn遇到EOF的时候返回不足值(即 不足n的那个部分的字节数)。
对同一个描述符,可以任意交错地调用rioreadn和riowriten函数。
7.RIO带缓冲的输入输出函数
- 意义:函数从内部缓冲区中拷贝一个文本行,当缓冲区变空的时候,会自动地调用read重新填满缓冲区。
-
主要的函数:
ssizet rioreadlineb(rio_t *rp,void *usrbuf,size_t maxlen);
rioreadnb(riot *rp,void *usrbuf,size_t n) ;
rioreadinitb(riot *rp,int fd);
- 补充说明:每打开一个描述符都会调用一次该函数,它将描述符fd和地址rp处的类型为riot的缓冲区联系起来。对同一描述符,rioreadnb和rio_readlineb的调用可以交叉进行。
8.RIO读程序的核心——rio_read函数
源代码如下:
static ssize_t rio_read(rio_t *rp,char *usrbuf,size_t n)
{
int cnt;
while(rp->rio_cnt<=0)
{
rp->rio_cnt=read(rp->rio_fd,rp->rio_buf,sizeof(rp->rio_buf));
if(rp->rio_cnt<0)//排除文件读不出数据的情况
{
if(error != EINTR)
{
return -1;
}
}
else if(rp->rio_cnt=0)
return 0;
else
rp->rio_bufptr = rp->rio_buf;
}
cnt=n;
if(rp->rio_cnt<n)
cnt=rp->rio_cnt;//以上三步,将n与rp->rio_cnt中较小的值赋给cnt
memcpy(usrbuf,rp->rio_bufptr,cnt);
rp->rio_bufptr+=cnt;
rp->rio_cnt-=cnt;
return cnt;
}
- 解读:当调用rioread函数要求读n个字节的时候,读缓冲区内有rp->riocnt个字节未读字节。如果缓冲区为空,会通过read函数填满它。它收到一个不足值并不是错误,只不过是缓冲区只填充了一部分。
9.读取文件元数据
函数:
#include <unistd.h>
#include <sys/stat.h>
int stat(cost char *filename,struc sta *buf);
int fstat(int fd,struct stat *buf);
- 应用程序能够通过调用stat和fstat函数,检索到关于文件的信息(元数据)。stat函数以一个文件的名字作为输入,并填写stat结构体的数据结构中的各个成员;fstat函数相似,只不过以文件描述符作为输入。
10.共享文件
文件共享方式
- 没有共享文件,每个描述符对应一个不同文件。
- 多个描述符也可以通过不同的文件表表项来引用同一个文件。(每个描述符都有自己的文件位置,所以对不同描述符的读操作可以从文件的不同位置获取数据)
- 父子进程可以共享文件。子进程会有一个父进程描述符表项的副本,父子进程打开相同的文件表集合,共享相同的文件位置。在内核删除相应的文件表表项之前,父子进程都必须关闭相应的描述符表项。
11.课后题
-
假设磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么,下列程序的输出是什么?
#include "csapp.h" int main() { int fd1,fd2; char c; fd1=Open("foobar.txt",O_RDONLY,0); fd2=Open("foobar.txt",O_RDONLY,0); Read(fd1,&c,1); Read(fd2,&c,1); printf("c=%c ",c); exit(0); }
【描述符fd1和fd2都有各自的打开文件表表项,所以有它们各自的文件位置。则fd2打开文件读出的第一个字母还是f。】
-
就像前面那样,磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么,下列程序的输出是什么?
include "csapp.h"
int main() { int fd; char c; fd=Open("foobar.txt",O_RDONLY,0); if(Fork()==0) { Read(fd,&c,1); exit(0); } Wait(NULL); Read(fd,&c,1); printf("c=%c ",c); exit(0); } 【父子进程共享相同的文件表表项,因此依次读取的是“f”和“o”。输出为o。】
二、学习心得
本章有很多代码需要理解(因为主要内容都是代码驱动的,只有读懂了代码才可以理解;比如:只有知道了rio_read的含义,才理解为什么RIO包更优秀),所以,虽然内容少,但是还是不能掉以轻心;通过注释和请教同学,对理解也有所推动。