zoukankan      html  css  js  c++  java
  • 第九周学习总结

    信息安全系统设计基础第九周学习总结

    【学习时间:4小时】

    【学习内容:第十章——系统级I/O】

    一、学习过程

    1.所有的I/O设备都被模型化为文件,所有的输入输出都被当作对对应文件的读写来执行。unix内核引出一个简单的应用接口——unixI/O来统一地执行I/O操作。

    2.unix系统中输入输出的操作:

    • 打开文件:一个应用程序通过要求内核打开相应的文件,来宣告它想要访问一个I/O设备,内核返回一个小的非负整数,叫做描述符。unix系统创建每个进程的时候都有三个打开的文件:标准输入;标准输出,标准错误。
    • 改变当前的文件位置。对于每个打开的文件,内核保持着一个文件位置k(从文件开头起始的字节偏移量)。应用程序可以通过执行seek操作,显式地设置当前文件位置为K。
    • 读写文件。读操作就是从文件拷贝n>0个字节到存储器,从当前文件位置k开始,然后将k增加到k+n。当k>=m时,会触发EOF条件。
    • 关闭文件。应用通知内核关闭这个文件;作为响应,内核释放文件打开时创建的数据结构,并将这个描述符恢复到可用的描述符池当中。

    3.进程通过调用open函数打开一个已存在的文件或者是创建一个新文件。

    • 代码:

      int open(char *filename,int flags,mode_t mode);

    • 作用:将filename转换为一个文件描述符,并且返回描述符数字(当前进程没有打开的最小描述符数字)。

    • 参数意义:
      • flags:指明了进程打算如何访问这个文件(只读,只写,可读可写)
      • mode:指明了新文件的访问权限位。作为上下文的一部分,,每个进程都有一个umask;当进程通过带某个带mode参数的open函数用来创建一个新文件的时候,文件的访问权限位被设置为mode & ~umask。

    4.读写文件

    • 代码:
      • (读)ssize_t read(int fd,void *buf,size_t n);//成功则返回n;EOF返回0;出错返回-1
      • (写)ssize_t write(int fd,const void *buf,size_t n);
    • 含义:read函数从当前描述符为fd的文件位置拷贝最多n个字节到存储器位置buf。wirte函数与之相反。
    • 注意:ssizet和sizet的区别?【前者是int型,可以是负数;后者是unsigned int,是非负数。】
    • 例外:某些情况下,这两个函数返回的值比应用程序要求的(n)要少;并不是出现了错误。原因可能如下:
      • 读时遇到EOF:可以读到的实际值比要求的少;
      • 从终端读取文本行:如果打开的文件是与终端相关联的,那么每个read函数将一次传送一个文本行,不足值等于文本行大小;
      • 读和写网络套接字

    5.RIO包

    • 目的:有效处理不足值的问题;
    • 类型:
      • 无缓冲的输入输出函数:直接在存储器和应用程序之间传送数据;
      • 有缓冲的输入输出函数:高效、安全(可以交叉调用)地从文件中读取文本行和二进制数据;这些内容储存在应用及缓冲区中。

    6.RIO无缓冲的输入输出函数

    ssize_t rio_writen(int fd,const void *usrbuf,size_t n);
    
    ssize_t rio_writen(int fd,const void *usrbuf,size_t n);
    

    rio__writen函数遇到EOF的时候返回0;

    rio__readn遇到EOF的时候返回不足值(即 不足n的那个部分的字节数)。

    对同一个描述符,可以任意交错地调用rioreadn和riowriten函数。

    7.RIO带缓冲的输入输出函数

    • 意义:函数从内部缓冲区中拷贝一个文本行,当缓冲区变空的时候,会自动地调用read重新填满缓冲区。
    • 主要的函数:

      ssizet rioreadlineb(rio_t *rp,void *usrbuf,size_t maxlen);

      rioreadnb(riot *rp,void *usrbuf,size_t n) ;

      rioreadinitb(riot *rp,int fd);

    • 补充说明:每打开一个描述符都会调用一次该函数,它将描述符fd和地址rp处的类型为riot的缓冲区联系起来。对同一描述符,rioreadnb和rio_readlineb的调用可以交叉进行。

    8.RIO读程序的核心——rio_read函数

    源代码如下:

    static ssize_t rio_read(rio_t *rp,char *usrbuf,size_t n)
    {
        int cnt;
        while(rp->rio_cnt<=0)
        {
            rp->rio_cnt=read(rp->rio_fd,rp->rio_buf,sizeof(rp->rio_buf));
            if(rp->rio_cnt<0)//排除文件读不出数据的情况
            {
                if(error != EINTR)
                {
                    return -1;
                }
            }
            else if(rp->rio_cnt=0)
                return 0;
            else 
                rp->rio_bufptr = rp->rio_buf;
        }
        cnt=n;
        if(rp->rio_cnt<n)
            cnt=rp->rio_cnt;//以上三步,将n与rp->rio_cnt中较小的值赋给cnt
        memcpy(usrbuf,rp->rio_bufptr,cnt);
        rp->rio_bufptr+=cnt;
        rp->rio_cnt-=cnt;
        return cnt;
    }
    
    • 解读:当调用rioread函数要求读n个字节的时候,读缓冲区内有rp->riocnt个字节未读字节。如果缓冲区为空,会通过read函数填满它。它收到一个不足值并不是错误,只不过是缓冲区只填充了一部分。

    9.读取文件元数据

    函数:

    #include <unistd.h>
    #include <sys/stat.h>
    int stat(cost char *filename,struc sta *buf);
    int fstat(int fd,struct stat *buf);
    
    • 应用程序能够通过调用stat和fstat函数,检索到关于文件的信息(元数据)。stat函数以一个文件的名字作为输入,并填写stat结构体的数据结构中的各个成员;fstat函数相似,只不过以文件描述符作为输入。

    10.共享文件

    文件共享方式

    • 没有共享文件,每个描述符对应一个不同文件。
    • 多个描述符也可以通过不同的文件表表项来引用同一个文件。(每个描述符都有自己的文件位置,所以对不同描述符的读操作可以从文件的不同位置获取数据)
    • 父子进程可以共享文件。子进程会有一个父进程描述符表项的副本,父子进程打开相同的文件表集合,共享相同的文件位置。在内核删除相应的文件表表项之前,父子进程都必须关闭相应的描述符表项。

    11.课后题

    • 假设磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么,下列程序的输出是什么?

      #include "csapp.h"
      int main()
      {
          int fd1,fd2;
          char c;
          fd1=Open("foobar.txt",O_RDONLY,0);
          fd2=Open("foobar.txt",O_RDONLY,0);
          Read(fd1,&c,1);
          Read(fd2,&c,1);
          printf("c=%c
      ",c);
          exit(0);
      }
      

    【描述符fd1和fd2都有各自的打开文件表表项,所以有它们各自的文件位置。则fd2打开文件读出的第一个字母还是f。】

    • 就像前面那样,磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么,下列程序的输出是什么?

      include "csapp.h"

      int main() { int fd; char c; fd=Open("foobar.txt",O_RDONLY,0); if(Fork()==0) { Read(fd,&c,1); exit(0); } Wait(NULL); Read(fd,&c,1); printf("c=%c ",c); exit(0); } 【父子进程共享相同的文件表表项,因此依次读取的是“f”和“o”。输出为o。】

    二、学习心得

    本章有很多代码需要理解(因为主要内容都是代码驱动的,只有读懂了代码才可以理解;比如:只有知道了rio_read的含义,才理解为什么RIO包更优秀),所以,虽然内容少,但是还是不能掉以轻心;通过注释和请教同学,对理解也有所推动。

  • 相关阅读:
    [LeetCode] Valid Palindrome
    [LeetCode] Word Ladder II(bfs、dfs)
    [LeetCode] Word Ladder
    [LeetCode] Longest Consecutive Sequence(DP)
    [LeetCode] Binary Tree Maximum Path Sum(递归)
    [LeetCode] Search in Rotated Sorted Array II
    hadoop streaming map输入文件路径获取
    LeetCode 4. 寻找两个正序数组的中位数
    剑指 Offer 56
    LeetCode 260.只出现一次的数字 III
  • 原文地址:https://www.cnblogs.com/shadow135211/p/4947912.html
Copyright © 2011-2022 走看看