zoukankan      html  css  js  c++  java
  • 信息安全系统设计基础第九周学习总结

    第十章 系统级I/O

    10.1 Unix I/O

    1. 一个unix文件就是一个m字节的序列(B0B1B2...Bm-1)。所有的IO设备,如网络,磁盘,终端,都被模型化为文件,而所有的输入和输出都被当作对相应文件的读和写来执行。 2、所有的输入和输出都被当作统一的方式来处理:

      1)打开文件。一个应用程序通过要求内核打开相应的文件,来宣告它想要访问一个IO设备。内核返回一个小的非负整数,叫做描述符,它在后续对此文件的所有操作中标识这个文件。内核记录这个打开文件的所有信息,而应用程序只需记住这个描述符。

      Unix创建的每个进程开始都有三个打开的文件:标准输入(描述符为0),标准输出(描述符1),标准错误(描述符为2)。头文件unistd.h中定义了相关常量。

      2)改变当前的位置。内核保持一个文件位置k,对于每个打开文件,初始为0。这个文件位置是从文件开头起始的字节偏移量。

      3)读写文件。读操作是从文件拷贝n>0个字节到存储器,从当前文件位置k开始,然后将k增加到k+n。写操作是从存储器拷贝n>0个字节到文件,从当前文件位置k开始,然后更新k。

      4)关闭文件。内核释放文件打开时创建的数据结构,并恢复描述符到可获得描述符池中。

    10.2 打开和关闭文件

    1. 进程是通过调用open函数来打开一个已存在的文件或是创建一个新文件

       #include <sys/types.h>
       #include <sys/stat.h>
       #include <fcntl.h>
       int open(char *filename, int flags, mode_t mode);
                     返回:若成功则为新文件描述符,若出错则为-1。
      
    2. Flag参数指明了进程打算如何访问这个文件:

       O_RDONLY:只读
       O_WRONLY:只写
       O_RDWR:可读可写。
      

    3. Mode参数指明了新文件的访问权限位。通过调用umask函数设置。

    4. Close函数关闭文件。

      #include <unistd.h>
      int close(int fd);
                      返回:若成功则0,若出错则为-1。
      

      关闭一个已关闭的描述符会出错。

    10.3 读和写文件

    #include <unistd.h>

    ssize_t read(int fd, void *buf, size_t n);

                         返回:若成功则为读的字节数,若EOF则为0,若出错则为-1。
    

    ssize_t write(int fd, const void *buf, size_t n);

                         返回:若成功则为写的字节数,若出错则为-1。
    

    某些情况下,原始的read,write传送的字节比应用程序要求的要少,这些不足值(short count)不一定是错误(比如read函数参数要读5个字节,结果只读了3个字节,即小于5),下面的情况下将可能发生不足值:

    1)读时遇到EOF。
    2)从终端读文本行。
    3)读和写网络套接字。
    

    为了避免不足值问题(健壮程序的需求,如Web服务器这样的网络应用),就需要通过反复调用read和write处理不足值。

    10.4 用RIO包壮健地读写

    RIO包会自动处理不足值。提供了两类不同的函数:

    • 无缓冲的输入输出函数

    • 带缓冲的输入函数

    1.无缓冲的输入输出函数

    通过调用rioreadn和riowriten函数,应用程序可以在存储器和文件之间直接传送数据。

     #include “csapp.h”
     ssize_t rio_readn (int fd, void *usrbuf, size_t n);
     ssize_t rio_writen (int fd, void *usrbuf, size_t n);
                              返回:若成功则为传送的字节数,若EOF则为0(只对rio_readn而言),若出错则为-1。
    

    2.带缓冲的输入函数

    1)文本行:一个由换行符结尾的ACSII码字符序列。Unix中换行符( )ACSII码换行符(LF)数字值均为0x0a。

    2)包装函数(rio_readlineb):

    从内部读缓冲区拷贝一个文件行,当缓冲区为空时,自动调用read填满缓冲区。

    3)rio_readnb:

    从和rio_readlineb一样的读缓冲区中传送原始字节。

     #include “csapp.h”
     void rio_readinitb(rio_t *rp, int fd)
                              返回:无
     ssize_t rio_readlineb (rio_t *rp,void *usrbuf, size_t n);
     ssize_t rio_readn (rio_t *rp, void *usrbuf, size_t n);
                              返回:若成功则为读的字节数,若EOF则为0,若出错则为-1。
    

    10.5 读取文件元数据

    1. 元数据:应用程序能够通过调用stat和fstat函数,检索到关于关于文件的信息,如创建时间,修改时间,metadata。

       #include <unistd.h>
       #include <sys/stat.h>
       int stat(const char *filename, struct stat *buf);
       int fstat(int fd, struct stat *buf);
                            返回: 若成功则为0,若出错则为-1.
      

      Stat函数以一个文件名作为输入,ftast以文件描述符作为输入。

                  

    1. 函数是线程安全的:它在同一个描述符上可以被交替地调用。

    10.6 共享文件

    1. 对于内核而言,文件文件和二进制文件毫无区别。

    2. 共享文件

    内核用三种相关的数据结构来表示打开的文件。

    1)描述符表:它的表项由进程打开的文件描述符来索引的。每个打开的描述符表项指向文件表中的一个选项。
    2)文件表:打开文件的集合是一张文件表来表示的,所有的进程共享这张表。包括当前的文件位置、引用计数以及一个指向v-node表中对应表项的指针。
    3)v-node表:同文件表一样,所有的进程共享这张v-node表。每个表项包含stat结构中的大部分信息,包括st_mode和st_size成员。
    

                 

                   

                     

    10.7 I/O重定向

    1. I/O重定向操作符,允许用户将磁盘文件和标准输入输出联系起来:

               unix > ls > foo.txt
      
    2. I/O重定向如何工作——使用dup2函数

       #include <unistd.h>
       int dup2(int oldfd, int newfd);
                         返回:若成功则为非负的描述符,若出错则为-1.
      

    实际是dup2函数(one case)。dup2函数对文件描述符表项进行重定位。

    10.8 标准I/O

    1. 标准I/O :ANSI C定义的一组高级输入输出函数。如fopen,fclose,fread,fwrite,fgets,fputs,scanf,printf。

    2. 标准IO库将一个打开的文件模型化为一个流,对于程序员来说,一个流就是一个指向类型为FILE结构的一个指针。每个ANSI C程序开始都有三个打开的流stdin,stdout,stderr,分别对应于标准输入、输出、错误:

      #include <stdio.h>
      extern  FILE  *stdin;
      extern  FILE  *stdout;
      extern  FILE  *sterr;
      

      !类型为FILE的流是对文件描述符和流缓冲区的抽象。

    10.9 该使用哪些I/O函数

    标准I/O流,从某种意义上而言是全双工的,因为程序能够在同一个流上执行输入和输出。但是有一些限定:

    1. 限制1: 跟在输出函数之后的输入函数。如果中间没有fflush,fseek,fsetpos或rewind的调用,一个输入函数不能跟随在一个输出函数之后。fflush清空与流相关的缓冲区,后三个函数使用unix I/O lseek函数来重置当前文件的位置。

    2. 限制2: 跟在输入函数之后的输出函数。情况类同上。 这些限定给网络应用带来一个问题:因为对套接字使用lseek是非法的。用Rio包可以解决这个问题。用sprintf把输出格式化一个字符串,通过riowriten输出,傅rioreadlineb来读一行,用scanf来从文本中提取不同的字段。

     

    遇到的问题及解决办法:

    首先学完本章之后总结为Unix系统I/O最基本的函数包括read和write等,所有的外部设备都被建模为文件,使得我们可以像读写文件一下读写外设。然后c语言标准I/O拥有应用级缓冲,而流的概念是对文件描述符和流缓冲区的抽象,流缓冲区的目的是为了减少Unix I/O系统调用,减少内核开销。但对最后的两个限制不太理解。后来经过查阅资料,看了网上一篇知乎上的一些回答,有了一定的理解。 但还有一点疑问就是执行定位后,一定会刷新缓冲区吗?写入后如果不fflush,那么其实可能还没有写入,可能写入了一部分,这时候读,是不是从哪里开始读是不可知的?

     

    参考资料:

                   《深入理解计算机系统》

                   博客http://blog.csdn.net/jewes/article/details/8629004帮助理解了I/O

                   知乎回答http://www.zhihu.com/question/31499851

  • 相关阅读:
    python 装饰器
    python 环境迁移之requirements.txt (window环境)
    selenium 元素查找与属性
    pytest+allure(allure-pytest基于这个插件)设计定制化报告
    Capability配置
    python_excel
    python_连接mysql
    MySql_1
    appium_环境搭建
    appium_appium简介
  • 原文地址:https://www.cnblogs.com/lhc-java/p/4941254.html
Copyright © 2011-2022 走看看