zoukankan      html  css  js  c++  java
  • Linux系统编程(2)——文件与IO之系统调用与文件IO操作

    系统调用是指操作系统提供给用户程序的一组“特殊”接口,用户程序可以通过这组“特殊”接口来获得得操作系统内核提供的特殊服务。在linux中用户程序不能直接访部内核提供的服务。为了更好的保护内核空间,将程序的运行空间分为内核空间和用户空间,他们运行在不同的级上,在逻辑上是相互隔离的。

    在linux中用户编程接口(API)遵循了在UNIX中最流行的应用编程界面标准——POSIX标准。这些系统调用编程接口主要通过C库(libc)实现的。

    POSIX(Portable OperatingSystem Interface)是由IEEE制定的标准,致力于统一各种UNIX系统的接口,促进各种UNIX系统向互相兼容的发向发展。IEEE 1003.1(也称为POSIX.1)定义了UNIX系统的函数接口,既包括C标准库函数,也包括系统调用和其它UNIX库函数。POSIX.1只定义接口而不定义实现,所以并不区分一个函数是库函数还是系统调用,至于哪些函数在用户空间实现,哪些函数在内核中实现,由操作系统的开发者决定,各种UNIX系统都不太一样。IEEE 1003.2定义了Shell的语法和各种基本命令的选项等。本书的第三部分不仅讲解基本的系统函数接口,也顺带讲解Shell、基本命令、帐号和权限以及系统管理的基础知识,这些内容合在一起定义了UNIX系统的基本特性。

    在UNIX的发展历史上主要分成BSD和SYS V两个派系,各自实现了很多不同的接口,比如BSD的网络编程接口是socket,而SYSV的网络编程接口是基于STREAMS的TLI。POSIX在统一接口的过程中,有些接口借鉴BSD的,有些接口借鉴SYSV的,还有些接口既不是来自BSD也不是来自SYSV,而是凭空发明出来的(例如本书要讲的pthread库就属于这种情况),通过Man Page的COMFORMING TO部分可以看出来一个函数接口属于哪种情况。Linux的源代码是完全从头编写的,并不继承BSD或SYSV的源代码,没有历史的包袱,所以能比较好地遵照POSIX标准实现,既有BSD的特性也有SYSV的特性,此外还有一些Linux特有的特性,比如epoll(7),依赖于这些接口的应用程序是不可移植的,但在Linux系统上运行效率很高。

    可用的文件I/O函数——打开文件、读文件、写文件等等。大多数linux文件I/O只需用到5个函数:open、read、write、lseek以及close。不带缓存指的是每read和write都调用内核中的一个系统调用。这些不带缓存的I/O函数不是ANSIC的组成部分,但是POSIX组成部分。

    文件描述符

    对于内核而言,所有打开文件都由文件描述符引用。文件描述符是一个非负整数。当打开一个现存文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时,用open或creat返回的文件描述符标识该文件,将其作为参数传送给read或write。在POSIX.1应用程序中,整数0、1、2应被代换成符号常数STDIN_FILEN0、STDOUT_FILENO和STDERR_FILENO。这些常数都定义在头文件<unistd.h>中

    文件描述符的范围是0~OPEN_MAX。早期的UNIX版本采用的上限值是19(允许每个进程打开20个文件),现在很多系统则将其增加至63。

    open函数

    #include<sys/types.h>
    #include<sys/stat.h>
    #inlcude<fcntl.h>
    int open(const char *pathname,intoflag,.../*,mode_t mode*/);


    返回:若成功为文件描述符,若出错为-1

    pathname是要打开或创建的文件的名字。

    oflag参数可用来说明此函数的多个选择项。

    对于open函数而言,仅当创建新文件时才使用第三个参数。

    用下列一个或多个常数进行或运算构成oflag参数(这些常数定义在<fcntl.h>头文件中):

    必选项:以下三个常数中必须指定一个,且仅允许指定一个。

    O_RDONLY 只读打开

    O_WRONLY 只写打开

    O_RDWR 可读可写打开

    以下可选项可以同时指定0个或多个,和必选项按位或起来作为flags参数。可选项有很多,这里只介绍一部分,其它选项可参考open(2)的Man Page:

    O_APPEND 表示追加。如果文件已有内容,这次打开文件所写的数据附加到文件的末尾而不覆盖原来的内容。

    O_CREAT 若此文件不存在则创建它。使用此选项时需要提供第三个参数mode,表示该文件的访问权限。

    O_EXCL 如果同时指定了O_CREAT,并且文件已存在,则出错返回。

    O_TRUNC 如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断(Truncate)为0字节。

    O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O(Nonblock I/O),非阻塞I/O在下一节详细讲解。

    注意open函数与C标准I/O库的fopen函数有些细微的区别:

    以可写的方式fopen一个文件时,如果文件不存在会自动创建,而open一个文件时必须明确指定O_CREAT才会创建文件,否则文件不存在就出错返回。

    以w或w+方式fopen一个文件时,如果文件已存在就截断为0字节,而open一个文件时必须明确指定O_TRUNC才会截断文件,否则直接在原来的数据上改写。

    第三个参数mode指定文件权限,可以用八进制数表示,比如0644表示-rw-r--r--,也可以用S_IRUSR、S_IWUSR等宏定义按位或起来表示,详见open(2)的Man Page。要注意的是,文件权限由open的mode参数和当前进程的umask掩码共同决定。

    补充说明一下Shell的umask命令。Shell进程的umask掩码可以用umask命令查看:

    $ umask
    0022

    creat函数

    可用creat函数创建一个新文件。

    #include<sys/types.h>
    #include<sys/stat.h>
    #include<fcntl.h>
    int creat(const char *pathname,mode_tmode);


    返回:若成功只为写打开的文件描述符,若出错为-1。注意,此函数等效于:

    open (pathname,O_WRONLY |O_CREAT|O_TRUNC,mode);


    creat的一个不足之处是它以只写方式打开所创建的文件。

    close函数

    可用close函数关闭一个打开文件:

    #include<unistd.h>
    int close(int filedes);


    返回:若成功为0,若出错为-1

    当一个进程终止时,它所有的打开文件都由内核自动关闭。很多程序都使用这一功能而不显式地用close关闭打开的文件。

    lessk函数——文件定位

    每个打开文件都有一个与其相关联的“当前文件偏移量”。它是一个非负整数,用以度量从文件开始处计算的字节数。通常,读、写操作都从当前文件偏移理处开始,并使偏移理增加所计或写的字节数。按系统默认,当打开一个文件时,除非指定O_APPEND选择项,否则该偏移量被设置为0。可以调用lseek显式地定位一个打开文件。

    #include<sys/types.h>
    #include<unistd.h>
    off_t lseek(it filesdes,off_t offset,intwhence);


    返回:若成功为新文件位移,若出错为-1。

    对于参数offset的解释与参数whence的值有关。

    若whence是SEEK_SET,则将该文件的位移量设置为距文件开始处offset个字节。若whence是SEEK_CUR,则将该文件的位移量设置为其当前值加offset,offset可为正或负。若whence是SEEK_END,则将该文件的位移量设置为文件长度加offset,offset可为正或负。若lseek成功执行,则返回新的文件位移量,为此可以用下列方式确定一个打开文件的当前位移量:

    off_t currpos;
    currpos=lseek(fd,0,SEEK_CUR);

    read函数

    用read函数从打开文件中读数据

    #include<unistd.h>
    ssize_t read(int feledes,void *buff,size_tnbytes);


    返回:读到的字节数,若已到文件尾为0,若出错为-1。如read成功,则返回读到的字节数。如已到达文件的尾端,则返回0。有多种情况可使实际读到的字节数小于要求读字节数:

    读普通文件时,在读到要求字节数之前已到达了文件尾端。例如,若在到达文件尾端之间还有30个字节,而要求读100个字节,则read返回30,下一次再调用read时,它将返回0(文件尾端)。当从终端设备读时,通常一次最多读一行。

    当从网络读时,网络中的缓冲机构可能造成返回值小于所要求读的字节数。某些面向记录的设备,例如磁带,一次最多返回一个记录。读操作从文件的当前位移量处开始,在成功返回之前,该位移量增加实际读得的字节数。

    write函数

    用write函数向打开文件写数据。

    #include<unistd.h>
    ssize_t write(int filedes,const void*buff,size_t nbytes);


    返回:若成功为已写的字节数,若出错为-1。其返回值通常与参数

    nbytes的值不同,否则表示出错。write出错的一个常见原因是:磁盘已写满,或者超过了对一个给定进程的文件长度限制。

    对于普通文件,写操作从文件的当前位移量处开始。如果在打开该文件时,指定了O_APPEND选择项,则在每次写操作之前,将文件位移量设置在文件的当前结尾处。在一次成功写之后,该文件位移量增加实际写的字节数。

  • 相关阅读:
    Restful levels &HATEOAS基本介绍~
    跨源资源共享(CORS)概念、实现(用Spring)、起源介绍
    Ubuntu下math库函数编译时未定义问题的解决
    常用软件清单~
    JetBrains PyCharm 专业版激活
    hello1.java内容简单介绍
    hello1 web项目中web.xml作用分析
    hello2 source analisis(notes)
    Servlet filter
    分析helo1项目中的 Web.xml
  • 原文地址:https://www.cnblogs.com/new0801/p/6177040.html
Copyright © 2011-2022 走看看