zoukankan      html  css  js  c++  java
  • UNIX环境编程学习笔记(2)——文件I/O之不带缓冲的 I/O

    lienhua34
    2014-08-25

    1 文件描述符

    对于内核而言,所有打开的文件都通过文件描述符引用。文件描述符是一个非负整数。当打开一个现有文件或创建一个新文件时,内核向进程返回一个文件描述符。当读或写一个文件时,使用 open 或 creat 返回的文件描述符标识该文件,将其作为参数传送给 read 或 write。

    按照惯例,UNIX 系统 shell 使用文件描述符 0 与进程的标准输入相关联,文件描述符 1 与进程的标准输出相关联,文件描述符 2 与进程的标准出错输出相关联。

    2 不带缓冲的 I/O 函数

    术语不带缓冲指的是每个 read 或 write 都调用内核中的一个系统调用。这些不带缓冲的 I/O 函数不是 ISO C 的组成部分,但是,它们是POSIX.1 和 Single UNIX Specification 的组成部分。下面分别来说明一下5 个基本的函数:open、read、write、lseek 以及 close。

    2.1 open 函数

    调用 open 函数可以打开或者创建一个文件。

    #include <fcntl.h>
    int open(const char *pathname, int oflag, ... /* mode_t mode */);
    返回值:若成功则返回文件描述符,若出错则返回-1.

    其中第三个参数... 表明余下的参数的数量及其类型根据具体的调用会有所不同。对于 open 函数而言,仅当创建新文件时才使用第三个参数。pathname 是要打开或创建文件的名字。oflag 参数用于说明此函数的多个选项。用下列一个或多个常量进行“或”运算构成 oflag 参数(这些常量定义在 <fcntl.h> 头文件中)。

      O_RDONLY  只读打开

      O_WRONLY  只写打开

      O_RDWR   读、写打开

    这三个常量中必须指定一个且只能指定一个。下列常量则是可选的:

      O_APPEND  每次写时都追加到文件的尾端。

      O_CREAT  若文件不存在,则创建它。使用此选项时,需要第三个参数 mode,用于指定该新文件的访问权限位。

      O_EXCL  如果同时指定了O_CREAT,而文件已经存在,则会出错。用此可以测试一个文件是否存在,如果不存在,则创建此文件。

      O_TRUNC  如果此文件存在,而且为只写或者读写成功打开,则将其长度截短为 0.

      O_NOCTTY  如果 pathname 指的是终端设备,则不将该设备分配为此进程的控制终端。

      O_NONBLOCK  如果指的是一个 FIFO、一个块特殊文件或一个字符特殊文件,则此选项为文件的本地打开操作和后续的 I / O 操作设置非阻塞模式。

    例1:

    下面程序以只读的方式打开文件 foo.txt,并设置 open 函数的O_CREAT和O_EXCL 选项。

    #include <fcntl.h>
    #include <stdlib.h>
    #include <stdio.h>
    int
    main(void)
    {
        int fd;
        if ((fd = open("foo.txt", O_RDONLY | O_CREAT | O_EXCL,S_IRUSR | S_IWUSR | S_IRGRP)) == -1) {
            printf("open error
    ");
        } else {
            printf("open success
    ");
        }
        exit(0);
    }

    编译该程序,生成open_demo,然后执行它,其结果如下:

    lienhua34:demo$ gcc -o open_demo open_demo.c
    lienhua34:demo$ ls
    open_demo
    open_demo.c
    lienhua34:demo$ ./open_demo
    open success
    lienhua34:demo$ ls -l foo.txt
    -rw-r----- 1 lienhua34 lienhua34 0
    8月 19 22:56 foo.txt
    lienhua34:demo$ ./open_demo
    open error

    当指定了O_CREAT 选项时,第三个参数取下面列表中的这些常量的“或”运算结果用于指定新文件的访问权限(这些常量定义在 <sys/stat.h>中)。

    表. 文件访问权限
    S_IRUSR 用户 -读
    S_IWUSR 用户 -写
    S_IXUSR 用户 -执行
    S_IRGRP 组 -读
    S_IWGRP 组 -写
    S_IXGRP 组 -执行
    S_IROTH 其他 -读
    S_IWOTH 其他 -写
    S_IXOTH 其他 -执行


     
     
     
     
     
     
     
     

    由 open 返回的文件描述符一定是最小的未用描述符数值。这一点可用于在标准输入、标准输出或标准出错输出上打开新的文件。

    open 函数的 oflag 参数还支持三个可选常量,他们是 Single UNIXSpecification 中同步输入和输出选项的一部分。

      O_DSYNC  使每次 write 等待物理 I/O 操作完成,但是,如果写操作并不影响读取刚写入的数据,则不等待文件属性被更新。

      O_RSYNC  使每一个以文件描述符作为参数的 read 操作等待,直至任何对文件同一部分进行的未决写操作都完成。

      O_SYNC  使每次 write 都等待物理 I/O 操作完成,包括由 write 操作引起的文件属性更新所需的I/O。

    当文件用O_DSYNC 标志打开时,在重写其现有的部分内容时,文件时间属性不会同步更新。与此相反,如果文件是用O_SYNC 标志打开时,那么对该文件的每一次 write 操作都将在 write 返回之前更新文件时间。

    2.2 creat 函数

    可调用 creat 函数创建一个新文件。

    #include <fcntl.h>

    int creat(const char *pathname, mode_t mode);

    返回值:若成功则返回以只写打开的文件描述符,若出错则返回-1.

    此函数等效于:

    open(pathname, O_WRONLY | O_CREAT | O_TRUNC, mode);

    creat 函数的一个不足之处是它以只写方式打开所创建的文件。之所以存在creat 函数,是因为早期的 UNIX 系统中,open 函数的第二个参数只能是0、1 或 2。没有办法打开一个尚未存在的文件,于是需要 creat 函数来创建新文件。现在 open 函数支持O_CREAT 选项之后,creat 函数就没有存在的必要了。

    2.3 close 函数

    调用 close 函数关闭一个打开的文件。

    #include <unistd.h>

    int close(int filedes);

    返回值:若成功则返回0,若出错则返回-1.

    当一个进程终止时,内核自动关闭它所有打开的文件。

    2.4 read 函数

    调用 read 函数从打开的文件中读数据。

    #include <unistd.h>

    ssize_t read(int filedes, void *buf, size_t nbytes);

    返回值:若成功则返回读到的字节数,若已到文件结尾则返回0,若出错则返回-1.

    读操作从文件的当前偏移量处开始,在成功返回之前,该偏移量将增加实际读到的字节数。

    2.5 write 函数

    调用 write 函数想打开的文件写数据。

    #include <unistd.h>

    ssize_t write(int filedes, const void *buf, size_t nbytes);

    返回值:若成功则返回已写的字节数,若出错则返回-1.

    对于普通文件,写操作从文件的当前偏移量处开始。如果在打开该文件时,制定了O_APPEND 选项,则在每次写操作之前,将文件偏移量设置在文件的当前结尾处。在一次成功写之后,该文件的偏移量增加实际写的字节数。

    2.6 lseek 函数

    调用 lseek 显示地为一个打开的文件设置其偏移量。

    #include <unistd.h>

    off_t lseek(int filedes, off_t offset, int whence);

    返回值:若成功则返回新的文件偏移量,若出错则返回-1.

    每个打开的文件都有一个与其关联的“当前文件偏移量”。它通常是一个非负整数,用以度量从文件开始处计算的字节数。按系统默认的情况,当打开一个文件时,除非指定O_APPEND 选项,否则该偏移量被设置成 0.

    对 lseek 函数的 offset 参数的解释与参数 whence 的值有关。

    • 若 whence 是SEEK_SET,则将该文件的偏移量设置为距离文件开始处offset 个字节。

    • 若 whence 是SEEK_CUR,则将该文件的偏移量设置为其当前值加 offset,offset 可为正或负。

    • 若 whence 是SEEK_END,则将该文件的偏移量设置为文件长度家 offset,offset 可为正或负。

    管道、FIFO 和网络套接字都不支持设置偏移量,如果一个文件描述符引用的是这三者之一,则 lseek 函数返回 -1,并将 errno 设置为 ESPIPE。对于普通文件,其偏移量只能是非负值。但是,某些设置可能支持负的偏移量。所以,在比较 lseek 函数的返回值时应当谨慎,不要测试它是否小于 0,而要测试它是否等于 -1.

    文件偏移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将加长该文件,并在文件中构成一个空洞。位于文件中但没有写过的字节都被读为 0.

    实例:

    下面程序创建一个新文件 file.hole,先在文件开始处写入“abcd”,然后将文件偏移量移动到距离开始处的 10 字节处,在该处写入“ABCD”,则在文件 file.hole 从第 4 个字节处到第 9 个字节之间就形成了一个空洞。

    #include <stdlib.h>
    #include <stdio.h>
    #include <fcntl.h>
    #include <unistd.h>
    char buf1[] = "abcd";
    char buf2[] = "ABCD";
    int
    main(void)
    {
        int fd;
        if ((fd = open("file.hole", O_WRONLY | O_CREAT | O_TRUNC,S_IRUSR | S_IWUSR | S_IRGRP)) < 0) {
            printf("open error");
        }
        if (write(fd, buf1, 4) != 4) {
            printf("write buf1 error");
        }
        if (lseek(fd, 10, SEEK_SET) == -1) {
            printf("lseek error");
        }
        if (write(fd, buf2, 4) != 4) {
            printf("write buf2 error");
        }
        exit(0);
    }


    编译该程序,生成文件 writedemo,然后执行 writedemo 文件,

    lienhua34:demo$ gcc -o writedemo write_demo.c
    lienhua34:demo$ ./writedemo
    lienhua34:demo$ ls -l file.hole
    -rw-r----- 1 lienhua34 lienhua34 14 8月 20 21:37 file.hole
    lienhua34:demo$ od -c file.hole
    0000000   a b c d 0 0 0 0 0 0 A B C D
    000001
  • 相关阅读:
    AVL平衡二叉树
    算法集锦(二)
    算法集锦(一)
    选择问题 and 字谜游戏问题
    TF-IDF与余弦相似性的应用
    一致性哈希算法
    Cache缓存
    布隆过滤器
    信号
    设置用户ID和设置组ID
  • 原文地址:https://www.cnblogs.com/lienhua34/p/3936086.html
Copyright © 2011-2022 走看看