zoukankan      html  css  js  c++  java
  • 【转】在linux内核中读写文件 -- 不错

    原文网址:http://blog.csdn.net/tommy_wxie/article/details/8194276

    1. 序曲

    在用户态,读写文件可以通过read和write这两个系统调用来完成(C库函数实际上是对系统调用的封装)。 但是,在内核态没有这样的系统调用,我们又该如何读写文件呢?

    阅读linux内核源码,可以知道陷入内核执行的是实际执行的是sys_read和sys_write这两个函数,但是这两个函数没有使用EXPORT_SYMBOL导出,也就是说其他模块不能使用。

    在fs/open.c中系统调用具体实现如下(内核版本2.6.34.1):

    SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, int, mode)

    {

    long ret;

           if (force_o_largefile())

                  flags |= O_LARGEFILE;

           ret = do_sys_open(AT_FDCWD, filename, flags, mode);

           /* avoid REGPARM breakage on x86: */

           asmlinkage_protect(3, ret, filename, flags, mode);

           return ret;

    }

    跟踪do_sys_open()函数,就会发现它主要使用了do_filp_open()函数该函数在fs/namei.c中,而在该文件中,filp_open函数也是调用了do_filp_open函数,并且接口和sys_open函数极为相似,调用参数也和sys_open一样,并且使用EXPORT_SYMBOL导出了,所以我们猜想该函数可以打开文件,功能和open一样。

    使用同样的方法,找出了一组在内核操作文件的函数,如下:

    功能

    函数原型

    打开文件

    struct file *filp_open(const char *filename, int flags, int mode)

    读文件

    ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)

    写文件

    ssize_t vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)

    关闭文件

    int filp_close(struct file *filp, fl_owner_t id)

    2. 内核空间与用户空间

    在vfs_read和vfs_write函数中,其参数buf指向的用户空间的内存地址,如果我们直接使用内核空间的指针,则会返回-EFALUT。这是因为使用的缓冲区超过了用户空间的地址范围。一般系统调用会要求你使用的缓冲区不能在内核区。这个可以用set_fs()、get_fs()来解决。

    在include/asm/uaccess.h中,有如下定义:

    #define MAKE_MM_SEG(s) ((mm_segment_t) { (s) })

    #define KERNEL_DS MAKE_MM_SEG(0xFFFFFFFF)

    #define USER_DS MAKE_MM_SEG(PAGE_OFFSET)

    #define get_ds() (KERNEL_DS)

    #define get_fs() (current->addr_limit)

    #define set_fs(x) (current->addr_limit = (x))

    如果使用,如下:

    mm_segment_t fs = get_fs();

    set_fs(KERNEL_FS);

    //vfs_write();

    vfs_read();

    set_fs(fs);

    详尽解释:系统调用本来是提供给用户空间的程序访问的,所以,对传递给它的参数(比如上面的buf),它默认会认为来自用户空间,在read或write()函数中,为了保护内核空间,一般会用get_fs()得到的值来和USER_DS进行比较,从而防止用户空间程序“蓄意”破坏内核空间;而现在要在内核空间使用系统调用,此时传递给read或write()的参数地址就是内核空间的地址了,在USER_DS之上(USER_DS ~ KERNEL_DS),如果不做任何其它处理,在write()函数中,会认为该地址超过了USER_DS范围,所以会认为是用户空间的“蓄意破坏”,从而不允许进一步的执行;为了解决这个问题; set_fs(KERNEL_DS);将其能访问的空间限制扩大到KERNEL_DS,这样就可以在内核顺利使用系统调用了!

    在VFS的支持下,用户态进程读写任何类型的文件系统都可以使用read和write着两个系统调用,但是在linux内核中没有这样的系统调用我们如何操作文件呢?我们知道read和write在进入内核态之后,实际执行的是sys_read和sys_write,但是查看内核源代码,发现这些操作文件的函数都没有导出(使用EXPORT_SYMBOL导出),也就是说在内核模块中是不能使用的,那如何是好?

    通过查看sys_open的源码我们发现,其主要使用了do_filp_open()函数,该函数在fs/namei.c中,而在改文件中,filp_open函数也是调用了do_filp_open函数,并且接口和sys_open函数极为相似,调用参数也和sys_open一样,并且使用EXPORT_SYMBOL导出了,所以我们猜想该函数可以打开文件,功能和open一样。使用同样的查找方法,我们找出了一组在内核中操作文件的函数,如下:

    功能 函数原型
    打开文件 struct file *filp_open(const char *filename,int flags, int mode)
    读取文件 ssize_t vfs_read(struct file *file,char __user *buf, size_t count, loff_t *pos)
    写文件 ssize_t vfs_write(struct file *file,const char __user *buf,size_t count, loff_t *pos)
    关闭文件 int filp_close(struct file *filp, fl_owner_t id)

    我们注意到在vfs_read和vfs_write函数中,其参数buf指向的用户空间的内存地址,如果我们直接使用内核空间的指针,则会返回-EFALUT。所以我们需要使用
    set_fs()和get_fs()宏来改变内核对内存地址检查的处理方式,所以在内核空间对文件的读写流程为:

    1. mm_segment_tfs = get_fs();
    2. set_fs(KERNEL_FS);
    3. //vfs_write();
    4. vfs_read();
    5. set_fs(fs);

    下面为一个在内核中对文件操作的例子:

      1. #include <linux/module.h>
      2. #include <linux/init.h>
      3. #include <linux/fs.h>
      4. #include <linux/uaccess.h>
      5. static charbuf[] ="你好";
      6. static charbuf1[10];
      7.  
      8. int __inithello_init(void)
      9. {
      10.     struct file *fp;
      11.     mm_segment_t fs;
      12.     loff_t pos;
      13.     printk("hello enter/n");
      14.     fp =filp_open("/home/niutao/kernel_file",O_RDWR | O_CREAT,0644);
      15.     if (IS_ERR(fp)){
      16.         printk("create file error/n");
      17.         return -1;
      18.     }
      19.     fs =get_fs();
      20.     set_fs(KERNEL_DS);
      21.     pos =0;
      22.     vfs_write(fp,buf, sizeof(buf), &pos);
      23.     pos =0;
      24.     vfs_read(fp,buf1, sizeof(buf), &pos);
      25.     printk("read: %s/n",buf1);
      26.     filp_close(fp,NULL);
      27.     set_fs(fs);
      28.     return 0;
      29. }
      30. void __exithello_exit(void)
      31. {
      32.     printk("hello exit/n");
      33. }
      34.  
      35. module_init(hello_init);
      36. module_exit(hello_exit);
      37.  
      38. MODULE_LICENSE("GPL");
  • 相关阅读:
    软件工程实践2017第一次作业
    第七次作业
    图结构练习——最短路径(floyd算法(弗洛伊德))
    图结构练习——最短路径(dijkstra算法(迪杰斯拉特))
    图结构练习——最小生成树(kruskal算法(克鲁斯卡尔))
    图结构练习——最小生成树(prim算法(普里姆))
    基于邻接矩阵的深度优先搜索遍历
    基于邻接表的深度优先搜索遍历
    数据结构实验图论一:基于邻接矩阵的广度优先搜索遍历
    数据结构实验之图论二:基于邻接表的广度优先搜索遍历
  • 原文地址:https://www.cnblogs.com/wi100sh/p/5091031.html
Copyright © 2011-2022 走看看