zoukankan      html  css  js  c++  java
  • [转]mmap和madvise的使用

    1.    madvise的简介
         
         madvise可以设置内存的分配方式或者说是分配的细节方式。具体参见linux man madvise。
    #include <sys/types.h>
    #include <sys/mman.h>
    int madvise(caddr_t addr, size_t len, int advice);
    madvise() 函数提供了以下标志,这些标志影响 lgroup 之间线程内存的分配方式:
    
    MADV_ACCESS_DEFAULT
    此标志将指定范围的内核预期访问模式重置为缺省设置。
    
    MADV_ACCESS_LWP
    此标志通知内核,移近指定地址范围的下一个 LWP 就是将要访问此范围次数最多的 LWP。内核将相应地为此范围和 LWP 分配内存和其他资源。
    
    MADV_ACCESS_MANY
    此标志建议内核,许多进程或 LWP 将在系统内随机访问指定的地址范围。内核将相应地为此范围分配内存和其他资源。
    
    madvise() 函数可以返回以下值:
    
    EAGAIN
    指定地址范围(从 addr 到 addr+len)中的部分或所有映射均已锁定进行 I/O 操作。
    
    EINVAL
    addr 参数的值不是sysconf(3C) 返回的页面大小的倍数,指定地址范围的长度小于或等于零或者建议无效。
    
    EIO
    读写文件系统时发生 I/O 错误。
    
    ENOMEM
    指定地址范围中的地址不在进程的有效地址空间范围内,或者指定地址范围中的地址指定了一个或多个未映射的页面。
    
    ESTALE
    NFS 文件句柄过时。
    

      

    2.  mmap和madvise的使用

         mmap的作用是将硬盘文件的内容映射到内存中,采用闭链哈希建立的索引文件非常适合利用mmap的方式进行内存映射,利用mmap返回的地址指针就是索引文件在内存中的首地址,这样我们就可以放心大胆的访问这些内容了。

          使用过mmap映射文件的同学会发现一个问题,search程序访问对应的内存映射时,处理query的时间会有latecny会陡升,究其原因是因为mmap只是建立了一个逻辑地址,linux的内存分配测试都是采用延迟分配的形式,也就是只有你真正去访问时采用分配物理内存页,并与逻辑地址建立映射,这也就是我们常说的缺页中断。  

          缺页中断分为两类,一种是内存缺页中断,这种的代表是malloc,利用malloc分配的内存只有在程序访问到得时候,内存才会分配;另外就是硬盘缺页中断,这种中断的代表就是mmap,利用mmap映射后的只是逻辑地址,当我们的程序访问时,内核会将硬盘中的文件内容读进物理内存页中,这里我们就会明白为什么mmap之后,访问内存中的数据延时会陡增。

           出现问题解决问题,上述情况出现的原因本质上是mmap映射文件之后,实际并没有加载到内存中,要解决这个文件,需要我们进行索引的预加载,这里就会引出本文讲到的另一函数madvise,这个函数会传入一个地址指针,已经是一个区间长度,madvise会向内核提供一个针对于于地址区间的I/O的建议,内核可能会采纳这个建议,会做一些预读的操作。例如MADV_SEQUENTIAL这个就表明顺序预读。

          如果感觉这样还不给力,可以采用read操作,从mmap文件的首地址开始到最终位置,顺序的读取一遍,这样可以完全保证mmap后的数据全部load到内存中。

    3. 举个栗子

      测试时同时运行30个播放程序读取30个不同的mpg文件,程序起初运行画面播放非常流畅,几分钟过后,内存剩下15MB左右时,mmap()就开始不停 的进行页面置换,将新的数据读入内存,老的数据置换出去,这时的磁盘利用率不到1%,但CPU耗在iowait上的时间却有90%多 。

    各位大侠我该怎么办,如果不用内存映射还有没有其他的办法处理大文件???

    开个4G的swap分区挂上去试试看 
    或者,把文件分段mmap(),如100M的文件做10次mmap(),并且要求在播放1段完前做好下段准备工作

    你挂mmap不释放怎么行. 
    你mmap一个大文件, 要在这个大文件播放完后才能释放. 
    要把大文件分小

    你可以分段映射试试看,比如一次映射2M,并跟踪程序在这个映射内的使用情况,如果这此映射的数据快用完时,就提前映射下一段.在上一段用完后,就释放掉其映射.

    今天又做了一下测试,先映射整个文件,在使用过程中一段一段释放,还是阻塞在IOWait,另外挂载4G交换分区的方法也试了,效果更差 
          在国外论坛上看了些IOWait的东东,有很多都说红帽企业版+Xeons处理器+磁盘阵列容易发生IOWait,和我现在的配置一模一样,用单独的大文件拷贝就能测得出来,明天下个新内核编译一下试试看

    问题原因: 
        调用mmap()时内核只是建立了逻辑地址到物理地址的映射表,并没有映射任何数据到内存。 
        在你要访问数据时内核会检查数据所在分页是否在内存,如果不在,则发出一次缺页中断,linux默认分页为4K,可以想象读一个将近2G的电影文件要发生多少次中断,I can't bear it!!! 

    解决办法: 
        将madvise()和mmap()搭配起来使用,在使用数据前告诉内核这一段数据我要用,将其一次读入内存,现在程序可以并发150个数据流了,每秒最高可读70MB数据

  • 相关阅读:
    PAT 甲级1135. Is It A Red-Black Tree (30)
    AVL树模板
    定时器模板
    Listview模板
    Hash二次探测
    BFS小结
    STL之set篇
    完全二叉树-已知中序排序,输出广度排序
    BZOJ2037: [Sdoi2008]Sue的小球
    poj1157LITTLE SHOP OF FLOWERS
  • 原文地址:https://www.cnblogs.com/wlzy/p/10665472.html
Copyright © 2011-2022 走看看