zoukankan      html  css  js  c++  java
  • Linux吃掉我的内存

    在Windows下资源管理器查看内存使用的情况,如果使用率达到80%以上,再运行大程序就能感觉到系统不流畅了,因为在内存紧缺的情况下使用交换分区,频繁地从磁盘上换入换出页会极大地影响系统的性能。而当我们使用free命令查看Linux系统内存使用情况时,会发现内存使用一直处于较高的水平,即使此时系统并没有运行多少软件。这正是Windows和Linux在内存管理上的区别,乍一看,Linux系统吃掉我们的内存(Linux ate my ram),但其实这也正是其内存管理的特点。


    free命令介绍

    下面为使用free命令查看我们实验室文件服务器内存得到的结果,-m选项表示使用MB为单位:

    [root@archlab-server2 ~]# free -m
          total   used   free   shared   buffers   cached
    Mem:    3920    1938   1982    0      497     1235
    -/+ buffers/cache:  205   3714
    Swap:    4095    0    4095

    输出的第二行表示系统内存的使用情况:

    Mem: total(总量)= 3920MB,

          used(已使用)= 1938MB,

          free(空闲)= 1982MB,

          shared(共享内存)= 0MB,

          buffers = 497MB,

          cached = 1235MB

    注:前面四项都比较好理解,buffer 和 cache找不到合适的词来翻译,它们的区别在于:

    • A buffer is something that has yet to be "written" to disk. 
    • A cache is something that has been "read" from the disk and stored for later use.

    即buffer用于存放要输出到磁盘的数据,而cache是从磁盘读出存放到内存中待今后使用的数据。它们的引入均是为了提供IO的性能。

    输出的第三行表示在第二行的基础上-/+ buffers/cache得到的:

    - buffers/cache used = Mem used – buffers – cached = 1938MB – 497MB – 1235MB = 205MB

    + buffers/cache free = Mem free + buffers + cached = 1982MB + 497MB + 1235MB = 3714MB

    输出的第三行表示交换分区使用的情况:

    Swap:total(总量)= 4095MB

          used(使用)= 0MB

          free(空闲)= 4095MB

    由于系统当前内存还比较充足,并未使用到交换分区。

    上面输出的结果比较难理解的可能是第三行,为什么要向用户展示这行数据呢?内存使用量减去系统buffer/cached的内存表示何意呢?系统空闲内存加上buffer/cached的内存又表示何意?

    内存的分类

    我们把内存分为三类,从用户和操作系统的角度对其使用情况有不同的称呼:

    Memory that is

    You'd call it

    Linux calls it

    taken by applications

    Used

    Used

    available for applications, and used for something

    Free

    Used

    not used for anything

    Free

    Free

    上表中something代表的正是free命令中"buffers/cached"的内存,由于这块内存从操作系统的角度确实被使用,但如果用户要使用,这块内存是可以很快被回收被用户程序使用,因此从用户角度这块内存应划为空闲状态。

    再次回到free命令输出的结果,第三行输出的结果应该就能理解了,这行的数字表示从用户角度看系统内存的使用情况。因此,如果你用top或者free命令查看系统的内存还剩多少,其实你应该将空闲内存加上buffer/cached的内存,那才是实际系统空闲的内存。

    buffers/cached好处

    Linux 内存管理做了很多精心的设计,除了对dentry进行缓存(用于VFS,加速文件路径名到inode的转换),还采取了两种主要Cache方式:Buffer Cache和Page Cache,目的就是为了提升磁盘IO的性能。从低速的块设备上读取数据会暂时保存在内存中,即使数据在当时已经不再需要了,但在应用程序下一次访问该数据时,它可以从内存中直接读取,从而绕开低速的块设备,从而提高系统的整体性能。而Linux会充分利用这些空闲的内存,设计思想是内存空闲还不如拿来多缓存一些数据,等下次程序再次访问这些数据速度就快了,而如果程序要使用内存而系统中内存又不足时,这时不是使用交换分区,而是快速回收部分缓存,将它们留给用户程序使用。

    因此,可以看出,buffers/cached真是百益而无一害,真正的坏处可能让用户产生一种错觉——Linux耗内存!其实不然,Linux并没有吃掉你的内存,只要还未使用到交换分区,你的内存所剩无几时,你应该感到庆幸,因为Linux 缓存了大量的数据,也许下一次你就从中受益!

    实验证明

    下面通过实验来验证上面的结论:

    我们先后读入一个大文件,比较两次读入的实践:

    1. 首先生成一个1G的大文件
      [root@archlab-server2 ~]# dd if=/dev/zero of=bigfile bs=1M count=1000
      1000+0 records in
      1000+0 records out
      1048576000 bytes (1.0 GB) copied, 15.8598 s, 66.1 MB/s
      [root@archlab-server2 ~]# du -h bigfile
      1001M bigfile
    2. 清空缓存
      [root@archlab-server2 ~]# echo 3 | tee /proc/sys/vm/drop_caches
      3
      [root@archlab-server2 ~]# free -m
               total     used     free     shared    buffers    cached
      Mem:     3920       154     3766      0         0          33
      -/+ buffers/cache:   120     3800
      Swap:      4095      0       4095
    3. 读入这个文件,测试消耗的时间
      [root@archlab-server2 ~]# time cat bigfile > /dev/null
      real 0m18.449s
      user 0m0.013s
      sys 0m0.617s
      [root@archlab-server2 ~]# free -m
                total      used     free     shared    buffers     cached
      Mem:      3920       1159     2761     0         3           1035
      -/+ buffers/cache:   120      3800
      Swap:      4095      0        4095
    4. 再次读入该文件,测试消耗的时间
      [root@archlab-server2 ~]# time cat bigfile > /dev/null
      real 0m0.310s
      user 0m0.005s
      sys 0m0.304s

    从上面看出,第一次读这个1G的文件大约耗时18s,而第二次再次读的时候,只耗时0.3s,足足提升60倍!

    参考资料:

    https://groups.google.com/forum/#!topic/shlug/Dvc-ciKGt7s/discussion  实验室师兄以前提出"cp命令占用双倍内存问题",在SLUG上的讨论,正是这个疑惑一直在我心中

    http://www.linuxatemyram.com/  前两天在Hacker News看到"Linux ate my ram"这个网页,写的通俗易懂,也顺藤摸瓜解决心中很多疑惑

    http://www.linuxatemyram.com/play.html  作者给出了其他的实验来分别验证磁盘cache对程序分配、交换分区、程序加载时间等的影响

    http://www.cnblogs.com/coldplayerest/archive/2010/02/20/1669949.html 一篇对free命令介绍的博客

        

  • 相关阅读:
    Redis on Spark:Task not serializable
    一次Spark应用程序参数优化案例
    Spark性能优化(2)——广播变量、本地缓存目录、RDD操作、数据倾斜
    Spark性能优化(1)——序列化、内存、并行度、数据存储格式、Shuffle
    Java – Convert IP address to Decimal Number
    Java IP地址字符串与BigInteger的转换, 支持IPv6
    Spark性能优化(2)——广播变量、本地缓存目录、RDD操作、数据倾斜
    Android Matrix类以及ColorMatri
    OpenGL中shader使用
    Android应用程序与SurfaceFlinger服务之间的共享UI元数据(SharedClient)的创建过程分析 .
  • 原文地址:https://www.cnblogs.com/hazir/p/linux_ate_my_ram.html
Copyright © 2011-2022 走看看