zoukankan      html  css  js  c++  java
  • 磁盘繁忙

    磁盘进行find 处于繁忙状态

    iostat  -x -k -d 12

    输出结果如下:

    sdk    r/s=244  rkB/s=976  await=4.07  rawait=4.07 avgqu-sz=8.0 svctm=4.06 %util=99

    ####################################################################################################

    rrqm/s:每秒合并放入驱动请求队列的读请求数(当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge)。

    wrqm/s:每秒合并放入驱动请求队列的写请求数。

    rsec/s:每秒发给磁盘设备的读请求数。

    wsec/:每秒发给磁盘设备的写请求数。

    r/s:每秒完成的读 I/O 设备次数.即delta(rio)/s
    w/s:每秒完成的写 I/O 设备次数.即 delta(wio)/s

    rKB/s:每秒从磁盘设备读取的KB数。

    wKB/s:每秒向磁盘设备写入的KB数。

    avgrq-sz 平均每次请求大小,单位为扇区(512B)。

    avgqu-sz 在驱动请求队列和在设备中活跃的平均请求数 

    await:每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。

    svctm:磁盘设备的I/O平均响应时间(ms)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长系统上运行的应用程序将变慢

    %util:在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)

    ##################################################################################################

    比喻例子(I/O 系统 vs. 超市排队)
    r/s+w/s 类似于交款人的总数
    平均队列长度(avgqu-sz)类似于单位时间里平均排队人的个数
    平均服务时间(svctm)类似于收银员的收款速度
    平均等待时间(await)类似于平均每人的等待时间
    平均I/O数据(avgrq-sz)类似于平均每人所买的东西多少
    I/O 操作率 (%util)类似于收款台前有人排队的时间比例。
    我们可以根据这些数据分析出 I/O 请求的模式,以及 I/O 的速度和响应时间

    ##################################################################################################

    硬件环境:

    Dell R730Xd

    HDD:ST8000NM0075_SAS_8TB_7.2K

    分析:

    1)查看磁盘调度

    # cat /sys/block/sdk/queue/scheduler
    noop [deadline] cfq

    2)查看磁盘队列长度

    # cat /sys/block/sdk/queue/nr_requests
    128

    3)uptime 查看负载

    uptime
    //输出
    up 1 day, 23:14, 2 users, load averages: 1.69 2.21 2.09
    平均负载表示1、5、15分钟进程队列中的平均进程数量。一般单核大于3的话负载就算高了

    4)iotop 找出使磁盘繁忙的IO进程pid

    iotop -Po,参数P表示只显示进程,不显示线程,参数o表示只显示正在进行io操作的进程

    附:

    一,磁盘IO调度

    I/O 调度算法再各个进程竞争磁盘I/O的时候担当了裁判的角色。他要求请求的次序和时机做最优化的处理,以求得尽可能最好的整体I/O性能
    二,iostat用法
    iostat命令的语法如下:
      iostat  [  -c  |  -d  ]  [  -k  ]  [  -t  ]  [  -x  [  device  ]  ]  [  interver  [  count  ]  ]
      各个选项及参数含义如下:
        -c:显示CPU的使用情况。
        -d:显示磁盘的使用情况。
        -k:美妙以KB为单位显示数据。
        -t:打印统计信息开始执行的时间。
        -x device:指点要统计的设备名称,默认为所有的磁盘设备。
        interval:指定两次统计间隔的时间。
        count:按照“interval”指定的时间间隔统计的次数。
     
     
    常见用法
    iostat -d -k 1 10     #查看TPS和吞吐量信息
    iostat -d -x -k 1 10     #查看设备使用率(%util)、响应时间(await)
    iostat -c 1 10     #查看cpu状态
     

    如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘

    可能存在瓶颈.

    idle小于70% IO压力就较大了,一般读取速度有较多的wait.

    同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)

    另外 await 的参数也要多和 svctm 来参考.差的过高就一定有 IO 的问题.

    avgqu-sz 也是个做 IO 调优时需要注意的地方,这个就是直接每次操作的数据的大小,如果次数多,但数据拿的小的话,其实 IO 也会很小.如果数据拿的大,才IO 的数据会高.也可以通过 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s.也就是讲,读定速度是这个来决定的.

    另外还可以参考

      svctm 一般要小于 await (因为同时等待的请求的等待时间被重复计算了),svctm 的大小一般和磁盘性能有关,CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加.await 的大小一般取决于服务时间(svctm) 以及 I/O 队列的长度和 I/O 请求的发出模式.如果
     svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响应时间变慢,如果响应时间超过了用户可以容许的范围,这时可以考虑更更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU.

    队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水.

     三,术语
    文件系统通过缓存和缓冲以及异步I/O等手段来缓和磁盘的延时对应用程序的影响。为了更详细的了解文件系统,以下就简单介绍一些相关术语:
    文件系统:一种把数据组织成文件和目录的存储方式,提供了基于文件的存取接口,并通过文件权限控制访问。另外,一些表示设备、套接字和管道的特殊文件类型,以及包含文件访问时间戳的元数据。
    文件系统缓存:主存(通常是DRAM) 的一块区域,用来缓存文件系统的内容,可能包含各种数据和元数据。
    操作:文件系统的操作是对文件系统的请求,包括读、写、打开、关闭、创建以及其他操作。
    I/O:输入/输出。文件系统I/O有多种定义,这里仅指直接读写(执行I/O)的操作,包括读、写、状态统计、创建。I/O不包括打开文件和关闭文件。
    逻辑I/O:由应用程序发给文件系统的I/O。
    物理I/O:由文件系统直接发给磁盘的I/O。
    吞吐量:当前应用程序和文件系统之间的数据传输率,单位是B/S。
    inode:一个索引节点时一种含有文件系统对象元数据的数据结构,其中有访问权限、时间戳以及数据指针。
    VFS:虚拟文件系统,一个为了抽象与支持不同文件系统类型的内核接口。
    磁盘相关术语:
    存储设备的模拟。在系统看来,这是一块物理磁盘,但是,它可能由多块磁盘组成。
    传输总线:用来通信的物理总线,包括数据传输以及其他磁盘命令。
    扇区:磁盘上的一个存储块,通常是512B的大小。
    I/O:对于磁盘,严格地说仅仅指读、写,而不包括其他磁盘命令。I/O至少由方向(读或写)、磁盘地址(位置)和大小(字节数)组成。
    磁盘命令:除了读写之外,磁盘还会被指派执行其他非数据传输的命令(例如缓存写回)。
    带宽:存储传输或者控制器能够达到的最大数据传输速率。
    I/O延时:一个I/O操作的执行时间,这个词在操作系统领域广泛使用,早已超出了设备层。
    相关概念
      文件系统延时
           文件系统延时是文件系统性能一项主要的指标,指的是一个文件系统逻辑请求从开始到结束的时间。它包括消耗在文件系统、内核磁盘I/O子系统以及等待磁盘设备——物理I/O的时间。应用程序的线程通常在请求时阻塞,等地文件系统请求的结束。这种情况下,文件系统的延时与应用程序的性能直接和成正比关系。在某些情况下,应用程序并不受文件系统的直接影响,例如非阻塞I/O或者I/O由一个异步线程发起。
      缓存
           文件系统启动之后会使用主存(RAM)当缓存以提供性能。缓存大小随时间增长而操作系统的空余内存不断减小,当应用程序需要更多内存时,内核应该迅速从文件系统缓存中释放一些内存空间。文件系统用缓存(caching)提高读性能,而用缓冲(buffering)提高写性能。文件系统和块设备子系统一般使用多种类型的缓存。
      随机I/O与顺序I/O
            一连串的文件系统逻辑I/O,按照每个I/O的文件偏移量,可以分为随机I/O与顺序I/O。顺序I/O里每个I/O都开始于上一个I/O结束的地址。随机I/O则找不出I/O之间的关系,偏移量随机变化。随机的文件系统负载也包括存取随机的文件。由于存储设备的某些性能特征的缘故,文件系统一直以来在磁盘上顺序和连续的存放文件数据,以努力减小随机I/O的数目。当文件系统未能达到这个目标时,文件的摆放变得杂乱无章,顺序的逻辑I/O被分解成随机的物理I/O,这种情况被称为碎片化。
    提示:关于文件系统更多内容,还请自行查阅相关理论。比如你还需要了解文件系统的预读、预取、写回缓存、同步写、裸I/O、直接I/O、内存映射文件、元数据等相关知识。
    四,参考
    性能调优
    文件系统优化
    关于文件系统优化,并没有太多的内容需要说明。就目前的情况,Redhat Enterprise 7系列默认更换为性能更好的XFS,这也是由于XFS在性能表现确实很好的原因。在我们使用的过程中,建议对XFS做一些简单的优化即可,比如执行格式化时指定额外的一些参数,挂载该分区时指定一些额外的挂载参数,这些都能够提高文件系统的相关性能。
    格式化时的参数:
    1
    mkfs.xfs -d agcount=256 -l size=128m,lazy-count=1,version=2 /dev/diska1
    mount时的参数:
    1
    defaults,noatime,nodiratime,nobarrier,discard,allocsize=256m,logbufs=8,attr2,logbsize=256k
    磁盘相关优化
    操作系统可调参数
      包括ionice、资源控制和内核可调参数。
      ionice
      Linux中的ionice命令可以设置一个进程I/O调度级别和优先级。调度级别为整数,0表示无,不指定级别,内核会挑选一个默认值,优先级根据进程nice值选定;1表示实时,对磁盘的最高级别访问,如果误用会导致其他进程饿死;2表示尽力,默认调度级别,包括优先级 0~7,0为最高级;3表示空闲,在一段磁盘空闲的期限过后才允许进行I/O。如下:
    1
    ionice -c 3 -p 65552
        cgroup
      通过cgroup为进程或进程组提供存储设备资源控制机制。一般很少用到,不用考虑。
        可调参数
      /sysock/sda/queue/scheduler:选择I/O调度器策略,是空操作、最后期限、an还是cfq;
    磁盘设备可调参数
      Linux上的hdparm(磁盘测试工具)工具可以设置多种磁盘设备的可调参数。
    磁盘控制器可调参数
     
     
     
     
  • 相关阅读:
    需要应用打开此 exe 解决办法:下载安装某软件所至,中毒了,
    AndroidManifest.xml清单文件详解--application节点
    [CSS 3] Solved: DOM element which is visible but not clickable: pointer-events
    [Cloud Architect] 2. Resiliency
    [Cloud Architect] 1. Design for Availability, Reliability, and Resiliency
    [Supabase] Use Triggers to Automatically Update Your Supabase Tables
    [SAA + SAP] 31. Migrations
    [SAA + SAP] 30. More solution Architectures
    [Javascript] event.target.closest(selector)
    [Javascript] Object.is() vs ===
  • 原文地址:https://www.cnblogs.com/zy1234567/p/10078425.html
Copyright © 2011-2022 走看看