zoukankan      html  css  js  c++  java
  • Spotlight 监控Linux服务器的性能

    Spotlight功能:
    详细的进程跟踪功能
    远程连接
    在线的Unix/Linux的调优指南
    事件日志跟踪
    配置警报

    详细的进程跟踪功能:
    Spotlight对具体的Unix / Linux的进程长达24小时的历史信息,包括可用性, CPU使用情况,内存和线程数。多面板显示会话(session)详细到所有方面的系统活动,可以看到I/O,物理和虚拟内存,网络和操作系统进程。

    事件日志跟踪:
    只要在服务器上具体的或一般的事件日志条目已提出,Spotlight就会产生警报提醒您查看。它不断扫描任何新的日志条目,以满足您的特定标准。

    配置报警:
    警报可以配置,以适应个人的需要,或保留它们的默认值用于提供有用的阈值。

    远程连接:
    快速,轻松地连接到网络上任何的有问题的机器上。

    在线的Unix/Linux的调优指南:
    Spotlight在线帮助对有效地排除故障和诊断Unix / Linux的性能问题提供了指导和建议。来自Quest业界专家的建议帮助用户加快了解决进程。

     

    服务器实时监控:
    点击菜单项中的“Home”,在服务器的监控面板中可以看到诸如System、Network、CPU、Memory、Paging Files、Disks等运行状况。
    Spotlight以红、黄、绿三种颜色标识服务器各组件的运行状况:
    红色是警报提示,如果哪项参数显示红色,就表示当前服务器的该组件性能告急或者出现了性能瓶颈,需要管理员马上解决相关问题。
    如果哪一项显示为黄色,表示该项处于亚健康状态,需要管理防范和注意了。
    如果是绿色,则该项运行正常。

    进程监控:
    点击Spotlight工具栏中的Processes工具按钮可查看服务器当前运行的进程情况。点击某进程会在下面出现一个框架窗口显示该进程的详细信息,Process Details项下显示了该进程的各项属性。
    此外, Processes项还包含Zombies和Services, Zombies可以查看僵死的进程, Services可以查看服务器当前的服务运行状况

    CPU的利用率:
    Total CPU Usage:总的CPU的利用率,该值在75%以上,则CPU 利用率过高。
    CPU Usage by Processor:单个CPU的利用率。
    Run Queues:可运行队列。
    Context Switching:上下文切换,就是Process(Thread)的切换,如果切换过多,会让CPU忙于切换,也会导致影响吞吐量。

    CPU性能分析:
    通常我们期望我们的系统能到达以下目标:
    CPU 利用率:如果 CPU有100%利用率,那么应该到达这样一个平衡:
    65%-70%User Time,
    30%-35% System Time,
    0%-5% Idle Time。
    上下文切换:上下文切换应该和 CPU 利用率联系起来看,如果能保持上面的 CPU 利用率平衡,大量的上下文切换是可以接受的。
    可运行队列:每个可运行队列不应该有超过1-3个线程(每处理器),比如:双处理器系统的可运行队列里不应该超过6个线程。


    内存监控相关的参数有:Physical、Virtual、Paging和Cache
    Physical:总物理内存。
    Virtual:虚拟物理内存。
    Paging:分页。
    Cache:缓存。

    linux服务器下输入free –g命令,对应的物理内存指标显现在Spotlight。

    (应用程序可用内存/系统物理内存)>70%时,表示系统内存资源非常充足,不影响系统性能;
    (应用程序可用内存/系统物理内存)<20%时,表示系统内存资源紧缺,需要增加系统内存;
    20%<(应用程序可用内存/系统物理内存)<70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。
    应用程序可用内存对应-/+ buffers/cache这行中的free值,系统物理内存对应Mem这行的total值。


    磁盘监控相关参数:Disk Reads、Service Time、Disk Writes、Queue Length、Wait Time和Busy
    Disk Reads:磁盘读取速率。
    Disk Writes:磁盘写入速率。
    Service Time:服务时间,指磁盘读或写操作执行的时间。如果该值持续超过 20ms,一般可考虑会对上层应用产生影响。
    Queue Length: I/O 等待队列长度,指待处理的 I/O 请求的数目,
    如果 I/O 请求压力持续超出磁盘处理能力,该值将增加。
    如果单块磁盘的队列长度持续超过 2,一般认为该磁盘存在 I/O 性能问题。

    Wait Time:等待时间,指磁盘读或写操作等待执行的时间,即在队列中排队的时间。
    Busy:磁盘处理事务繁忙百分比


    Network监控相关参数: Network Utilization、 Connections、 Network Utilization by Kilobytes、 Packets by Network Card、Error Rates by Network Card和Collisions by Network Card
    Network Utilization:网络利用率。(按数据包)
    Network Utilization by Kilobytes:网络利用率。(按字节)
    Packets by Network Card:数据流量。
    Error Rates by Network Card:数据传输的误差率。
    Collisions by Network Card:在网卡上检测到的冲突数。
    Connections:连接。

    小结:
    如果Error Rates by Network Card和Collisions by Network Card值过高,则意味着网络带宽可能出现瓶颈。

    Connections Established:建立连接的用户数。
    Time_Wait:该值过高,网络可能出现瓶颈。
    Close_Wait:该值过高,网络可能出现瓶颈。
    Pkts/s:数据包传输速率。
    Errors/s:数据包丢失率,该值过高,网络带宽可能出现瓶颈。

    Spotlight 有时候有误报的现象,要配置一下警报的阀值

     

     

     

     

  • 相关阅读:
    JBoss无规律自动关闭故障定位
    使用Js脚本 修改控制IE的注册表相关设置(activex等)
    EJB到底是什么,真的那么神秘吗??
    MyEclipse 8.5 优化实例
    ORACLE修改用户表所属表空间的步骤
    Ora-01536:超出了表空间users的空间限量(转)
    Houdini Python开发实战 课程笔记
    Houdini Mac 添加external editor
    Xcode 导出C++项目在其他电脑执行
    Xcode中opengl的配置
  • 原文地址:https://www.cnblogs.com/qianjinyan/p/9341614.html
Copyright © 2011-2022 走看看