监控对象
1.监控对象的理解
2.监控对象的指标
3.确定性能基准线
例如:
CPU是怎么工作的。原理
CPU使用率 CPU负载 CPU个数 上下文切换
怎么样才算故障?CPU负载多少才算高
监控范围
1.硬件监控 服务器的硬件故障
2.操作系统监控 CPU 内存 IO 进程
3.应用服务监控
4.业务监控 (登记 呼叫 购物人数 等等)
硬件监控
远程控制卡:DELL服务器:IDRAC
HP服务器:ILO
IBM服务器:IMM
Linux 就可以使用IPMI BMC控制器