https://blog.csdn.net/z50L2O08e2u4afToR9A/article/details/79695361
Q1花了较大的篇幅,系统化讲述了监控与告警体系的建立,本文稍作总结。假设恰巧你正在搭建自己主动化监控与告警平台,也许,细读这一系列文章就够了。
什么是集群信息管理
使用配置文件进行集群信息管理
使用服务进行集群信息管理
使用配置中心进行集群信息管理
使用配置文件进行员工信息管理
使用服务进行员工信息管理
常见分级告警策略:告警收敛。分时告警,逐层上报,黑白跳动
三《多维度立体化监控》
什么是多维度立体化监控
立体化监控有哪些维度
操作系统+进程+port
http状态码
服务存活性
接口处理时间
http接口
log监控
用户视角
怎样高速实施“1.操作系统+进程+port”的监控
怎样高速实施“2.http状态码”的监控
怎样高速实施“3.服务存活性”的监控
怎样高速实施“4.接口处理时间”的监控
常见http监控玩法
常见http监控的弊端
通用可扩展http监控平台架构
简版http监控框架架构
100行伪代码搞定http监控
什么是日志监控
日志分级,错误日志监控,正常日志监控
日志与文件夹规范
集中式日志监控及实现方案
分散式日志监控及实现方案
90行伪代码搞定log监控
什么是用户视角的监控
机房布点法
端上报法
第三方监控法
希望这六篇文章,对大家建立体系化的监控告警平台能有所帮助。告别背锅的时光。
调研一。下列场景大家是否常常遇到:
用户和老板总是比研发先发现线上问题
总是须要凌晨起床处理线上问题
短信一响就异常紧张
调研二。下列技术体系大家是否已经具备:
集群信息管理
员工信息管理
分级告警策略
多维度立体化监控
操作系统+进程+port
http状态码
服务存活性
接口处理时间
http接口
log监控
用户视角
求帮转。