新入职一家公司,公司平台不错 但自动化水准比较低,现有的监控平台不够完善,巡检工作还需要每天线下手动进行,不仅耗费大量的人力,巡检效果也不理想,于是想到自己写个巡检工具,将自己从每天的工作中释放出来
系统规划:
1、平台:支持Linux + Windows
2、功能要求:
1、巡检功能:
基础信息巡检
1、硬盘、内存、CPU
2、服务状态
3、自生服务端口检查
4、到指定服务器的端口可用性检查
5、web 网站访问可行性
暂时想到这么些 后续有更多想法再补充。 linux 平台可以使用shell, windows 可以调用powershell ,完美
数据处理功能:
数据收集:提供统一平台将每台服务器的巡检报告统一到一台服务器,经过研究,确认可以通过Ansible 实现。
数据清洗:Ansible 收集的日志信息有一定的标准,但还不具备直接适用的条件,这里想到使用Python 开发一个脚本来完成日志文件的清洗工作,提取有效信息。
数据分析:提取的文件只是检查结果,这些结果释放符合我们的预期,怎么才能将有价值的信息体现出来,同样,使用Python 实现。
数据处理:最后是结果处理,巡检只是发现问题,还得将问题及时反馈给到相关运维的同事,这里我想到了邮件。 于是基于Python 调用邮件模块。
按照这个规划,貌似一切都是可行的