Openstack ceilometer主要用于监控虚拟机、服务(glance、image、network等)和事件。虚拟机的监控项主要包括CPU、磁盘、网络、instance。本文在现有监控项的基础上,介绍如何增加新的监控项目。
一、Ceilometer框架结构
Ceilometer监控通过在计算节点部署Compute服务,轮询其计算节点上的instance,获取各自的CPU、网络、磁盘等监控信息,发送到RabbitMQ,Collector服务负责接收信息进行持久化存储,详细框架如下图所示(点击查看大图)。
本文主要介绍instance的监控,获取instance的监控数据发送到message队列。instance的监控数据的获取主要通过Compute服务以pollster方式轮询各虚拟机,Compute服务类图如下(点击查看大图)。
通过该类图可知,新增项目需要继承ComputePollster类,并实现get_samples方法。最后通过配置即可,获取到新的监控项数据。由于,现有的Ceilometer没有对内存的实时监控,本文以内存为例,详细介绍增加新的监控项的流程。
二、新增虚拟机监控项
现有虚拟机的监控项目,没有对内存的监控。本文以内存为例,介绍增加内存监控模块的方法,增加内存监控方法比较简单,主要在compute端增加获取数据的方式,然后修改配置文件,即可将数据持久化数据库中。详细步骤如下:
1、在 ceilometer/ceilometer/compute/pollsters目录下新建文件mem.py(名字自定义)。在该文件下定义MEMPollster类并实现get_samples方法:
class MEMPollster(plugin.ComputePollster): |
|
def get_samples(self, manager, cache, instance): |
2、get_samples中获取内存数据的方式,可参考CPU获取数据的架构,在ceilometer/ceilometer/compute/virt/inspector.py 中定义返回数据的格式:
MEMStats = collections.namedtuple(‘MEMStats’, ['total', 'free']) |
获取内存方式多样,本文采用读取proc文件获取instance所在进程占用的内存大小,有时获取的数据比instance最大内存大,所以该方式对windows系统的虚机有一定的误差,仅作为示例参考。方法定义如下:
def inspect_mems(self, instance_name): |
获取数据后,按sample数据结构返回即可。
3、设计完上述获取数据的方式后,并不能轮询到内存数据,还需要修改一些设置文件。
首先,修改ceilometer/setup.cfg文件,在该文件ceilometer.poll.compute下,增加
mem = ceilometer.compute.pollsters.mem:MEMPollster |
其次,由于包冲突的问题,将ceilometer安装在隔离环境中,所以source隔离环境,重新安装ceilometer,以上配置才能生效。执行 python setup.py develop 命令即可。
4、重启ceilometer服务,进入mongodb的ceilometer数据库即可在meter表中查看mem的监控数据。
监控的一些实现,可以做一下:https://github.com/kevinjs/procagent