6.4 处理监控工具
还有几个监控工具可以使您的日常生活更轻松。
其中最流行的监控工具是Nagios。它被广泛地使用,也支持各种软件组件。
要使用 Nagios 来监控您的 PostgreSQL 集群,需要安装一个方面运行复制相关测试的插件。这样的适用于PostgreSQL 的插件可以自由地从 http://bucardo.org/wiki/Check_postgres下载。适用于 Nagios的一个插件Burcardo不仅能够用于测试复制,而且还是一个监控 PostgreSQL 的标准软件组件。
6.4.1 安装check_postgres
一旦您已经从Bucardo的网站下载了插件,安装该软件是很容易的。第一步是提取.tar归档:
tar xvfz check_postgres.tar.gz
现在,您可以进入新创建的目录并运行Perl Makefile:
perl Makefile.PL
最后您可以编译并安装代码:
make
make install
最后一步必须使用root用户来执行,因为不这样的话,您可能没有足够的权限在您的系统上部署代码。
在我们的例子中,二进制文件被安装在/usr/local/bin目录下。我们可以容易地通过运行如下命令来检查是否已经成功地安装了:
/usr/local/bin/check_postgres.pl --help
直接启动 check_postgres.pl 也是在命令行提示符下调用这些插件并检查结果是否有意义的方式。
我们希望您把注意力集中在 custom_query 功能上。如果检查有缺失,缺失的东西是需要的,但是不能用,custom_query会帮助您。
6.4.2 决定监控策略
人们经常会问可Nagios的无数的检查中的哪些检查,他们可以用来配置它的数据库系统。 对我们来说,问题的答案只能是:这要看情况。如果您碰巧运行了一个大型数据库分析,该数据库将只能有少数人使用,检查打开的数据库连接数可能是没有用的。如果您碰巧运行了一个服务于成千上万用户的高性能的 OLTP 系统,检查打开的连接可能是个好注意。
这真的取决于您运行的应用的类型,所以您必须自己思考并得出一个合理的检查想和阀值。从逻辑上讲,这同样也适用于任何其它您能潜在地想起的监控软件。这些规则都是一样的:想想您的应用程序在做什么,考虑一下可能出错的事情。基于这些信息,您可以选择适当的检查。所有可用的检查列表可以在http://bucardo.org/check_postgres/check_postgres.pl.html找到。
6.5 总结
在本章中,您学习了许多关于监控的知识。我们看到了在归档中检查什么,我们已经看到如何解释PostgreSQL内部系统视图。最后,我们看到了在操作系统级别检查哪些进程。
在一般情况下,推荐使用专业的监控软件如Zabbix,Nagios和其它的能够自动运行测试和自动发出通知的软件。
所有这些检查将为您的数据库设置提供一个相当不错的安全网。
下一章专门讲高可用性。将为您介绍高可用性相关的重要概念,我们将引导您完成这些基础知识。