Prometheus配置
1、常用参数详解
[root@localhost ~]# /usr/local/prometheus/prometheus -h
--config.file="prometheus.yml" #指定配置文件
--web.listen-address="0.0.0.0:9090" #监听端口
--web.max-connections=512 #默认最大连接数512
--storage.tsdb.path="data/" #默认的存储路径: data目录下
--storage.tsdb.retention.time=15d #默认的数据保留时间:15天。
--alertmanager.timeout=10s #把报警发送给alertmanager的超时限制10s
--query.timeout=2m #查询超时时间限制默认为2min,超过自动被kill掉。可以结合grafana的限时配置如60s
--query.max-concurrency=20 #并发查询数prometheus的默认采集指标中有一项prometheus_engine_queries_concurrent_max可以拿到最大查询并发数及查询情况
2、配置文件解析
[root@localhost ~]# cat /usr/local/prometheus/prometheus.yml
global:
#默认情况下专区目标的频率
[ scrape_interval: <duration> | default = 1m ]
#抓取超时时间
[ scrape_timeout: <duration> | default = 10s ]
#评估规则的频率
[ evaluation_interval: <duration> | default = 1m ]
#与外部系统通信时添加到任何时间序列或警报的标签
#(联合,远程存储,Alertma# nager)
external_labels:
[ <labelname>: <labelvalue> ... ]
#规则文件指定了一个globs列表
#从所有匹配的文件中读取规则和警报
rule_files:
[ - <scrape_config> ... ]
#抓取配置列表:
scrape_configs:
[ - <scrape_config> ... ]
#警报指定与Alertmanager相关的设置
alerting:
alert_relabel_configs:
[ - <relabel_config> ... ]
alertmanagers:
[ - <alertmanager_config> ... ]
#与原创写入功能相关的设置
remote_write:
[ - <remote_write> ... ]
#与原创读取功能相关的设置
remote_read:
[ - <remote_read> ... ]
3、<scrape_config>配置:
<scrape_config>部分指定一组描述如何刮除他们的目标和参数。在一般情况下,一个scrape配置指定单个作业。在高级配置中,这可能会改变。
目标可以通过<scrape_config>参数静态配置,也可以使用其中一种支持的服务发现机制动态发现。
其中<scrape_config>在所有scrape配置中必须时唯一的。
默认配置相关的参数:
4、静态配置scrape_configs:
正常里面我们使用经常配置文件还是比较多的,在我们服务器的数量不是很多的场景下,我们可以使用静态的方式来进行配置,如下:
基础信息配置:
scrape_configs:
- job_name: 'linux-bj' #job名称
static_configs: #静态的形式
- targets: ['192.168.10.121'] #远程地址
labels: #标签
idc: bj-jiuxianqiao #机房标签
- job_name: 'linux-gx'
static_configs:
- targets: ['192.168.10.121:9100']
labels:
idc: gz-daxuecheng
[root@localhost ~]# systemctl restart prometheus
可视化界面
Alerts:表示可以看到我们定义的告警规则。
Graph:表示在界面查询数据,生成图片,或者返回值。
Status:下面比较主要的式target,表示我们远端的监控,可以看以下exporter的运行情况,出现故障很容易看出来。