ELK之Logstash配置文件详解

zoukankan html css js c++ java

ELK之Logstash配置文件详解
　　Logstash 是一个开源的数据收集引擎，它具有备实时数据传输能力。它可以统一过滤来自不同源的数据，并按照开发者的制定的规范输出到目的地。它以插件的形式来组织功能，通过配置文件来描述需要插件做什么，配置文件主要由input、filter和output三部分组成。

一、input

　　负责从数据源提取数据，由于我提取的是日志文件，所以使用的是file插件，该插件常用的几个参数是：
- path：指定日志文件路径。
type：指定一个自定义名称，设置type后，可以在后面的filter和output中对不同的type做不同的处理，适用于需要消费多个日志文件的场景。
start_position：指定起始读取位置，“beginning”表示第一次启动从文件头开始读取，后面动态读取；“end”表示从文件尾开始（类似tail -f）。
sincedb_path：sincedb_path 指定sincedb文件的路径。sincedb保存每个日志文件已经被读取到的位置，如果Logstash重启，对于同一个文件，会继续从上次记录的位置开始读取。如果想重新从头读取文件，需要删除sincedb文件。如果设置为“/dev/null”，即不保存位置信息。
二、 output

　　负责输出数据，改部分也有提供丰富的插件。以es为例，需要指定es接收数据的地址和端口，以及日志存入的index 名称。
# 输出到es output{ elasticsearch{ hosts => ["192.168.1.3:9200"] index => "log-%{+YYYY.MM.dd}" } }
三、filter

　　负责通过配置插件来解析、处理日志数据。插件介绍
grok：用于将非结构化的文本数据转化为结构化的数据，内部使用正则语法对文本数据进行匹配，为了降低使用复杂度，其提供了一组pattern，我们可以直接调用pattern而不需要自己写正则表达式，参考源码grok-patterns。也可以使用工具Grok Debugger可以对解析语法进行调试。
kv：用于将某个字段的值进行分解，类似于编程语言中的字符串Split。在下面的配置中，我们将request_args字段值按照“&”进行分解，分解后的字段名称以“request_args_”作为前缀，并且丢弃重复的字段。
geoip：用于根据IP信息生成地理位置信息，默认使用自带的一份GeoLiteCity database，也可以自己更换为最新的数据库，但是需要数据格式需要遵循Maxmind的格式（参考GeoLite），似乎目前只能支持legacy database，数据类型必须是.dat。下载GeoLiteCity.dat.gz后解压，并将文件路径配置到source中即可。
translate，用于检测某字段的值是否符合条件，如果符合条件则将其翻译成新的值，写入一个新的字段，匹配pattern可以通过YAML文件来配置。
查看全文

相关阅读:
django.template.exceptions.TemplateDoesNotExist: login.html 错误处理
 pycharm 如何进行全部搜索
 python调用 sshpass
sshpass 使用方法
 ssh 绕过The authenticity of host '*.*.*.*' can't be established 直接输入密码
 Django深入----django.db.transaction
django深入----django.db.transaction
Flask+ Angularjs 实例：创建博客
 Python --写excel
Python --链接Mongodb

原文地址：https://www.cnblogs.com/JoeyWong/p/10149957.html

ELK之Logstash配置文件详解

一、input

二、 output

三、filter