ELK日志分析平台环境部署（yum安装）

zoukankan html css js c++ java

ELK日志分析平台环境部署（yum安装）
前言：通常体质被分散存储在不同的设备上面，在庞大的服务器集群中，我们需要集中化的管理，日志的统计和检索，一般我们使用grep和awk，wc等linux命令虽然能够实现检索和统计，但是呢，对于要求更高的查询，排序等环境会有很大的压力和瓶颈；于是我们需要对于日志进行集中化的管理，将所有机器上面的日志信息进行收集，汇总到一起，完整的日志数据具有非常重要的作用；

1）信息查找，通过检索日志信息，定位相应的bug，及时找出解决方案

2）服务诊断（信息判断），通过检索日志信息，进行统计和分析，从而了解服务器的负载情况和运行状态，判断问题的所在点

3）数据分析，如果是格式化的log日志，可以做进一步的数据分析，统计和检索，汇总出最具价值的信息；

【ELK组成结构】

1）Elasticsearch：基于lucnne（卢斯）的开源分布式搜索引擎，同时是基于java开发的，其主要特点：分布式，零配置，自动发现，索引分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等

Ps：关键词详解：

Lucene：是一款高性能，可扩展的信息检索工具库，信息检索是指文档搜索，文档内信息搜索或者文档相关的元数据搜索等操作

Restful：对于rest理解就是web服务的一种架构风格，面向资源的资源的架构，使用不同的协议实现轻量级，跨品台，跨语言的架构设计；同时是一种思想设计；

索引分片：:在elasticsearch中索引是一个保存相关数据的地方，索引实际上是指向一个或多个物理分片的逻辑命名空间；在这里，需要知道，一个分片就是一个lucene实例，本身就是一个完整的搜索引擎，·我们的数据都存储和索引到分片内；ES就是利用分片将数据分发到集群各处，可以理解为分片是数据的容器，分片又被分配到集群各个节点，使得数据得以均衡；

2）Logstash:是一个完全开源的工具，可以对日志进行收集，过滤，并将其存储供以后使用（也就是搜索。工作模式是C/S架构，Clinet端安装在需要收集日志的机器上，server负责将收集到的日志信息数据进行过滤，一并发给elasticsearch）

3）Kibana可以理解为基于浏览器页面的elasticsearch前端展示工具，也是开源免费的工具，为logstash和elasticsearch提供日志分析友好的web界面，可以实现汇总，分析和搜索重要的数据日志；

Ps:logstash和elasticsearch是用java语言编写的，而kibana是使用node.js框架，所以说在配置ELK环境要保证JDK开发库；

【ELK原理剖析】

如上所示：LEK原理也就是工作流程，通过Logstash手机客户端app的日志信息数据，将所有的日志过滤出来，并存到Elasticsearch搜索引擎里，然后通过Kibana GUI在web前端展示给用户，用户需要可以进行查看指定的日志内容信息；

加入Redis之后的ELK的工作流程：

Logstash包含了indexer和Agent(shipper)，Agent负责客户端监控和过滤日志，而index负责日志并将日志信息交给elasticsearch，随后 elasticsearch将日志存储到本地，并建立索引，提供搜索，Kibana可以从Elasticsearch中获取想要的日志信息，最后再展示给用户；

【集中式日志系统特点汇总】

1）收集：能够收集到各种来源的日志信息

2）传输；能够稳定且实时有效的将数据传输到中央系统

3）存储：如何有效的将日志进行索引分片处理

4）分析：通过 Kibana CUI进行展示分析

5）告警：能够抓住关键性信息数据，进行告警处理

【ELK部署方案详解】

Logstash是一个ETL工具，负责从每个台机器上采集日志数据，对数据进行有效过滤和处理，传输到Elasticsearch中存储，Elasticsearch是一个分布式搜索分析引擎，主要用于存储数据同时提供实时的数据查询，Kibana是一个数据可视化的web服务展示平台，根据用户选择性的要求从Elasticsearch中查询数据，形成相应的分析结果，以图形化的形式展示给用户

思路：

1）在每台需要收集日志的机器上面部署Logstach，作为Shipper的角色，监控抓取和过滤日志信息，并将其传输到Redis消息列队中，另一个角色Index，负责从Redis中获取数据。对数据进行格式化和相关操作后，输出到Elasticsearch中存储

2)部署Elasticsearch，取决于日志信息量了，如果数据量大，则需要做集群，集群最好三个节点以上，同时还需要部署相关的监控软件

那么问题来了？为什么不在每台机器上面部署 Logstach直接获取数据，处理并存入Elasticsearch呢？

首先有三个优势：

第一：减轻日志所在机器的负载压力，本身每台机器上面都存在着应用服务所带来的压力，如果继续在这台机器上去搞事情，岂不是崩溃了？

第二：既然收集日志信息，那么收集对象数据量相当庞大，如果所有机器持续向Elasticsearch中持续写入数据，必然造成Elasticsearch压力过大，导致Elasticsearch“撑死”，所以需要给Elasticsearch有个缓冲的机会，同样日志信息量不丢失；

第三：将日志信息格式化处理和传输的工作交给indexer去做，这样可以在修改同时，避免复杂度，Indexer 作为索引管理工具，提供了批量索引导入、清空索引、刷新索引队列、日志等各项功能

【拓展】

我们需要做的是将数据放入一个消息列队中进行缓冲，redis只是其中的一个选择，还有另外RabbitMQ和Kafka两种方式，其实在生产环境中，用的比较多的是redis和kafka，但是由于Redis集群一般都是通过key来做分片，无法对list类型做集群，在数据量比较庞大的时候，就不合适了，而kafka天生就是分布式消息队列系统

【Elasticsearch】

[root@elasticsearch ~]# yum install -y java

[root@elasticsearch ~]# rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
[root@elasticsearch ~]# vim /etc/yum.repos.d/elasticsearch.repo

[elasticsearch-5.x]
name=Elasticsearch repository for 5.x packages
baseurl=http://packages.elastic.co/elasticsearch/5.x/centos
gpgcheck=1
gpgkey=http://packages.elastic.co/GPG-KEY-elasticsearch
enabled=1

1）配置

[root@elasticsearch ~]# mkdir /data/elasticsearch-data -p

[root@elasticsearch ~]# grep -v "^#" /etc/elasticsearch/elasticsearch.yml #修改elasticsearch配置文件
1 cluster.name: bixiaoyu #组名（集群相同组必须要一致） 2 node.name: elasticsearch #节点名称，建议与主机名一致 3 path.data: /data/elasticsearch-data/ #数据存放位置（ps：数据存放位置是我们刚刚创建的目录路径） 4 path.logs: /var/log/elasticsearch/elasticsearch.log #日志存放位置 5 bootstrap.memory_lock: true 锁住内存，不被使用到交换分区中 6 network.host: 0.0.0.0 #网络设置 7 http.port: 9200 #elasticsearch默认端口
[root@elasticsearch ~]# chown -R elasticsearch:elasticsearch /data/
[root@elasticsearch ~]# systemctl start elasticsearch
[root@elasticsearch ~]# chkconfig elasticsearch on
注意：正在将请求转发到“systemctl enable elasticsearch.service”。
Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service.
[root@elasticsearch ~]# systemctl status elasticsearch
● elasticsearch.service - Elasticsearch Loaded: loaded (/usr/lib/systemd/system/elasticsearch.service; enabled; vendor preset: disabled) Active: active (running) since 三 2018-05-30 22:55:55 CST; 13min ago Docs: http://www.elastic.co Main PID: 2425 (java) CGroup: /system.slice/elasticsearch.service └─2425 /bin/java -Xms256m -Xmx1g -Djava.awt.headless=true -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=75 -XX:+... 5月 30 22:55:58 elasticsearch elasticsearch[2425]: [2018-05-30 22:55:58,348][INFO ][env ] [Tessa] using [1] data paths, mou...[rootfs] 5月 30 22:55:58 elasticsearch elasticsearch[2425]: [2018-05-30 22:55:58,348][INFO ][env ] [Tessa] heap size [1015.6mb], com...s [true] 5月 30 22:56:00 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:00,346][INFO ][node ] [Tessa] initialized 5月 30 22:56:00 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:00,346][INFO ][node ] [Tessa] starting ... 5月 30 22:56:00 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:00,415][INFO ][transport ] [Tessa] publish_address {127.0.0.....1:9300} 5月 30 22:56:00 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:00,419][INFO ][discovery ] [Tessa] elasticsearch/4zbxGI80SvOJLFh7Y2slxg 5月 30 22:56:03 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:03,472][INFO ][cluster.service ] [Tessa] new_master {Tessa}{4zbxGI...eceived) 5月 30 22:56:03 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:03,502][INFO ][http ] [Tessa] publish_address {127.0.0.....1:9200} 5月 30 22:56:03 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:03,502][INFO ][node ] [Tessa] started 5月 30 22:56:03 elasticsearch elasticsearch[2425]: [2018-05-30 22:56:03,504][INFO ][gateway ] [Tessa] recovered [0] indices int...er_state Hint: Some lines were ellipsized, use -l to show in full.
PS:通过状态可以看出elasticsearch设置的内存最小为256m，最大1G

[root@elasticsearch ~]# netstat -antlp | grep -E "9200|9300"
查看全文

相关阅读:
大型网站架构系列：20本技术书籍推荐
 程序员进阶顺序
 乐观锁与悲观锁——解决并发问题
 Redis的事务功能详解
 驱动开发（8）处理设备I/O控制函数DeviceIoControl
钱币兑换问题（杭电1284）（母函数）
jqm文件上传,上传图片,jqm的表单操作,jqm的ajax的使用,jqm文件操作大全,文件操作demo
问：简述一下内部类的实质是什么？
Android 删除新版安卓fragment_main.xml
保温饭盒毕业设计程序

原文地址：https://www.cnblogs.com/bixiaoyu/p/9115071.html

ELK日志分析平台环境部署 （yum安装）

ELK日志分析平台环境部署（yum安装）