zoukankan      html  css  js  c++  java
  • 如何通过Logstash将MySQL数据同步到ElasticSearch

    前言:

            最近又重新在看ElasticSearch的文档,发现那些DSL语法全都忘记了,所以准备写一个用ES做储存的demo小项目。其实是用DSL代替之前项目的SQL,但是数据以及一些字段还是需要,所以就需要将以前的MySQL数据导入到ElasticSearch中。

            以前的做法是写一个脚本,通过创建索引,创建文档,将MySQL数据插入到ElasticSearch中,现在想通过Elastic中的成员之一——Logstash,来完成初步的导入工作。下面就从基础简单介绍该方式的导入过程吧。

    工具清单:

    1. ElasticSearch

    2. Logstash

    3. Java JDK

    4. mysql-connector-java

    环境搭建:

            首先可以先安装JDK,配置环境变量,版本1.8之类的都可以。ElasticSearch和Logstash可以在Elastic官网下载最新版本,最好是两个工具的版本保持一致,目前我这里使用的是7.8版本。mysql-connector-java是一个同步驱动,只需要在启动logstash指定目录就可以。

    配置MySQL同步:

    
    input {
    
        stdin {
    	
        }
    	
        jdbc {
          # mysql 数据库链接,shop为数据库名
          jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/rebuild?characterEncoding=UTF-8&useSSL=false"
          # 用户名和密码
          jdbc_user => "root"
          jdbc_password => "root"
          # 驱动
          jdbc_driver_library => "E:/2setsoft/1dev/logstash-7.8.0/mysqletc/mysql-connector-java-5.1.7-bin.jar"
          # 驱动类名
          jdbc_driver_class => "com.mysql.jdbc.Driver"
          jdbc_paging_enabled => "true"
          jdbc_page_size => "50000"
          # 执行的sql 文件路径+名称
          statement_filepath => "E:/2setsoft/1dev/logstash-7.8.0/mysqletc/run.sql"
          # 设置监听间隔  各字段含义(由左至右)分、时、天、月、年,全部为*默认含义为每分钟都更新
          schedule => "* * * * *"
          # 索引类型
          type => "content"
        }
    	
    }
     
    filter {
        json {
            source => "message"
            remove_field => ["message"]
        }
    }
     
    output {
    
        elasticsearch {
            hosts => ["127.0.0.1:9200"]
            index => "hhyp"
            document_type => "room"
            document_id => "%{id}"
        }
    	
        stdout {
            codec => json_lines
        }
    	
    }

    1. jdbc_connection_string

            配置示例:jdbc:mysql://IP地址:端口/数据库名?字符集&其他配置参数。

    2. jdbc_driver_library

            同步驱动工具绝对地址,全称mysql-connector-java-5.1.7-bin.jar,网上可以自行搜索,版本我这里使用的是5.17。

    3. statement_filepath

            需要进行执行的sql 文件,主要是通过SQL语句将数据通过到ES指令,以下就表示将room记录同步到ES。

    select * from rm_room where delete_time = 0

    4. 附加

            导入到ElasticSearch的配置,hosts指定ES服务的地址,index导入时创建的索引名称,document_type类似于MYSQL的表,ducument_id类似与该表的主键。

    启动同步: 

    1. 在Logstash根目录下创建一个新文件夹mysqletc,里面放置驱动文件,MySQL同步配置,MySQL查询同步指令。

    2. 在当前目录下启动cmd,输入命令,bin\logstash -f mysqletc\mysql.conf 就可以了。

    3.  最后在kibana中的索引管理就可以看到新同步过来的索引了,要数据可以通过DSL查看。

    个人网站:www.zerofc.cn 公众号:ZEROFC_DEV QQ交流群:515937120 QQ:2652364582 头条号:1637769351151619 B站:286666708 大鱼号:北桥苏
  • 相关阅读:
    【TCP】TCP三次握手与四次挥手
    【Spring】@PathVariable 获取带点参数,获取不全
    【异常】Caused by: java.sql.SQLTransientConnectionException: HikariPool-1
    【异常】 FlywayException:Validate failed:Migration checksum mismatch
    Eclipse------启动Server时出现弹窗Server at localhost was unable to start within 45 seconds.
    SpringBoot------集成PageHelper分页功能
    SpringBoot------集成MyBatis
    SpringBoot------thymeleaf的使用
    SpringBoot------全局异常捕获
    SpringBoot------JPA连接数据库
  • 原文地址:https://www.cnblogs.com/zerofc/p/15648400.html
Copyright © 2011-2022 走看看