zoukankan      html  css  js  c++  java
  • datax的安装使用

    大数据同步技术datax安装链接https://github.com/alibaba/DataX

    配置 python2,jdk1.8

    第一步命令查看配置模板:

    cd D:DataXdataxin    d:      python2 datax.py -r mysqlreader -w mysqlwriter  

    json模板  用的话没有注释的 这里是解释一下

    {
        "job": {
            "setting": {
                "speed": {
                    "channel": 1
                }
            },
            "content": [
                {
                   "reader": {
                        "name": "txtfilereader",
                        "parameter": {
                            "path": ["F:/作业.txt"],//文本路径
                            "encoding": "gbk",
                            "column": [//文本列
                                {
                                    "index": 0,
                                    "type": "string"
                                },
                                {
                                    "index": 1,
                                    "type": "string"
                                }
                               
                            ],
                            "fieldDelimiter": ",",//文件分隔符号
                            "skipHeader": "true"
                        }
                    },
                    
                   "writer": {
    
                        "name": "mysqlwriter",
                        "parameter": {
                            "writeMode": "insert",
                            "username": "root",
                            "password": "199126",
                            "column": [//表里字段
                                "time",
                                "name",
                               
                            ],
    
                            "session": [],
    
                            "connection": [
                                {
                                    "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/kettle?useUnicode=true&characterEncoding=utf8&useSSL=false", //数据库路径
                                    "table": ["my"]//数据库表
                                }
                            ]
                        }
                    }
                }
            ]
        }
    }

    数据库里建好表后

    启动datax 将文件导入数据库里

    将python2 D:DataXdataxindatax.py F:json.json

    出现的问题:

    • Python版本要为2,原因前面已经说过了
    • cmd乱码解决:输入CHCP 65001
    • 数据库中的数据中文乱码解决:在json文件中jdbcUrl项加上:?characterEncoding=utf8

  • 相关阅读:
    centos6和centos7升级openssh7.5脚本
    开通telnet服务,使用telnet登入
    彻底删除kafka的topic以及其中的数据
    redis集群创建
    curl 命令参数
    nginx.conf配置文件详解,白嫖的
    logstash迁移es数据
    es 常用查询
    pl/sql 存储过程
    es查看集群信息命令_cat和_cluster
  • 原文地址:https://www.cnblogs.com/zlj843767688/p/12391257.html
Copyright © 2011-2022 走看看