zoukankan      html  css  js  c++  java
  • 小记--------sqoop的简单从mysql导入到hbase操作

    sqoop import
    -D sqoop.hbase.add.row.key=true                        //是否将rowkey相关字段列入列族中,默认为false ;该参数必须在import之后
    --connect jdbc:mysql://120.27.208.185/bigdatatest        //连接mysql数据库
    --username och_test                                    //mysql用户名
    --password 1111111                                    //mysql密码
    --table t_teacher                                        //mysql表名
    --columns id,t_name,t_password,sex,description,pic_url,school_name,regist_date,remark        //mysql列名
    --hbase-table t_teacher                                //hbase中接受数据的表名
    --hbase-create-table                                    //如果接收数据的表名不存在则创建新表
    --column-family MM                                        //列族名称,所有源表的字段都进入该列族
    --hbase-row-key id                                        //如果不指定该参数,则采用源表的key作为rowkey;可以指定一个字段作为rowkey,或者指定多个字段组合成rowkey(需要用双引号包含多个字段,字段之间以逗号分隔)
    -m 1                                                    //并发度:1
     
     
    eg:
    #使用sqoop 将mysql数据库的t_teacher表的前500w行数据导入hbase
    sqoop import -D sqoop.hbase.add.row.key=true --connect jdbc:mysql://120.27.208.185/bigdatatest --username och_test --password 1111111 --query 'select * from t_teacher WHERE $CONDITIONS limit 5000000;' --columns id,t_name,t_password,sex,description,pic_url,school_name,regist_date,remark --hbase-table t_teacher --hbase-create-table --column-family MM --hbase-row-key id -m 1                                                   
     
    eg2:
    #导入整张表的数据
    sqoop import -D sqoop.hbase.add.row.key=true --connect jdbc:mysql://120.27.208.185/bigdatatest --username och_test --password 1111111 --table t_teacher  --columns id,t_name,t_password,sex,description,pic_url,school_name,regist_date,remark --hbase-table t_teacher --hbase-create-table --column-family MM --hbase-row-key id -m 1
     
  • 相关阅读:
    mysql5.7 linux安装参考
    谈谈微服务中的 API 网关(API Gateway)
    十大Intellij IDEA快捷键
    SqoopFlume、Flume、HDFS之间比较
    PostgreSQL-存储过程(一)基础篇
    spark调优篇-oom 优化(汇总)
    spark调优篇-数据倾斜(汇总)
    spark调优篇-Spark ON Yarn 内存管理(汇总)
    spark异常篇-OutOfMemory:GC overhead limit exceeded
    spark异常篇-Removing executor 5 with no recent heartbeats: 120504 ms exceeds timeout 120000 ms 可能的解决方案
  • 原文地址:https://www.cnblogs.com/yzqyxq/p/12054338.html
Copyright © 2011-2022 走看看