关于hbase的数据迁移

zoukankan html css js c++ java

关于hbase的数据迁移
场景：

一套自己编译的Hbase集群 A

一套自己通过cloudera平台搭建的Hbase集群 B

注意：（我的两套集群是同一个网段的）

方式1：通过快照方式进行数据迁移（不需要提前建表）

1）：首先现在老集群A上进行快照制作（hbase命令行）
hbase> snapshot '要快照的表名tableA' , '快照名称snapA'
查看快照：list_snapshots

删除快照：delete_snapshot '快照名称snapA'

2）：开始快照迁移（将集群A的快照迁移到集群B上）
bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot 快照名称snapA -copy-to hdfs://newCluster:8082/hbase
3)：登录新集群的hbase命令行,然后执行
restore_snapshot 'snapA'
但是执行第3）步时候报错：
Caused by: java.lang.IllegalArgumentException: A clone should not have regions to restore
发现其实自己编译的快照和cloudera平台的Hbase不兼容。so，这种方式不合适

方式2：在老集群A上通过bulkload写入新集群B上（需要提前建表，别忘记预分区）

1）：在新集群B 提前将表创建好，例如：
create 'renter_info',{NAME =>'MM', COMPRESSION => 'SNAPPY'}, SPLITS => ['19999999', '33333332', '4ccccccb', '66666664' , '7ffffffd' , '99999996' , 'b333332f' , 'ccccccc8' , 'e6666661']
2）：在老集群A 执行bulkload命令语句：
bin/hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles -Dcreate.table=no -DHbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily=2014 hdfs://newCluster:8020/hbase/data/default/order_info
依然执行不过去！

因此上面的方式1、方式2其实是很依赖是否集群版本兼容问题

方式3：hadoop distcp 方式

1）：通过hadoop distcp将集群A中要迁移的表数据通过分布式copy方式，copy到集群B
hadoop distcp hdfs://oldcluster:8020/hbase/data/default/order_info hdfs://newCluster:8020/hbase/data/default/order_info
2）：修复元数据
/opt/cloudera/parcels/CDH/lib/hbase/bin/hbase hbck -fixMeta
3）：重启Hbase

解决！
查看全文

相关阅读:
C#读写xml文件
 XSD(XML Schema Definition)用法实例介绍以及C#使用xsd文件验证XML格式
 C#异步批量下载文件
 echarts的markline的使用 y轴预警线
 Bootstrap-table 增删改查
 二维数组和稀疏数组的相互转换及数据存入文件中
 Bootstrap-table实现动态合并相同行
 echarts 中参数的详讲
 BootstrapTable的简单使用教程
 遍历List 中 Map 的值

原文地址：https://www.cnblogs.com/niutao/p/11218549.html

关于hbase的数据迁移

方式1：通过快照方式进行数据迁移（不需要提前建表）

方式2：在老集群A上通过bulkload写入新集群B上（需要提前建表，别忘记预分区）

方式3：hadoop distcp 方式