1.请先创建好命名空间 .然后再创建表 .
create 'gld:student',{NAME=>'cf1', VERSIONS=>5}, {SPLITS => ['1', '2', '3', '4', '5', '6', '7', '8', '9']}
我这里的namespace是提前创建好了的, 如果没有 , 请提前创建好 .
2.根据 rowkey , 查询所有 VERSION
get 'gld:student','002',{COLUMN=>'cf1:name',VERSIONS=>3}
以下是一般查询到最新的version
总结: 预分区是一个很重要的步骤 , 如何分区 , 几个分区 , 需要和业务对勾 , 是利于查询还是利于存储
另外 , 插入数据不会第一时间存入hdfs , 会到达一个阈值再写入 .