zoukankan      html  css  js  c++  java
  • HBase的rowkey排序和scan输出顺序

    本文目的:搞清楚HBase里面行与行之间的排序排序规则,如何正序和反序输出扫描结果。

    明确:

    HBase里面同一列的元素按照rowkey进行排序,排序规则是rowkey的ASCII码排序,小的在前大的在后

    举例说明:rowkey的时间设计是Long.MAX_VALUE减去真实的timestamp(单位:秒)(System.currentTimeMillis()/1000得到),由此来看rowkey的排序。

    其中箭头表示HBase扫描内容时的扫描方向。

    假设startRowKey由时间戳产生startTime产生,endRowKey由endTime产生,其中endTime > startTime,例如endTime表示"2016-01-02 00:00:00",startTime表示"2016-01-01 00:00:00",则对应关系为

    此时扫描由于startRowkey > endRowKey不会有扫描结果!证明箭头方向表示扫描方向。但是可以通过设置反向扫描数据,这时相当于扫描方向反转,而不是endRowKey和startRowKey位置互换

    1 scanner.setReversed(true);

    通过依次输出结果可以看出时间戳递增,同样证明箭头方向表示扫描方向,且扫描方向被反转。

    //{"timestamp":1478620651}
    //{"timestamp":1478620661}
    //{"timestamp":1478620671}
    //{"timestamp":1478620681}
    //{"timestamp":1478620692}
    //{"timestamp":1478620703}

     如果想扫描出结果还有一种办法,startRowKey由时间戳产生endTime产生,endRowKey由startTime产生。此时相当于endRowKey和startRowKey位置互换

     

    此时输出结果与之前相反,时间顺序由大到小。

    //{"timestamp":1478620703}
    //{"timestamp":1478620692}
    //{"timestamp":1478620681}
    //{"timestamp":1478620671}
    //{"timestamp":1478620661}
    //{"timestamp":1478620651}
  • 相关阅读:
    .Net 6+项目使用Husky.Net在项目提交时格式化代码
    maven 之将项目打包压缩。
    netty ChannelPipeline流处理源码详细分析
    maven 之 将资源文件 copy到classes目录中
    maven 之 根据不同环境,选择不同的配置文件。
    flex+spring+blazds 数据推送,client自动断开问题。
    C#如何读写xml文件
    序列化 与 反序列化
    DataSet与List的转换
    Python基础入门
  • 原文地址:https://www.cnblogs.com/chen-kh/p/6294822.html
Copyright © 2011-2022 走看看