zoukankan      html  css  js  c++  java
  • HBase写数据

    1 多HTable并发写

    创建多个HTable客户端用于写操作,提高写数据的吞吐量,一个例子:

    static final Configuration conf = HBaseConfiguration.create(); static final String table_log_name = “user_log”;

    wTableLog = new HTable[tableN]; for (int i = 0; i < tableN; i++) {

        wTableLog[i] = new HTable(conf, table_log_name);

        wTableLog[i].setWriteBufferSize(5 * 1024 * 1024); //5MB  wTableLog[i].setAutoFlush(false);

    }

    2 HTable参数设置

    2.1 Auto Flush

    通过调用HTable.setAutoFlush(false)方法可以将HTable写客户端的自动flush关闭,这样可以批量写入数据到 HBase,而不是有一条put就执行一次更新,只有当put填满客户端写缓存时,才实际向HBase服务端发起写请求。默认情况下auto flush是开启的。

    2.2 Write Buffer

    通过调用HTable.setWriteBufferSize(writeBufferSize)方法可以设置HTable客户端的写buffer大小, 如果新设置的buffer小于当前写buffer中的数据时,buffer将会被flush到服务端。其中,writeBufferSize的单位是 byte字节数,可以根据实际写入数据量的多少来设置该值。

    2.3 WAL Flag

    在HBae中,客户端向集群中的RegionServer提交数据时(Put/Delete操作),首先会先写WAL(Write Ahead Log)日志(即HLog,一个RegionServer上的所有Region共享一个HLog),只有当WAL日志写成功后,再接着写 MemStore,然后客户端被通知提交数据成功;如果写WAL日志失败,客户端则被通知提交失败。这样做的好处是可以做到RegionServer宕机 后的数据恢复。

    因此,对于相对不太重要的数据,可以在Put/Delete操作时,通过调用Put.setWriteToWAL(false)或Delete.setWriteToWAL(false)函数,放弃写WAL日志,从而提高数据写入的性能。

    值得注意的是:谨慎选择关闭WAL日志,因为这样的话,一旦RegionServer宕机,Put/Delete的数据将会无法根据WAL日志进行恢复。

    3 批量写

    通过调用HTable.put(Put)方法可以将一个指定的row key记录写入HBase,同样HBase提供了另一个方法:通过调用HTable.put(List<Put>)方法可以将指定的row key列表,批量写入多行记录,这样做的好处是批量执行,只需要一次网络I/O开销,这对于对数据实时性要求高,网络传输RTT高的情景下可能带来明显的 性能提升。

    4 多线程并发写

    在客户端开启多个HTable写线程,每个写线程负责一个HTable对象的flush操作,这样结合定时flush和写 buffer(writeBufferSize),可以既保证在数据量小的时候,数据可以在较短时间内被flush(如1秒内),同时又保证在数据量大的 时候,写buffer一满就及时进行flush。下面给个具体的例子:

    for (int i = 0; i < threadN; i++) {

        Thread th = new Thread() { public void run() { while (true) { try {

                        sleep(1000); //1 second  } catch (InterruptedException e) {

                        e.printStackTrace();

                    } synchronized (wTableLog[i]) { try {

                            wTableLog[i].flushCommits();

                        } catch (IOException e) {

                            e.printStackTrace();

                        }

                    }

                }

    }

        };

        th.setDaemon(true);

        th.start();

    }

  • 相关阅读:
    Ubuntu16.04 JAVA配置!
    vs快捷键
    2015上半年软件设计师考点,难点5
    2015上半年软件设计师考点,难点4
    2015上半年软件设计师考点,难点3
    2015上半年软件设计师考点,难点2
    软件的知识产权保护
    标准化知识
    嵌入式系统
    2015上半年软件设计师考点,难点
  • 原文地址:https://www.cnblogs.com/cl1024cl/p/6205305.html
Copyright © 2011-2022 走看看