zoukankan      html  css  js  c++  java
  • 关于Infobright 的几种数据格式

    如果大家用到INFOBRIGHT,对这个字眼就不陌生了。 

     
    目前有4种格式。
    1. binary.
    2. txt_variable
    3. mysql
    4. infobright
     
    代表什么意思呢,我来详细解释下。
    BINARY 代表二进制数据。 也就是说,原始数据是以特定格式的二进制来保存。 具体格式,可以参见官方的白皮书,很容易下载到。
     
    TXT_VARIABLE 代表 CSV格式文本。默认的列分隔符为“;”。 
     
    MYSQL 代表和MYSQL兼容的CSV格式文本。默认分隔符为“水平制表符“。
     
    INFOBRIGHT 呢,代表分布式导入工具(DLP)生成的中间结果集, 只能用来导入DLP的中间数据。
     
     
    这几种格式的载入速度按照以下顺序,由高到低排列:
    INFOBRIGHT   --->   BINARY ---> TXT_VARIABLE ---> MYSQL。
    可以看到MYSQL载入最慢。 但是MYSQL能打印出来更多的错误信息以供调试。
     
     
    设置方法:
    set @bh_dataformat = '随便一种';
    即可。
  • 相关阅读:
    Interrupt、Interrupted、IsInterrupted
    ReentrantLock
    tcp粘包、拆包
    jstat 分析应用垃圾回收状况
    CopyOnWriteArrayList
    storm基础概念
    余弦距离
    websocket
    awk
    sed
  • 原文地址:https://www.cnblogs.com/secbook/p/2655270.html
Copyright © 2011-2022 走看看