zoukankan      html  css  js  c++  java
  • 透过面试题,洞察Hbase 核心知识点

    LSM  算法

    HFile

    索引 ,二级索引


    hbase的问题


    1.hbase怎么预分区? 


    2.hbase怎么给web前台提供接口来访问?


    3.htable API有没有线程安全问题,在程序中是单例还是多例?


    4.我们的hbase大概在公司业务中(主要是网上商城)大概都几个表,几个表簇,大概都存什么样的数据?


    5.hbase的并发问题?


    第二部分:HBase核心知识点(对于Hbase实现核心LSM,会在下篇文章介绍)

    11. LSM含义是?A
    日志结构合并树(Log-Structured Merge Tree)
    二叉树
    平衡二叉树
    长平衡二叉树

    12. 下面对LSM结构描述正确的是? AC
    顺序存储
    直接写硬盘
    需要将数据Flush到磁盘
    是一种搜索平衡树

    13. LSM更能保证哪种操作的性能?B
    随机读
    合并

    14. LSM的读操作和写操作是独立的?A
    是。
    否。
    C LSM并不区分读和写
    D LSM中读写是同一种操作

    15. LSM结构的数据首先存储在()。 B
    硬盘上
    内存中
    磁盘阵列中
    闪存中

    16 HFile数据格式中的Data字段用于()。A
    存储实际的KeyValue数据
    存储数据的起点
    指定字段的长度
    存储数据块的起点

    17 HFile数据格式中的MetaIndex字段用于()。D
    A Meta块的长度
    B Meta块的结束点
    C Meta块数据内容
    D Meta块的起始点

    18 HFile数据格式中的Magic字段用于()。A
    存储随机数,防止数据损坏
    存储数据的起点
    存储数据块的起点
    指定字段的长度

    19 HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。AD
    byte[]数组
    没有固定的结构
    数据的大小是定长的
    有固定的结构

    20 HFile数据格式中的KeyValue数据格式中Value部分是()。C
    拥有复杂结构的字符串
    字符串
    二进制数据
    压缩数据


    第三部分:HBase高级应用介绍

    34. HBase构建二级索引的实现方式有哪些? A、B
    A MapReduce
    B Coprocessor
    (HBase在0.92之后引入了协处理器(coprocessors),实现一些激动人心的新特性:能够轻易建立二次索引、复杂过滤器(谓词下推)以及访问控制等)
    C Bloom Filter
    D Filter

    35. 关于HBase二级索引的描述,哪些是正确的?A、B
    核心是倒排表
    二级索引概念是对应Rowkey这个“一级”索引
    二级索引使用平衡二叉树
    二级索引使用LSM结构

    36. 下列关于Bloom Filter的描述正确的是?A、C
    是一个很长的二进制向量和一系列随机映射函数
    没有误算率
    有一定的误算率
    可以在Bloom Filter中删除元素

    -------------------------------------华丽分割线-------------------------------------------




  • 相关阅读:
    oracle基本语句
    SVM入门(六)线性分类器的求解——问题的转化,直观角度
    深入浅出KMeans算法
    SVM入门(三)线性分类器Part 2
    SVM入门(一)SVM的八股简介
    Hadoop源代码分析(五)
    用HTML5 Audio API开发游戏音乐
    Hadoop源代码分析(六)
    SVM入门(四)线性分类器的求解——问题的描述Part1
    SVM入门(二)线性分类器Part 1
  • 原文地址:https://www.cnblogs.com/TendToBigData/p/10501427.html
Copyright © 2011-2022 走看看