zoukankan      html  css  js  c++  java
  • 关于hadoop学习常识

    以下是我从各个网站截图和官网文档找到的资料,仅供学习使用

     

    以下是hadoop的发展和应用史说不定面试的话多少要了解

    1.    这一切,都起源自Web数据爆炸时代的来临

    2.    数据抓取系统 - Nutch

    3.    海量数据怎么存,当然是用分布式文件系统 - HDFS

    4.    数据怎么用呢,分析,处理

    5.    MapReduce框架,让你编写代码来实现对大数据的分析工作

    6.    非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe
    7.    数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop
    8.    MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
    9.    让你的数据可见 - drilldown, Intellicus
    10.  用高级语言管理你的任务流 – oozie, Cascading 
    11.  Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia 
    12.  数据序列化处理与任务调度 – Avro, Zookeeper 
    13. 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce 
    14. OLTP存储系统 – Hbase

  • 相关阅读:
    js把日期字符串转换成时间戳
    JS array 数组
    for循环中的if嵌套
    第三章:图像增强
    直方图均衡化
    第二章:数字图像处理基础
    马赫带效应
    图片格式
    4邻接,8邻接和m邻接
    第一章:绪论
  • 原文地址:https://www.cnblogs.com/waterfox/p/3399461.html
Copyright © 2011-2022 走看看