zoukankan      html  css  js  c++  java
  • hadoop基础

    1 定义

    hadoop是一个分布式系统架构。

    2 基本模块

    HDFS为海量数据提供了存储。

    Map/Reduce为海量数据提供了计算。

    3 子项目

    Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Common
    HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)
    MapReduce:并行计算框架,0.20前使用 org.apache.hadoop.mapred 旧接口,0.20版本开始引入org.apache.hadoop.mapreduce的新API
    HBase: 一个分布式的、面向列的开源数据库。(HBase和Avro已经于2010年5月成为顶级 Apache 项目)
    Hive:数据仓库工具,由Facebook贡献。
    Zookeeper:分布式锁设施,由Facebook贡献。
    Avro:新的数据序列化格式与传输工具,将逐步取代Hadoop原有的IPC机制。
    Pig: 大数据分析平台,为用户提供多种接口。
    Ambari:Hadoop管理工具,可以快捷的监控、部署、管理集群。
    Sqoop:于在HADOOP与传统的数据库间进行数据的传递。

  • 相关阅读:
    CCF201503-2数字排序
    CCF201503-1图像旋转
    leetcode 13.罗马数字转整数
    Mysql中limit的用法
    网站访问量统计案例
    ServletContext(重要)
    Servlet(自己实现的Servlet)细节
    HttpServlet
    GenericServlet
    Servlet的相关类--ServletConfig(接口)
  • 原文地址:https://www.cnblogs.com/yanyichao/p/3897291.html
Copyright © 2011-2022 走看看