zoukankan      html  css  js  c++  java
  • Google分布式计算框架 VS 开源实现版本Hadoop

    Google分布式计算框架的开源实现版本---hadoop

    hadoop是google的云计算系统的开源实现,用java开发。Hadoop由 Apache Software Foundation(阿帕奇软件基金会)公司于 2005 年秋天作为Lucene的子项目Nutch的一部分正式引入。它受到最先由 Google Lab 开发的 Map/Reduce 和 Google File System(GFS) 的启发。HDFS基本可以认为是GFS的一个简化版实现,二者因此有很多相似之处。HBase是Google的BigTable架构的一个开源实现。

    Google分布式计算框架主要包括三个部分:

    1. 分布式文件系统Google File System (GFS);
    2. 分布式并行计算模型map/reduce;
    3. 分布式数据库Bigtable。
    4. 此系统由Google公司自己开发,
    5. 闭源。

    MapReduce的系统实现至今仍为谷歌机密,而开源的版本Hadoop效率低下(据谷歌内部人士透露,5年前的谷歌MapReduce版本也比当前的Hadoop快一个数量级;现在谷歌的版本到底有多快,是否有新的功能,不得而知)。参考

    1. Google的分布式锁Chubby

    开源实现版本:Hadoop

    1. HDFS对应谷歌的GFS;参考
    2. Hadoop的map/reduce对应谷歌的map/reduce模型;
    3. Hbase对应谷歌的分布式数据库Bigtable;
    4. 此项目由Apache基金会管理
    5. 开源项目
    6. Zookeeper对应Google的分布式锁Chubby。
  • 相关阅读:
    poj_3923Ugly Windows
    背包问题九讲笔记_01背包
    素数环
    全排列的STL实现
    [1424] 金克拉与贪吃蛇的故事
    hdoj_1548A strange lift
    iBATIS缓存配置详解
    jQuery的一些特性和用法:
    当iBATIS出项某个列不存在的问题
    当iBATIS出项某个列不存在的问题
  • 原文地址:https://www.cnblogs.com/Lewis_Liu/p/MapReduce.html
Copyright © 2011-2022 走看看