zoukankan      html  css  js  c++  java
  • Hadoop是什么

         Hadoop是一个开源框架,可编写和运行分布式应用处理大数据。分布式是一个宽泛并且不断变化的领域,Hadoop的优势在于:

         1.方便:Hadoop运行在一般商用机器构成的大型集群上,或者云计算上,比如EC2

         2.健壮:  Hadoop致力于在一般商业应用硬件上,,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障。

         3.可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集。

       4.简单:Hadoop允许用户快速编写高效的并行代码

       Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系统,MapReduce 是分布式数据处理模型和执行环境。

      Hadoop生态系统:

          Nutch互联网以及Nutch搜索引擎应用

          HDFS数据存储

          HBase, OLTP存储系统

    个人交流QQ:58053439

  • 相关阅读:
    Python基础学习笔记(一)
    前端之jQuery
    JavaScript概述
    前端CSS
    前端HTML
    WIN10下Mysql安装使用
    python 创建线程
    Python 创建进程
    python day24模块
    python常用模块2(序列化,pickle,shelve,json,configparser)
  • 原文地址:https://www.cnblogs.com/wenhouniba/p/5299210.html
Copyright © 2011-2022 走看看