zoukankan      html  css  js  c++  java
  • Hadoop使用场景

    Hadoop使用场景:

    1. 大数据量存储:分布式存储
    2. 日志处理: Hadoop擅长这个
    3. 海量计算: 并行计算
    4. ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
    5. 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
    6. 机器学习: 比如Apache Mahout项目
    7. 搜索引擎:hadoop + lucene实现
    8. 数据挖掘:目前比较流行的广告推荐
    9. 大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
    10. 数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
    11. 数据不进行本地缓存(文件很大,且顺序读没有局部性)
    12. 任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
    13. 用户细分特征建模
    14. 个性化广告推荐
    15. 智能仪器推荐
  • 相关阅读:
    1128项目跟进
    冲刺一 (day 3)
    1118 冲刺1-需求文档(初稿)
    1117 新冲刺 day1
    0622 总结与回顾
    0621 第三次冲刺
    0617 主存空间的分配和回收
    学习进度条
    软件工程学期总结
    学术诚信与职业道德
  • 原文地址:https://www.cnblogs.com/pejsidney/p/6955473.html
Copyright © 2011-2022 走看看