zoukankan      html  css  js  c++  java
  • Hadoop使用场景

    Hadoop使用场景:

    1. 大数据量存储:分布式存储
    2. 日志处理: Hadoop擅长这个
    3. 海量计算: 并行计算
    4. ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
    5. 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
    6. 机器学习: 比如Apache Mahout项目
    7. 搜索引擎:hadoop + lucene实现
    8. 数据挖掘:目前比较流行的广告推荐
    9. 大量地从文件中顺序读。HDFS对顺序读进行了优化,代价是对于随机的访问负载较高。
    10. 数据支持一次写入,多次读取。对于已经形成的数据的更新不支持。
    11. 数据不进行本地缓存(文件很大,且顺序读没有局部性)
    12. 任何一台服务器都有可能失效,需要通过大量的数据复制使得性能不会受到大的影响。
    13. 用户细分特征建模
    14. 个性化广告推荐
    15. 智能仪器推荐
  • 相关阅读:
    POJ 3253 Fence Repair
    POJ 2431 Expedition
    NYOJ 269 VF
    NYOJ 456 邮票分你一半
    划分数问题 DP
    HDU 1253 胜利大逃亡
    NYOJ 294 Bot Trust
    NYOJ 36 最长公共子序列
    HDU 1555 How many days?
    01背包 (大数据)
  • 原文地址:https://www.cnblogs.com/pejsidney/p/6955473.html
Copyright © 2011-2022 走看看