zoukankan html css js c++ java

Hadoop使用场景

大数据量存储：分布式存储
日志处理: Hadoop擅长这个
海量计算: 并行计算
ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统
机器学习: 比如Apache Mahout项目
搜索引擎:hadoop + lucene实现
数据挖掘：目前比较流行的广告推荐
大量地从文件中顺序读。HDFS对顺序读进行了优化，代价是对于随机的访问负载较高。
数据支持一次写入，多次读取。对于已经形成的数据的更新不支持。
数据不进行本地缓存（文件很大，且顺序读没有局部性）
任何一台服务器都有可能失效，需要通过大量的数据复制使得性能不会受到大的影响。
用户细分特征建模
个性化广告推荐
智能仪器推荐

查看全文

相关阅读:
Jenkins构建时间Poll Scm的设置(常用设置)
jenkins对测试脚本的构建步骤
 jemeter排至数据库时报：Access denied for user 'root'@'localhost' (using password:YES) 解决方案
 接口测试总结
 linux gitlab-ctl reconfigure报错问题修复 502
Linux Redis 开机启动
 CentOS7安装iptables防火墙
 linux mongodb开机启动(服务的方式)
Linux服务器使用XShell上传下载文件
 推荐.Net、C# 逆向反编译四大工具利器

原文地址：https://www.cnblogs.com/fjzhang/p/7063479.html