ZooKeeper:
ZooKeeper浅析:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3113923.html
ZooKeeper原理及使用:http://www.wuzesheng.com/?p=2609#more-2609
HDFS:
MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html
HDFS小文件处理解决方案总结:http://www.aboutyun.com/thread-14227-1-1.html
Hadoop 学习总结之一:HDFS简介:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html
Hadoop集群作业调度算法
MapReduce
初步掌握Yarn的架构及原理
hadoop杂记-为什么会有Map-reduce v2 (Yarn):http://www.cnblogs.com/LeftNotEasy/archive/2012/02/18/why-yarn.html
YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework:http://blog.csdn.net/colorant/article/details/9146201
从Container内存监控限制到CPU使用率限制方案
MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html
hadoop学习(六)WordCount示例深度学习MapReduce过程(1)
Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解:http://blog.csdn.net/yczws1/article/details/19178265。
hadoop学习WordCount+Block+Split+Shuffle+Map+Reduce技术详解:http://blog.csdn.net/yczws1/article/details/21899007
MapReduce调度与执行原理系列文章
JobTracker作业启动过程分析:http://blog.csdn.net/androidlushangderen/article/details/41356521
浅析 Hadoop 中的数据倾斜:http://my.oschina.net/leejun2005/blog/100922
Hadoop源码解析之: TextInputFormat如何处理跨split的行:http://blog.csdn.net/bluishglc/article/details/9380087
MapReduce框架中全排序的算法思想--学习笔记
mapreduce编程(一)-二次排序
MapReduce 图解流程超详细解答(1)-【map阶段】
MapReduce 图解流程超详细解答(2)-【map阶段】
hive:
hive基本操作:http://www.aboutyun.com/thread-6867-1-1.html
hive组件和执行过程:http://blog.csdn.net/lifuxiangcaohui/article/details/40262021
大数据时代的技术hive介绍:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html
Hive体系结构:http://blog.csdn.net/lifuxiangcaohui/article/details/40615843
HIVE Group by、join、distinct等实现原理
Hive SQL的编译过程
Hive之分区(Partitions)和桶(Buckets)
Hive性能优化
HBase:
Hadoop核心架构Hbase:http://blog.csdn.net/yczws1/article/details/19178265
HBase学习:http://blog.bcmeng.com/post/hbase-note.html
hbase 学习(十六)系统架构图
HBase -ROOT-和.META.表结构(region定位原理)
Hbase 学习(九) 华为二级索引(原理)
HBase高性能复杂条件查询引擎
【HBase】zookeeper在HBase中的应用
HBase什么时候作minor major compact
HBase的compact分析
二级索引方案:http://www.aboutyun.com/thread-14201-1-1.html
hbase分页应用场景及分页思路与代码实现
hbase权威指南阅读随手笔记二之过滤器
*HBase原理、设计与优化实践
HBase性能优化方法总结
HBase 管理,性能调优
HBase Rowkey的散列与预分区设计
Solr:
Elasticsearch与Solr 选型
ElasticSearch:
Redis:
几款主流 NoSql 数据库的对比(转)
Kafka:
- Kafka设计解析(一)- Kafka背景及架构介绍
- Kafka设计解析(二)- Kafka High Availability (上)
- Kafka设计解析(三)- Kafka High Availability (下)
- Kafka设计解析(四)- Kafka Consumer设计解析
- Kafka设计解析(五)- Kafka性能测试方法及Benchmark报告
Apche Kafka 的生与死 – failover 机制详解
Kafka消息的可靠性测试--针对直播业务的方案选择
Kafka文件存储机制那些事
高可用保证消息绝对顺序消费的BROKER设计方案
使用Java API创建(create),查看(describe),列举(list),删除(delete)Kafka主题(Topic)
Flume:
Flume(NG)架构设计要点及配置实践: http://shiyanjun.cn/archives/915.html
基于Flume的美团日志收集系统(一)架构和设计
Storm:
使用Storm实现实时大数据分析
Storm ack和fail机制再论
Apache Storm内部原理分析
你了解实时计算吗?
Spark:
Apache Spark源码走读之1 -- Spark论文阅读笔记
科普Spark,Spark核心是什么,如何使用Spark(1)
Docker:
Scala
Tachyon
Impala
Oozie
oozie 入门
ganglia
.......
大数据(一) - hadoop生态系统及版本演化
大数据(二) - HDFS
大数据(三) - YARN
大数据(四) - MapReduce
大数据(五) - HBase
大数据(六) - ZooKeeper
大数据(七) - Flume
大数据(八) - Sqoop
大数据(九) - Hive
大数据(十) - Pig
大数据(十一) - Mahout
大数据(十二) - Oozie
大数据(十三) - Azkaban
大数据(十四) - Storm
大数据(十五) - JStorm