常见分布式存储系统架构分析

zoukankan html css js c++ java

常见分布式存储系统架构分析
ceph, tikv, 小米飞马, GFS, etcd
存储系统分片后，如果不均衡，某一片写满了一台服务器，其他服务器还很空怎么处理的呢

ceph
ceph架构

ceph存储集群包括osd、monitor和client三个组件
- osd提供单机存储与数据复制
- monitor负责保存集群元数据，包括osd map(包括osd状态等)，crush map(包括物理层次结构及访问规则)，pg map等，monitor本身也是一个paxos强一致性集群
- client是请求接入的地方，会去monitor请求osd map,crush map,crush rules，然后根据objid -> pgid -> osd sets
crush算法

ceph说自己没有leader，根据crush算法来算的，算到谁就是谁，那算出来的leader挂掉的呢，是需要向monitor拿视图吗?

CRUSH 算法是一个伪随机的过程，他可以从所有的 OSD 中，随机性选择一个 OSD 集合，但是同一个 PG 每次随机选择的结果是不变的，也就是映射的 OSD 集合是固定的。
根据crush算法，计算出pg -> 3 osd的映射，如果某个副本挂了，通过心跳检测会报告给monitor，monitor决策标记为down，更新osd map中的osd状态，再次调用crush算法时，会跳过down（选个临时主吧，此时应该不会踢出down的）

推荐阅读
- 大话Ceph--CRUSH那点事儿
- CRUSH算法的原理与实现
- [weil-crush-sc06.pdf]CRUSH: Controlled, Scalable, Decentralized Placement of Replicated Data
io复制
- 分布式存储 Ceph 介绍及原理架构分享上
心跳机制

选主

故障恢复
- 基于 pglog 的 Ceph 一致性存储问题
小米飞马

字节跳动的几个项目
- 字节跳动分布式表格存储系统的演进
- 字节跳动自研强一致在线 KV & 表格存储实践 - 上篇
tikv

GFS & HDFS
- Hadoop分布式文件系统：架构和设计
HBASE
- BigTable 的开源实现：HBase
etcd
- 《深入浅出 etcd》part 2 – 解析 etcd 的心跳和选举机制
分布式对象存储

多了解一些
- 分布式存储：你知道对象存储是如何保存图片文件的吗？
分布式文件系统
- 开源分布式文件系统 GlusterFS 3.3 发布
查看全文

相关阅读:
工资到帐的快乐排名第四
 如何成为一个具有批判性思维的人？
别让千里马被驴踢死
 接口协议抓包与分析
 Qt + ffmpeg+SDl （转）
各种流媒体服务器的架设（二）
memcpy（转）
java之public class和class声明区别详解（转）
cin、cin.get()、cin.getline()、getline()、gets()等函数的用法 (转）
const_iterator 与 const iterator

原文地址：https://www.cnblogs.com/holidays/p/arch.html

常见分布式存储系统架构分析

ceph

ceph架构

crush算法

io复制

心跳机制

选主

故障恢复

小米飞马

字节跳动的几个项目

tikv

GFS & HDFS

HBASE

etcd

分布式对象存储

分布式文件系统