分布式ID总结

zoukankan html css js c++ java

分布式ID总结
分布式ID

生成的ID使用场景

几乎所有的业务系统，都有生成一个记录标识的需求，例如：message_id, order_id。这个记录标识往往就是数据库中的唯一主键，数据库上会建立聚集索引（cluster index），即在物理存储上以这个字段排序。

在数据量大时往往需要分库分表，这些ID经常作为取模分库分表的依据，为了分库分表后数据均匀，ID生成往往有“取模随机性”的需求，所以我们通常把每秒内的序列号放在ID的最末位，保证生成的ID是随机的。

需求分析
1. 全局唯一，绝对不会出现重复的ID，且ID整体趋势递增。
2. 高可用，服务完全基于分布式架构。
3. 高并发低延时，在4C8G的Linux上远程调用QPS5W+，TP99在1ms内。
4. 接入简单，直接通过RPC服务或者HTTP调用即可接入。
方法一：使用数据库的 auto_increment 来生成全局唯一递增ID

优点：
- 简单，使用数据库已有的功能
- 能够保证唯一性
- 能够保证递增性
- 步长固定
缺点：
- 可用性难以保证：数据库常见架构是一主多从+读写分离，生成自增ID是写请求，主库挂了就玩不转了
- 扩展性差，性能有上限：因为写入是单点，数据库主库的写性能决定ID的生成性能上限，并且难以扩展
改进方法：
1. 增加主库，避免写入单点
2. 数据水平切分，保证各主库生成的ID不重复
每个写库设置不同的auto_increment初始值，以及相同的增长步长，以保证每个数据库生成的ID是不同的（上图中库0生成0,3,6,9…，库1生成1,4,7,10，库2生成2,5,8,11…）

改进后的架构保证了可用性，但缺点是：
- 丧失了ID生成的“绝对递增性”：先访问库0生成0,3，再访问库1生成1，可能导致在非常短的时间内，ID生成不是绝对递增的（这个问题不大，我们的目标是趋势递增，不是绝对递增）
- 数据库的写压力依然很大，每次生成ID都要访问数据库
方法二：uuid

方案一不管是数据库还是服务来生成ID，业务方Application都需要进行一次远程调用，比较耗时。有没有一种本地生成ID的方法，即高性能，又时延低呢？

uuid是一种常见的方案：string ID =GenUUID();

优点：
- 本地生成ID，不需要进行远程调用，时延低
- 扩展性好，基本可以认为没有性能上限
缺点：
- 无法保证趋势递增
- uuid过长，往往用字符串表示，作为主键建立索引查询效率低，常见优化方案为“转化为两个uint64整数存储”或者“折半存储”（折半后不能保证唯一性）
方法三：时间戳

优点：
- 本地生成ID，无需远程调用，低延时
- ID趋势递增
- ID是整数，建立索引后查询效率高
缺点：
- 如果并发量超过1000，会生成重复的ID
方法四：随机数+数据库唯一索引

优点：
- 本地生成ID，无需远程调用，低延时
- ID趋势递增
- ID是整数，建立索引后查询效率高
缺点：
- 依赖数据库
- 性能一般，直到持久化的时候才能确定id的唯一性
方法五：类snowflake算法

snowflake是twitter开源的分布式ID生成算法，其核心思想是：一个long型的ID，使用其中41bit作为毫秒数，10bit作为机器编号，12bit作为毫秒内序列号。这个算法单机每秒内理论上最多可以生成1000*(2^12)，也就是400W的ID，完全能满足业务的需求。

借鉴snowflake的思想，结合各公司的业务逻辑和并发量，可以实现自己的分布式ID生成算法。

优点：
- 快（哈哈，天下武功唯快不破）。
- 没有啥依赖，实现也特别简单。
- 知道原理之后可以根据实际情况调整各各位段，方便灵活。
缺点：
- 只能趋势递增。（如果绝对递增，竞争对手中午下单，第二天在下单即可大概判断该公司的订单量）
- 依赖机器时间，如果发生回拨会导致可能生成id重复。
  
  欢迎关注我的公众号：好奇心森林
查看全文

相关阅读:
solr 笔记
 oracle 相关笔记
 Linux之shell
Linux 笔记2
Linux 笔记1
ConfigurationClassParser类的parse方法源码解析
 ConfigurationClassPostProcessor类的processConfigBeanDefinitions方法源码解析
 spring-ConfigurationClassUtils类
 有关金融的一些专有名词的解释
 centos7安装hadoop3.2.1集群

原文地址：https://www.cnblogs.com/hackingForest/p/12995080.html

分布式ID

生成的ID使用场景

需求分析

方法一：使用数据库的 auto_increment 来生成全局唯一递增ID

方法二：uuid

方法三：时间戳

方法四：随机数+数据库唯一索引

方法五：类snowflake算法