跳跃表，数据集，对象

zoukankan html css js c++ java

跳跃表，数据集，对象

跳跃表优点
相对于红黑树以及AVL树，实现相对简单
查找性能相对单一的链表来说性能比较高效，节点越多，性能越能凸显，平均是O（logN）
因为链表的插入性能主要消耗在查找上，所以查找性能高效的情况下，插入性能也比较高效
Redis的跳表，同节点的层次之间通过数组来实现，不是通过链表指针的方式来指向

整数集合
核心：减少内存使用

关于跳跃表
（1）跳跃表是一种有序数据结构，查询效率和平衡树媲美，实现上比平衡树简单，可以用跳跃表代替平衡树；查找复杂度平均是O(logN)z,最坏是O(N);
（2）跳跃表在redis里只有2个地方使用：一个是实现有序集合键（sorted set）、一个是集群节点中用作内部数据结构；也就是说，跳跃表是sorted set类型的底层实现之一；
（3）每个节点都有层高，层高越高，查找效率越高；存储节点的时候，随机生成1-32之间的随机数，假设生成的层高随机数为N，则，该节点数值在第一层~第N层都会被插入，
且每层的数据都是有序的，这样在查找该节点时从最高层依次查找，最高层查不到，接着查次高层；
（4）同节点的层次直接通过数组实现，不是通过链表
关于整数集合
整数集合（intset）就是将所有整数类型封装到intset这个结构体里，根据实际存储的数据长度来动态选择使用哪种数据类型；
1）整数类型有int16_t int32_t int64_t等；分别表示的整数范围
2）整数集合（intset）将所有整数类型封装的目的是：减少内存使用。可以根据存入的整数数值大小，动态选择用int16_t类型的还是int32_t类型的等
当设置一个集合后，会判断集合里元素的整数值大小，最大的元素是什么类型的整数，就会将intset设置为该类型；例如一个集合里最大的元素是50000，
那么这个集合的数据类型就是int32_t类型的，其他元素值也将被设置为int32_t类型；一个集合里最大的元素是30000，那么这个结婚的数据类型就是in16_t类型的；
例如：新增一个元素，该元素长度超过原来的类型范围，就需要类型升级，例如从int16_t升级到int32_t;

关于对象
（1）Redis里说的SDS字符串、链表、字典。压缩列表、整数集合等都是数据结构，redis并没有直接使用数据结构来实现键值对数据库，而是创建了
一个对象系统，这个系统包含字符串对象、列表对象、哈希对象、集合对象、有序集合对象这5种类型的对象；通过不同类型的对象来判断一个对象是否可以执行给定的命令。
（2）redis的对象系统还实现基于引用计数技术的内存回收机制：有个引用计数参数，通过识别这个参数判断对象是否被使用，没有被引用则是否该
对象的内存；此外，还实现了对象共享机制，一定条件下，可以多个数据库共享一个对象来节约内存；
（3）redis的5种数据类型，都是通过redisObject结构体来实现的，通过对该结构体的引用，根据实际使用生成5种数据类型的对象
（3.1）Type属性表示类型，type:4的意思是定义属性type，占4个比特，unsigned等同于unsigned int;
（3.2）Encoding属性也占4个比特位；lru属性占24个比特位；
也就是type属性、encoding属性、lru属性合在一起，占用32个比特，也就是4个字节；
（3.3）Refcount属性，是int类型，占4个字节；ptr属性也占用4个字节；
综上，redisObject结构体一共占用12个字节，也就是redisObject结构体，巧妙运用位字段，节省内存，同时相对直接操纵位来编程也更容易。
（3.4）Type属性对应的值有5种，也就是5种对象类型：REDIS_STRING/REDSI_LIST/REDIS_HASH/REDIS_SET/REDIS_ZSET
3.5）Encoding属性表示编码类型：5种对象类型，对应不同的编码类型，会有不同的底层实现；即，编码不同，底层支撑的数据结构不同；

Redis在减少内存开销方面做的设计：（1）整数集合；（2）定义redisObject一个结构体，来实现5种数据类型的引用，也即是5种对象；
redisObject结构体里，定义type属性区分5种数据类型，多种底层存储结构支撑；而且，redisObject结构体里的type属性、encoding
属性、lru属性是用位字段定义的，巧妙运用位字段，节省内存；

总结概括五种对象的关键点
1 字符串对象
字符串对象有3种类型实现：int类型、raw类型、embstr类型；
Int,如果一个字符串对象保存的是整数值，并且这个整数值可以用long类型表示；
raw,如果保存的是字符串，且长度大于39字节；
embstr，如果保存的是字符串，且长度小于等于39字节；（embstr与raw一样，使用sds简单动态字符串结构；和redisObject结构一起分
片和回收，因此只需要分配或回收一次；embstr的内存回收更快，因为redisObject和sdshdr内存是连续的；）
RawL类型的字符串长度大于39字节，不利于连续内存的分配，因此Raw类型的内存分片不是连续的；
可以用object encoding命令来查看数据的底层存储结构；
2 列表对象
列表对象有2种类型实现：ziplist类型、linkedlist类型
--- ziplist类型的使用要满足如下2个条件：所有节点长度都小于64字节+元素个数小于512；
列表对象使用ziplist类型的2个条件，是默认在redis.conf配置文件里的
--- linkedlist类型：不能满足ziplist类型的条件的，都会采用linkedlist
Ziplist VS linkedlist
--- Linkedlist是链表，扩展性好；且不需要连续的内存空间，内存利用率高；但是查找性能相对差；
--- ziplist类似数组，有高效的访问，查找性能更高；但是因为ziplist需要连续内存空间，对内存的利用率较低
3 哈希对象
哈希对象有2种类型实现：ziplist类型、字典类型
--- ziplist类型：同事满足2个条件：所有节点长度都小于64字节 + 列表元素个数小于512
（注意：键值对挨在一起，先添加的键值对会被放在表头方向，后添加的放在表尾方向）
哈希对象使用ziplist类型的这2个限制条件是默认在redis.conf配置文件里的：
--- 字典类型：不能满足使用ziplist类型的2个条件，则采用字典类型
4集合对象
集合对象有2种类型实现：intset类型、字典类型
--- intset类型：整数集合，满足2个条件才行：所有元素都是整数值 + 列表元素个数小于512
--- 字典类型：不满足上述2个条件，则采用字典；
（2）集合对象使用intset类型的限制条件是默认在redis.conf配置文件里的
5 有序集合
（1）有序集合对象有2种类型实现：ziplist类型、字典+跳跃表
--- ziplist类型：需要满足2个条件：所有节点长度都小于64字节 + 列表元素的个数小于128；（注意：元素和分支紧挨一起；先添加的键值对会被放在表头方向，后添加的放在表尾方向）
在redis.conf配置文件里的默认参数如下：
--- 字典和跳跃表：不能满足用ziplist类型的，就用字典+跳跃表实现
（2）用字典+跳跃表组合实现，而不是只用字典的原因如下：
跳跃表保存分值和元素，字典也保存分值和元素；之所以用字典+跳跃表的组合，总体是为了在不同场景下的高性能；
zrank zrange等命令是通过跳跃表api实现；zscore命令通过字典实现；
字典和跳跃表都通过指针共享内存的方式避免重复存储；

查看全文

相关阅读:
recorder.js 基于H5录音功能
 input type=file 怎么样调取用户手机照相机
 js replace(a,b)之替换字符串中所有指定字符的方法
 XYIXY.COM短网址在线生成，快速、稳定、永久有效，免费开放网址缩短API接口。
NAVICAT FOR MYSQL破解版安装
 HTML之marquee(文字滚动)详解
 奇异值分解(SVD) --- 几何意义
 矩阵奇异值分解(SVD)及其应用
 行人检测(Pedestrian Detection)资源
 基金项目的英文

原文地址：https://www.cnblogs.com/yhq1314/p/10001121.html