zoukankan      html  css  js  c++  java
  • redis基础数据结构

    Redis 有 5 种基础数据结构,分别为:string (字符串)、list (列表)、set (集合)、hash (哈希) 和 zset (有序集合)。熟练掌握这 5 种基本数据结构的使用是 Redis 知识最基础也最重要的部分,它也是在 Redis 面试题中问到最多的内容

    1、string (字符串)

    字符串结构使用非常广泛,一个常见的用途就是缓存用户信息。我们将用户信息结构体使用 JSON 序列化成字符串,然后将序列化后的字符串塞进 Redis 来缓存。同样,取用户信息会经过一次反序列化的过程。Redis 的字符串是动态字符串,是可以修改的字符串,内部结构实现上类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配。需要注意的是字符串最大长度为 512M。下面介绍几种常用方法:

    单个键值对常用方法(set,exists,del,get)。可以批量对多个字符串进行读写,节省网络耗时开销(在工作中必须考虑性能问题)。批量键值对常用方法(mset,mget)。如果value是一个整数,还能进行自增操作,自增是有范围的,它的范围是 signed long 的最大最小值,超过了这个值,Redis 会报错。

    > set age 30

    OK

    > incr age

    (integer) 31

    > incrby age 5

    (integer) 36 

    2、list (列表)

    Redis 的列表相当于 Java 语言里面的 LinkedList,注意它是链表而不是数组。这意味着 list 的插入和删除操作非常快,时间复杂度为 O(1),但是索引定位很慢,时间复杂度为 O(n)。当列表弹出了最后一个元素之后,该数据结构自动被删除,内存被回收。常用于异步队列。

    右边进左边出:队列(rpush、lpop)右边进右边出:栈(rpush、rpop)

    关于列表的一些慢操作:
    lindex 相当于 Java 链表的get(int index)方法,它需要对链表进行遍历,性能随着参数index增大而变差。

    > rpush books python java golang

    (integer) 3

    > lindex books 1 # O(n) 慎用

    "java"

    > lrange books 0 -1 # 获取所有元素,O(n) 慎用

    1) "python"

    2) "java"

    3) "golang"

    > ltrim books 1 -1 # O(n) 慎用

    OK

    > lrange books 0 -1

    1) "java"

    2) "golang"

    > ltrim books 1 0 # 这其实是清空了整个列表,因为区间范围长度为负

    OK

    > llen books

    (integer) 0

    如果再深入一点,你会发现 Redis 底层存储的还不是一个简单的 linkedlist,而是称之为快速链表 quicklist 的一个结构。 首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是 ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。当数据量比较多的时候才会改成 quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间,而且会加重内存的碎片化。比如这个列表里存的只是 int 类型的数据,结构上还需要两个额外的指针 prev 和 next 。所以 Redis 将链表和 ziplist 结合起来组成了 quicklist。也就是将多个 ziplist 使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。关于ziplist的详细解释参见http://zhangtielei.com/posts/blog-redis-ziplist.html,介绍的很详细。

    3、hash(字典)

    相当于Java中的Hashmap,是无序字典。同样的数组+链表二维结构。不同的是,Redis 的字典的值只能是字符串,另外它们 rehash 的方式不一样,因为 Java 的 HashMap 在字典很大时,rehash 是个耗时的操作,需要一次性全部 rehash。Redis 为了高性能,不能堵塞服务,所以采用了渐进式 rehash 策略。通常用来存储用户信息,但存储消耗要高于单个字符串。

    > hset books java "think in java" # 命令行的字符串如果包含空格,要用引号括起来

    (integer) 1

    > hgetall books # entries(),key 和 value 间隔出现

    1) "java"

    2) "think in java"

    > hlen books

    (integer) 1

    > hget books java

    "think in java"

    > hmset books java "effective java" python "learning python" golang "modern golang programming" # 批量 set

    OK

    4、set(集合)

    类似与java中的hashset,无序且唯一。set 结构可以用来存储活动中奖的用户 ID,因为有去重功能,可以保证同一个用户不会中奖两次。 

    > sadd books python

    (integer) 1

    > sadd books python #重复

    (integer) 0

    > sadd books java golang

    (integer) 2

    > smembers books # 注意顺序,和插入的并不一致,因为 set 是无序的

    1) "java"

    2) "python"

    3) "golang"

    > sismember books java # 查询某个 value 是否存在,相当于 contains(o)

    (integer) 1

    > scard books # 获取长度相当于 count()

    (integer) 3

    > spop books # 弹出一个

    "java"

    5、zset(有序集合)

    zset 可能是 Redis 提供的最为特色的数据结构,它也是在面试中面试官最爱问的数据结构。它类似于 Java 的 SortedSet 和 HashMap 的结合体,一方面它是一个 set,保证了内部 value 的唯一性,另一方面它可以给每个 value 赋予一个 score,代表这个 value 的排序权重。它的内部实现用的是一种叫做「跳跃列表」的数据结构。

    zset 可以用来存储学生的成绩,value 值是学生的 ID,score 是他的考试成绩。我们可以对成绩按分数进行排序就可以得到他的名次。

    > zadd books 9.0 "think in java"

    > zadd books 8.9 "java concurrency"

    > zadd books 8.6 "java cookbook"

    > zrange books 0 -1 # 按 score 排序列出,参数区间为排名范围

    1) "java cookbook"

    2) "java concurrency"

    3) "think in java"

    > zrevrange books 0 -1 # 按 score 逆序列出,参数区间为排名范围

    1) "think in java"

    2) "java concurrency"

    3) "java cookbook"

    > zcard books # 相当于 count()

    > zscore books "java concurrency" # 获取指定 value 的 score

    "8.9000000000000004" # 内部 score 使用 double 类型进行存储,所以存在小数点精度问题

    > zrank books "java concurrency" # 排名

    (integer) 1

    > zrangebyscore books 0 8.91 # 根据分值区间遍历 zset

    1) "java cookbook"

    2) "java concurrency"

    > zrem books "java concurrency" # 删除 value

    跳跃列表

    zset 内部的排序功能是通过「跳跃列表」数据结构来实现的,它的结构非常特殊,也比较复杂。

    因为 zset 要支持随机的插入和删除,所以它不好使用数组来表示。

    我们需要这个链表按照 score 值进行排序。这意味着当有新元素需要插入时,要定位到特定位置的插入点,这样才可以继续保证链表是有序的。通常我们会通过二分查找来找到插入点,但是二分查找的对象必须是数组,只有数组才可以支持快速位置定位,链表做不到,那该怎么办?

    跳跃列表就是类似于层级制,最下面一层所有的元素都会串起来。然后每隔几个元素挑选出一个代表来,再将这几个代表使用另外一级指针串起来。然后在这些代表里再挑出二级代表,再串起来。最终就形成了金字塔结构。

    想想你老家在世界地图中的位置:亚洲-->中国->安徽省->安庆市->枞阳县->汤沟镇->田间村->xxxx号,也是这样一个类似的结构。

    「跳跃列表」之所以「跳跃」,是因为内部的元素可能「身兼数职」,比如上图中间的这个元素,同时处于 L0、L1 和 L2 层,可以快速在不同层次之间进行「跳跃」。

    定位插入点时,先在顶层进行定位,然后下潜到下一级定位,一直下潜到最底层找到合适的位置,将新元素插进去。你也许会问,那新插入的元素如何才有机会「身兼数职」呢?

    跳跃列表采取一个随机策略来决定新元素可以兼职到第几层。

    首先 L0 层肯定是 100% 了,L1 层只有 50% 的概率,L2 层只有 25% 的概率,L3 层只有 12.5% 的概率,一直随机到最顶层 L31 层。绝大多数元素都过不了几层,只有极少数元素可以深入到顶层。列表中的元素越多,能够深入的层次就越深,能进入到顶层的概率就会越大。

    容器型数据结构的通用规则

    list/set/hash/zset 这四种数据结构是容器型数据结构,它们共享下面两条通用规则:

    1. create if not exists

      如果容器不存在,那就创建一个,再进行操作。比如 rpush 操作刚开始是没有列表的,Redis 就会自动创建一个,然后再 rpush 进去新元素。

    2. drop if no elements

      如果容器里元素没有了,那么立即删除元素,释放内存。这意味着 lpop 操作到最后一个元素,列表就消失了。

  • 相关阅读:
    Vasya and Endless Credits CodeForces
    Dreamoon and Strings CodeForces
    Online Meeting CodeForces
    数塔取数 基础dp
    1001 数组中和等于K的数对 1090 3个数和为0
    1091 线段的重叠
    51nod 最小周长
    走格子 51nod
    1289 大鱼吃小鱼
    POJ 1979 Red and Black
  • 原文地址:https://www.cnblogs.com/linnaf5/p/9906727.html
Copyright © 2011-2022 走看看