zoukankan      html  css  js  c++  java
  • 初识Redis,看这一篇就够了

    环境的搭建和安装网上有很多教程,在这里就不再重复了。

    1. Redis是什么?

    Redis(全称:Remote Dictionary Server 远程字典服务)是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库

    大家可能知道Redis是做缓存用的,它实际上也是一种数据库,可以对经常使用到的数据进行存储,也就是大家所说的缓存。

    官方给出的数据是,Redis能达到10w+QPS(每秒查询速度)

    为什么Redis的速度比Mysql等这种数据快呢?

    因为Redis存储的是key-values格式的数据,时间复杂度是O(1),即直接通过key查询对应的value而如Mysql数据库,底层的实现是B+树,时间复杂度是O(logn)

    最重要的一点是,数据库的数据是存储在磁盘中的,而Redis是存储在内存当中的,它们的速度差距不言而喻。但Redis也支持持久化存储,这个后面的常见问题里会提到。

    2. Redis数据类型

    Redis支持5种数据类型:string(字符串)、hash(哈希)、list(列表,有序可重复)、set(集合,无序不可重复)、zset(有序集合,有序不可重复)。

    Redis中所有数据都是字符串,key是区分大小写的。

    1.string是最基本的类型,可以包含任何数据,但是string类型的值最大能存储512MB

    2.hashvalue相当于一个mapvalue里面也有对应的key-value,特别适合存储对象。一个hash可以存储2^32-1个键值对,基本用不完。并且可以修改某一个属性值,所以一般用于存储用户或其他实体类的值。

    3.list中的value按照插入顺序排序,可以在列表的头部和尾部添加新元素。一般用于最新消息的排行或消息队列。

    4.set存放的是不重复值的集合,是无序的。并提供了求交集、并集、差集等操作,所以一般用于统计等功能。

    5.set不同的是,zset是通过分数(score)从小到达进行排序的,我们可以指定每个值的分数,分数可以重复。一般用于排行等功能。

    3.Redis常用命令

    基于对上面5种数据类型的了解,接着学习一下Redis常用命令。更多了命令学习,推荐大家看一看官方文档http://www.redis.cn/commands.html


    1.对stirng的操作

    redis命令不区分大小写。

    下面命令中,str就是key,hello就是value,append为追加命令,如果原来没有str,就新建一个。

    append str hello    //对key为str的键追加hello字符串
    append str redis  //str的value变为helloredis
    set str1 1  //set命令设置一个key的value值 str1是key,1是value
    get str1   //get命令,获取一个key的值
    incr str1  //incr命令,执行加1操作,比如str1的值会变成2,如果指定的key的value不能表示一个整数,就会返回一个错误
    decr str1  //减一操作

    2.对hash的操作

    上面说到过,hash的value相当于一个map,所以只设置值的时候myhash是key,h1是value里面的key,hello是h1的value

    hset myhash h1 hello  //设置一个key的value值
    hget myhash h1  //返回hello,myhash为key,h1是value里面的key,两个都需要指定
    hlen myhash  //获取myhash的字段数量,这里返回1
    hkeys myhash  //获取myhash所以字段,这里返回h1

    3.对list的操作

    mylst是key,a,b,c,d都是value,并且有顺序,所以实际存进去后是d,c,b,a

    lpush mylist a b c d  //lpush,从队列左边入队一个或多个元素
    lrange mylist 0 -1  //获取指定范围的值,从0开始,-1代表全部,注意这里返回d,c,b,a。
    rpush mylist 1 2 3  //从右边入队,再次lrange的话就是d,c,b,a,1,2,3
    lpop mylist  //从左边弹出一个元素,这里弹出d,此时的mylist就没有d了

    4.对set的操作

    如果我们添加了重复的元素,不会报错,但只会存一个。如a b b,只会存a b

    两个集合之间不受影响,即key为myset和myset2两个集合里面都可以有a b

    sadd myset a b c d  //添加一个或多个元素到集合里面
    smembers myset  //获取集合里所有元素,输出是无序的,随机的。这里可能是b,d,c,a
    srem myset a c  //移除myset中的a和c元素,由于不可能重复也没顺序,所以可以直接指定元素值来移除

    5.对zset的操作

    myzset为key,a b c前面的数字就是score

    zadd myzset 2 b 1 a 3 c  //添加一个或多个元素
    zrange myzset 0 -1  //获取指定范围的值,0开始,-1代表全部。这里返回a,b,c

    更多的命令可以看上面网站中的文档,写的非常详细,下面的常见问题中也会提及一些。

    4.Redis常见问题

    1.在大量的key中查询某一固定前缀的key

    在实际的业务当中,key的命名是有规范的,比如缓存用户信息,key的前缀可能会是user。

    现在有几千万条数据,查询user为前缀的key的话,第一下想到的可能会是keys命令

    keys user*  //user*为正则表达式

    其时间复杂度为O(n),虽然性能也算可以,但是在查询几千万条数据时明显太慢了,花上几分钟都不稀奇,而且在查询出来之前,可能会造成服务卡顿,占用大量内存,显然是不可取的。

    那么这种情况就可以使用scan命令

    下面的命令中,math count为可选项,可用可不用,所以需要显示的写出来。math意味后面会匹配一个正则表达式。count代表一次查询10条。

    这个10条不是强制的,可能会比10条少。

    scan 0 math user*  count 10  //从0开始,查询user为前缀的key,一次查询10条并返回

    执行上面一句话后,会返回两个东西,一个游标,代表执行到哪了,比如执行到了14325。返回的另一个就是user为前缀的key了。

    下次再执行这条语句时,把0换成14325,接着上次的位置继续查询。但是游标不一定是递增的,也许下次的游标比这次还小,所以存在重复的隐患。

    我们可以在业务代码处循环查询,记录每次返回的游标,并把查询的key存入到set当中,起到去重的效果。

    scan,实际上就是分批查询,速度显然没有keys快,在查询大量数据时,不会对服务器造成压力。数据量不大时依旧推荐keys

    2.利用Redis实现分布式锁

    首先了解什么是分布式锁。即控制分布式系统访问共享资源的一种方式。

    比如系统(或主机)A和B都需要访问资源DataA时,当A先访问到了DataA,这时候就需要分布式锁来把B挡住,防止A和B彼此干扰,保证数据的一致性。

    额外提一点就是,Redis命令的操作是原子性的,原子性在数据库的事务中有体现,Redis的命令也是原子性的,要么执行要么不执行,不会出现一个命令执行到一半失败了,但还是改变了数据的问题。

    实现分布式锁,需要解决一下几个问题:

    1.互斥性,即任意时刻只能有一个客户端获取锁。

    2.安全性,锁只能有持有它的客户端删除,不能由其他客户端删除。

    3.死锁,即由于某些原因,一些客户端出现问题不能及时释放锁,导致其他客户端也不能获取锁。

    4.容错,当某些Redis节点出现问题时,客户端也要能获取到锁。

    我们可以用setnx实现锁的功能。语法:setnx key value

    仅当key不存在时,才会设置成功。成功返回1,否则返回0。

    1.在对应的访问资源的业务代码处,对指定的key设值,如果成功了,则代表没有其他线程执行过这段代码,也就是没有其他线程访问这个资源。

    如果设值失败,就代表有其他线程占用该资源,就一直等待,直到setnx成功。

    2.还有个问题就是,这个key是长期有效的,所以还需要用到expire命令,语法:expire key seconds,seconds单位为秒,用以设置对应key的过期时间。

    上面两步似乎好像是实现了锁的功能,但是缺陷也非常明显,如果成功设值后,在我设置时间之前客户端就出现问题了怎么办?用两个命令实现一个功能有悖于Redis的原子性

    在Redis2.6.12版本开始,set有两个参数,就是实现了以上两个功能。虽然上面两步分开的做法是错的,但是思路是一样的。

    具体语法:set key value ex 10 nx。ex代表过期时间,这里设置10秒过期,nx代表key是要唯一的,即一个命令实现了以上两个步骤。

    最后还有一个小问题,如果不同资源同时设置了锁key,过期时间也是一样的,到期后Redis同时删除大量key时,难免会出现卡顿。

    解决方法就是在设置过期值时加上随机值。

    3.利用Redis实现消息队列

    消息队列,简称MQ,即消息和队列两个单词的首字母缩写。常见的消息队列有RabbitMQ和RocketMQ等,利用Redis实现消息队列只是熟悉下其特点,实际当中一般会使用专门的消息队列中间件。

    如果之前没了解过消息队列,建议搜索一下消息队列相关知识进行一下简单的学习。

    简单地说,消息队列的作用就是接受客户端的请求,然后对这些请求依次处理,一般应用请求量特别大时,比如秒杀抢购等。上面介绍数据类型时就说到了list一般用于消息队列。

    看一下list的常见操作,虽然叫做列表,但其特点和数据结构的队列基本一模一样。所以在用Redis实现消息队列时,首先肯定会想到list。

    1.利用list的话,仿佛使用rpush生产消息,lpop消费消息就行了。但是有一个小问题,lpop不会等待rpush的,当rpush还没来得及生成数据时,这时lpop会直接返回null的。

    2.既然要等待rpush生成数据,难免又会想到一个命令blpop,其语法为:blpop key seconds。和lpop功能一样,但是会等待指定的时间,这段时间内rpush如果生成数据的话,blpop会及时返回

    3.但是blpop的缺点也很明显,当然这个缺点也存在于lpop当中,就是blpop执行完后,代表出队,rpush生成的这条消息就没了,而消息队列中有的需求是需要多个消费者去接收的。

    这时候就可以用上Redis的订阅者模式,Redis客户端可以订阅任意数量的频道(Topic)

    在Redis当中用subscribe命令订阅一个频道,语法subscribe topic,topic就是自定义的频道名称,注意是topic不是key,不需要事先定义,直接订阅就行了。

    然后用publish生产消息,语法publish topic value,topic就是你想发布到哪个频道,value就是数据内容,而订阅了这个频道的所有消费者都会接收到消息。注意是及时收到,不需要你再去手动用命令获取。

    订阅者模式,的确解决了以上两种方法的缺点,但是其缺陷也很明显,就是只有处于订阅者模式,也就是监听状态下,消费者才会接受到生产者的消息,也就是及时发送及时接收的,一旦Redis客户端下线,就永远不会接收到这个消息了。

    这就回到了前面说到的一句话,实际当中会使用专门的消息队列中间件来说实现这些功能,以上三种方法或多或少可以实现消息队列的功能,但是缺陷也非常明显。

    4.Redis如何做持久化

    Redis是基于内存当中的,那么肯定就会有疑问了,当我关闭主机或者关闭了Redis,那Redis的数据是不是就全没了。

    持久化的作用就是,把Redis的数据存储到磁盘当中,以免Redis的数据丢失。

    Redis有两种持久化机制,默认的一种是RDB,另一种是AOF。

    1.RDB(快照)持久化会在某个时间点保存全量的数据,快照即针对内存进行的快速读取技术。而这个时间点可以由我们的实际业务进行时间策略配置。

    RDB会按照时间周期策略对数据以快照的方式保存到磁盘里,并产生一个dump.rdb的二进制文件。我们可以在redis.conf配置文件中save参数查看和配置时间策略。

    dump.rdb文件是如何创建的呢?rdb文件可以通过两个命令创建,一个是save,一个是bgsave。要注意这里的save是redis命令,上面提到的save是配置文件里面的参数。

    save命令会阻塞Redis服务器进程,直到rdb文件创建完成,一般很少使用。

    bgsave命令会fork出一个子进程来创建rdb文件,不会阻塞服务器进程。fork即创建一个与父进程几乎一样的子进程。

    bgsave的基本原理:当我们使用bgsave命令时,首先会检查是否存在RDB/AOF子进程正在进行,有的话就返回错误,即当我们第一次执行了bgsave,在执行完之前其他的bgsave会被拒绝执行。

    如果没有正在进行的子进程,就会调用redis源码里面的rdbSaveBackground这个方法,然后利用fork创建一个子进程。

    RDB的缺点:

      1.1.前面提到,在某个时间点会进行全量数据保存,数据量大的话由于I/O而严重影响到性能。

      1.2.由于RDB是根据配置文件里面的时间策略进行保存的,如果发生意外情况,那么上次保存到当前时间段内的数据会发生丢失。

    2.AOF(Append-Only-File)持久化会以追加的方式(append)保存除了查询指令以外所有变更的数据,其默认的文件名称为appendonly.aof

    AOF持久化默认是关闭的,我们可以在配置文件当中找到appendonly参数,把它的参数内容改为yes。

    前面说到AOF文件会记录所有非查询的所有指令,最后肯定难以避免文件不断增大的问题,最主要的问题是记录的很多数据是不必要的。

    比如循环更新一个数100次,AOF会记录这100个过程,而我们只需要最终结果就行了。

    所以,Redis提供了一个日志重写的功能解决文件不断增大的问题,可以用BGREWRITEAOF命令手动执行。日志重写在服务不中断的情况下也能执行,其基本原理如下

    1.使用fork创建一个子进程。2.子进程把新的AOF写道一个临时文件里,并不会依赖现有的AOF文件,只需要读取内存中的数据。这里就优化了很多不必要的数据。

    3.主进程这时候会依旧将新的变动写到内存里,也会写到现有的AOF文件里,即使子进程重写失败,数据也不会丢失。4.主进程获取到子进程AOF重写完成的信号后,会把新的变动追加到新的AOF文件里。

    5.最后使用新的AOF文件替换掉原来的AOF文件。

    如果启用了AOF持久化,Redis启动时会先检查AOF文件是否存在,如果存在就直接加载AOF文件,如果不存在就检查RDB文件是否存在,如果存在就加载,不存在就直接启动Redis。

    在Redis4.0之后,推出了RDB-AOF混合持久化方式并作为默认方式,RDB全量保存,AOF增量保存,集成了它们各自的优点。

    5.SpringBoot整合Redis

    首先在依赖项里面添加redis启动器

    spring-boot-starter-data-redis

    然后在配置文件里面进行相关的配置,更多的配置可以看RedisProperties.java源码查看。

    spring.redis.host=127.0.0.1    #redis地址
    spring.redis.port=6379    #redis服务端口号

     最后注入相关的类

    //操作的是复杂类型,比如各种实体类
    @Autowired
    RedisTemplate redisTemplate
    
    //操作的是字符串
    @Autowired
    StringRedisTemplate stringRedisTemplate

    SpringBoot框架下对Redis的操作不像Jedis那样可以直接使用原生的Redis命令,具体的API大家可以自行搜索相关的文档。

    不过推荐使用一些SpringBoot的Redis工具类,工具类会对RedisTemplate和StringRedisTemplate的方法进行封装,而封装后的方法名和Redis原生命令是一样的。

  • 相关阅读:
    将在线图片转换成base64踩坑记录及静态资源跨域及缓存的处理
    MySQL大表拆分多个表的方式(横向拆分和纵向拆分)及如何解决跨表查询效率问题
    electron-vue项目打包踩坑指南
    如何在npm上发布vue插件
    MVC之前的那点事儿系列(9):MVC如何在Pipeline中接管请求的?
    MVC之前的那点事儿系列(8):UrlRouting的理解
    MVC之前的那点事儿系列(7):WebActivator的实现原理详解
    MVC之前的那点事儿系列(6):动态注册HttpModule
    MVC之前的那点事儿系列(5):Http Pipeline详细分析(下)
    MVC之前的那点事儿系列(4):Http Pipeline详细分析(上)
  • 原文地址:https://www.cnblogs.com/lbhym/p/12290938.html
Copyright © 2011-2022 走看看