Redis的持久化

zoukankan html css js c++ java

Redis的持久化
Redis有两种持久化的方式：快照（RDB文件）和追加式文件（AOF文件）：
- RDB持久化方式会在一个特定的间隔保存那个时间点的一个数据快照。
- AOF持久化方式则会记录每一个服务器收到的写操作。在服务启动时，这些记录的操作会逐条执行从而重建出原来的数据。写操作命令记录的格式跟Redis协议一致，以追加的方式进行保存。
- Redis的持久化是可以禁用的，就是说你可以让数据的生命周期只存在于服务器的运行时间里。
- 两种方式的持久化是可以同时存在的，但是当Redis重启时，AOF文件会被优先用于重建数据。
RDB

工作原理
- Redis调用fork()，产生一个子进程。
- 子进程把数据写到一个临时的RDB文件。
- 当子进程写完新的RDB文件后，把旧的RDB文件替换掉。
优点
- RDB文件是一个很简洁的单文件，它保存了某个时间点的Redis数据，很适合用于做备份。你可以设定一个时间点对RDB文件进行归档，这样就能在需要的时候很轻易的把数据恢复到不同的版本。
- 基于上面所描述的特性，RDB很适合用于灾备。单文件很方便就能传输到远程的服务器上。
- RDB的性能很好，需要进行持久化时，主进程会fork一个子进程出来，然后把持久化的工作交给子进程，自己不会有相关的I/O操作。
- 比起AOF，在数据量比较大的情况下，RDB的启动速度更快。
缺点
- RDB容易造成数据的丢失。假设每5分钟保存一次快照，如果Redis因为某些原因不能正常工作，那么从上次产生快照到Redis出现问题这段时间的数据就会丢失了。
- RDB使用fork()产生子进程进行数据的持久化，如果数据比较大的话可能就会花费点时间，造成Redis停止服务几毫秒。如果数据量很大且CPU性能不是很好的时候，停止服务的时间甚至会到1秒。
文件路径和名称

默认Redis会把快照文件存储为当前目录下一个名为dump.rdb的文件。要修改文件的存储路径和名称，可以通过修改配置文件redis.conf实现：
```
# RDB文件名，默认为dump.rdb。
dbfilename dump.rdb

# 文件存放的目录，AOF文件同样存放在此目录下。默认为当前工作目录。
dir ./
```
保存点（RDB的启用和禁用）

你可以配置保存点，使Redis如果在每N秒后数据发生了M次改变就保存快照文件。例如下面这个保存点配置表示每60秒，如果数据发生了1000次以上的变动，Redis就会自动保存快照文件：
```
save 60 1000
```
保存点可以设置多个，Redis的配置文件就默认设置了3个保存点：
```
# 格式为：save <seconds> <changes>
# 可以设置多个。
save 900 1 #900秒后至少1个key有变动
save 300 10 #300秒后至少10个key有变动
save 60 10000 #60秒后至少10000个key有变动
```
如果想禁用快照保存的功能，可以通过注释掉所有"save"配置达到，或者在最后一条"save"配置后添加如下的配置：
```
save ""
```
错误处理

默认情况下，如果Redis在后台生成快照的时候失败，那么就会停止接收数据，目的是让用户能知道数据没有持久化成功。但是如果你有其他的方式可以监控到Redis及其持久化的状态，那么可以把这个功能禁止掉。
```
stop-writes-on-bgsave-error yes
```
数据压缩

默认Redis会采用LZF对数据进行压缩。如果你想节省点CPU的性能，你可以把压缩功能禁用掉，但是数据集就会比没压缩的时候要打。
```
rdbcompression yes
```
数据校验

从版本5的RDB的开始，一个CRC64的校验码会放在文件的末尾。这样更能保证文件的完整性，但是在保存或者加载文件时会损失一定的性能（大概10%）。如果想追求更高的性能，可以把它禁用掉，这样文件在写入校验码时会用0替代，加载的时候看到0就会直接跳过校验。
```
rdbchecksum yes
```
手动生成快照

Redis提供了两个命令用于手动生成快照。

SAVE

SAVE命令会使用同步的方式生成RDB快照文件，这意味着在这个过程中会阻塞所有其他客户端的请求。因此不建议在生产环境使用这个命令，除非因为某种原因需要去阻止Redis使用子进程进行后台生成快照（例如调用fork(2)出错）。

BGSAVE

BGSAVE命令使用后台的方式保存RDB文件，调用此命令后，会立刻返回OK返回码。Redis会产生一个子进程进行处理并立刻恢复对客户端的服务。在客户端我们可以使用LASTSAVE命令查看操作是否成功。
```
127.0.0.1:6379> BGSAVE
Background saving started
127.0.0.1:6379> LASTSAVE
(integer) 1433936394
```
配置文件里禁用了快照生成功能不影响SAVE和BGSAVE命令的效果。

AOF

快照并不是很可靠。如果你的电脑突然宕机了，或者电源断了，又或者不小心杀掉了进程，那么最新的数据就会丢失。而AOF文件则提供了一种更为可靠的持久化方式。每当Redis接受到会修改数据集的命令时，就会把命令追加到AOF文件里，当你重启Redis时，AOF里的命令会被重新执行一次，重建数据。

优点
- 比RDB可靠。你可以制定不同的fsync策略：不进行fsync、每秒fsync一次和每次查询进行fsync。默认是每秒fsync一次。这意味着你最多丢失一秒钟的数据。
- AOF日志文件是一个纯追加的文件。就算是遇到突然停电的情况，也不会出现日志的定位或者损坏问题。甚至如果因为某些原因（例如磁盘满了）命令只写了一半到日志文件里，我们也可以用redis-check-aof这个工具很简单的进行修复。
- 当AOF文件太大时，Redis会自动在后台进行重写。重写很安全，因为重写是在一个新的文件上进行，同时Redis会继续往旧的文件追加数据。新文件上会写入能重建当前数据集的最小操作命令的集合。当新文件重写完，Redis会把新旧文件进行切换，然后开始把数据写到新文件上。
- AOF把操作命令以简单易懂的格式一条接一条的保存在文件里，很容易导出来用于恢复数据。例如我们不小心用FLUSHALL命令把所有数据刷掉了，只要文件没有被重写，我们可以把服务停掉，把最后那条命令删掉，然后重启服务，这样就能把被刷掉的数据恢复回来。
缺点
- 在相同的数据集下，AOF文件的大小一般会比RDB文件大。
- 在某些fsync策略下，AOF的速度会比RDB慢。通常fsync设置为每秒一次就能获得比较高的性能，而在禁止fsync的情况下速度可以达到RDB的水平。
- 在过去曾经发现一些很罕见的BUG导致使用AOF重建的数据跟原数据不一致的问题。
启用AOF

把配置项appendonly设为yes：
```
appendonly yes
```
文件路径和名称
```
# 文件存放目录，与RDB共用。默认为当前工作目录。
dir ./

# 默认文件名为appendonly.aof
appendfilename "appendonly.aof"
```
可靠性

你可以配置Redis调用fsync的频率，有三个选项：
- 每当有新命令追加到AOF的时候调用fsync。速度最慢，但是最安全。
- 每秒fsync一次。速度快（2.4版本跟快照方式速度差不多），安全性不错（最多丢失1秒的数据）。
- 从不fsync，交由系统去处理。这个方式速度最快，但是安全性一般。
推荐使用每秒fsync一次的方式（默认的方式），因为它速度快，安全性也不错。相关配置如下：
```
# appendfsync always
appendfsync everysec
# appendfsync no
```
日志重写

随着写操作的不断增加，AOF文件会越来越大。例如你递增一个计数器100次，那么最终结果就是数据集里的计数器的值为最终的递增结果，但是AOF文件里却会把这100次操作完整的记录下来。而事实上要恢复这个记录，只需要1个命令就行了，也就是说AOF文件里那100条命令其实可以精简为1条。所以Redis支持这样一个功能：在不中断服务的情况下在后台重建AOF文件。

工作原理如下：
- Redis调用fork()，产生一个子进程。
- 子进程把新的AOF写到一个临时文件里。
- 主进程持续把新的变动写到内存里的buffer，同时也会把这些新的变动写到旧的AOF里，这样即使重写失败也能保证数据的安全。
- 当子进程完成文件的重写后，主进程会获得一个信号，然后把内存里的buffer追加到子进程生成的那个新AOF里。
- Redis
我们可以通过配置设置日志重写的条件：
```
# Redis会记住自从上一次重写后AOF文件的大小（如果自Redis启动后还没重写过，则记住启动时使用的AOF文件的大小）。
# 如果当前的文件大小比起记住的那个大小超过指定的百分比，则会触发重写。
# 同时需要设置一个文件大小最小值，只有大于这个值文件才会重写，以防文件很小，但是已经达到百分比的情况。

auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
```
要禁用自动的日志重写功能，我们可以把百分比设置为0：
```
auto-aof-rewrite-percentage 0
```
Redis 2.4以上才可以自动进行日志重写，之前的版本需要手动运行BGREWRITEAOF这个命令。

数据损坏修复

如果因为某些原因（例如服务器崩溃）AOF文件损坏了，导致Redis加载不了，可以通过以下方式进行修复：
- 备份AOF文件。
- 使用redis-check-aof命令修复原始的AOF文件：
  
  $ redis-check-aof --fix
- 可以使用diff -u命令看下两个文件的差异。
- 使用修复过的文件重启Redis服务。
从RDB切换到AOF

这里只说Redis >= 2.2版本的方式：
- 备份一个最新的dump.rdb的文件，并把备份文件放在一个安全的地方。
- 运行以下两条命令：
  
  $ redis-cli config set appendonly yes $ redis-cli config set save ""
- 确保数据跟切换前一致。
- 确保数据正确的写到AOF文件里。
第二条命令是用来禁用RDB的持久化方式，但是这不是必须的，因为你可以同时启用两种持久化方式。

记得对配置文件redis.conf进行编辑启用AOF，因为命令行方式修改配置在重启Redis后就会失效。

备份

建议的备份方法：
- 创建一个定时任务，每小时和每天创建一个快照，保存在不同的文件夹里。
- 定时任务运行时，把太旧的文件进行删除。例如只保留48小时的按小时创建的快照和一到两个月的按天创建的快照。
- 每天确保一次把快照文件传输到数据中心外的地方进行保存，至少不能保存在Redis服务所在的服务器。
redis缓存是支持数据持久化的操作，也就是可以把内存中的数据持久化到硬盘当中，和数据库有些相似，这也是redis和memcache的区别之一。

redis数据持久化常用的方式有两种：
1. Snapshotting （RDB）
  在指定的时间间隔内生成数据集的时间点快照（point-in-time snapshot），也是redis持久化的默认方式。
2. Append Only File （AOF）
  持久化记录服务器执行的所有操作命令，并在服务启动时，通过重新执行这些命令来还原数据集。
RDB的生成方式：
1. 通过执行命令手动生成
  可通过SAVE和BGSAVE命令对数据进行持久化，生成RDB文件。
  SAVE命令，会阻塞当前服务的进程，在阻塞期间，服务器不能处理任何命令请求，直到缓存数据持久化完成。
  BGSAVE命令，顾名思义就是在后台执行，不会阻塞当前服务，会派生出一个子进程，由子进程负责持久化数据，父进程继续处理命令请求。
2. 通过配置自动生成
  可以通过redis.conf配置文件找到SNAPSHOTTING配置，修改save选项，让服务器每隔一段时间自动执行BGSAVE。
配置如下：
```
<span style="font-size:12px;">################################ SNAPSHOTTING  #################################
#  
# Save the DB on disk:  
#  
#   save <seconds> <changes>  
#  
#   Will save the DB if both the given number of seconds and the given  
#   number of write operations against the DB occurred.  
#  
#   In the example below the behaviour will be to save:  
#   after 900 sec (15 min) if at least 1 key changed  
#   after 300 sec (5 min) if at least 10 keys changed  
#   after 60 sec if at least 10000 keys changed  
#  
#   Note: you can disable saving at all commenting all the "save" lines.  
  
save 900 1         //服务器在900秒内，对缓存数据库至少修改了1次  
save 300 10        //服务器在300秒内，对缓存数据库至少修改了1次  
save 60 10000      //服务在60秒内，对缓存数据库至少修改了10000次  
  
# Compress string objects using LZF when dump .rdb databases?  
# For default that's set to 'yes' as it's almost always a win.  
# If you want to save some CPU in the saving child set it to 'no' but  
# the dataset will likely be bigger if you have compressible values or keys.  
rdbcompression yes  
  
# The filename where to dump the DB  
dbfilename dump.rdb    //持久化数据存到磁盘的文件名称  
  
# The working directory.  
#  
# The DB will be written inside this directory, with the filename specified  
# above using the 'dbfilename' configuration directive.  
#   
# Also the Append Only File will be created inside this directory.  
#   
# Note that you must specify a directory here, not a file name.  
dir ./       //存到磁盘的路径</span>  
```
只要满足上面三个save配置中的一个，redis就会自动进行数据快照，持久化到硬盘中。用户可根据自己需求进行配置。

看到上面的配置我会很好奇，服务器怎么知道我在多长的时间对缓存数据修改了多少次了？后来发现Redis服务其中有个dirty和一个lastsave时间戳。

当服务器执行一个数据修改命令之后，dirty计数器数值会进行更新。

lastsave则是记录上次服务器执行BGSAVE命令的时间，在这就不详细解释了。

AOF

AOF持久化数据是通过保存Redis服务所有的操作命令，下次启动服务时，从新执行这些操作命令来还原缓存数据。

AOF文件刷新有三种方式：

1.appendfsync always - 每提交一个修改命令都调用fsync刷新到AOF文件，非常非常慢，但也非常安全
2.appendfsync everysec - 每秒钟都调用fsync刷新到AOF文件，很快，但可能会丢失一秒以内的数据
3.appendfsync no - 依靠OS进行刷新，redis不主动刷新AOF，这样最快，但安全性就差

默认并推荐每秒刷新，这样在速度和安全上都做到了兼顾

数据恢复：

RDB

RDB恢复数据的方式没有专门的操作命令去执行，redis服务启动时，会自动查找RDB文件进行加载，指导RDB文件加载完成为止。

AOF

服务器在启动时，通过载入和执行AOF文件中保存的命令来还原服务器关闭之前的数据库状态，具体过程：

（1）载入AOF文件

（2）创建模拟客户端

（3）从AOF文件中读取一条命令

（4）使用模拟客户端执行命令

（5）循环读取并执行命令，直到全部完成

如果同时启用了RDB和AOF方式，AOF优先，启动时只加载AOF文件恢复数据
查看全文

相关阅读:
《深入了解 Linq to SQL》之对象的标识 —— 麦叔叔呕心呖血之作
 闲聊吉日与水军
 谈谈需求的变更
 ALinq BUG & 版本发布
 Linq to SQL (ALinq) 也来AOP —— ALinq Inject 博客园首发
 使用Orachard与Bootstrap建站心得
 一位软件作者的吐嘈——读《Google Reader猝死启示录：互联网无法永远免费》有感
 被神化的架构和被夸大的CTRL+C、CTRL+V
我对程序员技能的一些认识
 又见ORM跑分 —— 对ORM跑分的吐嘈

原文地址：https://www.cnblogs.com/xingchong/p/10405720.html

RDB

工作原理

优点

缺点

文件路径和名称

保存点（RDB的启用和禁用）

错误处理

数据压缩

数据校验

手动生成快照

SAVE

BGSAVE

AOF

优点

缺点

启用AOF

文件路径和名称

可靠性

日志重写

数据损坏修复

从RDB切换到AOF

备份

建议的备份方法：

redis数据持久化常用的方式有两种：

RDB的生成方式：

AOF

数据恢复：