Redis中两种持久化机制RDB和AOF

Redis简介

Redis 是完全开源的,遵守 BSD 协议,是一个高性能的 key-value 数据库。

特点和优势

  • Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。

  • Redis不仅仅支持简单的key-value类型的数据,还有以下的5种数据类型:

    1. string 字符串(可以为整形、浮点型和字符串,统称为元素)

    2. list 列表(实现队列,元素不唯一,先入先出原则)

    3. set 集合(各不相同的元素)

    4. hash hash散列值(hash的key必须是唯一的)

    5. sort set 有序集合

  • Redis支持数据的备份,即master-slave模式的数据备份。

  • 性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。

  • 原子 – Redis的所有操作都是原子性的,意思就是要么成功执行要么失败完全不执行。单个操作是原子性的。多个操作也支持事务,即原子性,通过MULTI和EXEC指令包起来。

  • 丰富的特性 – Redis还支持 publish/subscribe, 通知, key 过期等等特性。

数据持久化流程

  1. 客户端向服务端发送写操作(数据在客户端的内存中)。

  2. 数据库服务端接收到写请求的数据(数据在服务端的内存中)。

  3. 服务端调用write这个系统调用,将数据往磁盘上写(数据在系统内存的缓冲区中)。

  4. 操作系统将缓冲区中的数据转移到磁盘控制器上(数据在磁盘缓存中)。

  5. 磁盘控制器将数据写到磁盘的物理介质中(数据真正落到磁盘上)。

RDB机制

RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。

RDB提供了三种触发机制:

  1. save触发方式

该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。执行完成时候如果存在老的RDB文件,就把新的替代掉旧的。具体流程如下:

e7cd7b899e510fb3aa8c05042b22c093d0430ca7

  1. bgsave触发方式

执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。流程如下:

023b5bb5c9ea15cefb035bc8431132f53b87b21e

  1. 自动触发

自动触发是由我们的配置文件来完成的。在redis.conf配置文件中,里面有如下配置,我们可以去设置:

①save:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave。

默认如下配置:

表示900 秒内如果至少有 1 个 key 的值变化,则保存save 900 1#表示300 秒内如果至少有 10 个 key 的值变化,则保存save 300 10#表示60 秒内如果至少有 10000 个 key 的值变化,则保存save 60 10000

不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。

②stop-writes-on-bgsave-error :默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了。如果Redis重启了,那么又可以重新开始接收数据了

③rdbcompression ;默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。

④rdbchecksum :默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。

⑤dbfilename :设置快照的文件名,默认是 dump.rdb

⑥dir:设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。

1c950a7b02087bf43b4490d50ac25f2a11dfcf7e

RDB 的优势和劣势

优势:

  • RDB文件紧凑,全量备份,非常适合用于进行备份和灾难恢复。

  • 生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。

  • RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。

劣势

  • RDB快照是一次全量备份,存储的是内存数据的二进制序列化形式,存储上非常紧凑。当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,所以在快照持久化期间修改的数据不会被保存,可能丢失数据。

AOF机制

AOF 工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中,通俗的理解就是日志记录。每当有一个写命令过来时,就直接保存在我们的AOF文件中。

持久化原理如下

32fa828ba61ea8d3c2502e396b1b3848251f58b0

文件重写原理

AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。
重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。

09fa513d269759ee28454d2c4cea4b106c22dfd3

AOF触发机制

  • 每修改同步always:同步持久化 每次发生数据变更会被立即记录到磁盘 性能较差但数据完整性比较好

  • 每秒同步everysec:异步操作,每秒记录 如果一秒内宕机,有数据丢失

  • 不同no:从不同步

b17eca8065380cd7df69859ba056a5325982816c

AOF 的优势和劣势

优势:

  • AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据。

  • AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损。

  • AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。

  • AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据

劣势

  • 对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大

  • AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的

  • 以前AOF发生过bug,就是通过AOF记录的日志,进行数据恢复的时候,没有恢复一模一样的数据出来。

RDB和AOF 优势和劣势对比

8326cffc1e178a82c532308ef2117b8ba977e8ae

Redis 的回收策略

  • volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选 最近最少使用的数据淘汰。
  • volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选 将要过期的数据淘汰。
  • volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任 意选择数据淘汰。
  • allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰。
  • allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰。
  • no-enviction(驱逐):禁止驱逐数据。

使用策略规则:

  • 如果数据呈现幂律分布,也就是一部分数据访问频率高,一部分数据访问频率低,则使用 allkeys-lru。
  • 如果数据呈现平等分布,也就是所有的数据访问频率都相同,则使用 allkeys-random。

Redis中两种持久化机制RDB和AOF
http://www.wangxiaohuan.com/2020/02/19/2020-02-19/
作者
吃素的左撇子
发布于
2020年2月19日
许可协议