# Redis 持久化

面试和工作,持久化都是重点

Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失,所以 Redis 提供了持久化功能

# RDB(Redis DataBase)

在主从复制中,rdb 就是备用的,从机上面!

什么是 RDB

image-20240105142624377

在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的 Snapshot 快照,它恢复时是将快照文件直接读到内存里.

Redis 会单独创建 (fork), 一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件,整个过程中,主进程是不进行任何 IO 操作的,这就确保了极高的性能,如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效,RDB 的缺点是最后一次持久化后的数据可能丢失。我们默认的就是 RDB, 一般情况下不需要修改这个配置!

有时候在生产环境我们会将这个文件进行备份

rdb 保存的文件是 dump.rdb 都是在配置文件中的快照中进行配置的!

image-20240105142652722

image-20240105142725442

rdb 触发机制

1.save 的规则满足的情况下,会自动触发 rdb 规则

2. 执行 flushall 命令,也会触发 rdb 规则

3. 退出 redis, 也会产生 rdb 文件

备份就自动生成一个 dump.rdb 文件

image_2023-01-02-17-53-39

如何恢复 rdb 文件

1. 只需要将 rdb 文件放在我们 redis 启动目录就可以,redis 启动的时候会自动检查 dump.rdb

2. 查看存在的位置

127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/bin"
127.0.0.1:6379>

几乎它自己默认的配置就够用了,但是我们还是需要去学习

# 优点

  1. 适合大规模的数据恢复

  2. 对数据的完整性要求不高

# 缺点

  1. 需要一定的时间间隔进程操作,如果 redis 意外宏基了,这个最后一次修改的数据就没了

  2. fork (分岔) 进程的时候,会占用一定的内存空间

# AOF(Append only File)

将我们的所有命令都记录下来,类似与命令 history , 恢复的时候就把这个文件全部在执行一遍!

image_2023-01-02-17-17-21

以日志的形式来记录每个写操作,将 redis 执行过的所有指令记录下来 (读操作不记录), 只许追加文件但不可以改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作

Aof 保存的是 appendonly.aof 文件

APPEND

image-20240105142742273

默认是不开启的,我们需要手动进行配置更改为开启 yes

image_2023-01-03-17-16-29

一般每间隔一秒修改就好了

image_2023-01-03-17-19-15

重写规则说明

aof 默认就是文件的无限追加,文件会越来越大

image-20240105142755534

image_2023-01-03-17-23-03

如果 aof 文件大于 64mb, 就会 fork 一个新的进程来将我们的文件进行重写!

测试 如果破坏 aof 文件会怎么样

image_2023-01-03-19-14-06

<font style="color:red"><u > 报错:拒绝连接 </u></font>

image_2023-01-03-19-15-50

如果这个 aof 文件有错误,这时候 redis 是启动不起来的,我们需要修复这个 aof 文件 <br>redis 给我们提供了一个工具 redis-check-aof

image_2023-01-03-19-20-44

查看 aof 文件里面没有错误命令了

image_2023-01-03-19-21-34

再次重启后就可以正常启动了

image_2023-01-03-19-23-33

优点和缺点

# appendfsync always #每次修改都会 sync, 消耗性能
appendfsync everysec #每秒执行一次 sync, 可能会丢失这 1 秒的数据
# appendfsync no #不执行 sync, 这个时候操作系统自动同步数据,速度最快

优点:

  1. 每次修改都同步,文件的完整性会更好

  2. 每秒修改同步一次,可能会丢失一秒的数据

  3. 从不同步,效率最高

缺点:

  1. 相对于数据文件来说,aof 远远大于 rdb, 修复的速度也比 rdb 慢!

  2. aof 运行效率要比 rdb 慢,所以我们 redis 默认的配置就是 rdb 持久化!

扩展

  1. rdb 持久化方式能够在指定的时间间隔内对你的数据进行快照存储

  2. aof 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始数据,aof 命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 aof 文件进行后台重写,使得 aof 文件的体积不至于过大

  3. 只做缓存,如果你希望你的数据在服务器运行的时候存在,你也可以不适用任何持久化

  4. 同时开启两种持久化方式

    • 在这种情况下,当 redis 重启的时候会优先载入 aof 文件来恢复原始的数据,因为在通常情况下 aof 文件保存的数据集要比 rdb 文件保存的数据集要完整
    • rdb 的数据不实时,同时使用两者时服务器重启也只会找 aof 文件,那要不要只使用 aof 呢?作者不建议,因为 rdb 更适合用于备份数据库 (aof 在不断变化不好备份), 快速重启,而且不会有 aof 可能潜在的 bug, 留着作为一个万一的手段
  5. 性能建议

    • 因为 rdb 文件只用作后背用途,建议只在 Slae 上持久化 rdb 文件,而且只要 15 分钟备份一次就够了,只保留 Save 900 1 这条规则
    • 如果 Enable AOF, 好处是在最恶劣的情况下也只会丢失不超过两秒数据,启动脚本较简单只 load 自己的 aof 文件就可以了,代价一是带来了持续的 IO, 二是 AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的,只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值 64mb 太小了,可以设到 5G 以上,默认超过原大小 100% 大小重写可以改到适当的数值
    • 如果不 Enable AOF, 仅靠 Master-Slave Repllcation (主从复制) 实现高可用性也可以,能省掉一大笔 IO, 也减少了 rewrite 是带来的系统波动,代价是如果 Master/Slave 同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的 RDB 文件,载入较新的那个,微博就是这种架构