mysql使用LVM快照进行备份与恢复的技巧

来源:这里教程网 时间:2026-02-28 20:38:14 作者:

为什么 LVM 快照不能直接替代 MySQL 逻辑备份

因为

mysqld
的数据文件(如
ibdata1
ib_logfile*
)在运行时持续被写入,即使开启了
innodb_flush_method=O_DIRECT
,内核页缓存和 InnoDB 自身的 buffer pool 仍可能导致快照时刻的数据页不一致。LVM 快照只是块设备层面的瞬间拷贝,它不感知 MySQL 的事务状态或 checkpoint 位置。

所以直接对正在运行的 MySQL 数据目录做 LVM 快照,大概率导致恢复后

mysqld
启动失败,报错类似:

InnoDB: Database page corruption on disk or a failed
InnoDB: file read of page 3.

除非你提前让 MySQL 进入一致性状态,否则快照只是“看起来快”,实际不可用。

如何配合
FLUSH TABLES WITH READ LOCK
安全打快照

这是最常用也最稳妥的组合方式:先让 MySQL 停止写入,再打 LVM 快照。关键点不是“锁表”本身,而是它会触发 InnoDB 将脏页刷盘,并阻塞后续 DML,确保磁盘上所有数据文件处于可恢复的一致点。

FLUSH TABLES WITH READ LOCK
必须在 MySQL 客户端中执行,且连接不能断开(否则锁自动释放)
执行完后立刻在 shell 中调用
lvcreate --snapshot
,中间延迟应控制在秒级以内
快照创建完成后,尽快执行
UNLOCK TABLES
,避免业务长时间阻塞
注意:该命令会阻塞
DDL
(如
ALTER TABLE
),如果存在长事务或未提交的事务,
FLUSH
会卡住,需先查
SHOW PROCESSLIST

示例流程:

mysql -u root -p -e "FLUSH TABLES WITH READ LOCK;"
lvcreate -L 5G -s -n mysql_snap /dev/vg0/mysql_lv
mysql -u root -p -e "UNLOCK TABLES;"

恢复时必须跳过 InnoDB 的 crash recovery 阶段

LVM 快照恢复出来的数据目录,对 InnoDB 来说等同于“异常关机后重启”,默认会尝试 redo log 恢复。但快照里的

ib_logfile*
是静默时刻的副本,redo 日志并不连续,强行 recovery 会导致数据损坏或启动失败。

正确做法是让 MySQL 跳过 crash recovery,以只读方式校验数据完整性,再决定是否重放 binlog 或导入逻辑备份:

启动前删除或重命名
ib_logfile0
ib_logfile1
my.cnf
中临时添加:
innodb_force_recovery = 1
(从 1 试到 6,通常 1–3 足够)
启动 mysqld 后立即用
mysqldump
导出关键库,不要尝试写入
恢复完成后再清空
innodb_force_recovery
并重建 redo log(MySQL 会自动重建)

快照生命周期与存储成本的真实约束

LVM 快照不是零成本备份。它依赖 COW(Copy-on-Write)机制,一旦原 LV 上有写入,被修改的块就会从快照中“分离”并占用额外空间。如果你保留快照数天且业务写入频繁,

mysql_snap
卷可能迅速膨胀甚至填满整个 VG。

建议策略:

快照仅用于“临时中转”,生成后立即
dd
rsync
到独立存储(如 NAS、对象存储),然后销毁快照
不要把多个快照链式叠加(如 snap1 → snap2 → snap3),LVM 不支持,性能极差 监控快照使用率:
lvs -o +snap_percent
,超过 70% 就该清理了
生产环境务必测试快照恢复耗时——大实例(>100GB)+ 高 IO 压力下,
lvconvert --merge
可能卡住数小时

真正难的从来不是打快照,而是验证它能不能恢复、以及恢复出来是不是你想要的那一秒。别信“快照成功=备份成功”。

相关推荐