MySQL 设置复制延迟监控主要通过监控主从复制的延迟时间(即从库落后主库的时间),常用的方法包括使用 Seconds_Behind_Master 指标、定期检查复制状态,以及结合外部监控工具进行告警。以下是具体操作方式。
1. 使用 SHOW SLAVE STATUS 查看延迟
这是最基础的方式,登录到从库执行:
SHOW SLAVE STATUS\G关注以下两个关键字段:
Slave_IO_Running:是否正常拉取主库日志 Slave_SQL_Running:是否正常应用日志 Seconds_Behind_Master:当前复制延迟的秒数如果 Seconds_Behind_Master 数值持续增长或明显偏高(如超过60秒),说明存在延迟问题。
2. 编写脚本定期监控延迟
可以编写一个简单的 Shell 或 Python 脚本,定时检查 Seconds_Behind_Master 并记录或告警。
示例 Shell 脚本片段:
mysql -h slave_host -u user -p'password' -e "SHOW SLAVE STATUS\G" | grep "Seconds_Behind_Master" | awk '{print $2}'将该命令加入 crontab 每分钟执行一次,当数值超过阈值时发送邮件或调用 webhook 告警。
3. 使用 pt-heartbeat(Percona Toolkit)精确监控
pt-heartbeat 是 Percona Toolkit 提供的精准复制延迟监控工具,比 Seconds_Behind_Master 更可靠(后者在某些场景下可能不准,比如SQL线程停止时显示为0)。
使用步骤:
-
在主库安装 Percona Toolkit:
apt install percona-toolkit
在主库启动心跳写入:
pt-heartbeat -D test --update -h master_host -u user -p password --daemonize --interval=1
在从库查看延迟:
pt-heartbeat -D test --monitor -h slave_host -u user -p password --interval=1
它会持续输出从库的实时延迟(单位为秒),可用于接入监控系统如 Zabbix、Prometheus 等。
4. 集成到监控系统
将上述脚本或 pt-heartbeat 输出接入通用监控平台:
Prometheus + MySQL Exporter:MySQL Exporter 可采集 slave_seconds_behind_master 指标 Zabbix:配置自定义 key 监控 Seconds_Behind_Master 或调用 pt-heartbeat Grafana:配合 Prometheus 或 Zabbix 展示延迟趋势图基本上就这些。关键是选择合适的方法确保及时发现复制延迟,避免数据不一致影响业务。pt-heartbeat 推荐用于生产环境,因为它更准确可靠。监控的同时也建议设置合理的告警阈值,比如延迟超过5分钟触发通知。
