MySQL 主从复制集群怎么快速搭起来做测试
本地快速验证主从同步逻辑,不需要高可用或自动故障转移,用两台 Docker 容器最省事。关键不是“搭集群”,而是让
SHOW SLAVE STATUS\G里
Slave_IO_Running和
Slave_SQL_Running都是
Yes。
常见卡点:从库连不上主库(报错
ERROR 2003 (HY000))、GTID 不一致导致启动失败、
server-id重复或没设。Docker 网络模式选
bridge就行,别用
host—— macOS/Windows 上 host 模式不生效,反而误导排查。 主库配置加三行:
server-id = 1、
log-bin = mysql-bin、
binlog-format = ROW从库只加
server-id = 2(必须和主库不同),其他靠
CHANGE REPLICATION SOURCE TO命令动态配 主库建复制用户时,主机名别写
localhost,用
%或具体容器 IP;否则从库连不过来 执行
START REPLICA;前,先在从库上
STOP REPLICA;再重置位点,避免残留状态干扰
MySQL 8.0 GTID 模式下怎么避免 Cannot add or update a child row: a foreign key constraint fails
这不是外键问题,是 GTID 复制里事务顺序被破坏的典型表现——比如主库手动跳过一个事务,但从库没同步跳过,后续事务依赖被跳过的那个,就崩了。测试环境最容易在模拟故障恢复时踩中。
主从都开启 GTID:gtid_mode = ON、
enforce_gtid_consistency = ON,缺一不可 不要用
SET GLOBAL sql_slave_skip_counter = 1(已废弃),改用
SET GTID_NEXT = 'xxx'; BEGIN; COMMIT;注入空事务 查从库延迟:看
Seconds_Behind_Master,但更准的是比对
Retrieved_Gtid_Set和
Executed_Gtid_Set差集 如果已经报错,别硬启复制;先
STOP REPLICA;,用
SELECT * FROM performance_schema.replication_applier_status_by_coordinator;看卡在哪条事务
用 MySQL Shell AdminAPI 搭 InnoDB Cluster 为什么连不上 mysqlsh --uri root@localhost:3306
AdminAPI 默认走 X Protocol(端口 33060),不是传统 SQL 连接。用
--uri连 3306 就是错的,会卡住或报
Access denied for user 'root'@'localhost'(其实是协议不匹配)。 确认 MySQL 实例开了 X Plugin:
SELECT PLUGIN_NAME, PLUGIN_STATUS FROM INFORMATION_SCHEMA.PLUGINS WHERE PLUGIN_NAME = 'mysqlx';返回
ACTIVE连接必须用 X 协议端口:
mysqlsh --uri root@localhost:33060,或者不写端口让客户端自动探测(前提是服务端配置了
mysqlx_port = 33060) 首次创建集群前,所有节点要关掉 SELinux / firewall,Docker 容器记得暴露 33060 端口,不只是 3306
dba.createCluster('test') 报 Host is not reachable,大概率是节点间 DNS 解析失败——测试环境直接用
--localAddress指定 IP,别依赖 hostname
测试环境要不要开 semi-sync replication
不开。测试主从延迟、断网重连、日志轮转这些场景,开 semi-sync 反而掩盖问题。它会让主库等从库 ACK 才返回成功,本地 Docker 环境网络稳定,延迟几乎为 0,起不到验证作用,还可能因超时参数(
rpl_semi_sync_master_timeout)引发误判。 真正需要 semi-sync 的是生产写一致性要求高的场景,比如金融类事务 测试时想观察“主库提交后从库多久才执行”,关掉它,直接查
Exec_Master_Log_Pos和主库
SHOW MASTER STATUS对比 如果非要开,记得主从都装插件:
INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';,且从库也要装
rpl_semi_sync_slave
集群配置里最容易被忽略的是时间同步——Docker 容器默认不跟宿主机时间走,
SELECT NOW()在主从上差几秒,某些基于时间戳的 binlog 过滤规则就会失效。跑之前先
docker run加
-v /etc/localtime:/etc/localtime:ro。
