MySQL数据库binlog解析神器-binlog2sql应用

来源:这里教程网 时间:2026-03-01 17:28:22 作者:

来源:运维记事

介绍

binlog2sql是一个开源的python开发的mysql数据库binlog解析工具,能够将binlog解析为原始的sql语句。也支持将binlog解析为回滚的sql语句,以便做数据恢复。GitHub地址:https://github.com/danfengcao/binlog2sql

用途

数据快速回滚(闪回)

主从切换后新master丢数据的修复

从binlog生成标准SQL,带来的衍生功能

项目状态

正常维护。应用于部分公司线上环境。

已测试环境

Python 2.7, 3.4+

MySQL 5.6, 5.7

安装

 shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql shell> pip install -r requirements.txt

使用

参数设置

MySQL server必须设置以下参数

 [mysqld] server_id = 1 log_bin = /var/log/mysql/mysql-bin.log max_binlog_size = 1G binlog_format = row binlog_row_image = full

必要授权

user需要的最小权限集合

 select, super/replication client, replication slave 建议授权 GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO

权限说明

select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句

super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表

replication slave:通过BINLOG_DUMP协议获取binlog内容的权限

选项说明

mysql连接配置

-h host; -P port; -u user; -p password

解析模式

--stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。

-K, --no-primary-key 对INSERT语句去除主键。可选。默认False

-B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。

--back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。

解析范围控制

--start-file 起始解析文件,只需文件名,无需全路径 。必须。

--start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。

--stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。

--stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。

--start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

--stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

对象过滤

-d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。

-t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。

--only-dml 只解析dml,忽略ddl。可选。默认False。

--sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。

应用案例

创建用户并授权

 mysql> CREATE USER 'binlog2sql'@'%' IDENTIFIED BY '123456'; Query OK, 0 rows affected (0.01 sec)  mysql> GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'binlog2sql'@'%'; Query OK, 0 rows affected (0.00 sec)  mysql> flush privileges; Query OK, 0 rows affected (0.00 sec)

执行binlog解析

 [root@ansible-server /]# python /opt/binlog2sql/binlog2sql/binlog2sql.py -ubinlog2sql -p123456 --start-file='mysql-bin.000231'; CREATE USER 'binlog2sql'@'%' IDENTIFIED WITH 'mysql_native_password' AS '*6BB4837EB74329105EE4568DDA7DC67ED2CA2AD9'; GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'binlog2sql'@'%'; flush privileges;

误删整张表数据,进行紧急回滚

 mysql> flush logs; Query OK, 0 rows affected (0.00 sec)  mysql> show master status; +------------------+----------+--------------+------------------+-------------------+ | File             | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+-------------------+ | mysql-bin.000233 |     154 |             |                 |                   | +------------------+----------+--------------+------------------+-------------------+ 1 row in set (0.00 sec)  mysql> use test; Database changed  #test库user表原有数据  mysql> select * from user; +----+--------+------+------+ | id | name   | addr | tel | +----+--------+------+------+ | 1 | 张三   | NULL | NULL | | 2 | 李四   | NULL | NULL | | 3 | 王五   | NULL | NULL | +----+--------+------+------+ 3 rows in set (0.00 sec)  mysql> select sysdate(); +---------------------+ | sysdate()           | +---------------------+ | 2023-10-15 20:48:56 | +---------------------+ 1 row in set (0.00 sec)  #2023-10-15 20:48:56误删test库user表,所有数据丢失 mysql> delete from user; Query OK, 3 rows affected (0.00 sec)  mysql> select * from user; Empty set (0.00 sec)  mysql>

恢复数据步骤

登录mysql,查看目前的binlog文件。

 mysql> show master status; +------------------+----------+--------------+------------------+-------------------+ | File             | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+-------------------+ | mysql-bin.000233 |     449 |             |                 |                   | +------------------+----------+--------------+------------------+-------------------+ 1 row in set (0.00 sec)

最新的binlog文件是mysql-bin.000233,我们再定位误操作SQL的binlog位置。误操作人只能知道大致的误操作时间,我们根据大致时间过滤数据。解析2023-10-15 20:00:00-2023-10-15 21:00:00期间test库user表sql类型为delete的操作记录。

 [root@ansible-server ~]# python /opt/binlog2sql/binlog2sql/binlog2sql.py -ubinlog2sql -p123456 --start-file='mysql-bin.000233' -d test -t user --start-datetime='2023-10-15 20:00:00' --stop-datetime='2023-10-15 21:00:00' --sql-type=delete DELETE FROM `test`.`user` WHERE `addr` IS NULL AND `tel` IS NULL AND `id`=1 AND `name`='张三' LIMIT 1; #start 4 end 418 time 2023-10-15 20:47:43 DELETE FROM `test`.`user` WHERE `addr` IS NULL AND `tel` IS NULL AND `id`=2 AND `name`='李四' LIMIT 1; #start 4 end 418 time 2023-10-15 20:47:43 DELETE FROM `test`.`user` WHERE `addr` IS NULL AND `tel` IS NULL AND `id`=3 AND `name`='王五' LIMIT 1; #start 4 end 418 time 2023-10-15 20:47:43

我们得到了误操作sql的准确位置在4-418之间,再根据位置进一步过滤,使用flashback模式生成回滚sql,检查回滚sql是否正确。

 [root@ansible-server ~]# python /opt/binlog2sql/binlog2sql/binlog2sql.py -ubinlog2sql -p123456 --start-file='mysql-bin.000233' -d test -t user --start-position=4 --stop-position=418 --sql-type=delete -B > rollback.sql;cat rollback.sql  INSERT INTO `test`.`user`(`addr`, `tel`, `id`, `name`) VALUES (NULL, NULL, 3, '王五'); #start 4 end 418 time 2023-10-15 20:47:43 INSERT INTO `test`.`user`(`addr`, `tel`, `id`, `name`) VALUES (NULL, NULL, 2, '李四'); #start 4 end 418 time 2023-10-15 20:47:43 INSERT INTO `test`.`user`(`addr`, `tel`, `id`, `name`) VALUES (NULL, NULL, 1, '张三'); #start 4 end 418 time 2023-10-15 20:47:43

与业务方确认回滚sql正确,执行回滚语句。同时登录mysql确认数据回滚成功。

 [root@ansible-server ~]# mysql -uroot -p123456 < rollback.sql   mysql> select * from test.user; +----+--------+------+------+ | id | name   | addr | tel | +----+--------+------+------+ | 1 | 张三   | NULL | NULL | | 2 | 李四   | NULL | NULL | | 3 | 王五   | NULL | NULL | +----+--------+------+------+ 3 rows in set (0.00 sec)  mysql>

限制(对比mysqlbinlog)

mysql server必须开启,离线模式下不能解析

参数 binlog_row_image 必须为FULL,暂不支持MINIMAL

解析速度不如mysqlbinlog

优点(对比mysqlbinlog)

纯Python开发,安装与使用都很简单

自带flashback、no-primary-key解析模式,无需再装补丁

flashback模式下,更适合闪回实战

解析为标准SQL,方便理解、筛选

代码容易改造,可以支持更多个性化解析

总结

binlog2sql在做回滚操作的时候大致分为4步:

1、查看当前的binlog文件

2、通过大概误操时间范围解析出误操作执行的SQL;

3、根据第2步得到的binlog位置信息,使用-B参数生成回滚SQL;

4、经和误操作方确认回滚SQL无误,执行回滚操作。

同样,我们还可以根据不同需求、配合不同参数解析出我们想要的正、反向SQL。

相关推荐