MySQL为了兼容其它非事务引擎的复制,在server层面引入了 binlog, 它可以记录所有引擎中的修改操作。
binlog是记录所有数据库表结构变更(例如CREATE、ALTER TABLE…)以及表数据修改(INSERT、UPDATE、DELETE…)的二进制日志。binlog不会记录SELECT和SHOW这类操作,因为这类操作对数据本身并没有修改,但可以通过查询通用日志来查看MySQL执行过的所有语句。通常选用 row格式,一方面可准确的记录每行数据的变更,在现有的网络环境基础上,这些网络IO和磁盘IO均可以支撑。
Innodb事务日志包括redo log和undo log, 事务日志的目的:实例或者介质失败,事务日志文件就能派上用场。
MySQL为了兼容其它非事务引擎的复制,在server层面引入了 binlog, 它可以记录所有引擎中的修改操作,因而可以对所有的引擎使用复制功能; 然而这种情况会导致 redo log 与 binlog 的一致性问题;
MySQL通过内部XA机制解决这种一致性的问题。XA(分布式事务)规范主要定义了(全局)事务管理器(TM: Transaction Manager)和(局部)资源管理器(RM: Resource Manager)之间的接口。
XA为了实现分布式事务,将事务的提交commit分成了两个阶段,2PC (Tow Phase Commit),XA协议就是通过将事务的提交分为两个阶段来实现分布式事务。
第一阶段:InnoDB prepare, write/sync redo log;binlog不作任何操作;第二阶段:包含两步: write/sync Binlog;当 write/sync Binlog执行完成之后,binlog已经写入,MySQL会认为事务已经提交并持久化了(在这一步binlog就已经ready并且可以发送给订阅者)。在这个时刻,即使算数据库发生了崩溃,那么重启MySQL之后依然能正确恢复该事务。在这一步之前包含这一步任何操作的失败都会引起事务的rollback。
2. InnoDB commit (commit in memory);
第二阶段的第2步,大部分都是内存操作(注意是 InnoDB commit 不是事务的commit),比如释放锁,释放mvcc相关的read view等等。MySQL认为这一步不会发生任何错误,一旦发生了错误那就是数据库的崩溃,MySQL自身无法处理。这个阶段没有任何导致事务rollback的逻辑。在程序运行层面,只有这一步完成之后,事务导致变更才能通过API或者客户端查询体现出来。
3. MySQL会在binlog落盘之后会立即将新增的binlog发送给订阅者以尽可能的降低主从延迟