gitbook/分布式协议与算法实战/docs/252148.md

110 lines
10 KiB
Markdown
Raw Permalink Normal View History

2022-09-03 22:05:03 +08:00
# 加餐 | MySQL XA是如何实现分布式事务的
你好,我是韩健。
相信很多同学都知道MySQL支持单机事务那么在分布式系统中涉及多个节点MySQL又是怎么实现分布式事务的呢
这个和我最近遇到的问题很类似我现在负责的一个业务系统需要接收来自外部的指令然后访问多个内部其他系统来执行指令但执行完指令后我需要同时更新多个内部MySQL数据库中的值比如MySQL数据库A、B、C
但又因为业务敏感系统必须处于一个一致性状态也就是说MySQL数据库A、B、C中的值要么同时更新成功要么全部不更新。不然的话会出现有的系统显示指令执行成功了有的系统显示指令尚未被执行导致多部门对指令执行结果理解混乱。
那么我当时是如何实现多个MySQL数据库更新的一致性呢答案就是采用MySQL XA。
在我看来MySQL通过支持XA规范的二阶段提交协议不仅实现了多个MySQL数据库操作的事务还能实现MySQL、Oracle、SQL Server等支持XA规范的数据库操作的事务。
对你来说理解MySQL XA不仅能理解数据层分布式事务的原理还能在实际系统中更加深刻的理解二阶段提交协议这样一来当你在实际工作中遇到多个MySQL数据库的事务需求时就知道如何通过MySQL XA来处理了。
老规矩,咱们先来看一道思考题。
假设两个数据库A、B位于不同的服务器节点上我们需要实现多个数据库更新比如UPDATE executed\_table SET status = true WHERE id=100和插入操作比如INSERT into operation\_table SET id = 100, op = get-cdn-log的事务那么在MySQL中如何实现呢
![](https://static001.geekbang.org/resource/image/92/e4/92164eafa6604e334b22d245d1543ce4.jpg)
带着这个问题我们进入今天的学习。不过因为MySQL通过XA规范实现分布式事务的所以你有必要先来了解一下XA规范。
## 什么是XA
提到XA规范就不得不说DTP模型 Distributed Transaction Processing因为XA规范约定的是DTP模型中2个模块事务管理器和资源管理器的通讯方式那DTP就是分布式事务处理就像下图的样子
![](https://static001.geekbang.org/resource/image/a0/93/a08794d4a09101fdc0789496a50db193.jpg)
为了帮助你更好的理解DTP模型我来解释一下DTP各模块的作用。
* AP应用程序Aplication Program一般指事务的发起者比如数据库客户端或者访问数据库的程序定义事务对应的操作比如更新操作UPDATE executed\_table SET status = true WHERE id=100
* RM资源管理器Resource Manager管理共享资源并提供访问接口供外部程序来访问共享资源比如数据库另外RM还应该具有事务提交或回滚的能力。
* TM事务管理器Transaction ManagerTM是分布式事务的协调者。TM与每个RM进行通信协调并完成事务的处理。
你是不是觉得这个架构看起来很复杂其实在我看来你可以这么理解这个架构应用程序访问、使用资源管理器的资源并通过事务管理器的事务接口TX interface定义需要执行的事务操作然后事务管理器和资源管理器会基于XA规范执行二阶段提交协议。
那么XA规范是什么样子的呢它约定了事务管理器和资源管理器之间双向通讯的接口规范并实现了二阶段提交协议
![](https://static001.geekbang.org/resource/image/4e/ed/4e6d8e0104c4b22e58c5a400323e94ed.jpg)
为了帮你更好地理解这个过程,咱们一起走下流程,加深下印象:
1. AP应用程序联系TM事务管理器发起全局事务
2. TM调用ax\_open()建立与资源管理器的会话;
3. TM调用xa\_start()标记事务分支Transaction branch的开头
4. AP访问RM资源管理器并定义具体事务分支的操作比如更新一条数据记录UPDATE executed\_table SET status = true WHERE id=100和插入一条数据记录INSERT into operation\_table SET id = 100, op = get-cdn-log
5. TM调用xa\_end()标记事务分支的结尾;
6. TM调用xa\_prepare()通知RM做好事务分支提交的准备工作比如锁定相关资源也就是执行二阶段提交协议的提交请求阶段
7. TM调用xa\_commit()通知RM提交事务分支xa\_rollback()通知RM回滚事务也就是执行二阶段提交协议的提交执行阶段
8. TM调用xa\_close()关闭与RM的会话。
整个过程,也许有些复杂,不过你可以这么理解:**xa\_start()和xa\_end()在准备和标记事务分支的内容然后调用xa\_prepare()和xa\_commit()或者xa\_rollback())执行二阶段提交协议,实现操作的原子性。**在这里需要你注意的是这些接口需要按照一定顺序执行比如xa\_start()必须要在xa\_end()之前执行。
另外我想说的是事务管理器对资源管理器调用的xa\_start()和xa\_end()这对组合,一般用于标记事务分支(就像上面的更新一条数据记录和插入一条数据记录)的开头和结尾。在这里,你需要注意的是:
* 对于同一个资源管理器,根据全局事务的要求,可以前后执行多个操作组合,比如,先标记一个插入操作,然后再标记一个更新操作。
* 事务管理器只是标记事务,并不执行事务,最终是由应用程序通知资源管理器来执行事务操作的。
另外XA规范还约定了如何向事务管理器注册和取消资源管理器的API接口也就是ax\_reg()和ax\_unreg()接口。在这里需要你注意的是这两个接口是ax\_开头的而不是像xa\_start()那样是xa\_开头的这是很容易误解的点我希望你能注意到。
那么讲了这么多我们该如何通过MySQL XA实现分布式事务呢
## 如何通过MySQL XA实现分布式事务呢
首先你需要创建一个唯一的事务ID比如xid来唯一标识事务并调用“XA START”和“XA END”来定义事务分支对应的操作比如INSERT into operation\_table SET id = 100, op = get-cdn-log
![](https://static001.geekbang.org/resource/image/76/ca/76c1110506c7409c748f20e17ea23bca.jpg)
接着你需要执行“XA PREPARE”命令来执行二阶段提交协议的提交请求阶段。
![](https://static001.geekbang.org/resource/image/28/30/285e440ff3bee6b6c74eeaaa2b37c430.jpg)
最后你需要调用“XA COMMIT”来提交事务或者“XA ROLLBACK”回滚事务。这样你就实现了全局事务的一致性了。
![](https://static001.geekbang.org/resource/image/16/93/169ae090f2b55c6e520ecf7424c0f293.jpg)
从上面的流程中你可以看到客户端在扮演事务管理器的角色而MySQL数据库就在扮演资源管理器的角色。另外你要注意上面流程中的xid必须是唯一值。
另外我想补充的是如果你要开启MySQL的XA功能必须设置存储引擎为 InnoDB也就是说在MySQL中只有InnoDB引擎支持XA规范。
当然了可能有些同学对MySQL XA有这样的疑问能否将“XA END”和“XA PREPARE”合并到一起呢**答案是不能因为在“XA END”之后是可以直接执行“XA COMMIT”的也就是一阶段提交比如当共享资源变更只涉及到一个RM时。**
最后我强调一下MySQL XA性能不高适合在并发性能要求不高的场景中使用而我之所以需要采用MySQL XA实现分布式事务不仅因为整个系统对并发性能要求不高还因为底层架构是多个第三方的没法改造。
## 内容小结
本节课我主要带你了解了XA规范以及如何使用MySQL XA实现分布式事务。我希望你明确这样几个重点。
1.XA规范是个标准的规范也就是说无论是否是相同的数据库只要这些数据库比如MySQL、Oracle、SQL Server支持XA规范那么它们就能实现分布式事务也就是能保证全局事务的一致性。
2.相比商业数据库对XA规范的支持MySQL XA性能不高所以我不推荐你在高并发的性能至上场景中使用MySQL XA。
3.在实际开发中,为了降低单点压力,通常会根据业务情况进行分表分库,将表分布在不同的库中,那么,在这种情况下,如果后续需要保证全局事务的一致性时,也需要实现分布式事务。
最后我想说的是尽管XA规范保证了全局事务的一致性实现成本较低而且包括MySQL在内的主流数据库都已经支持但因为XA规范是基于二阶段提交协议实现的所以它也存在二阶段提交协议的局限比如
首先XA规范存在单点问题也就是说因为事务管理器在整个流程中扮演的角色很关键如果其宕机比如在第一阶段已经完成了在第二阶段正准备提交的时候事务管理器宕机了相关的资源会被锁定无法访问。
其次XA规范存在资源锁定的问题也就是说在进入准备阶段后资源管理器中的资源将处于锁定状态直到提交完成或者回滚完成。
不过虽然MySQL XA能实现数据层的分布式事务但在我现在负责的这套业务系统中还面临这样的问题那就是在接收到外部的指令后我需要访问多个内部系统执行指令约定的操作而且我必须保证指令执行的原子性也就是说要么全部成功要么全部失败那么我应该怎么做呢答案是TCC这也是我在下一讲想和你聊一聊的。
## 课堂思考
既然我提到了我通过MySQL XA解决了数据库操作的一致性问题而MySQL XA性能不高适用于对并发性能要求不高的场景中。那么你不妨想想在MySQL XA不能满足并发需求时如何重新设计底层数据系统来避免采用分布式事务呢为什么呢欢迎在留言区分享你的看法与我一同讨论。
最后,感谢你的阅读,如果这节课让你有所收获,也欢迎你将它分享给更多的朋友。