微服务分布式事务及微服务分布式事务解决方案

Yanyan 850 2023-10-23

微服务架构下的分布式事务

一提到分布式事务，就不得不说XA规范、TCC事务模型。

XA规范

分布式事务中耳熟能详的全局事务管理器（Transaction Manager）以及资源管理器（Resource Manager)。就是XA规范定义的。

XA协议提供了资源管理器（数据库）和事务管理器之间的接口标准。XA接口是双向的系统接口，在事务管理器和一个或者多个资源管理器之间建成通信桥梁，事务管理器充当全局事务中的协调者，控制着全局事务，管理事务的生命周期，协调资源，一般常见的事务管理器（TM）有JDBC、hibernate框架中的TransacManager等。资源管理器控制和管理实际的资源，比如数据库。目前各大数据库产家都支持这种标准。

XA 事务的执行流程 XA

两阶段提交的分布式事务，XA将一次事务分割成两个阶段，Prepare准备阶段和Commit提交阶段。

Prepare阶段，TM向所有的RM发送prepare指令，RM接收到指令以后，就会执行数据的修改和日志记录操作（binlog和redo log）。然后返回能不能提交的消息给TM。TM假如接收到所有的参与者返回的消息，会通知所有的RM进行提交，于是进入第二阶段。

Commit阶段，TM接收到所有事务参与者RM返回的Prepare结果，如果RM全部返回提交，则事务进行提交，假如存在某个RM返回不能提交或者超时的情况，则所有的事务进行回滚操作。

MySQL如何实现XA规范

大多数生产环境中的Mysql都会开启Bin log日志，于是为了为了两套日志的数据一致性，Mysql就是使用了XA事务。

当事务提交的时候，Binlog中会添加一个XID_EVENT作为事务的结束，该事件记录了事务的ID就是XID。

Binlog事务的提交过程，是先写redo log，再写binlog，以binlog写成功为事务提交成功的标志。

事务提交：

第一步，prepare阶段，写入redo log。binlog不做任何操作。

第二步，写入binlog。

第三步，事务提交。

第一步和第二步失败，整个事务会回滚，第三步失败，事务会进行再次提交。

Spring事务

众所周知，Spring事务采用AOP的方式实现，Spring中的事务机制和业务代码几乎不存在耦合关系。

获取事务的属性（@Transactional注解中的配置，比如spring的事务传播机制）

加载spring 配置中的事务管理器PlatformTransactionManager。

获取事务的信息TransactionInfo

执行目标方法

提交或者回滚

Spring 提供了超类PlatformTransactionManager，Hibernate自定义实现了自身框架的事务管理器HibernateTransactionManager。HibernateTransactionManager中会打开sessionFactory，创建Session，执行事务，关闭session。session在打开过程中还存在Hibernate的一级缓存，查询数据的时候会先进行session一级缓存的查询，然后在进行DB的查询。

spring事务的传播级别

PROPAGATION_REQUIRED 支持当前事务，如果当前没有事务，就新建一个事务。这是最常见的选择，也是 Spring 默认的事务的传播。 PROPAGATION_REQUIRES_NEW 新建事务，如果当前存在事务，把当前事务挂起。新建的事务将和被挂起的事务没有任何关系，是两个独立的事务，外层事务失败回滚之后，不能回滚内层事务执行的结果，内层事务失败抛出异常，外层事务捕获，也可以不处理回滚操作。

PROPAGATION_NOT_SUPPORTED 以非事务方式执行操作，如果当前存在事务，就把当前事务挂起。

spring事务不生效的场景

private、final、static方法，事务不生效，入口方法必须是public ,spring的AOp特性决定的，spring认为private自己用的方法应该自己控制，不应该用事务切进去

在同一个类中一个无事务的方法调用另一个有事务的方法，事务是不会起作用的

如果使用的是rollbakfor的默认，已检查的异常（所有派生自Error和RuntimeException的类,都是未检查异常.其余的是已检查异常，比如nullPointException是未检查的，IllegalAccessException 是已检查的）不回滚，可设为rollbackFor={Exception.class}

TCC事务模型

TCC提出了一种新的事务模型，是基于业务层面的事务定义，锁粒度完全由业务自己控制，目的是解决复杂业务中，跨表跨库等大颗粒度资源锁定的问题。TCC把事务运行过程分成Try、Confirm/Cancel两个阶段，每个阶段的逻辑由业务代码控制，避免了长事务，可以获取更高的性能。

Try 阶段：调用 Try 接口，尝试执行业务，完成所有业务检查，预留业务资源。Confirm 或 Cancel 阶段：两者是互斥的，只能进入其中一个，并且都满足幂等性，允许失败重试。

Confirm 操作：对业务系统做确认提交，确认执行业务操作，不做其他业务检查，只使用 Try 阶段预留的业务资源。Cancel 操作：在业务执行错误，需要回滚的状态下执行业务取消，释放预留资源。

Try 阶段失败可以 Cancel，如果 Confirm 和 Cancel 阶段失败了怎么办？

TCC 中会添加事务日志，如果 Confirm 或者 Cancel 阶段出错，则会进行重试，所以这两个阶段需要支持幂等；如果重试失败，则需要人工介入进行恢复和处理等。

实际开发中，TCC 的本质是把数据库的二阶段提交上升到微服务来实现，从而避免数据库二阶段中长事务引起的低性能风险。

所以说，TCC 解决了跨服务的业务操作原子性问题，比如下订单减库存，多渠道组合支付等场景，通过 TCC 对业务进行拆解，可以让应用自己定义数据库操作的粒度，可以降低锁冲突，提高系统的业务吞吐量。

TCC 的不足主要体现在对微服务的侵入性强，TCC 需要对业务系统进行改造，业务逻辑的每个分支都需要实现 try、Confirm、Cancel 三个操作，并且 Confirm、Cancel 必须保证幂等。

为了应用 TCC 事务模型，需要对业务代码改造，抽象 Try、Confirm 和 Cancel 阶段。

Try 操作一般都是锁定某个资源，设置一个预备的状态，冻结部分数据。比如，订单服务添加一个预备状态，修改为 UPDATING，也就是更新中的意思，冻结当前订单的操作，而不是直接修改为支付成功。库存服务设置冻结库存，可以扩展字段，也可以额外添加新的库存冻结表。积分服务和库存一样，添加一个预增加积分，比如本次订单积分是 100，添加一个额外的存储表示等待增加的积分，账户余额服务等也是一样的操作。

Confirm 操作就是把前边的 Try 操作锁定的资源提交，类比数据库事务中的 Commit 操作。在支付的场景中，包括订单状态从准备中更新为支付成功；库存数据扣减冻结库存，积分数据增加预增加积分。

Cancel 操作执行的是业务上的回滚处理，类比数据库事务中的 Rollback 操作。首先订单服务，撤销预备状态，还原为待支付状态或者已取消状态，库存服务删除冻结库存，添加到可销售库存中，积分服务也是一样，将预增加积分扣减掉。

业务请求过来，开始执行 Try 操作，如果 TCC 分布式事务框架感知到各个服务的 Try 阶段都成功了以后，就会执行各个服务的 Confirm 逻辑。

如果 Try 阶段有操作不能正确执行，比如订单失效、库存不足等，就会执行 Cancel 的逻辑，取消事务提交。

关于TCC的事务模型，国内存在很多的开源框架。如ByteTCC，TCC-transaction，Himly等。

比较下XA事务和TCC事务的区别

2PC/XA 是数据库或者存储资源层面的事务，实现的是强一致性，在两阶段提交的整个过程中，一直会持有数据库的锁。

TCC 关注业务层的正确提交和回滚，在 Try 阶段不涉及加锁，是业务层的分布式事务，关注最终一致性，不会一直持有各个业务资源的锁。

业内还存在一种3PC的分布式事务，与2PC不同的地方是引入了超时机制，在第一阶段和第二阶段中新增了一个准备阶段。这里的Can-Commit是尝试获取数据库锁，第二阶段和第三阶段同2PC中一致，

Java互联网架构-微服务架构如何解决跨库问题的思路与方案？

一般来说如果应用系统出现性能瓶颈或者业务代码耦合过重，可考虑使用微服务架构，而后端的数据库通常使用读写分离，双主互备或者是分库分表来实现性能的提升和数据服务的高可用。

在数据分布在不同的数据库服务器的带来良好性能的同时，新的问题也随之而来，比如说数据一致性的保证，性能监控，数据存取复杂等，而较为突出的就是数据跨库问题！数据分布在不同的节点上，导致原来的连接查询需要跨库，字段的主键难以保证唯一，跨库的事务处理复杂，下面逐一解决:

1，连接查询(join)问题:因为库表分布在不同的机器上，连接查询失效。

解决办法:

①，代码解决:根据某个字段进行hash的方式进行分库分表，保证落在一个库中的类似表中(比如aa_00.t_user_0000和aa_00.t_member_0000)，然后基于这样的规则在代码中进行连接查询语句书写！

②，同步:将常用的，需要的字段同步到一个库中进行联合查询！

③，冗余:在一个库中冗余更多的连接查询需要的字段，保证全部数据都能查询到！

2，唯一主键:如果使用传统的自增等方式，多库中的主键id势必重复，所以需要对唯一性加以控制！

解决方法:UUID(根据机器ID，时间等)，redis(单线程保证不重复)，snowflake算法！

3，分布式事务:

1，TCC:try控制业务代码流程，Confirm确认事务的正确性，cancel取消失败的事务！

2，基于消息系统的一致性方案:单节点事务完成后，通过发送消息保证事务提交，如果失败可通过重试，任务补偿等方式保证数据一致性！

标签：分布式事务数据库数据一致性

微服务分布式事务及微服务分布式事务解决方案

Java互联网架构-微服务架构如何解决跨库问题的思路与方案？

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20