gitbook/遗留系统现代化实战/docs/523851.md
2022-09-03 22:05:03 +08:00

18 KiB
Raw Blame History

23微服务拆分如何拆分存储过程

你好,我是姚琪琳。

上节课我们学习了解耦数据库表的三种方法,单体架构拆分的挑战又下一城。

虽然在遗留系统中用Java直接调用SQL语句十分常见但真正的大Boss是调用链很深的存储过程。

在十几二十年前,将业务逻辑写在数据库的存储过程或函数中是一种潮流。虽然这种潮流有着当时的历史背景,但在现在看来显然是“最差实践”了。如果遗留系统中存在大量的存储过程,该如何应对呢?我们今天就来学习这方面的内容。

将存储过程或函数封装成API

在遗留系统中,存储过程和函数往往用来封装复杂的业务逻辑。比如“审核核保申请”这样一个功能,可能会修改二十多张表。这里的表有的与核保相关,也有的与核保关系并不大,比如保单表。

然而用存储过程或函数来编写业务逻辑的风气一旦形成,很多简单的业务逻辑,比如对单张或少量表的修改,开发人员也会自然而然放到存储过程或函数里。

我曾经见过用数据库函数来比较时间前后关系的自定义函数明明任何一门编程语言都提供了这种基本功能但当时的开发人员却偏偏钟爱SQL真的是难以理解。

这样一来,真正的代码反而变成了薄薄的一层胶水,真的是面向数据库编程啊。看到这你先别忙着叹气,我们一起理理思路,争取“分而治之”。

对于十分简单的存储过程或函数(如比较时间前后关系),我们可以将它们改造成代码。这个改造过程不会太难,我就不展开说了。

对于只涉及少量表的存储过程和函数,我们首先要分析它里面的表的所有权属于谁。主要分成三种情况。

  • 第一种情况:如果全都是与核保业务相关的表,就可以把整个存储过程或函数复制到核保库中,让核保服务的代码直接访问。

  • 第二种情况:如果全都是非核保业务相关的表,就可以将其封装为数据API让核保服务调用具体方式和步骤与上节课的第一招“用API调用取代连表查询”类似。

  • 第三种情况:如果既包含与核保业务相关的表,又包含不相关的表,就要先将其拆分成相关和不相关的两部分存储过程或函数,再分别应用上面两种处理方式来处理。

在拆分存储过程和函数的时候,必然会涉及到一些修改。特别是拆分出来的多个存储过程或函数之间,会依赖彼此数据的情况。

比如下面这个与审核核保申请相关的存储过程(为了突出重点,我做了一定简化):

PROCEDURE APPROVE_UNDERWRITE(I_UW_ID IN NUMBER) AS
  V_UNDERWRITE_APPLICATION TBL_UNDERWRITE_APPLICATION%ROWTYPE;
BEGIN
  -- 更新核保申请表
  UPDATE TBL_UNDERWRITE_APPLICATION 
    SET UNDERWRITE_STATUS = 2 
        -- 其他字段赋值
    WHERE UNDERWRITE_ID = I_UW_ID;
  SELECT * INTO V_UNDERWRITE_APPLICATION WHERE UNDERWRITE_ID = I_UW_ID;
  -- 更新保单表
  UPDATE TBL_POLICY 
    SET POLICY_STATUS = V_UNDERWRITE_APPLICATION.POLICY_STATUS
        -- 其他字段赋值
    WHERE POLICY_ID = V_UNDERWRITE_APPLICATION.POLICY_ID
END APPROVE_UNDERWRITE;

这段存储过程大体上可以拆分为两个阶段第一个阶段是修改核保申请表第二个阶段是用修改后的核保申请数据来更新保单表。如果存储过程中的SQL语句和方法一样也存在代码交织、混乱不堪的情况你可以复习一下第九节课讲的拆分阶段模式,它也可以应用到存储过程的重构中。

这个存储过程原本是位于单体数据库中的,我们要对其进行拆分,就要将访问核保表的部分迁移到核保库中:

-- 核保库中新增的存储过程
PROCEDURE APPROVE_UNDERWRITE(I_UW_ID IN NUMBER) AS
BEGIN
  UPDATE TBL_UNDERWRITE_APPLICATION
    SET UNDERWRITE_STATUS = 2 
        -- 其他字段赋值
    WHERE UNDERWRITE_ID = I_UW_ID;
END APPROVE_UNDERWRITE;

但是在原存储过程中就不能直接查询核保申请表了需要对它进行改写在调用该存储过程的地方通过API获得核保申请数据然后再将核保申请数据作为参数传递给这个存储过程。如果数据库支持PL/SQL我们可以引入对象类型来进行参数传递

-- 新建的对象类型
CREATE OR REPLACE TYPE OBJ_UNDERWRITE_APPLICATION AS OBJECT
(
  UNDERWRITE_ID NUMBER, POLICY_ID NUMBER, UNDERWRITE_STATUS VARCHAR2(1), -- 其他字段
  CONSTRUCTOR FUNCTION OBJ_UNDERWRITE_APPLICATION RETURN SELF AS RESULT,
  CONSTRUCTOR FUNCTION OBJ_UNDERWRITE_APPLICATION(POLICY_ID IN NUMBER, POLICY_ID IN NUMBER, UNDERWRITE_STATUS IN VARCHAR2) RETURN SELF AS RESULT
);
-- 单体库中复制出来的原存储过程修改之后
PROCEDURE APPROVE_UNDERWRITE(V_UNDERWRITE_APPLICATION AS OBJ_UNDERWRITE_APPLICATION)) AS
BEGIN
  UPDATE TBL_POLICY 
    SET POLICY_STATUS = V_UNDERWRITE_APPLICATION.POLICY_STATUS
        -- 其他字段赋值
    WHERE POLICY_ID = V_UNDERWRITE_APPLICATION.POLICY_ID
END APPROVE_UNDERWRITE;

别忘了,我们要把原来的存储过程复制一份出来,不能在原存储过程上直接修改,否则就无法回退了。

这样一来,调用这个存储过程的代码就变成了这样:

-- 调用上面存储过程的Java代码
Object[] underwriteApplicationFields = new Object[] { underwriteApplicationDto.getPolicyId(), /*...*/ };
Connection connection = getConnection();
-- 在Java中与对象类型对应的是Struct
Struct underwriteApplicationStruct = connection.createStruct("OBJ_UNDERWRITE_APPLICATION", underwriteApplicationFields);
Statement statement = connection.prepareCall("{ CALL APPROVE_UNDERWRITE(:underwriteApplication) }");
statement.setObject("underwriteApplication", underwriteApplicationStruct);
statement.execute();

以上存储过程我们都可以先在单体数据库中实现,然后在核保库中建立同义词,来访问单体库中的存储过程。

对于表很少的简单情况,还算比较好拆分。当表又多,关系又错综复杂的时候,就比较棘手了。我们接下来就看看这种情况如何应对。

拆分复杂存储过程或函数

遗留系统中的存储过程和函数往往是很复杂的,有的时候会涉及到几十甚至上百张表也不为过。我们分情况讨论一下要如何进行拆分。

第一种情况是SQL的执行彼此之间没有前后顺序关系。有些存储过程和函数虽然也涉及到很多表,但实际上它们的执行顺序是可以调换的,彼此之间没有依赖关系,先执行谁后执行谁不会影响最终的结果。

这时候只需要完成下面四步即可:

1.调整SQL的执行顺序按数据的所有权进行分组也就是将涉及单体库表的和涉及核保库表的SQL语句分组

2.从与单体库表相关的SQL语句中提取出一个新的存储过程或函数并封装成数据API

3.在核保服务的防腐层代码中分别调用数据API和只包含核保库表的那个存储过程或函数因为它们的执行顺序无关所以这里调用的前后顺序也无所谓

4.如果涉及到参数传递,就引入对象类型。

图片

我们仍然拿审核核保申请的存储过程举例,假设它由以下三个子存储过程组成,各个子存储过程之间没有先后顺序:

PROCEDURE APPROVE_UNDERWRITE(I_UW_ID IN NUMBER) AS
  V_POLICY_ID NUMBER;
BEGIN
  UPDATE_POLICY_FOR_APPROVAL(I_UW_ID);
  SELECT POLICY_ID INTO V_POLICY_ID FROM TBL_UNDERWRITE_APPLICATION WHERE UNDERWRITE_ID = I_UW_ID;
  UPDATE_UNDERWRITE_APPLICATION_FOR_APPROVAL(V_POLICY_ID);
  UPDATE_POLICY_PRODUCT_FOR_APPROVAL(V_POLICY_ID);
END APPROVE_UNDERWRITE;

按上面的步骤改写完之后就变成了两个,分别位于单体和核保的数据库中:

-- 单体库中的存储过程
PROCEDURE APPROVE_UNDERWRITE(I_POLICY_ID IN NUMBER) AS
BEGIN
  UPDATE_POLICY_FOR_APPROVAL(I_POLICY_ID);
  UPDATE_POLICY_PRODUCT_FOR_APPROVAL(I_POLICY_ID);
END FINISH_UNDERWRITE;
-- 核保库中的存储过程
PROCEDURE APPROVE_UNDERWRITE(I_UW_ID IN NUMBER) AS
BEGIN
  UPDATE_UNDERWRITE_APPLICATION_FOR_APPROVAL(I_UW_ID);
END FINISH_UNDERWRITE;

而核保中的原API就改为了先执行核保内的存储过程再通过API来调用单体库中的存储过程

public void approveUnderwrite(long underwriteId) {
  // 调用本地存储过程
  Connection connection = getConnection();
  Statement statement = connection.prepareCall("{ CALL APPROVE_UNDERWRITE(:underwriteId) }");
  statement.setLong("underwriteId", underwriteId);
  statement.execute();
  // 通过API调用远程存储过程
  PolicyServiceProvider policyService = new PolicyServiceProvider();
  policyService.approveUnderwrite(underwriteId);
}

第二种情况是SQL的执行有前后顺序关系比如后面的SQL会依赖到前面SQL的执行结果。这个时候就相当麻烦并没有好的解决方案只能按照下面这样的顺序拆分

1.将众多SQL按数据的所有权拆分成一组一组的小块每一小块的内部是顺序无关的

2.将这些小块抽取成不同的存储过程或函数;

3.将属于单体库的存储过程或函数逐一封装成数据API将属于核保库的存储过程或函数复制到核保库中

4.然后再按照原存储过程或函数内部的顺序在核保服务的防腐层代码中去逐个调用这些API和属于核保库的存储过程或函数

5.如果涉及到参数传递,就引入对象类型。

图片

对于复杂的存储过程和函数除了拆分本身的工作量外,最重要的就是要确定它们之间的相互依赖关系。对于这一点,并没有非常好的方法,只能耐心加细心。

用重试来取代回滚

在前面介绍的诸多实践中我们把大量的SQL语句转换成了API调用。表面上看它们的执行结果是相同的但实质上我们已经把很多事务性的操作转换成了非事务性的。比如在审核核保申请时本来我们是在一个数据库事务中修改核保申请表和保单表任何一个修改失败都会导致整个操作的回滚。

但这样的修改在解决老问题的同时也会给我们带来新问题当把对保单表的修改替换成远程API调用后情况就变得复杂起来。

在代码直接修改完毕后如果我们不做任何调整原来的事务所包裹的除了执行SQL的代码之外还包括了调用远程API的代码。这是应该避免的。因为远程API的调用相对来说是不稳定的有可能耗时过长也有可能执行成功了但由于网络问题返回了错误的响应。前者会导致长事务后者会导致错误的回滚。这时我们就要把调用API的代码从事务中挪出来。

但这样虽然解决了长事务的问题回滚又变得麻烦了。如果API调用真的失败了需要回滚前面的SQL我们可以编写一个补偿性的SQL来对冲它。但如果API调用是假失败该怎么处理呢有的时候我们甚至无从知道到底是真失败还是假失败。

作为聪明的开发者实在解不出答案的时候我们可以尝试直接“改题目”也就是回溯问题本身遵循第一性原理看看能不能换道题解答。要解决在远程调用失败的情况下本地SQL的回滚问题不如重新思考一下这两步操作是否必须在一个事务下

单体系统中的代码为了方便很多有关、无关的批量SQL操作都会无脑地放入一个事务中靠数据库提供的提交和回滚功能来进行流程控制。但这些批量操作是否在业务上必须是事务的恐怕没有人去深究。我们在改造这样的代码时不妨来把这一课补上以方便拆分事务。

还拿审核核保申请这个功能来举例。在修改了核保申请的状态后,要在保单表中也回写一个状态,以前这两步操作位于同一个事务中。但仔细思考并且与业务人员讨论后,我们就会发现,保单表状态是否写入成功,不应该影响当前核保申请的正常核保业务。

假想一下在线下操作中可能发生的场景:核保员在审核完核保申请之后,在核保申请上填上核保意见、日期并签字盖章,然后在投保单上填上核保意见、日期并签字盖章。我能因为签投保单时笔没水了,就把刚签完的投保单撤销吗?这显然是荒谬的。

事实上只有在DDD的一个限界上下文内操作才应该是事务性的。跨限界上下文的调用都不应该是事务性的否则就说明限界上下文的划分有问题。在进行微服务拆分之前既然我们已经把核保作为一个限界上下文了就说明它与单体的交互就不应该再具有事务性了。

我们可以选择当API调用失败之后不管是真失败还是假失败都可以采取不断重试的方式保证数据的最终一致性。不过这时要注意的一个问题是需要重试的API本身必须是幂等的,即多次重复调用后产生的结果是一致的。否则,多次重试后产生了多个结果,就会造成数据错误。

如果讨论之后,业务人员还是认为应该保证数据的实时性和一致性,并且限界上下文的划分在大多数情况下也是合理的,这时候就不得不引入分布式事务来解决了。关于分布式事务,极客时间上有很多相关课程,你可以自行拓展学习。但值得说一句的是,分布式事务的解决方案会给整体拆分过程带来极大的认知负载,不到万不得已,不建议采用。

通过前面的课程,你一定已经清楚了,将代码依赖或数据依赖改为API依赖是我们进行服务拆分的最基本手段。然而API调用有时又会带来新的问题接下来我就分享两个实践帮你避免这些问题。

用批量API取代单次API

在遗留系统中,可能存在下面这样的循环:

for(long productId : request.getSelectedProductIds()) {
  ProductDao productDao = new ProductDao();
  ProductModel product = productDao.getProductById(productId);
  // 针对单个险种给出核保结论
  // ...
}

如果直接使用API调用取代代码依赖这个实践将会得到这样的代码

for(long productId : request.getSelectedProductIds()) {
  ProductServiceProvider productServiceProvider = new ProductServiceProvider();
  ProductModel product = productServiceProvider.getProductById(productId);
  // 针对单个险种给出核保结论
  // ...
}

这段代码功能上没有任何问题但会导致潜在的性能问题因为它在一个循环内部多次调用了同一个API列表中的元素越多API调用就越多。

有的时候我们这么做只是为了复用已有的API比如这个ProductServiceProvider.getProductById或者说为了尽量少地在遗留系统中添加新的API或者就是单纯的没有在code review的时候发现问题。这样的代码一旦上线就很难复查直到发现性能问题。

这时候我们需要增加一个新的批量API一次性查询出所有后续要用到的对象然后再进入循环中去逐个处理

ProductServiceProvider productServiceProvider = new ProductServiceProvider();
List<ProductModel> products = productServiceProvider.getProducts(request.getSelectedProductIds());
for(ProductModel product : products) {
  // 针对单个险种给出核保结论
  // ...
}

用这种批量的API来取代单次的API可以很容易地解决性能问题。

将同步API调用改为异步事件

之前我们说了用同步的API调用来取代代码依赖或数据库表依赖会对性能造成一定影响特别是依赖较复杂需要改成多次API调用的情况。而且当API调用失败时用代码实现的重试机制也不够灵活。这里我向你推荐一种在分布式系统中常见的解决方案也就是事件机制。

前面课程里我们讲过事件实现数据同步有时候是不现实的,因为遗留系统中的事件缺得太多,无法满足数据同步的要求。但是用事件来实现异步调用,还是可以胜任的。

我们将调用API的地方改为抛出一个事件发送到消息中间件上然后在消费端消费这个事件从而完成原本由API完成的工作。

图片

小结

总结一下今天的内容我们学习了如何拆分存储过程和函数总体思路还是转换成API调用但对于过于复杂的场景转换成API调用的工作也并不轻松。此外我还分享了一些数据拆分时的小技巧包括以重试的方式来代替回滚操作、用批量API来取代单次API的循环调用以及用异步事件来取代同步API。

有些时候存储过程过于复杂你可能考虑把它们转换成Java代码。我劝你一定要慎重。并不是说不能这么做只是这样做的认知负载仍然是相当高的你应该根据实际情况先去寻找相对认知负载低的方案。

数据拆分是遗留系统拆分最复杂的部分,没有轻松的解决方案。而且不同的遗留系统现状也不同,需要具体问题具体分析。今天的课程只包含一些通用的方案,不过我们在实践中总结了一些针对特定场景的技巧,之后我将邀请我的同事以加餐的形式为你分享。

思考题

感谢你学完了今天的内容,今天的思考题是,对于复杂的存储过程拆分,你有没有其他思路?

期待你的分享,如果你觉得这节课对你有帮助,别忘了分享给你的同事和朋友,我们一起开始拆分存储过程。