You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

128 lines
13 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 21 | 性能CI性能测试也可以集成到Pipeline中吗
你好我是尉刚强。这节课我们来讲讲如何利用Pipeline来实现更好的性能测试效果。
如果你用过开源数据库MongoDB那你可能会遇到或者是听说过一个比较典型的性能问题也就是**N+1性能问题**。
这个问题描述是本来业务实现中需要查询N条数据项因此最佳的性能实现方式当然是通过1条查询语句返回所有数据。但是如果编码人员对MongoDB客户端的API接口不太熟悉或者是编码过程中不小心都有可能导致最后实现的查询代码执行了N+1次数据库查询请求从而造成性能浪费。而如果N的数字比较大可能还会对软件性能造成更严重的影响。
那么针对这类性能问题,有没有什么好的解决办法呢?
当然是有的,我们可以**把组件或者微服务级的性能测试集成到Pipeline流水线上**让它成为CI持续集成中的一部分就可以很好地解决这类问题。
而至于具体的原因今天这节课我就会先带你一起探究下。然后我还会针对不同种类的性能测试给你分享一些实用的集成到Pipeline中的策略和思路。你可以根据今天学习的内容将自己产品中的一些关键性能测试也集成到Pipeline上来帮助团队更早地发现性能问题从而提升研发效率。
下面我们就先来了解下Pipeline的工作原理看看为什么可以把性能测试集成到Pipeline上。
### 为什么性能测试可以集成到Pipeline上
首先我这里所说的Pipeline其实指的是DevOps软件开发方法中提出CI/CD的一种技术实现手段。
> 补充DevOps是一种软件开发方法它将持续开发、持续测试、持续集成、持续部署和持续监控贯穿于软件开发的整个生命周期基于这种方法可以帮助提升团队的开发效率加快产品的交付。
在一个Pipeline中你定义多个步骤或阶段的执行操作编译、构建、测试、部署等都可以在代码提交后自动触发执行。而如果中间某个阶段出现了错误就会导致整个Pipeline失败然后你就可以从中找到引入问题的代码合入节点。
其实在不同的平台或工具上支持DevOps的CI/CD的流水线技术都是不一样的。比如说在Jenkins中主要是基于Pipeline的插件来完成的而在GitHub中你可以通过基于action的Workflow来实现。
但是它们解决问题的原理与思路是比较相似的。所以下面我们就通过Jenkins中的Pipeline插件来理解下Pipeline的工作原理。
![](https://static001.geekbang.org/resource/image/e8/3f/e8ba35cb4e3f56d58599504fcfb6c23f.jpg?wh=2000x1125)
如上图所示在Jenkins中每个Pipeline其实是定义了一个工作流中间由多个Stage阶段组成它们分别完成不同的流水线功能比如编译、测试等。但是在每个Stage执行时都需要一个运行时环境这个在Jenkins中是使用Agent来表示的。
一般情况下Pipeline会基于代码仓提交来触发执行但是软件的编译、构建等相关功能使用的工具链通常是比较稳定的我们不需要在代码仓中管理。所以更有效的实现方式就是将这些工具链都安装到Pipeline中的执行Agent内来实现复用。
事实上不同的软件产品构建Agent运行环境的差异非常大。比如说在很多嵌入式内核与驱动的软件构建流水线中很可能会在Agent中安装Linux源码或框架还有一堆交叉编译工具链。所以你其实可以认为**Agent就是目前封装Pipeline的基础设施的重要手段**。
那么对于性能测试工具来说你就可以把它安装到Agent这个Pipeline的基础设施中。而再进一步既然性能测试工具可以集成到Pipeline的基础设施上自然性能测试也就可以集成到Pipeline中了。
在明确了Pipeline的原理之后接下来我们还需要解决的问题就是如何才能将性能测试集成到Pipeline当中呢
### 性能测试集成Pipeline的策略思路
在第[17](https://time.geekbang.org/column/article/387611)和[18](https://time.geekbang.org/column/article/388461)讲中我把性能基准测试划分成了两类分别是微基准测试和宏基准测试。所以实际上这两类性能基准测试集成到Pipeline中所碰到的问题与解决思路是有些差异的下面我们就来分别讨论下。
* **微基准性能测试**
首先对于微基准测试而言其实它的测试运行过程和普通的单元测试比较相似所以它可以比较方便地集成到Pipeline中。但这里你需要注意的是微基准测试与单元测试存在一个比较大的差异就是**微基准测试对执行时间比较敏感。**
因为执行时长会直接影响测试结果的准确性而一般的单元测试并不会所以针对微基准性能测试集成到Pipeline时你需要确保它在执行期间使用的资源配置是确定的才能保证最后的执行结果是有意义的。
* **宏基准性能测试**
其次,对于宏基准测试来说,这里我们可以将其进一步划分为**全系统端到端的性能测试**和**组件/服务级的性能测试**。
我们先来看下,全系统级的性能测试的原理模型是什么样的:
![](https://static001.geekbang.org/resource/image/a9/40/a9c0273f24393fe78520497a1a935140.jpg?wh=2000x1125)
如上图所示,对于系统级性能测试而言,被测系统中通常包含了很多的组件/服务,而这些组件或服务通常会依赖很多个代码仓。所以说,我们将系统级性能测试挂接到某一个具体代码仓提交触发的流水线上,其实并不合适。
那么具体我们应该怎么做呢?其实,针对这种类型的性能测试,我们可以**定义独立的流水线**。因为它和代码仓是独立的,所以你可以使用**定时器触发机制**来触发性能测试流水线,并生成性能测试报告。
对于云服务化的性能测试工具来说其实很多都提供了定时触发机制比如阿里云的PTS等。但假如你使用的是单机版的性能测试工具那你就可以基于流水线来实现相似的能力。
好了,现在我们接着来看看,要如何将组件/服务级的性能测试集成到Pipeline中。
在上节课,我也给你介绍了将系统级的性能测试,拆分成组件/服务级的性能测试的各种好处但我之前讲得并不全面。其实这种拆分方式还有一个明显的好处就是你可以更容易地把拆分后的性能测试添加Pipeline中。
那么,如果我们将组件/服务级基线的性能测试集成到Pipeline后它对应的工作流图就如下图所示
![](https://static001.geekbang.org/resource/image/bc/0f/bc3b34e139b523fa2475147de8491f0f.jpg?wh=2000x1125)
我们对比之前的Pipeline工作原理模型图可以发现在将组件/服务级性能测试集成到Pipeline后它可以在原来的Deploy阶段执行从而实现将组件/服务实例部署到被测运行环境中的目的。当然这个测试运行环境的系统资源与规格应该是确定的比如说CPU核数、内存等。
然后我们就可以在Deploy阶段后添加一个**自动化性能测试阶段**Performance Test来执行对被测系统的自动化性能测试并生成性能测试报告。
另外从上图中你还可以发现在自动化性能测试阶段运行的Agent是一个包含了被测工具的运行时环境那么这个Agent应该如何添加呢
其实这一步并不难。现在主流的Pipeline工具基本都支持容器化的运行环境所以你其实只需要**将被测相关工具通过Dockerfile方式构建成镜像并上传到特定的容器镜像仓**之后比如docker.io上你就可以在Pipeline中选择这个镜像作为Agent了。
好了,现在我们知道,将组件/服务的性能测试集成到Pipeline中可以帮助我们第一时间发现代码合入引入的性能恶化问题。
但对于很多软件系统来说,还有一点也很重要,就是我们应该**将性能基线数据持续地导出并可视化,来帮助分析软件性能的变化趋势**。因为在大部分场景下,性能的优化其实是一个逐步累积的过程,并不是一次性的。
总而言之在做性能测试的过程中你要有尽量将性能测试集成到流水线中的意识。但是在实践的过程中你还需要注意的就是当性能测试集成到Pipeline之后其实还会带来一些新的问题与挑战。
所以接下来,我们就一起来看看要如何应对这些挑战。
### 性能测试集成Pipeline的问题和挑战
我们知道原来的性能测试通常是由手动触发执行的所以执行频率会比较低即使出错了我们也可以进行人为的分析。但是如果把它集成到了Pipeline中首先就意味着它会频繁执行而且还需要比较高的稳定性。因此这就对性能测试工作提出了更高的要求。
那么这里我就给你总结了把性能测试集成到Pipeline之后可能会引入的核心变化和挑战然后我也会给你分享更好地应对这些挑战的方法和手段让你能在具体的业务开发过程中用得更好少踩坑。
* **更低的执行成本**
首先,性能测试的执行花销是不能忽视的,比如说,有些被测组件/服务在业务执行期间会调用第三方服务API而很多都是按照请求调用次数来进行收费的比如短信验证、云对象文件存储下载等。另外在性能测试期间被测组件/服务会频繁调用接口如果再进一步将性能测试集成到Pipeline中就势必会带来比较昂贵的成本。
那么针对这类问题,其实你可以将这些**与收费相关的依赖都打桩实现,然后在性能测试时使用桩接口即可**。
* **更高的稳定性要求**
其次,很多系统实现性能测试的稳定性并不高,比如说,有些被测组件/服务,对真实的物理环境依赖比较强,尤其在嵌入式场景下非常普遍。所以针对这种情况,你就需要考虑**将性能系统中,软/硬件稳定性比较差的依赖项隔离出去,也可以采用打桩的方式**。
* **更准确的性能结果**
最后,针对更准确的性能结果,这个其实是对性能测试提出了更高的要求。因为前面我也介绍过,很多性能测试结果值都是波动的,所以这样就导致我们根据测试结果,来判断性能是否劣化会比较困难。这里呢,我给你提供两个解决思路,你可以参考使用。
**第一**,通过优化软件设计与实现来减少性能指标抖动。比如,我在[第10讲](https://time.geekbang.org/column/article/382237)中提到的剥离非核心业务、引入延迟计算服务等,来解决业务处理时延的长尾效应;
**第二**,你可以选择一些性能抖动比较小的部分业务模块的性能指标,来替换整体业务流程性能指标,以此进行判断分析。
事实上由于性能测试集成到Pipeline时会存在很多的挑战所以大部分团队并不愿意投入很多时间精力和成本。但是你会发现在性能测试集成到Pipeline过程中所暴露的问题其实是帮你指出了性能测试的优化改进方向。如果你沿着这个方向去优化和设计性能测试就可以让性能测试工作朝着更高效的方向演进。
### 小结
这节课我带你了解了将性能测试集成到Pipeline上的优势和方法策略。其中你要重点把握的地方就是要根据不同的性能基准测试类型来选择具体的集成策略。另外在将性能测试集成到Pipeline的实践过程中你还需要注意去规避解决一些典型问题和挑战比如成本的问题、稳定性的问题等。
实际上,现在很多的研发团队所做的性能基线测试,与代码提交都是脱节的,而这样就不能在第一时间发现代码提交引入的性能劣化问题。所以间接也就会导致,软件产品的性能问题解决不及时,投入的研发成本也会很大。
因此在学完今天的课程之后你就可以借鉴我介绍的把性能测试集成到Pipeline的思路方法来改进和优化性能测试工作然后将其集成到Pipeline中助力团队更早地发现和解决软件产品中的性能问题。而且你想一想如果每次代码提交都可以看到软件的性能变化是不是还挺酷的
### 思考题
如果性能测试工具的负载量非常大需要部署为集群模式那么是否也可以集成到Pipeline中呢
欢迎在留言区分享出你的思考和答案,如果觉得有收获,也欢迎你把今天的内容分享给更多的朋友。