You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

270 lines
16 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 27 | 深入浅出之动态测试方法
你好,我是茹炳晟,今天我和你分享的主题是:深入浅出之动态测试方法。
相较于,静态测试方法是不需要实际执行代码去发现潜在代码错误的方法,我今天要和你讨论的动态测试方法,则是要通过实际执行代码去发现潜在代码错误的测试方法。
正如我在分享[《不破不立:掌握代码级测试的基本理念与方法》](https://time.geekbang.org/column/article/14008)这个主题时,将动态测试方法进一步划分为人工动态方法和自动动态方法,今天这次关于动态测试方法的分享,我也会从这两个方面展开。
由于自动动态方法并不能理解代码逻辑,所以仅仅被用于发现异常、崩溃和超时这类“有特征”的错误,而对于代码逻辑功能的测试,主要还是要依靠人工动态方法。
## 人工动态方法
人工动态方法,可以真正检测代码的业务逻辑功能,其关注点是“什么样的输入,执行了什么代码,产生了什么样的输出”,主要用于发现算法错误和部分算法错误,是最主要的代码级测试手段。
从人工动态方法的定义中,你可以很清楚地看出:代码级测试的人工动态测试方法,其实就是单元测试所采用的方法。所以,下面的分享,我会从单元测试方法的角度展开。
如果有一些代码基础,那么你在学习单元测试框架或者工具时,会感觉单元测试很简单啊,一点都不难:**无非就是用驱动代码去调用被测函数,并根据代码的功能逻辑选择必要的输入数据的组合,然后验证执行被测函数后得到的结果是否符合预期。** 但是,一旦要在实际项目中开展单元测试时,你会发现有很多实际的问题需要解决。
我在专栏第4篇文章[《什么是单元测试?如何做好单元测试?》](https://time.geekbang.org/column/article/10275)中,已经分享过单元测试中的主要概念了,所以今天的分享我不会重复前面的内容,只和你分享前面没有涉及到的部分。如果你有哪些概念已经记不太清楚了,建议你先回顾一下那篇文章的内容。
接下来,我将和你分享单元测试中三个最主要的难点:
1. 单元测试用例“输入参数”的复杂性;
2. 单元测试用例“预期输出”的复杂性;
3. 关联依赖的代码不可用。
## 单元测试用例“输入参数”的复杂性
提到“输入参数”的复杂性,你应该已经记起了,我在前面的分享中提到过:如果你认为单元测试的输入参数只有被测函数的输入参数的话,那你就把事情想得过于简单了。
其实,这也是源于我们在学习单元测试框架时,单元测试用例的输入数据一般都是被测函数的输入参数,所以我们的第一印象会觉得单元测试其实很简单。
但是到了实际项目时,你会发现单元测试太复杂了,因为测试用例设计时需要考虑的“输入参数”已经完全超乎想象了。
我在[《什么是单元测试?如何做好单元测试?》](https://time.geekbang.org/column/article/10275)一文中已经总结了多种常见的单元测试输入数据,但是并没有详细解释每种输入数据的具体含义,你可能也对此感到困惑,那么今天我就结合一些代码示例和你详细聊聊这些输入参数吧。
**第一,被测试函数的输入参数**
这是最典型也是最好理解的单元测试输入数据类型。假如你的被测函数是下面这段代码中的形式那么函数输入参数a和b的不同取值以及取值的组合就构成了单元测试的输入数据。
```
int someFunc(int a, int b)
{
}
```
**第二,被测试函数内部需要读取的全局静态变量**
如果被测函数内部使用了该函数作用域以外的变量,那么这个变量也是被测函数的输入参数。
下面这段代码中被测函数Func\_SUT的内部实现中使用了全局变量someGlobalVariable并且会根据someGlobalVariable的取值去执行FuncA()和FuncB()这不同的代码分支。
在做单元测试时为了能够覆盖这两个分支你就必须构造someGlobalVariable的不同取值那么自然而然这个someGlobalVariable就成为了被测函数的输入参数。
所以在这段代码中单元测试的输入参数不仅包括Func\_SUT函数的输入参数a还包括全局变量someGlobalVariable。
```
bool someGlobalVariable = true
void Func_SUT(int a)
{
...
if(someGlobalVariable == true)
{
FuncA();
}
else
{
FuncB();
}
...
}
```
**第三,被测试函数内部需要读取的类成员变量**
如果你能理解“被测函数内部需要读取的全局静态变量”是单元测试的输入参数,那么“被测试函数内部需要读取的类成员变量”也是单元测试的输入参数就不难理解了。因为,类成员变量对被测试函数来讲,也可以看做是全局变量。
我们一起看一段代码。这段代码中变量someClassVariable是类someClass的成员变量类的成员函数Func\_SUT是被测函数。Func\_SUT函数根据someClassVariable的取值不同会执行两个不同的代码分支。
同样地单元测试想要覆盖这两个分支就必须提供someClassVariable的不同取值所以someClassVariable对于被测函数Func\_SUT来说也是输入参数。
```
class someClass{
...
bool someClassVariable = true
...
void Func_SUT(int a)
{
...
if(someClassVariable == true)
{
FuncA();
}
else
{
FuncB();
}
...
}
...
}
```
**第四,函数内部调用子函数获得的数据**
“函数内部调用子函数获得的数据”也是单元测试的输入数据,从字面上可能不太好理解,那我就通过一段代码,和你详细说说这是怎么回事吧。
```
void Func_SUT(int a)
{
bool toggle = FuncX(a);
if(toggle == true)
{
FuncA();
}
else
{
FuncB();
}
}
```
函数Func\_SUT是被测函数它的内部调用了函数FuncX函数FuncX的返回值是bool类型并且赋值给了内部变量toggle之后的代码会根据变量toggle的取值来决定执行哪个代码分支。
那么从输入数据的角度来看函数FuncX的调用为被测函数Func\_SUT提供了数据也就是这里的变量toggle后续代码逻辑会根据变量toggle的取值执行不同的分支。所以从这个角度来看被测函数内部调用子函数获得的数据也是单元测试的输入参数。
这里还有一个小细节被测函数Func\_SUT的输入参数a在内部实现上只是传递给了内部调用的函数FuncX而并没有在其他地方被使用我们把这类用于传递给子函数的输入参数称为“间接输入参数”。
这里需要注意的是,**有些情况下“间接输入参数”反而不是输入参数。**
就以这段代码为例如果我们发现通过变量a的取值很难控制FuncX的返回值也就是说当通过间接输入参数的取值去控制内部调用函数的取值以达到控制代码内部执行路径比较困难我们会直接对FuncX(a)打桩用桩代码来控制函数FuncX返回的是true还是false。
这样一来原本的变量a其实就没有任何作用了。那么此时变量a虽然是被测函数的输入参数但却并不是单元测试的输入参数。
**第五,函数内部调用子函数改写的数据**
理解了前面几种单元测试的输入参数类型后,“函数内部调用子函数改写的数据”也是单元测试中被测函数的输入参数就好解释了。
比如,当被测函数内部调用的子函数改写了全局变量或者类的成员变量,而这个被改写的全局变量或者类的成员变量又会在被测函数内部被使用,那么“函数内部调用子函数改写的数据”也就成为了被测函数的输入参数了。
**第六,嵌入式系统中,在中断调用中改写的数据**
嵌入式系统中,在中断调用中改写的数据有时候也会成为被测函数的输入参数,这和“函数内部调用子函数改写的数据也是单元测试中的输入参数”类似,在某些中断事件发生并执行中断函数时,中断函数很可能会改写某个寄存器的值,但是被测函数的后续代码还要基于这个寄存器的值进行分支判断,那么这个被中断调用改写的数据也就成了被测函数的输入参数。
其实在实际工程项目中,除了这六种输入参数,还有很多输入参数。在这里,我详细分析这六种输入参数的目的,一来是帮你理解到底什么样的数据是单元测试的输入数据,二来也是希望你可以从本质上认识单元测试的输入参数,那么在以后遇到相关问题时,你也可以做到触类旁通,不会再踌躇无措。
理解了“输入参数”的复杂性,接下来我们再一起看看“预期输出”的复杂性表现在哪些方面。
## 单元测试用例“预期输出”的复杂性
同样地,单元测试用例的“预期输出”,也绝对不仅仅是函数返回值这么简单。通常来讲,“预期输出”应该包括被测函数执行完成后所改写的所有数据,主要包括:被测函数的返回值,被测函数的输出参数,被测函数所改写的成员变量和全局变量,被测函数中进行的文件更新、数据库更新、消息队列更新等。
**第一,被测函数的返回值**
这是最直观的预期输出。比如加法函数int add(int a, int a)的返回值就是预期输出。
**第二,被测函数的输出参数**
要理解“被测函数的输出参数”是预期输出最关键的是要理解什么是函数的输出参数。如果你有C语言背景那么你很容易就可以理解这个概念了。
我们一起来看一段代码。被测函数add包含三个参数其中a和b是输入参数而sum是个指针指向了一个地址空间。
如果被测函数的代码对sum指向的空间进行了赋值操作那么在被测函数外你可以通过访问sum指向的空间来获得被测函数内所赋的值相当于你把函数内部的值输出到了函数外所以sum对于函数add来讲其实是用于输出加法结果的那么显然这个sum就是我们的“预期输出”。
如果你还没有理解的话可以在百度上搜索一下“C语言的参数传递机制”。
```
void add(int a, int bint *sum)
{
*sum = a + b;
}
void main()
{
int a, bsum;
a = 10;
b = 8;
add(a, b, &sum);
printf("sum = %d \n", sum);
}
```
**第三,被测函数所改写的成员变量和全局变量**
理解了单元测试用例“输入参数”的复杂性“被测函数所改写的成员变量和全局变量”也是被测函数的“预期输出”就很好理解了此时如果你的单元测试用例需要写断言来验证结果那么这些被改写的成员变量和全局变量就是assert的对象。
**第四,被测函数中进行的文件更新、数据库更新、消息队列更新等**
这应该不难理解。
但在实际的单元测试实践中因为测试解耦的需要所以一般不会真正去做这些操作而是借助对Mock对象的断言来验证是否发起了相关的操作。
## 关联依赖的代码不可用
什么是关联依赖的代码呢?
**假设被测函数中调用了其他的函数,那么这些被调用的其他函数就是被测函数的关联依赖代码。**
大型的软件项目通常是并行开发的,所以经常会出现被测函数关联依赖的代码未完成或者未测试的情况,也就是出现关联依赖的代码不可用的情况。那么,为了不影响被测函数的测试,我们往往会采用桩代码来模拟不可用的代码,并通过打桩补齐未定义部分。
具体来讲假定函数A调用了函数B而函数B由其他开发团队编写且未实现那么我们就可以用桩函数来代替函数B使函数A能够编译链接并运行测试。
桩函数要具有与原函数完全相同的原形,仅仅是内部实现不同,这样测试代码才能正确链接到桩函数。**一般来讲桩函数主要有两个作用,一个是隔离和补齐,另一个是实现被测函数的逻辑控制。**
用于实现隔离和补齐的桩函数实现比较简单,只需拷贝原函数的声明,加一个空的实现,可以通过编译链接就可以了。
用于实现控制功能的桩函数是最常用的,实现起来也比较复杂,需要根据测试用例的需要,输出合适的数据作为被测函数的内部输入。
## 自动动态方法
我们先来回顾一下,什么是自动动态方法。自动动态方法是,基于代码自动生成边界测试用例并执行来捕捉潜在的异常、崩溃和超时的测试方法。
自动动态方法的重点是:如何实现边界测试用例的自动生成。
**解决这个问题最简单直接的方法是,根据被测函数的输入参数生成可能的边界值。**
具体来讲,任何数据类型都有自己的典型值和边界值,我们可以预先为它们设定好典型值和边界值,然后组合就可以生成了。
比如函数int func(int a, char \*s),就可以按下面的三步来生成测试用例集。
1. **定义各种数据类型的典型值和边界值。** 比如int类型可以定义一些值如int的最小值、int的最大值、0、1、-1等char\*类型也可以定义一些值比如“”、“abcde”、“非英文字符串”等。
2. **根据被测函数的原形,生成测试用例代码模板**,比如下面这段伪代码:
```
try{
int a= @a@;
char *s = @s@;
int ret = func(a, s);
}
catch{
throw exception();
}
```
3. **将参数@a@和@s@的各种取值循环组合,分别替换模板中的相应内容,即可生成用例集。**
由于该方法不可能自动了解代码所要实现的功能逻辑所以不会验证“预期输出”而是通过try…catch来观察是否会引发代码的异常、崩溃和超时等具有边界特征的错误。
## 总结
代码级测试的动态测试方法,可以分为人工动态测试方法和自动动态测试方法。其中人工动态测试方式,是最常用的代码级测试方法,也是我们在进行单元测试时采用的方法。
人工动态方法,也就是单元测试方法,通常看似简单,但在实际的工程实践中会遇到很多困难,总结来看这些困难可以概括为三大方面:
1. 单元测试用例“输入参数”的复杂性,表现在“输入参数”不是简单的函数输入参数。本质上讲,任何能够影响代码执行路径的参数,都是被测函数的输入参数。
2. 单元测试用例“预期输出”的复杂性,主要表现在“预期输出”应该包括被测函数执行完成后所改写的所有数据。
3. 关联依赖的代码不可用,需要我们采用桩代码来模拟不可用的代码,并通过打桩补齐未定义部分。
而自动动态方法,需要重点讨论的是:如何实现边界测试用例的自动生成。解决这个问题最简单直接的方法是,根据被测函数的输入参数生成可能的边界值。
## 思考题
除了我们一起讨论的这些单元测试的难点,还有复杂数据初始化、函数内部不可控子函数的调用、间接输入参数的估算等难点。你在单元测试中是否遇到过这些问题呢,又是如何解决的?
感谢你的收听,欢迎给我留言一起讨论。