You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

10 KiB

11 | 性能测试的工具:七大测试场景如何选择高质量的测试工具?

你好,我是庄振运。

我们在前面两讲讨论了如何进行性能测试的规划和设计。性能测试离不开合适的工具,那么这一讲,我们来讨论一下测试工具的分类和构成,并根据七个不同的测试场景,分别学习几个常用的高质量测试工具,尤其是开源的。

这七个测试场景分别是Web测试、系统测试、数据库测试、文件IO测试、存储测试、网络测试以及移动App测试。

我们应该尽量借助这些好用的工具,而不要自己去重新开发。

自己开发的话,费时费力不说,开发出来的工具也不见得会比这些工具好用。更重要的是,性能测试工具的开发和使用过程中,有很多需要注意的地方和容易陷入的坑,一不小心就会掉坑。我们下一讲就会讨论常见的坑。

而这些常用的工具已经经过很多人的努力和长时间的改进,在很多方面避免了容易出现的各种问题,所以尽量使用它们吧。

测试工具的分类

首先你必须认识到,性能测试工具是繁多的。之所以繁多,是因为每种工具适合的场合不同,所以它们各有特点。比如如下几个方面:

  • 测试场景是针对Web环境、移动App、系统、数据库还是模块测试
  • 测试类型:是基准测试还是峰值测试?
  • 免费还是收费:开源工具一般都是免费的;但是很多收费工具也的确物有所值。
  • 支持的协议比如是否支持HTTP协议、FTP协议等等。
  • 支持的功能:比如并发性支持度,能否分析测试结果,能否录制性能测试脚本等。

测试工具的模块

要评价一个测试工具的优劣好坏,我们就需要知道测试工具的模块和测试的一般过程。

大规模性能测试的一般过程是通过录制、回放定制的脚本模拟多用户同时访问被测试系统SUT来产生负载压力同时监控并记录各种性能指标最后生成性能分析结果和报告从而完成性能测试的基本任务。

比照这个过程,一个稍微健全的测试工具都会包括以下的模块:

  • 负载生成模块负责产生足够的流量负载。多少流量算足够这得根据测试类型和具体需求来定。如果测试类型是压力测试那么产生的流量一定要大到SUT不能处理的程度。
  • 测试数据收集模块:负责获取测试的数据,包括具体的各种性能数据。这个收集可以是实时的,就是在测试进行之中收集;也可以是后期,等测试完成之后收集的。
  • 结果分析和展示:有了大量的测试数据,就需要进行分析并展示。同样的,这个过程可以是实时的,也可以是等全部测试完成后进行。
  • 资源监控模块测试过程中离不开对SUT和流量生成模块的实时资源监控目的是确保这两个模块运行正常。具体来说流量生成模块必须不能负载过量否则很可能产生的流量不够大。SUT也要确保运行还是正常的否则整个测试就失去意义了。
  • 控制中心模块:测试者需要用这个模块和整个测试系统来交互,比如开始或停止测试,改变测试的各种参数等等。

这几个模块的关系我用下面这张图表示。

Web测试场景

我们先看第一个测试场景Web测试。这一场景的测试工具很多我们介绍几个。

JMeter是一款优秀而小巧精致的开源测试工具是用Java写的。JMeter安装简单使用方便所以很流行建议每个性能测试者都掌握它。熟练使用它在绝大多数场合都能大大提高测试效率。JMeter的测试是基于HTTP协议的所以最好对HTTP协议熟悉一些才能快速上手和理解里面的概念。

LoadRunner是HP公司的一款测试工具功能和资料都比较全也好用但不是开源的。它的组成模块都很强大比如分析模块中的AutoCorrelation向导。这个向导会自动整理所有的监控和诊断数据并找出导致性能降低的最主要的几个原因。这样就将性能测试结果转化为可处理的精确数据从而使开发团队大大减少了解决问题的时间。

Locust是基于Python的开源测试工具支持HTTP、HTTPS等协议。它的一个突出优点是可扩展性很好。

系统测试场景

这种场景下的测试工具很多,我主要介绍两个。

UnixBench是一个Unix系统比如Unix、BSD、Linux下的性能测试工具是开源的而且被普遍用于测试Linux系统主机的性能。这个工具可以测试很多模块和场景比如系统调用、读写、进程、图形化测试、2D、3D、管道、运算、C库等它的测试结果可以作为基准性能测试数据。

比如你可以用它测试从一个文件向另外一个文件传输数据的速率要求每次测试使用不同大小的缓冲区。再比如测试两个进程通过一个管道Pipe交换一个不断增大的整数的速度类似现实编程中的一些应用这个测试会首先创建一个子进程再和这个子进程进行双向的管道传输。它也可以测试进入和离开操作系统内核的开销即一次系统调用System Call的开销代价。

这是通过反复地调用 getpid 函数的小程序来进行的。

Perf是Linux下最普遍使用的性能分析工具功能强大全面俗称性能测试的“瑞士军刀”。比如Perf 可以对程序进行函数级别的采样,从而了解程序的性能瓶颈究竟在哪里。或者计算每个时钟周期内的指令数等等。

Perf的原理是使用特殊的计数器来进行性能统计。它既可以分析指定应用程序的性能问题也可以用来分析内核的性能问题所以可以全面理解应用程序中的性能瓶颈。

我个人建议每个关心性能的人都了解和学习一下Perf的使用。

数据库测试场景

数据库的测试工具也是汗牛充栋。

SysBench是一个容易使用的的开源多线程测试工具主要用于测试数据库性能比如MySQL Oracle和PostgreSQL但也可以测试CPU内存文件系统等性能。它的强项包括数据分析和展示模块多线程并发性比较好而且开销低。另外我们可以很容易地定制脚本来创建新的测试。

mysqlslap是MySQL自带的压力测试工具它可以轻松模拟出大量客户端同时操作数据库的情况。

文件IO和存储测试场景

对文件系统和存储系统的性能测试工具也有很多,比如ioZone可以测试不同操作系统中的文件系统的读写性能。比如可以测试不同IO读写方式下硬盘的性能。

Bonnie++是一个用来测试UNIX文件系统和磁盘性能的测试工具它可以通过一系列的简单测试来生成硬盘和文件系统的性能参数。这个工具很容易使用输出结果显示方面很不错。

如果你希望在Linux中很快地测试硬盘读写性能dd这个很有用的命令经常就够用了。这个工具就是用指定大小的块拷贝一个文件,并在拷贝的同时进行指定的转换。

网络测试场景

网络测试也有各种各样的工具。

Netperf是很不错的一个网络性能的测量工具主要针对基于TCP或UDP的传输。它有两种基本模式即批量数据传输bulk data transfer模式和请求/应答request/reponse模式我们可以根据应用的不同来选择不同模式。

测试结果所反映的,是两个系统之间发送和接受数据的速度和效率,即一个系统能够以多快的速度向另一个系统发送数据,以及后者能够以多快的速度接收数据。

Iperf可以测试最大TCP和UDP带宽性能具有多种参数和UDP特性可以根据需要调整可以报告带宽、延迟抖动和数据包丢失。这个工具使用起来很简单一条命令行就可以。比如如下的测试“采用UDP协议以100Mbps的数据发送速率从本机到服务器192.168.1.1作上传带宽测试测试时间为120秒”或者“以50Mbps的发送速率同时向服务器端发起100个连接线程”。

移动App测试场景

移动App测试的性能指标主要是内存、CPU、电量使用、启动时长、显示帧率、网络流量等。 针对App的性能测试工具和平台可以按照两种方式分类。

第一种分类是根据线下还是线上。线下App性能测试主要依靠传统测试手段和方法比如不同的版本框架等等都需要进行App性能测试。 线上测试算是场景化测试主要针对大规模或者动态环境让App在特定场合和特别条件下更精准地衡量App的核心性能。

另外一种分类方式是平台生态系统现在主要有安卓Android和iOS。有的测试工具可以兼容多个平台比如Appium就是一个可以同时支持安卓和iOS的测试框架的工具功能强大。

对Android的测试工具常用的有adbAndroid Debug BridgeMonkey。Monkey是Android SDK自带的测试工具。Monkey的意思是猴子 顾名思义,就是在电脑面前乱敲键盘在测试。 在测试过程中会向系统发送伪随机的用户事件流如按键输入、触摸屏输入、手势输入等对App进行压力测试也有日志输出。

对iOS App的测试工具也很多比如XCTest、Frank、KIF等等这里就不展开了。

总结

古人说:“工欲善其事,必先利其器”。业界已经有很多好用的工具,一般都能满足大多数场合的测试要求,会让我们的测试工作如虎添翼。

虽然有些环境下我们经常倾向于自己开发某些工具,但是往往会花费很多时间,而且很容易陷入各种各样的坑中,因此尽量避免自己开发。

这一讲介绍的几款工具适用于不同的场合,如果你能合理运用它们,应该会取得事半功倍的效果。

思考题

  • 你曾经用过什么样的性能测试工具?
  • 为什么会选择这些工具,而不是其他的工具?
  • 你使用的测试工具有什么优点和缺点?
  • 你是怎么克服它的缺点的?

欢迎你在留言区分享自己的思考,与我和其他同学一起讨论,也欢迎你把文章分享给自己的朋友。