You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

280 lines
11 KiB
Markdown

2 years ago
# 31 | pdb & cProfile调试和性能分析的法宝
你好,我是景霄。
在实际生产环境中,对代码进行调试和性能分析,是一个永远都逃不开的话题。调试和性能分析的主要场景,通常有这么三个:
* 一是代码本身有问题需要我们找到root cause并修复
* 二是代码效率有问题比如过度浪费资源增加latency因此需要我们debug
* 三是在开发新的feature时一般都需要测试。
在遇到这些场景时,究竟应该使用哪些工具,如何正确的使用这些工具,应该遵循什么样的步骤等等,就是这节课我们要讨论的话题。
## 用pdb进行代码调试
### pdb的必要性
首先我们来看代码的调试。也许不少人会有疑问代码调试说白了不就是在程序中使用print()语句吗?
没错在程序中相应的地方打印的确是调试程序的一个常用手段但这只适用于小型程序。因为你每次都得重新运行整个程序或是一个完整的功能模块才能看到打印出来的变量值。如果程序不大每次运行都非常快那么使用print(),的确是很方便的。
但是如果我们面对的是大型程序运行一次的调试成本很高。特别是对于一些tricky的例子来说它们通常需要反复运行调试、追溯上下文代码才能找到错误根源。这种情况下仅仅依赖打印的效率自然就很低了。
我们可以想象下面这个场景。比如你最常使用的极客时间App最近出现了一个bug部分用户无法登陆。于是后端工程师们开始debug。
他们怀疑错误的代码逻辑在某几个函数中如果使用print()语句debug很可能出现的场景是工程师们在他们认为的10个最可能出现bug的地方都使用print()语句然后运行整个功能块代码从启动到运行花了5min看打印出来的结果值是不是和预期相符。
如果结果值和预期相符,并能直接找到错误根源,显然是最好的。但实际情况往往是,
* 要么与预期并不相符需要重复以上步骤继续debug
* 要么虽说与预期相符但前面的操作只是缩小了错误代码的范围所以仍得继续添加print()语句再一次运行相应的代码模块又要5min进行debug。
你可以看到这样的效率就很低下了。哪怕只是遇到稍微复杂一点的case两、三个工程师一下午的时间可能就没了。
可能又有人会说现在很多的IDE不都有内置的debug工具吗
这话说的也没错。比如我们常用的Pycharm可以很方便地在程序中设置断点。这样程序只要运行到断点处便会自动停下你就可以轻松查看环境中各个变量的值并且可以执行相应的语句大大提高了调试的效率。
看到这里你不禁会问既然问题都解决了那为什么还要学习pdb呢其实在很多大公司产品的创造与迭代往往需要很多编程语言的支持并且公司内部也会开发很多自己的接口尝试把尽可能多的语言给结合起来。
这就使得很多情况下单一语言的IDE对混合代码并不支持UI形式的断点调试功能或是只对某些功能模块支持。另外考虑到不少代码已经挪到了类似Jupyter的Notebook中往往就要求开发者使用命令行的形式来对代码进行调试。
而Python的pdb正是其自带的一个调试库。它为Python程序提供了交互式的源代码调试功能是命令行版本的IDE断点调试器完美地解决了我们刚刚讨论的这个问题。
### 如何使用pdb
了解了pdb的重要性与必要性后接下来我们就一起来看看pdb在Python中到底应该如何使用。
首先要启动pdb调试我们只需要在程序中加入`“import pdb”`和`“pdb.set_trace()”`这两行代码就行了,比如下面这个简单的例子:
```
a = 1
b = 2
import pdb
pdb.set_trace()
c = 3
print(a + b + c)
```
当我们运行这个程序时时,它的输出界面是下面这样的,表示程序已经运行到了`“pdb.set_trace()”`这行,并且暂停了下来,等待用户输入。
```
> /Users/jingxiao/test.py(5)<module>()
-> c = 3
```
这时我们就可以执行在IDE断点调试器中可以执行的一切操作比如打印语法是`"p <expression>"`
```
(pdb) p a
1
(pdb) p b
2
```
你可以看到我打印的是a和b的值分别为1和2与预期相符。为什么不打印c呢显然打印c会抛出异常因为程序目前只运行了前面几行此时的变量c还没有被定义
```
(pdb) p c
*** NameError: name 'c' is not defined
```
除了打印,常见的操作还有`“n”`,表示继续执行代码到下一行,用法如下:
```
(pdb) n
-> print(a + b + c)
```
而命令`”l“`则表示列举出当前代码行上下的11行源代码方便开发者熟悉当前断点周围的代码状态
```
(pdb) l
1 a = 1
2 b = 2
3 import pdb
4 pdb.set_trace()
5 -> c = 3
6 print(a + b + c)
```
命令`“s“`,就是 step into 的意思,即进入相对应的代码内部。这时,命令行中会显示`”--Call--“`的字样,当你执行完内部的代码块后,命令行中则会出现`”--Return--“`的字样。
我们来看下面这个例子:
```
def func():
print('enter func()')
a = 1
b = 2
import pdb
pdb.set_trace()
func()
c = 3
print(a + b + c)
# pdb
> /Users/jingxiao/test.py(9)<module>()
-> func()
(pdb) s
--Call--
> /Users/jingxiao/test.py(1)func()
-> def func():
(Pdb) l
1 -> def func():
2 print('enter func()')
3
4
5 a = 1
6 b = 2
7 import pdb
8 pdb.set_trace()
9 func()
10 c = 3
11 print(a + b + c)
(Pdb) n
> /Users/jingxiao/test.py(2)func()
-> print('enter func()')
(Pdb) n
enter func()
--Return--
> /Users/jingxiao/test.py(2)func()->None
-> print('enter func()')
(Pdb) n
> /Users/jingxiao/test.py(10)<module>()
-> c = 3
```
这里,我们使用命令`”s“`进入了函数func()的内部,显示`”--Call--“`而当我们执行完函数func()内部语句并跳出后,显示`”--Return--“`。
另外,
* 与之相对应的命令`”r“`表示step out即继续执行直到当前的函数完成返回。
* 命令`”b [ ([filename:]lineno | function) [, condition] ]“`可以用来设置断点。比方说我想要在代码中的第10行再加一个断点那么在pdb模式下输入`”b 11“`即可。
* 而`”c“`则表示一直执行程序,直到遇到下一个断点。
当然,除了这些常用命令,还有许多其他的命令可以使用,这里我就不在一一赘述了。你可以参考对应的官方文档([https://docs.python.org/3/library/pdb.html#module-pdb](https://docs.python.org/3/library/pdb.html#module-pdb)),来熟悉这些用法。
## 用cProfile进行性能分析
关于调试的内容,我主要先讲这么多。事实上,除了要对程序进行调试,性能分析也是每个开发者的必备技能。
日常工作中我们常常会遇到这样的问题在线上我发现产品的某个功能模块效率低下延迟latency占用的资源多但却不知道是哪里出了问题。
这时对代码进行profile就显得异常重要了。
这里所谓的profile是指对代码的每个部分进行动态的分析比如准确计算出每个模块消耗的时间等。这样你就可以知道程序的瓶颈所在从而对其进行修正或优化。当然这并不需要你花费特别大的力气在Python中这些需求用cProfile就可以实现。
举个例子,比如我想计算[斐波拉契数列](https://en.wikipedia.org/wiki/Fibonacci_number),运用递归思想,我们很容易就能写出下面这样的代码:
```
def fib(n):
if n == 0:
return 0
elif n == 1:
return 1
else:
return fib(n-1) + fib(n-2)
def fib_seq(n):
res = []
if n > 0:
res.extend(fib_seq(n-1))
res.append(fib(n))
return res
fib_seq(30)
```
接下来我想要测试一下这段代码总的效率以及各个部分的效率。那么我就只需在开头导入cProfile这个模块并且在最后运行cProfile.run()就可以了:
```
import cProfile
# def fib(n)
# def fib_seq(n):
cProfile.run('fib_seq(30)')
```
或者更简单一些,直接在运行脚本的命令中,加入选项`“-m cProfile”`也很方便:
```
python3 -m cProfile xxx.py
```
运行完毕后,我们可以看到下面这个输出界面:
![](https://static001.geekbang.org/resource/image/2b/49/2b15939d6da0fd14d07e4c7c15fb3c49.png)
这里有一些参数你可能比较陌生,我来简单介绍一下:
* ncalls是指相应代码/函数被调用的次数;
* tottime是指对应代码/函数总共执行所需要的时间(注意,并不包括它调用的其他代码/函数的执行时间);
* tottime percall就是上述两者相除的结果也就是`tottime / ncalls`
* cumtime则是指对应代码/函数总共执行所需要的时间,这里包括了它调用的其他代码/函数的执行时间;
* cumtime percall则是cumtime和ncalls相除的平均结果。
了解这些参数后再来看这张图。我们可以清晰地看到这段程序执行效率的瓶颈在于第二行的函数fib()它被调用了700多万次。
有没有什么办法可以提高改进呢答案是肯定的。通过观察我们发现程序中有很多对fib()的调用,其实是重复的,那我们就可以用字典来保存计算过的结果,防止重复。改进后的代码如下所示:
```
def memoize(f):
memo = {}
def helper(x):
if x not in memo:
memo[x] = f(x)
return memo[x]
return helper
@memoize
def fib(n):
if n == 0:
return 0
elif n == 1:
return 1
else:
return fib(n-1) + fib(n-2)
def fib_seq(n):
res = []
if n > 0:
res.extend(fib_seq(n-1))
res.append(fib(n))
return res
fib_seq(30)
```
这时我们再对其进行profile你就会得到新的输出结果很明显效率得到了极大的提高。
![](https://static001.geekbang.org/resource/image/2f/e3/2f5d33bf3151eb8099a54e1340bfd9e3.png)
这个简单的例子便是cProfile的基本用法也是我今天想讲的重点。当然cProfile还有很多其他功能还可以结合stats类来使用你可以阅读相应的 [官方文档](https://docs.python.org/3.7/library/profile.html) 来了解。
## 总结
这节课我们一起学习了Python中常用的调试工具pdb和经典的性能分析工具cProfile。pdb为Python程序提供了一种通用的、交互式的高效率调试方案而cProfile则是为开发者提供了每个代码块执行效率的详细分析有助于我们对程序的优化与提高。
关于它们的更多用法,你可以通过它们的官方文档进行实践,都不太难,熟能生巧。
## 思考题
最后留一个开放性的交流问题。你在平时的工作中常用的调试和性能分析工具是什么呢有发现什么独到的使用技巧吗你曾用到过pdb、cProfile或是其他相似的工具吗
欢迎在下方留言与我讨论,也欢迎你把这篇文章分享出去。我们一起交流,一起进步。