You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

159 lines
16 KiB
Markdown

2 years ago
# 11 | 热点问题答疑(一):基础模块问题答疑
你好,我是戴铭。
专栏上线以来,我通过评论区收到了很多同学提出的问题、建议、心得和经验,当然提的问题居多。虽然我未在评论区对每条留言做出回复,但是我对大家提出的问题却都一一记录了下来,等待这次答疑文章的到来。其实,不光是在留言区,也有一些朋友通过私信跟我反馈了学习专栏遇到的问题。
所以今天我就借此机会汇总并整理了几个典型并重要的问题和你详细说一说希望可以解答你在学习前面10篇文章时的一些困惑。
## 动态库加载方式的相关问题
@五子棋在看完第5篇文章“[链接器:符号是怎么绑定到地址上的?](https://time.geekbang.org/column/article/86840)”后,关于动态库是否参与链接的问题,通过私信和我反馈了他的观点。他指出:动态库也是要参与链接的,不然就没法知道函数的标记在哪儿。
为了帮助大家理解这个问题,我把与这个问题相关的内容,再和你展开一下。
我在文章中,是这么阐述这部分内容的:
> Mach-O 文件是编译后的产物,而动态库在运行时才会被链接,并没参与 Mach-O文件的编译和链接所以 Mach-O文件中并没有包含动态库里的符号定义。也就是说这些符号会显示为“未定义”但它们的名字和对应的库的路径会被记录下来。运行时通过 dlopen 和 dlsym 导入动态库时,先根据记录的库路径找到对应的库,再通过记录的名字符号找到绑定的地址。
细细想来,这种说法并不严谨。关于这个问题,更严谨的说法应该是,加载动态库的方式有两种:
* 一种是,在程序开始运行时通过 dyld 动态加载。通过 dyld 加载的动态库需要在编译时进行链接,链接时会做标记,绑定的地址在加载后再决定。
* 第二种是显式运行时链接Explicit Runtime Linking即在运行时通过动态链接器提供的 API dlopen 和 dlsym 来加载。这种方式,在编译时是不需要参与链接的。
不过通过这种运行时加载远程动态库的App苹果公司是不允许上线 App Store 的所以只能用于线下调试环节。关于这种方式的适用场景我也已经在文章第6篇文章“[App 如何通过注入动态库的方式实现极速编译调试?](https://time.geekbang.org/column/article/87188)”中和你举例说明过,你可以再回顾下相关内容。
在第5篇文章中我将动态库的这两种加载方式混在一起说了让你感到些许困惑所以在这里我特地做个补充说明。
接下来我们就再看看第6篇文章后的留言。这篇文章留言区的问题集中在项目中使用了CocoaPods来开发组件在使用InjectionIII调试时遇到了修改源码无法进行注入的问题。
在这里,我首先要感谢@manajay同学在 InjectionIII 的 issue 里找到了相关的解答,并分享到了留言区。
其实,**关于 InjectionIII 的这部分内容,我更希望你能够了解 InjectionIII 的工作原理,从而加深对运行时动态库加载原理的理解。**然后,根据自己的工程情况动手改造或者直接造个新轮子,我相信会极大地提升你的技术水平,至少比直接使用已有轮子的效果要好得多。
所以,还是回到我在[开篇词](https://time.geekbang.org/column/article/85318)中和你提到的观点:动手就会碰到问题,就会思考,这个主动过程会加深你的记忆,这样后面再碰到问题时,你会更容易将相关知识串联起来,形成创新式的思考。但如果你在碰到困难时,就选择放弃那必定会抱有遗憾。
在第8篇文章“[如何利用 Clang 为 App 提质?](https://time.geekbang.org/column/article/87844)”中,@鹏哥同学在评论区问了我这样一个问题:
> 在第1篇文章“[建立你自己的iOS开发知识体系](https://time.geekbang.org/column/article/85326)”中,你提到对某一领域的知识要做到精通的程度,而不能只是了解。那么,你在这个专栏中提到了这么多内容,我应该选择哪些内容去深入研究呢?还是说所有的内容,我都需要去深入研究?
我给出的回答是,根据工作需要来选择。比如说,如果调试速度的问题,确实是你目前工作中面临的最大挑战,那我觉得你就应该在这个点上深挖,并勇敢地克服其中遇到的困难,就像我上次通过“极客时间”的平台直播时,和你分享的我自己学画画的经历一样,挑战素描的过程确实很痛苦,但挺过来了之后我会很受益并享受自己的进步。对我们这种手艺人来说,不断挑战才能不断进步。
最近我在看一个豆瓣评分非常高的日剧《北国之恋》在第3集“决心”里一位老爷爷在北海道送别朋友时说了一番话我觉得特别有力量。所以我把这段话放在这里和你共勉
> 不可思议啊虽然是流行歌曲不过呢。听到这首歌这歌流行起来让人回想起那个时代的往事。那年发生了很严重的冻灾再加上农业机械的引进农场的经营方式慢慢不一样了。一起来开荒的伙伴们收拾行李一个一个地从麓乡离开了。那是11月啊亲密的伙伴们四家一起放弃了农场那个时候当然要来送行稀稀落落地下起了雪那时流行北岛三郎有四家要离开来送行的只有我和老婆两个人大家都一句话也不说。不过那个时候我真想把心里想的说出来。你们这么做行吗这是输了之后逃跑啊二十多年来一直在一起努力你们的心酸、悲哀、悔恨一切的一切我自以为都了解。因此我没有对别人说三道四没有对别人自以为是地指指点点。可是说这句话的权利我还是有的你们失败了逃跑了背叛了我们。逃跑了这一点你们给我好好记住。
好了,我们现在继续回到专栏文章上吧。
App启动时通过 dyld 加载动态库就是运行时动态库加载在App启动速度优化上的一个应用场景。在专栏的第2篇文章“[App 启动速度怎么做优化与监控?](https://time.geekbang.org/column/article/85331)”中,我和你分享了动态库加载后的监控和优化,文后的评论区就有很多同学提到了,想要多了解些动态库加载方面的优化。
关于App开始启动到 main 函数之间的 dyld 内部细节,我推荐你去看苹果公司的 WWDC 2016 Session 406 [Optimizing App Startup Time](https://developer.apple.com/videos/play/wwdc2016/406/)视频。这个视频里面,不仅详细剖析了 dyld还提供了构建代码的最佳实践。
除此之外,“[How we cut our iOS apps launch time in half (with this one cool trick)](https://blog.automatic.com/how-we-cut-our-ios-apps-launch-time-in-half-with-this-one-cool-trick-7aca2011e2ea)”这篇博客,也是个不错的阅读资料。光看名字就很吸引人了,对吧。
关于App 启动速度的话题,很多同学还提出了其他问题,包括很多关于课后作业的问题。所以接下来,我就针对这个话题再专门做个答疑吧。
## App 启动速度的相关问题
专栏的第2篇文章“[App 启动速度怎么做优化与监控?](https://time.geekbang.org/column/article/85331)”中的大部分问题,我都直接在评论区回复了。下面的答疑内容,我主要是针对课后作业和汇编部分,统一做下回复。
### 关于课后作业
在这篇文章最后,我留下的课后作业是:
> 按照今天文中提到的 Time Profiler 工具检查方法耗时的原理,你来动手实现一个方法耗时检查工具吧。
虽然这个问题的思路,我已经在文章中提到了,但还是有很多同学感觉无从下手。接下来,我们就再一起来看看这个思考题吧。
关于实现思路,文中有怎么一段文字:
> 定时抓取主线程上的方法调用堆栈,计算一段时间里各个方法的耗时。
现在,我们再一起看一下这个实现思路(我原本未在文中详细展开,是希望多留点思考空间给你)。动手写耗时检查工具时,首先需要开启一个定时器,来定时获取方法调用堆栈。一段时间内方法调用堆栈相同,那么这段时间,就是这个方法调用堆栈的栈顶方法耗时。
**这个解题思路里很关键的一步,也是你最容易忽视的一步,就是应该怎么做好获取方法调用堆栈。**
callstackSymbols 是一种获取方法调用栈的方法,但是只能获取当前线程的调用栈,为了把对主线程的影响降到最小,获取当前线程调用栈的工作就需要在其他线程去做。所以,**这个解题思路就需要换成:**使用系统提供的 task\_threads 去获取所有线程使用thread\_info 得到各个线程的详细信息使用thread\_get\_state 方法去获取线程栈里的所有栈指针。
如果接下来立刻进行符号化去获取方法名,那么就需要去 \_\_LINKEDIT segment 里查找栈指针地址所对应符号表的符号特别当你设置的时间隔较小的时候符号化过程会持续消耗较多的CPU资源从而影响主线程。
所以,获取到栈指针后,我们可以不用立刻做符号化,而是先使用一个结构体将栈地址记录下来,最后再统一符号化,将对主线程的影响降到最低,这样获取的数据也会更加准确。
我们可以把记录栈地址的结构体设计为通用回溯结构,代码如下:
```
typedef struct SMStackFrame {
const struct SMStackFrame *const previous;
const uintptr_t return_address;
} SMStackFrame;
```
在这段代码中, previous 记录的是上一个栈指针的地址。考虑 CPU 性能,记录堆栈的数量也不必很多,取最近几条即可。通过栈基地址指针获取当前栈指针地址的关键代码如下:
```
// 栈地址初始化
SMStackFrame stackFrame = {0};
// 栈基地址指针
const uintptr_t framePointer = smMachStackBasePointerByCPU(&machineContext);
if (framePointer == 0 || smMemCopySafely((void *)framePointer, &stackFrame, sizeof(stackFrame)) != KERN_SUCCESS) {
return @"Fail frame pointer";
}
// 下面的8表示堆栈数量
for (; i < 8; i++) {
// 记录栈地址
buffer[i] = stackFrame.return_address;
if (buffer[i] == 0 || stackFrame.previous == 0 || smMemCopySafely(stackFrame.previous, &stackFrame, sizeof(stackFrame)) != KERN_SUCCESS) {
break;
}
}
```
### 关于汇编代码的学习
除了课后作业在这篇文章的评论区中问到的最多的问题就是objc\_msgSend 汇编的部分。@西京富贵兔在评论区留言说到:
> 看完这篇文章我膨胀了,都敢去翻看 objc\_msgSend的源码文件了。嗯不出意料一句没看懂。
我想要说的是,汇编并不是必学技能,我们在日常的业务开发工作中也很少会用到。而且,现在编译器对高级语言的优化已经做得非常好了,手写出来的汇编代码性能不一定就会更好。如果你的工作不涉及到逆向和安全领域的话,能够看懂汇编代码就非常不错了。
但是,对于逆向和安全领域来说,掌握汇编技能还是很有必要的。**如果你想学汇编语言的话,同样也需要动手去编写和调试代码,使用 Xcode工具也没有问题。在开始学习时你可以按照教程边学边写其实就和学习其他编程语言的过程一样。**
而具体到 objc\_msgSend 源码的剖析,你可以参考 Mike Ash 的 “[Dissecting objc\_msgSend on ARM64](https://www.mikeash.com/pyblog/friday-qa-2017-06-30-dissecting-objc_msgsend-on-arm64.html)”这篇博客详细讲述了objc\_msgSend 的 ARM64 汇编代码。等你看完这篇博客以后,再来看我们这篇文章中的汇编代码就一定会觉得轻松很多。
## 关于Clang的相关问题
专栏已经更新的第7~第10这4篇文章中都涉及到了Clang的知识以及应用所以我在这里单独列出了一个问题和你一起解决关于Clang的相关问题。
其实我在第7篇文章“[Clang、Infer 和 OCLint ,我们应该使用谁来做静态分析?](https://time.geekbang.org/column/article/87477)”中介绍的3款静态分析工具都用到了Clang而且Clang 本身也提供了 LibTooling 这种强大的 C++ 接口来方便定制独立的工具。
当然了Clang 的知识也是需要投入大量精力才能掌握好。那么,你可能会问,我掌握这些偏底层的知识有什么用呢,好像也解决不了我在现实开发工作中遇到的问题啊?
**在我看来,你只有掌握了某个方面的知识,在工作中碰到问题时才能够想到用这个知识去解决问题。如果你都不知道有这么一种方法,又怎么会用它去解决自己的问题呢?**
就比如说你掌握了Clang的知识那在研究[无侵入的埋点方案](https://time.geekbang.org/column/article/87925)应该如何实现时你才能可能会想到用Clang的LibTooling 来开发一个独立的工具专门以静态方式插入埋点的代码只有掌握了Clang的知识当你在面对代码量达到百万行的[App包瘦身需求](https://time.geekbang.org/column/article/88573)时,才会想到通过 Clang 静态分析来开发工具,去检查无用的方法和类。
当你掌握了 Clang 的相关知识后,编译前端的技术也就掌握得差不多了;在理解了编译前端的词法分析和语法分析的套路后,脱离 Clang 的接口完成第8篇文章“[如何利用 Clang 为 App 提质?](https://time.geekbang.org/column/article/87844)”的课后作业,也就没什么难度了。
在完成这个课后作业之前你也可以先看看王垠在2012年的一篇博客“[怎样写一个解释器](http://www.yinwang.org/blog-cn/2012/08/01/interpreter)”。看完后这篇博客后,你一定会有撸起袖子加油干的冲劲儿。
关于第8篇文章的课后作业如果你还有其他不明白的地方欢迎继续给我留言。
## 小结
专栏更新至今已经发布了10篇文章大家在评论区留下很多高质量的留言让我非常感动在这里我也要感谢你的支持与鼓励。
这10篇文章学习下来你可能会觉得这些文章so easy也可能会觉得这些文章确实帮你解决了工作中遇到的困惑还可能会觉得这些文章太难啃了但依旧在努力学习中我想要和你说的就是有的知识学起来很难但是再坚持一下并不断重复只要能比昨天的自己进步一点点终究可以掌握你想要的知识。
所以,在今天这篇答疑文章,也是我们专栏的第一篇答疑文章中,我不打算大而全地去回复太多的问题,只是甄选了其中其中非常重要、核心的几个问题,和你再一起巩固下我们所学的知识,并和你分享一些我的学习方法。
希望通过今天这篇文章,可以帮你搞明白那些让你困惑的知识点,逐步地建立起自己的知识体系。如果你还有其他的问题,欢迎你给我留言。
最后,虽然这是篇答疑文章,还是要留给你一个小小的思考题。
王垠的博客文章中,除了我在前面提到的“怎样写一个解释器”外,其他文章也都可以帮助你开阔眼界,非常值得一看。在看完他的博客后,你会发现他对编程语言本质的理解非常透彻,而你自己也能从中受益良多。
我在看完他所有的博客文章之后,对很多知识有了更深的理解,但同时知识量也非常大,无法一时都消化掉,感觉需要学习的地方还有很多。所以,我当时的感觉就是酸甜苦辣咸五味俱全。不知道你看完他的文章后,会有什么感觉呢?我们就把这个话题作为今天文章的思考题,请你在评论区分享一下你的阅后感吧。
感谢你的收听,欢迎你在评论区给我留言分享你的观点,也欢迎把它分享给更多的朋友一起阅读。