# 22|答疑:几种常见内存问题的解决策略 你好,我是李兵。 这是我们“事件循环和垃圾回收”这个模块的最后一讲。在这个模块中,我们讲了消息循环系统和垃圾回收机制,这两块内容涉及到了比较底层的知识,但是这些知识对实际的项目有着非常重要的指导作用,很多同学也比较关注这两部分内容。 今天这节答疑课,我们来结合Node中的读文件操作,分析下消息循环系统是怎么影响到异步编程的,然后我们再来结合JavaScript中的几种常见的内存问题,来分析下内存问题出现的原因和解决方法。 ## Node中的readFile API工作机制 Node中很多API都提供了同步和异步两种形式,下面我们来看下《[17 | 消息队列:V8是怎么实现回调函数的?](https://time.geekbang.org/column/article/227926)》这节课留的思考题。思考题中有两段代码,我们通过这两段代码来分析下同步和异步读文件API的区别。 ``` var fs = require('fs') var data = fs.readFileSync('test.js') ``` ``` function fileHanlder(err, data){ data.toString() } fs.readFile('test.txt', fileHanlder) ``` 在解答这个问题之前,我们来看看Node的体系架构。你可以先参考下图: ![](https://static001.geekbang.org/resource/image/b2/eb/b2894f2297a23a9d706d0517610deeeb.jpg) Node是V8的宿主,它会给V8提供事件循环和消息队列。在Node中,事件循环是由libuv提供的,libuv工作在主线程中,它会从消息队列中取出事件,并在主线程上执行事件。 同样,对于一些主线程上不适合处理的事件,比如消耗时间过久的网络资源下载、文件读写、设备访问等,Node会提供很多线程来处理这些事件,我们把这些线程称为线程池。 通常,在Node中,我们认为读写文件是一个非常耗时的工作,因此主线程会将回调函数和读文件的操作一道发送给文件读写线程,并让实际的读写操作运行在读写线程中。 比如当在Node的主线程上执行readFile的时候,主线程会将readFile的文件名称和回调函数,提交给文件读写线程来处理,具体过程如下所示: ![](https://static001.geekbang.org/resource/image/65/ff/654cccf962dccd2797bd1267ab82b9ff.jpg) 文件读写线程完成了文件读取之后,会将结果和回调函数封装成新的事件,并将其添加进消息队列中。比如文件线程将读取的文件内容存放在内存中,并将data指针指向了该内存,然后文件读写线程会将data和回调函数封装成新的事件,并将其丢进消息队列中,具体过程如下所示: ![](https://static001.geekbang.org/resource/image/da/99/daaad54f06e7bb25dbb3b8174f55bf99.jpg) 等到libuv从消息队列中读取该事件后,主线程就可以着手来处理该事件了。在主线程处理该事件的过程中,主线程调用事件中的回调函数,并将data结果数据作为参数,如下图所示: ![](https://static001.geekbang.org/resource/image/b9/c2/b9e3c603cfa7d3f47178c06ffd945fc2.jpg) 然后在回调函数中,我们就可以拿到读取的结果来实现一些业务逻辑了。 不过,总有些人觉得异步读写文件操作过于复杂了,如果读取的文件体积不大或者项目瓶颈不在文件读写,那么依然使用异步调用和回调函数的模式就显得有点过度复杂了。 因此Node还提供了一套同步读写的API。第一段代码中的readFileSync就是同步实现的,同步代码非常简单,当libuv读取到readFileSync的任务后,就直接在主线程上执行读写操作,等待读写结束,直接返回读写的结果,这也是同步回调的一种应用。当然在读写过程中,消息队列中的其他任务是无法被执行的。 所以在选择使用同步API还是异步API时,我们要看实际的场景,并不是非A即B。 ## 几种内存问题 分析了异步API,接下来我们再来看看JavaScript中的内存问题,内存问题至关重要,因为通过内存而造成的问题很容易被用户察觉。总的来说,内存问题可以定义为下面这三类: * **内存泄漏(****Memory leak****)**,它会导致页面的性能越来越差; * **内存膨胀(****Memory bloat****)**,它会导致页面的性能会一直很差; * **频繁垃圾回收**,它会导致页面出现延迟或者经常暂停。 ### 内存泄漏 我们先看内存泄漏。本质上,内存泄漏可以定义为:当进程不再需要某些内存的时候,这些不再被需要的内存依然没有被进程回收。 在JavaScript中,造成内存泄漏(**Memory leak)**的主要原因是不再需要(没有作用)的内存数据依然被其他对象引用着。 下面我们就来看几种实际的例子: 我们知道,JavaScript是一门非常宽松的语言,你甚至可以使用一个未定义的变量,比如下面这样一段代码: ``` function foo() { //创建一个临时的temp_array temp_array = new Array(200000) /** * 使用temp_array */ } ``` 当执行这段代码时,由于函数体内的对象没有被var、let、const这些关键字声明,那么V8就会使用this.temp\_array替换temp\_array。 ``` function foo() { //创建一个临时的temp_array this.temp_array = new Array(200000) /** * this.temp_array */ } ``` 在浏览器,默认情况下,this是指向window对象的,而window对象是常驻内存的,所以即便foo函数退出了,但是temp\_array依然被window对象引用了, 所以temp\_array依然也会和window对象一样,会常驻内存。因为temp\_array已经是不再被使用的对象了,但是依然被window对象引用了,这就造成了temp\_array的泄漏。 为了解决这个问题,我们可以在 JavaScript 文件头部加上`use strict`,使用严格模式避免意外的全局变量,此时上例中的this指向undefined。 另外,我们还要时刻警惕闭包这种情况,因为闭包会引用父级函数中定义的变量,如果引用了不被需要的变量,那么也会造成内存泄漏。比如你可以看下面这样一段代码: ``` function foo(){ var temp_object = new Object() temp_object.x = 1 temp_object.y = 2 temp_object.array = new Array(200000) /** * 使用temp_object */ return function(){ console.log(temp_object.x); } } ``` 可以看到,foo函数使用了一个局部临时变量temp\_object,temp\_object对象有三个属性,x、y,还有一个非常占用内存的array属性。最后foo函数返回了一个匿名函数,该匿名函数引用了temp\_object.x。那么当调用完foo函数之后,由于返回的匿名函数引用了foo函数中的temp\_object.x,这会造成temp\_object 无法被销毁,即便只是引用了temp\_object.x,也会造成整个temp\_object 对象依然保留在内存中。我们可以通过Chrome调试工具查看下: ![](https://static001.geekbang.org/resource/image/ff/10/ff81eec387d021a3b4a3d019c09cbb10.jpg) 从上图可以看出,我们仅仅是需要temp\_object.x的值,V8却保留了整个temp\_object对象。 要解决这个问题,我就需要根据实际情况,来判断闭包中返回的函数到底需要引用什么数据,不需要引用的数据就绝不引用,因为上面例子中,返回函数中只需要temp\_object.x的值,因此我们可以这样改造下这段代码: ``` function foo(){ var temp_object = new Object() temp_object.x = 1 temp_object.y = 2 temp_object.array = new Array(200000) /** * 使用temp_object */ let closure = temp_object.x return function(){ console.log(closure); } } ``` 当再次执行这段代码时,我们就可以看到闭包引用的仅仅是一个closure的变量,最终如下图所示: ![](https://static001.geekbang.org/resource/image/8c/ca/8c3309fd82201bf67d5c92b58d58e6ca.jpg) 我们再来看看由于JavaScript引用了DOM节点而造成的内存泄漏的问题,只有同时满足DOM树和JavaScript代码都不引用某个DOM节点,该节点才会被作为垃圾进行回收。 如果某个节点已从 DOM 树移除,但JavaScript 仍然引用它,我们称此节点为“**detached** ”。“**detached ”**节点是DOM内存泄漏的常见原因。比如下面这段代码: ``` let detachedTree; function create() { var ul = document.createElement('ul'); for (var i = 0; i < 100; i++) { var li = document.createElement('li'); ul.appendChild(li); } detachedTree = ul; } create() ``` 我们通过JavaScript创建了一些DOM元素,有了这些内存中的DOM元素,当有需要的时候,我们就快速地将这些DOM元素关联到DOM树上,一旦这些DOM元素从DOM上被移除后,它们并不会立即销毁,这主要是由于JavaScript代码中保留了这些元素的引用,导致这些DOM元素依然会呆在内存中。所以在保存 DOM 元素引用的时候,我们需要非常小心谨慎。 ### 内存膨胀 了解几种可能造成内存泄漏的问题之后,接下来,我们再来看看另外一个和内存泄漏类似的问题:**内存膨胀(****Memory bloat****)**。 内存膨胀和内存泄漏有一些差异,内存膨胀主要表现在程序员对内存管理的不科学,比如只需要50M内存就可以搞定的,有些程序员却花费了500M内存。 额外使用过多的内存有可能是没有充分地利用好缓存,也有可能加载了一些不必要的资源。通常表现为内存在某一段时间内快速增长,然后达到一个平稳的峰值继续运行。 比如一次性加载了大量的资源,内存会快速达到一个峰值。内存膨胀和内存泄漏的关系你可以参看下图: ![](https://static001.geekbang.org/resource/image/99/10/992872337410ff5915e288e68f2c2e10.jpg) 我们可以看到,内存膨胀是快速增长,然后达到一个平衡的位置,而内存泄漏是内存一直在缓慢增长。要避免内存膨胀,我们需要合理规划项目,充分利用缓存等技术来减轻项目中不必要的内存占用。 ### 频繁的垃圾回收 除了内存泄漏和内存膨胀,还有另外一类内存问题,那就是频繁使用大的临时变量,导致了新生代空间很快被装满,从而频繁触发垃圾回收。频繁的垃圾回收操作会让你感觉到页面卡顿。比如下面这段代码: ``` function strToArray(str) { let i = 0 const len = str.length let arr = new Uint16Array(str.length) for (; i < len; ++i) { arr[i] = str.charCodeAt(i) } return arr; } function foo() { let i = 0 let str = 'test V8 GC' while (i++ < 1e5) { strToArray(str); } } foo() ``` 这段代码就会频繁创建临时变量,这种方式很快就会造成新生代内存内装满,从而频繁触发垃圾回收。为了解决频繁的垃圾回收的问题,你可以考虑将这些临时变量设置为全局变量。 ## 总结 这篇答疑主要分析了两个问题,第一个是异步API和同步API的底层差异,第二个是JavaScript的主要内存问题的产生原因和解决方法。 Node为读写文件提供了两套API,一套是默认的异步API,另外一套是同步API。 readFile就是异步API,主线程在执行readFile的时候,会将实际读写操作丢给文件读写线程,文件读写线程处理完成之后,会将回调函数读取的结果封装成新的消息,添加到消息队列中,然后等主线执行该消息的时候,就会执行readFile设置的回调函数,这就是Node中的异步处理过程。readFileSync是同步API,同步API很简单,直接在主线程上执行,执行完成直接返回结果给它的调用函数。使用同步API会比较方便简单,但是你需要考虑项目能否接受读取文件而造成的暂停。 内存问题对于前端开发者来说也是至关重要的,通常有三种内存问题:内存泄漏(Memory leak)、内存膨胀(Memory bloat)、频繁垃圾回收。 在JavaScript中,造成内存泄漏(Memory leak)的主要原因,是不再需要(没有作用)的内存数据依然被其他对象引用着。所以要避免内存泄漏,我们需要避免引用那些已经没有用途的数据。 内存膨胀和内存泄漏有一些差异,内存膨胀主要是由于程序员对内存管理不科学导致的,比如只需要50M内存就可以搞定的,有些程序员却花费了500M内存。要解决内存膨胀问题,我们需要对项目有着透彻的理解,也要熟悉各种能减少内存占用的技术方案。 如果频繁使用大的临时变量,那么就会导致频繁垃圾回收,频繁的垃圾回收操作会让你感觉到页面卡顿,要解决这个问题,我们可以考虑将这些临时变量设置为全局变量。 ## 思考题 今天留给你的题目是,在实际的项目中,你还遇到过哪些具体的内存问题呢?这些问题都是怎么解决的?欢迎你在留言区与我分享讨论。 感谢你的阅读,如果你觉得这一讲的内容对你有所启发,也欢迎把它分享给你的朋友。