You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

92 lines
10 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 02 | 大数定律与小数陷阱:生活是随机还是有定数的?
数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
不知道在生活中,你是否想到过这样的问题:生活到底是随机的还是有定数的?
按理来说在生活中很多事情应该像抛硬币一样50%的部分向好的方向发展另外50%的部分向坏的方向发展。但是你可能连续努力了好几次结果却都没有向着你想象的方向去发展。于是你开始怀疑人生说自己最近“水逆”。或者你去应聘岗位有的时候一下子一周来了好几个Offer有的时候却连续两三周都没有任何进展你把它归纳成上天的安排这真是上天的安排吗
今天我就来给你讲解下这背后的数据规律——大数定律和小数陷阱。希望你明白了这两个数据规律后,在遇到一些所谓的“水逆”或者不如意时,站在数据分析的层面,正确看待我们的生活。
## 什么是大数定律?
我们先讲讲大数定律,你肯定遇到过这样的场景:抛硬币看正反面。理论上来说,抛十次硬币应该是五次正面、五次反面,但结果九次却都是正面。又或者你在拉斯维加斯玩轮盘赌,连续十次押小,十次都输了。你就是不服,第十一次接着押小,但还是输了。
上面的两个场景的背后就是大数定律在发挥作用。大数定律是由瑞士数学家雅各布·伯努利提出来并验证的,它的核心逻辑是说**当随机事件发生的次数足够多时,发生的频率才会趋近于预期的概率**。
再回到我们刚刚提到的抛硬币的例子随机抛硬币理论上正面和反面出现的次数应该是一样多正反面的预期概率均为50%),也就是一半正面一半反面。所以上抛十次应该是五次正面、五次反面。
但是这有一个前提,就是大数定律中提到的“随机事件发生的次数足够多”。那怎么叫做“足够多”呢?
理解这个“足够多”其实也就是我们理解这个问题的关键。“足够多”数学上叫“无穷大”生活里也会叫做“足够大”。你有没有想过那么数量多大才叫“足够大”呢10次肯定是不行的那应该是100次还是1000次
历史上还真有一个数学家做了这么一个实验他就是丹麦概率论学者克里克。二战时克里克曾被拘留当时在监狱中他也没有什么事情可做于是就做了这个抛硬币的实验来打发无聊的时间。他一共抛了1万次硬币他把每次抛下来的硬币是正面还是反面做了一个统计统计图大概就像下图的这个样子。
![](https://static001.geekbang.org/resource/image/cd/44/cd80a689115a8efa57a5dd2502191744.jpg?wh=1876x1417)
从这个统计图中你会发现在最开始的几百次里抛硬币的概率波动是非常大的也就是说有的时候连续若干次都会正面或者连续若干次都会反面。到后面随着次数的增多正面和反面的概率才越来越各自趋向于50%。
所以看了这个图你可能就理解了为什么我们在去抛硬币的时候虽然每次抛出正反面的概率应该各是50%但是我们抛10次却不一定是5次正面、5次反面——因为我们抛硬币的次数不够多最后反映出来的结果也并不够客观。换句话说你看到的结果都是各种偶然的极端情况。
这时候你可能会萌生出一种想法,那就是觉得既然胜负概率都差不多,我不用努力,只要不停地去尝试,总会赢的。
请注意,这可完全不同。因为相对大数定律,还有一个小数定律。小数定律是科学家阿莫斯·特沃斯基等人在研究“赌徒谬误”时做出的一个总结,我把它叫做“小数陷阱”。
## 什么是小数陷阱?
前面你了解大数定律后你大概率会认为既然随着数据的增多整体趋势会趋向50%-50%,那么我们在赌场里玩轮盘赌大小时,如果前面开的都是“大”,那我们接下来应该向“小”去加倍下注。因为理论上长期来看出现“大”和“小”的概率应该是趋于一致的,所以未来出现“小”的概率应该增大。
是不是事情真会像我们想的那样呢?
还真不一定,这就是一个典型的对大数定律的误读,它叫**赌徒谬误**,我把它叫做“**小数陷阱**”。
就拿轮盘赌来讲虽然前面轮盘转出几轮“大”了但其实后面每一次转出来“小”的概率还是不变的50%,也就是说每次的事件其实和上一次的事件是**独立且随机**的,并不是前面都是“大”,后面开“小”的概率就会高。
我们的大数定律里面最重要的是“**大数**”,也就是说你得出现足够多的次数,才能够趋近于它的期望概率。
这个大数要求非常大,所以一般的赌徒都没有赌到足够多的时候就已经输成穷光蛋了,并且一个人也不可能不间断地几百个小时看一台赌博机的趋势。
而赌场其实是在利用大数定律赚钱一般的赌博机都会被设计成为51%比49%的这种预期概率赌场其实只多赢2%而你却会输100%。
这也就是为什么赌场乐于提供各种免费的好东西,去吸引源源不断的客户。因为在赌场里某些赌徒可能偶尔赚钱,但从整体的趋势来讲,所以只要赌博机不断地转动下去,赌场都是稳赚不赔的。
同理,如果你要去买彩票,然后费尽心力去做数据分析,选出那些中奖号码以前出现少的数,认为这些数字在下次开奖的时候就会出现几率高,那么在学过今天的小数陷阱后,你应该就知道,这完全是一个错误的认识,运气永远只是运气而已。守株待兔,究竟能有多少只兔子撞到你的木桩上,答案其实是显而易见的。
## 大数定律和小数陷阱给我们的启示
前面我通过一些生活中比较常见的例子,给你讲解了大数定律和小数陷阱。那么我们具体应该如何应用大数定律,又要如何避免落入小数的“陷阱”呢?
**首先,对于大数定律来说,我们做事不要轻易跟风。**
在开始某件事之前,你要想好,自己是否已经有了持续投入的能力?例如,现在炒币很火,不少人跃跃欲试准备进场分一杯羹。但我希望你学了我们这节课后,在做任何投资之前,做好持续精力和金钱投入的准备,否则就不要轻易去跟风了。
因为很可能你羡慕的“他”,已经不再是简单地通过赌博博弈获得收入,而是因为他有着大量的失败和经验,已经进入到了大数定律的规律部分。如果你只是盲目地去跟风,哪怕开始赚了一些钱,最后也会“靠运气赚的钱,最后靠实力全亏回去”。
**其次,对于小数陷阱来说,我们要保持一颗平常心。**
当我们在做一件事情的时候,如果失败了,要有平常心态。气馁或者赌徒心理都是不可取的。你需要意识到,我们在生活中的数,绝大多数都不够大,所以我们的偶然只是偶然,并不是我们这段时间就该倒霉。
当你想“梭哈”或者完全放弃时,不妨想一想,我们是否已经持续努力足够久了?要学会把一件事情放在足够长的时间轴上去评判(尤其是当这件事对你特别重要时)。当你遇到各种不如意时心态不要崩,要持续在你认为成功的路线上持续努力,并且努力足够长的时间足够多的次数,相信你最终会有一种“拨云见日”的感觉。
**最后,希望你建立自己的“大数据定律”来规避“小数陷阱”。**
做法其实很简单,就是多利用前人的经验,站在前人实验的结果和规律上,多去学习、阅读(比如多学数据思维课这样的课程),多去经历、总结自己想从事的事业。相信绝大多数人是做不到在赌博中拥有足够大的“大数”,但是没关系,你可以根据自己的生活去建立属于自己的“大数定律”,赋予偶然的生活必然性。
任何时刻都不要放弃自己的追求,人生只有努力才是向上的,这才是你一生的“大数定律”。我想在这里送你一个成语,叫做“慎始敬终”。“慎始”指的是要想清楚,有没有持续投入的准备,没有想清楚就不要开始。“敬终”指的是,一旦做了,持续投入,从头到尾踏踏实实落实。
## 小结
好了,最后我们再来总结一下,今天我主要给你讲了一个数据分析的关键理论:“大数定律”和“小数陷阱”。
大数定律说的是当随机事件发生的次数足够多时,发生的频率就趋近于预期的概率。对于一件事情,你需要持续不断努力,才可以达到你的期望值。而“小数陷阱”则告诉你,每个事件都是独立的事件,“否极泰来”需要足够多的次数才可能出现,做事情要少一些“赌徒心态”,多一些平常心,不要盲目跟风和下注才能获得最后的成功。
生活里最难的就是如何辨别什么是偶然,什么是必然。我们期待把生活全部变成必然,但其实你会发现人的一生很短暂,我们一生的经历很难都是必然。但是学了今天这节课,希望给你一颗平常心,明天上班开车的时候,无论遇到一路红灯还是绿灯,都不会影响你心情,因为这都是“小数陷阱”而已。
人生也总会红灯和绿灯,你不会老顺利或者老倒霉,但如果你不断努力,你确实会更容易成功。这听起来好像是一句鸡汤,但是站在数据分析的角度来看,生活本来就充满着各种不确定性,你如果不去努力,那经历的样本就太少了,你经历的可能就会是各种偶然的极端情况(比如一路上老是遇上红灯)。
数据给你一双看透本质的眼睛,希望“大数定律”和“小数陷阱”可以帮助你未来的工作和学习。数据知识学无止境,让我们一起持续学习,一起共勉。
## 课后思考
在你的人生学习和工作经历里,哪些例子是符合“大数定律”,哪些例子是经历的“小数陷阱”的?希望你在留言区分享出来,让我们一起站在大家的“大数定律”上成长得更好。