gitbook/数据分析思维课/docs/400744.md
2022-09-03 22:05:03 +08:00

70 lines
8.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 导读 | 万物背后的规律都是数据
你好,我是郭炜。我是一个特别热爱数据的人,我自己有一个座右铭:“数据是有灵魂的,我将用我的一生去追寻他。”
从小学开始你就一直在学习和考试用分数定排名这些计算离不开数据你工作了开始自己挣工资KPI的评估、年终奖的计算也离不开数据你结婚了要去买房你开始思考等额本息和等额本金哪种贷款方式更适合你这也是数据平时和朋友玩牌牌面现在有两张红桃、一张黑桃你手里有一张红桃你开始判断拿到全部红桃的概率、应不应该加注这也是数据。
我们生命的点点滴滴,其实都是用数据在记录的。在当今这个时代,我可以说,**人这一辈子都离不开数据。**
## 万物背后的规律都是数据
数据无处不在,每个人都会觉得自己多多少少懂一些数据。但细究起来,你能够拍着胸脯说自己真正懂数据吗?
就拿我自己来讲小时候我和小伙伴赌抛硬币我觉得硬币有两面是抛20次至少应该有8、9次是正面向上的我就跑去和别人打赌抛20次至少8次向上最后我输得很惨请了好几顿冰棍。同样地现在你去澳门赌场去赌大小大概率也会输得很惨。这背后其实有深层次的数据逻辑和数学理论你会在接下来的课程里具体学到这个理论——“大数定律”。
在管理中我也曾听到部下和我吹嘘竞争对手现在的平均客单价只有10万我们的平均客单价有100万我们服务的都是高端客户。但是我做了用户访谈后发现我们三、五万客单价的单子还有很多原来是背后一个1000万的单子拉高了整体的平均值。
如果我没有做深入的用户调研可能我就会按照100万客单价级别的战略去做相关的规划进而对公司造成影响。
我当时由于对平均值理解得不够,差点出了差错。同样,如果你不了解这些数字背后的逻辑,你也很可能会做出错误的决策。基于这件事,我在下节课讲平均值的时候就会告诉你,你天天“被幸福”、“被加薪”就是这样的错误的理念在作怪。
另外,现在有很多“数据科学家”会给你各种算法预测,更有甚者,直接给你画出一条“增长曲线”告诉你未来投资回报率会有多高,要求你进行基金投资或者你所在的部门增大投入,并告诉根据“大数据算法”进行这些投入之后,就能带你或者公司来多少回报。
但等你真的投入之后,你才发现这根本就不是一回事。于是,你会下结论说“数据预测”都不靠谱,其实这也是不正确的。毕竟在人家给你的数据报告中既可能有“幸存者偏差”,还有“因果倒置”。所以在接下来的课程里,我希望用通俗易懂的例子让你充分了解这些基本知识,这样在下次“数据科学家”给你号脉的时候,你就可以知道他是“真科学家”还是“伪科学家”。
所以你看,数据无处不在,**你需要很好地去认识数据,这样才能让数据更好地指导你的生活。**而数据背后的规律是什么呢?它是算法。
## 数据背后的规律是算法
现在的数据算法分析和过去的数据算法分析又有所不同,现在有了大数据和小数据之分。有人说,大数据加上人工智能才是一切,而又有人认为小而传统的逻辑数据才是真理。那谁才是对的呢?
我既做过小数据也做过大数据,在我看来,这两种趋势的结论其实都是对的,只是它的应用场景不同。
在大数据里面我们针对的是个人的数据,这些数据量虽然很大,但是每行数据蕴含的信息量(也叫熵)很小,所以我们会用很多人工智能的数据挖掘算法,来帮我们在浩如烟海的数据里找到其中的珍珠。
而小数据往往是在企业经营范围内产生的,他们的数据量很小,但是他们蕴含的数据价值(熵)会非常大,所以分析的时候要更讲究,因为每一个数据背后都蕴含着大量的知识,我们要了解它背后的规律才能掌握数据的命脉。
![](https://static001.geekbang.org/resource/image/e7/76/e74b89308cf09e2c4cd74648236afa76.jpg?wh=1748x1313)
我来给你举个大数据和小数据的例子。从大数据的方向来说,抖音的推荐算法就是典型的大数据代表。抖音需要在复杂多变的环境找到你喜爱的视频并推荐给你,不断增强你的体验,从而让你爱不释手。如果抖音没有一个很好的推荐算法,其实是很难达到今天的地位的。
但是对于抖音背后的母公司字节跳动来讲,它的上市数据、经营收入、人员成本这些小数据同样重要。这些小数据会影响字节跳动的整体估值,以及每个员工所持有股票最后变现的金额。
所以你看,就算对于字节跳动这样大数据浩如烟海的一线大厂来说,大数据和小数据依旧要两手抓。**大数据是业务支撑,小数据是内核动力,两者缺一不可,只是应用的场景不同。**
在这门课里,我既会教你一些小数据的基本概念,也会教你大数据算法的基本原理,让你不再对那些奇怪的专用名词和算法感到陌生,帮你初步迈进数据分析和算法的门槛。
## 数据重要的是分析和表达
但是,光知道算法还远远不够。数据有它的复杂性,同样的数据往往可以从很多不同的角度诠释,诠释得特别好的人,我们就可以叫他数据分析师了。此外,作为管理者,也必须要有数据分析的常识,才能透过现象看本质。
我跟你讲一个典故:平江人李元度本来是一个书生,根本不知道领兵作战。曾国藩命令他领兵出战,每打一次仗便败一次。曾国藩很生气,准备写奏折弹劾他。在他的奏折上便有“屡战屡败”这样的词语。后来曾国藩的幕僚中有人为李元度求情,把“屡战屡败”改为“屡败屡战”,最后李元度因此被免罪。
你看同样都是100%的失败,但是不同的解释会让结果完全不同。**数据也是如此,你如何看待这个数据和它背后的解释,往往会让你得到完全不同的结果。**
所以当我们有了数据和算法后,就好比手里拿了一块“璞玉”,还不能够完全发挥作用。我们要通过有效地分析数据、表达数据,从而让数据最终影响到人。在我们整个课程里,我会带着你学习怎样把数据表达得更为清晰,让你成为别人眼里的“数据分析师”。
## 小结
好了,这节课到这里也就接近尾声了。这节课其实相当于我们正式进入正课内容的一个小预习,通过这节课,我想告诉你,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。万物背后都是数据,不是我想出来的噱头,数据就是这么无处不在。
光认识数据对我们的生活很重要还不够数据背后的规律是算法。就像客观世界背后蕴含着哲理一样学了这门课程你能够从数据算法中同样领会到生活的哲理。比如在接下来的课程中你会发现原来“物以类聚人以群分”这句话里面是有数学算法支持的而《飘》里面提到的“tomorrow is another day”其实也是有数据算法根据的。我希望你学了这门课程不要把它仅仅当成一个知识库来对待而是通过这门课来培养一个时时思考数据规律的习惯。
最后,当你有了对数据思考的习惯,我希望你能够进一步去表达数据,用数据正确地影响他人,跨入数据分析师的门槛。在这样一个纷繁复杂的世界里,你要是能够有一个清晰、优雅的数据观,那么你能够把一件事情更好地想明白、说清楚。
数据就是外行看热闹,内行看门道。看清数据真谛的人才能真正把握自己的命运,把握自己企业的命脉,最终获得生活和事业的成功。所以希望你能够通过这门课,能够对自己的生活有一个新的认知,看到数据背后的逻辑和趋势。在接下来的课程学习中,你如果有任何的思考和疑问,一定要在留言区大胆提出来,我们共同成长。
## 课后思考
你在生活或工作中有曾经被哪些数据骗了的经历吗?明白之后又有哪些收获呢?可以写在这里,我们一起来讨论一下。