You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

72 lines
8.7 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 开篇词 | 数据给你一双看透本质的眼睛
数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
先和你简单介绍一下我自己。我本科和研究生都就读于北大的计算机系专业是数据仓库和数据挖掘。毕业后我待过不少的公司从Teradata到 IBM从中金到万达到联想研究院再到易观职位也从数据架构师、数据部总经理到最后的CTO。在数据这个行业里我一做就做了二十多年数据已经成为了我生命中不可分割的一部分。
我经常听到这样一句话:“数据是客观的,但是解读数据的人是主观的”。在我看来,数据这门科学就像中西医混合的一门医学,既要有西医的理论、分析模型以及实验,又需要有中医的望闻问切这些个人经验。
我们都生活在一个由数据组成的世界里,不管是工作还是过日子,数据其实无处不在。我觉得我还算是一个“中西结合”的人,所以我想把自己的西医部分(数据科学理论)与中医部分(个人数据经验)一并分享给你。
## 数据时代 ,思维为王
前段时间我的一个游戏分析师朋友告诉我他的公司做了款游戏这款游戏很受欢迎他们分别开发了安卓、iOS、Pad等等版本。他分析了已有的付费数据发现安卓用户的付费率要高于iOS用户所以他得出结论在公司开发资源有限的情况下他们应该投入更多精力或者提高优先级优化安卓版本。
我听完之后倒吸一口凉气。这个决策执行下去这个公司可能在投入了很多Android开发工作后却无法有更多的收入回报最终导致这个很有前途的小公司破产。
你知道他是在哪里出错了吗?我给你一个提示:这个数据本身没问题,但是分析数据的逻辑出了问题,他犯了数据分析行业都熟知的叫“**辛普森悖论**”的错误。还不知道什么是“辛普森悖论”吗?不要担心,我会在后面的课程详细跟你讲。
这些年,随着技术的发展以及时代的变换,我也经常感叹,现在的数据真是比以前更容易获得和计算了——我们有最强大的计算工具、分析算法和浩如烟海的大数据。
但是,当我们沉醉于数据量之大、算法之精美时,却可能忘记了做数据分析的初衷和最基本的逻辑。你可要知道,不管是大数据还是小数据,只有经过客观合理地分析之后,才能真正产生价值。
所以我认为,**在这个数据为王的时代,我们缺乏的不是工具、算法,而是数据思维**。这就好比过去,我们打猎用的是弓箭,看见了兔子就去射箭,虽然效率低,但是目标很明确。而现在我们拿着最高级的冲锋枪冲进了森林里,一通乱扫,却不知道打什么。
我希望这门课程,不仅能告诉你打什么,还能教会你弹无虚发、百步穿杨。
## 开这门课的初心
在我过去20年的数据相关工作里我曾经因为追求极致的技术而没有交付最终的业务结果最后被老板一通批评我也曾拿着一个片面的数据分析结果就给出了一个全面的分析解读答案我还曾经在做管理决策的时候用一个平均值来去看整体的收入状态和开发迭代速度导致错失一些优秀的人才和客户更有时候我在听汇报的时候没有甄别出来小伙伴写出来的因果倒置或者一些存在“幸存者偏差”的结论数据导致走了弯路。
这些我经历过的教训,让我也意识到数据分析的常识非常重要。我开这门《数据分析思维课》的初衷就是希望能够用简单的生活和工作当中的例子,结合数据分析的原理,帮助你培养数据思维。
就如我们前面所说,有了数据是第一步,你怎么分析数据,那就是另外一门学问了。在分析数据的时候,你有没有掌握基本的数据分析方法,有没有站在前人的经验之上思考问题,也会决定着你做这件事情的段位,我希望我能通过这个专栏把这些逻辑都告诉给你。
在这门课当中,我不会“罗列”特别多的公式、复杂的推理、大量的程序等。我只是希望用各种各样的例子告诉你怎样用数据分析的角度来看待这个世界,与此同时也教会你一些数据分析最基本的知识。
当你学完这门课以后,我希望的效果是:**你再看待同一件事情的维度和以前不一样了,你可以用数据的维度来诠释你身边发生的事情,用数据的思维来做出你的判断。**
为什么我把它做成这样一个通识课的类型,而不是一个专业课呢?我是这么考虑的:如果你知道自己需要什么,比如需要某一个深入的专业领域知识,那么你可以直接到网络搜索引擎去找,或者在“极客时间”里搜索相关的专业课。
而实际情况往往是你可能并不知道自己需要什么,或者怎么用数据分析去诠释一个问题。这时,你就需要有一门课把这些数据分析的相关知识串起来,扩大自己的认知边界,知道原来还可以利用这样的想法来分析这个问题。
## 你可以从这门课里得到什么
做这门课的时候,我给自己定的第一个原则就是“场景化”。我讲的这些不应该是一些需要死记硬背的概念,而是你曾经经历、或者触手可及的案例。
所以在整个这门课的一开始,我会先将数据分析的基础概念和实际生活结合,让你能够轻松识别生活里的那些“伪科学”和“伪数据”。
然后我会给出基于这些数据分析基本概念的思路,和你分享一些常见的数据分析算法,去帮助你了解人工智能时代下的数据分析是怎样玩的,这其实是数据分析基础的延伸。
除此之外,我还会告诉你怎样去用数据和算法来分析解决一些具体的问题并做出实战。也会推荐给你一些我自己常用的分析工具以及这些工具的使用技巧。这样你可以快速地把前面的那些理论,直接应用你的实际工作和生活当中,提高你和数据相关的工作效率,让你在分析管理上也更加得心应手。
数据分析非常复杂,它融汇了数学、统计学、计算机科学、管理学等一系列的学科。
![](https://static001.geekbang.org/resource/image/8d/de/8d7e78dae9a1130166811550d59c20de.jpg?wh=1928x1305)
这门课只是一个入门,无论你是文科生还是理科生,无论你是程序员还是产品经理,无论你是高管还是普通的初出茅庐的学生,通过这门课,我都希望能让你对数据分析产生兴趣,让你具有数据思维,以后不管是面对生活还是工作,都可以有一双通过数据看透事物本质的眼睛。
当然,我想强调的是,并不是说只有工作场景才能用到这些数据分析知识,也并非有了大数据才能用到这些知识,数据分析应该是渗入到我们生活的每一个场景里。
比如去赌场玩俄罗斯轮盘连续10次开小了你心里可能会觉得连续10次小了下一次开大的概率更高一些然后就去押大那实际上大的概率真的会高吗听过后面的课后你就会明白这是典型的“**赌徒谬误**”,是错误的。
再比如,你带了一个十人的团队,每个人都有自己的优缺点和性格,每次一提到团队管理你就头大,因为内心总是混乱的,没有一条主线。但是不知道你想过没有,这十个人也是数据,你可以根据“四象限法”对他们进行分类,能力是纵轴,意愿是横轴……最后看看谁是你最应该提拔的人才。
所以,其实只要你有心,生活之中,处处都藏着数据的学问。
最后,我再重复下我的核心观点:**这世界缺的真不是算法和技术,而是能用算法、技术解决实际问题的人。**我希望能把自己学习到的诸多课程、项目的经验和阅读的大量书籍浓缩一下,深入浅出地用比较朴实和简单的语言让你理解什么是数据分析,以及怎么在自己的生活和工作当中更好地利用好数据做出更有效的决策。
“数据是有灵魂的,我将用我一生去追寻它”,这是我的座右铭,我发在这里,和你共勉。也欢迎你加入《数据分析思维课》,从今天开始,我们一起开启数据分析之旅!
当然,也欢迎你在留言区分享你对于数据的思考,以及你曾经用过的那些数据分析小知识。英国教育家约翰·纽曼曾经说过,最好的教育应该是让年轻人们生活在一起相互学习,我想,留言区就是我们最好的学习场地。