# 数学专栏课外加餐(三):程序员需要读哪些数学书? 你好,我是黄申。欢迎来到第三次加餐时间!之前很多同学问我能否推荐一些数学方面的书,今天我就来分享几本。 数学领域涉及的面很广,相关的书籍也很多。咱们这个专栏我从数学的三个主要方面,介绍程序员常用的数学知识,包括离散数学、概率和统计和线性代数。所以我还是围绕这个专栏的三大模块,来给你推荐相应的书籍。 ## 基础思想篇推荐书籍:《离散数学及其应用》 第一模块是“基础思想篇”。这一模块,我尝试用实际项目中的案例,把不同的离散数学知识点串了起来,并加以解释。如果你对其中某些点,有更深的兴趣,可以参考Kenneth H·Rosen所著的《**离散数学及其应用**》,英文原名是$Discrete$ $Mathematics$ $and$ $Its$ $Applications$。 ![](https://static001.geekbang.org/resource/image/42/48/4219469a129f55f25373045081867848.jpg?wh=1080*1522) 这本书是国外高校的教材,对所有离散数学的知识点介绍的比较全面。咱们讲过的同余定理、数学归纳法、递归、分治算法、排列和组合、树和树的遍历、图和最短路径、逻辑以及集合等概念,这里面都有非常详细的介绍。我看很多人对这些内容很感兴趣,可以参考这本书的相关章节,深入学习。 除此之外,这本书还有几个特点,我觉得非常好。 第一,介绍了不少证明的方法。计算机算法的正确性是很重要的,专栏中我在不同的地方介绍并使用了数学归纳法,在解释Dijkstra算法时也用到了反证法和分情形证明的思想。数学中用于证明的方法其实还有很多,这本书涉及了穷举证明、存在性证明等。相信这些证明方法,可以让你更好地理解,为什么有些算法是可行的,有些算法是有问题的,并帮助你在理解算法、学习算法,甚至设计算法时保证它的正确性。 第二,介绍了不少逻辑和集合相关的知识。这些我在专栏里没有涉及太多。主要是因为程序员经常接触各种条件和查询语句,对这些内容已经很熟悉了,所以我没有花太多的篇幅。如果你想知道更多关于逻辑、集合和布尔代数这些基础内容的解释,也可以看看这本书。 第三,和编程结合得非常紧密。主要体现在两个方面:第一,它介绍了一些基于伪代码的算法,也对这些算法进行了时间和空间复杂度的分析,例如常见的排序、搜索算法。第二,它介绍了不少离散数学在计算机科学中的应用场景,例如关系型数据库和SQL查询语言是如何设计的。另外,它也提供了不少课后习题,可以加深你对这些知识点的理解。所以,当你读到这本书的某些章节时,会发现,怎么和计算机的数据结构和算法这么像啊?确实,离散数学和数据结构和基础算法有着紧密的联系,加上这本书使用了不少计算机的语言、例子和应用,自然有不少共同的内容了。 专栏的第二模块是“概率统计篇”,这本书也谈到了一些离散概率的内容。在学习第二个模块的时候,你也可以搭配这本书的内容来看,相信对你会很有帮助。 当然,这本书的某些内容讲得比较深,而且有些知识点在程序员日常编码中基本上用不到。你可以结合我专栏的主题和内容,并针对自己的日常工作,挑出一些重点来学习。 ## 概率统计篇推荐书籍:《概率统计》 专栏第一模块已经结束了,接下来的“概率统计篇”我会着重介绍概率统计及其在计算机领域中的主要应用。你可以预先阅读一些相关的书籍,热热身。这里我推荐另一本国外高校的教材,Morris H.DeGroot和Mark J.Schervish所著的《**概率统计**》,英文原名是$Probability$ $and$ $Statistics$。本书的两位作者,DeGroot和Schervish都是贝叶斯统计理论的重量级人物。 ![](https://static001.geekbang.org/resource/image/8a/76/8aa4bee1c0b435fd4dbe8bae7f955076.png?wh=1012*1340) 这本书包含了概率论常用的知识点,包括了随机变量及其分布、条件概率、期望值、贝叶斯理论、马尔科夫链等等。专栏的第二模块,我也会介绍这些知识点,以及它们在计算机领域,特别是机器学习中的应用。 我们再来说这本书的几个特色。 第一,这本书通常以列举非常实用的例子开始,然后详尽地讲解理论及其扩展应用。比如,一开篇解释“概率”的时候,作者使用了抛硬币的例子,分别从“频率”“经典”和“主观”的角度来解释概率,并又阐述了“概率理论”和“概率”有何不同。这样的写法会给你很多思路上的启发,让你获得更直观的认识。文章中也不乏很多来源于各个领域的案例,比如经济学和金融学等等。 第二,对概念的解释非常详细。比如“充分统计量(sufficient statistic)”这个概念,一般的书可能两句话就解释完了,然后就是大堆的公式,但是这本书用了差不多两页的篇幅来解释它。我觉得这点对自学者而言是非常有帮助的。 第三,这本书几乎没有任何涉及计算机算法和代码的部分,哪怕是伪代码也没有。我想作者是希望完全从概率和统计本身的角度来写,而避免过多的实现细节。不过,对于这点你也不用过于担心,因为在专栏中,我会结合一些具体的机器学习算法及其应用,给你展示这些理论知识是如何运用到实践中的。 总的来说,这是一本相当不错的概率和统计方面的专业书籍。如果你预先读读这本书的内容,对概念有了理解,再看我的专栏也会更有感触。 ## 线性代数篇推荐书籍:《线性代数及其应用》 如今的机器学习模型,除了基于概率和统计,还会使用线性代数的知识,本专栏的第三个模块就是“线性代数”。介绍线性代数的书籍不少,我这里推荐一本David C. Lay和Steven R. Lay合著的《**线性代数及其应用**》,英文原名$Linear$ $Algebra$ $and$ $Its$ $Applications$。 ![](https://static001.geekbang.org/resource/image/41/65/4103851f3c50c4f1048bbe144178c965.png?wh=986*1224) 这本书最大的特色在于: 第一,使用通俗易懂的口吻和大量的插图来阐述概念。而且在我看来,这些概念他解释得也相当清楚,比如线性方程、向量空间、特征向量、奇异值的分解等等,这些都是在机器学习算法中常用的模型或技术。 第二,写作的逻辑也相当清晰。这本书基本上都是先提出一个实际的问题,然后对这个问题进行分析,最终才进行定理式的归纳和证明。通俗易懂的同时,不乏数学的严谨性。和前面两本推荐的书一样,这本书中也结合了很多生动的案例,特别是经济学领域的。 第三,这本书还配套了一本优秀的学习指南$Linear$ $Algebra$ $and$ $Its$ $Applications$: $Study$ $Guide$。这本指南,加上原书课后的习题,对于自学的读者巩固知识很有帮助。不过我没有找到这本指南的中文翻译版。如果哪位同学有好的练习题推荐,也可以在留言区分享出来。 ## 入门、通识类书籍推荐 除了上述三本重量级的专业书籍,我觉得还有几本通俗的入门书也是不错的。 一套是几位日本作家写的《**程序员的数学**》系列,包括《程序员的数学》《程序员的数学:概率统计》《程序员的数学:线性代数》。这套书也强调了和计算机领域紧密相连的三大模块。这几位作者使用朴实的语言,把最重要的一些概念给说明白了。相比前面三本,这套书所涵盖的内容可能没有那么全面、也没有那么深入,不过对于初学者来讲,是不错的入门书籍。 ![](https://static001.geekbang.org/resource/image/c1/69/c1cf06f722b99ee0a3efd2a530c33c69.png?wh=1080*1364) 最后一本书是吴军老师的《**数学之美**》。这本书最大的特点是和计算机领域结合得非常紧密。所有的问题和解决方案,最后都联系到了计算机中的某个应用。可以说,作者更多的是从计算机从业者的角度出发,深入探讨了背后的数学思想和知识。除此之外,吴军老师广博的学识和深刻的见解,在这本书中也体现得淋漓尽致。这本书的写作风格对我写作这个专栏也是非常有启发的。 ![](https://static001.geekbang.org/resource/image/07/21/07a3b6e3dcbb918f3f9458c23dc32921.png?wh=1003*1393) 读书在精,不在多。我选的这些书,你可能多多少少见过,但是能静下心来读完一本的人可能寥寥无几。我相信,订阅这个专栏的你,一定有颗不甘于平庸的心。你一定有你的目标和追求。开卷有益,坚持下去,学下去、读下去,相信你一定会有所收获!