gitbook/程序员的数学基础课/docs/77849.md

175 lines
17 KiB
Markdown
Raw Permalink Normal View History

2022-09-03 22:05:03 +08:00
# 15 | 从树到图:如何让计算机学会看地图?
你好,我是黄申。
我们经常使用手机上的地图导航App查找出行的路线。那计算机是如何在多个选择中找到最优解呢换句话说计算机是如何挑选出最佳路线的呢
前几节,我们讲了数学中非常重要的图论中的概念,图,尤其是树中的广度优先搜索。在广度优先的策略中,因为社交网络中的关系是双向的,所以我们直接用无向边来求解图中任意两点的最短通路。
这里,我们依旧可以用图来解决这个问题,但是,影响到达最终目的地的因素有很多,比如出行的交通工具、行驶的距离、每条道路的交通状况等等,因此,我们需要赋予到达目的地的每条边,不同的权重。而我们想求的最佳路线,其实就是各边权重之和最小的通路。
我们前面说了,广度优先搜索只测量通路的长度,而不考虑每条边上的权重。那么广度优先搜索就无法高效地完成这个任务了。那我们能否把它改造或者优化一下呢?
我们需要先把交通地图转为图的模型。图中的每个结点表示一个地点,每条边表示一条道路或者交通工具的路线。其中,边是有向的,表示单行道等情况;其次,边是有权重的。
假设你关心的是路上所花费的时间,那么权重就是从一点到另一点所花费的时间;如果你关心的是距离,那么权重就是两点之间的物理距离。这样,我们就把交通导航转换成图论中的一个问题:在边有权重的图中,如何让计算机查找最优通路?
## 基于广度优先或深度优先搜索的方法
我们以寻找耗时最短的路线为例来看看。
一旦我们把地图转换成了图的模型,就可以**运用广度优先搜索,计算从某个出发点,到图中任意一个其他结点的总耗时**。
基本思路是,从出发点开始,广度优先遍历每个点,当遍历到某个点的时候,如果该点还没有耗时的记录,记下当前这条通路的耗时。如果该点之前已经有耗时记录了,那就比较当前这条通路的耗时是不是比之前少。如果是,那就用当前的替换掉之前的记录。
实际上,地图导航和之前社交网络最大的不同在于,每个结点被访问了一次还是多次。在之前的社交网络的案例中,使用广度优先策略时,对每个结点的首次访问就能获得最短通路,因此每个结点只需要被访问一次,这也是为什么广度优先比深度优先更有效。
而在地图导航的案例中,从出发点到某个目的地结点,可能有不同的通路,也就意味着耗时不同。而耗时是通路上每条边的权重决定的,而不是通路的长度。因此,为了获取达到某个点的最短时间,我们必须遍历所有可能的路线,来取得最小值。这也就是说,我们对某些结点的访问可能有多次。
我画了一张图方便你理解多条通路对最终结果的影响。这张图中有A、B、C、D、E五个结点分别表示不同的地点。
![](https://static001.geekbang.org/resource/image/c1/b2/c155d6b1babe59e0c42928337686f9b2.jpg?wh=1142*654)
从这个图中可以看出从A点出发到目的地B点一共有三条路线。
* 如果你直接从A点到B点度数为1需要50分钟。
* 从A点到C点再到B点虽然度数为2但总共只要40分钟。
* 从A点到D点到E点再到最后的B点虽然度数为3但是总耗时只有35分钟比其他所有的路线更优。
这种情形之下,使用广度优先找到的最短通路,不一定是最优的路线。所以,对于在地图上查找最优路线的问题,无论是广度优先还是深度优先的策略,都需要遍历所有可能的路线,然后取最优的解。
在遍历所有可能的路线时,有几个问题需要注意。
第一,由于要遍历所有可能的通路,因此一个点可能会被访问多次。当然,这个“多次“是指某个结点出现在不同通路中,而不是多次出现在同一条通路中。因为我们不想让用户总是兜圈子,所以需要避免回路。
第二如果某个结点x和起始点s之间存在多个通路每当x到s之间的最优路线被更新之后我们还需要更新所有和x相邻的结点之最优路线计算复杂度会很高。
## 一个优化的版本Dijkstra算法
无论是广度优先还是深度优先的实现,算法对每个结点的访问都可能多于一次。而访问多次,就意味着要消耗更多的计算机资源。那么,有没有可能在保证最终结果是正确的情况下,尽可能地减少访问结点的次数,来提升算法的效率呢?
首先我们思考一下对于某些结点是不是可以提前获得到达它们的最终的解例如最短耗时、最短距离、最低价格等等从而把它们提前移出遍历的清单如果有是哪些结点呢什么时候可以把它们移除呢Dijkstra算法要登场了它简直就是为了解决这些问题量身定制的。
Dijkstra算法的核心思想是对于某个结点如果我们已经发现了最优的通路那么就无需在将来的步骤中再次考虑这个结点。Dijkstra算法很巧妙地找到这种点而且能确保已经为它找到了最优路径。
### 1.Dijkstra算法的主要步骤
让我们先来看看Dijkstra算法的主要步骤然后再来理解它究竟是如何确定哪些结点已经拥有了最优解。
首先你需要了解几个符号。
第一个是source我们用它表示图中的起始点缩写是s。
然后是weight表示二维数组保存了任意边的权重缩写为w。w\[m, n\]表示从结点m到结点n的有向边之权重大于等于0。如果m到n有多条边而且权重各自不同那么取权重最小的那条边。
接下来是min\_weight表示一维数组保存了从s到任意结点的最小权重缩写为mw。假设从s到某个结点m有多条通路而每条通路的权重是这条通路上所有边的权重之和那么mw\[m\]就表示这些通路权重中的最小值。mw\[s\]=0表示起始点到自己的最小权重为0。
最后是Finish表示已经找到最小权重的结点之集合缩写为F。一旦结点被放入集合F这个结点就不再参与将来的计算。
初始的时候Dijkstra算法会做三件事情。第一把起始点s的最小权重赋为0也就是mw\[s\] = 0。第二往集合F里添加结点sF包含且仅包含s。第三假设结点 s 能直接到达的边集合为M对于其中的每一个对端节点m则把mw\[m\]设为w\[s, m\]同时对于所有其他s不能直接到达的结点将通路的权重设为无穷大。
然后Dijkstra算法会重复下列两个步骤。
**第一步查找最小mw**。从mw数组选择最小值则这个值就是起始点s到所对应的结点的最小权重并且把这个点加入到F中针对这个点的计算就算完成了。
比如当前mw中最小的值是mw\[x\]=10那么结点s到结点x的最小权重就是10并且把结点x放入集合F将来没有必要再考虑点xmw\[x\]可能的最小值也就确定为10了。
**第二步,更新权重**。然后我们看看新加入F的结点x是不是可以直接到达其他结点。如果是看看通过x到达其他点的通路权重是否比这些点当前的mw更小如果是那么就替换这些点在mw中的值。
例如x可以直接到达y那么把(mw\[x\] + w\[x, y\])和mw\[y\]比较,如果(mw\[x\] + w\[x, y\])的值更小那么把mw\[y\]更新为这个更小的值而我们把x称为y的前驱结点。
然后重复上述两步再次从mw中找出最小值此时要求mw对应的结点不属于F重复上述动作直到集合F包含了图的所有结点也就是说没有结点需要处理了。
字面描述有些抽象,我用一个具体的例子来解释一下。你可以看我画的这个图。
![](https://static001.geekbang.org/resource/image/79/aa/796ad4473319311570c64646875370aa.jpg?wh=1142*634)
我们把结点s放入集合F。同s直接相连的结点有a、b、c和d我把它们的mw更新为w数组中的值就可以得到如下结果
![](https://static001.geekbang.org/resource/image/85/7e/85d93aaa912327053fa18157f02c067e.png?wh=1580*224)
然后我们从mw选出最小的值0.2把对应的结点c加入集合F并更新和c直接相连的结点f、h的mw值得到如下结果
![](https://static001.geekbang.org/resource/image/7a/bf/7abb384727aa14482c5c1a99e841fabf.png?wh=1550*376)
然后我们从mw选出最小的值0.3把对应的结点b加入集合F并更新和b直接相连的结点a和f的mw值。以此逐步类推可以得到如下的最终结果
![](https://static001.geekbang.org/resource/image/ac/46/acfbc2ef21b572cb0b7d1a8ea248d346.png?wh=1768*1464)
你可以试着自己从头到尾推导一下,看看结果是不是和我的一致。
说到这里你可能会产生一个疑问Dijkstra算法提前把一些结点排除在计算之外而且没有遍历全部可能的路径那么它是如何确保找到最优路径的呢
下面我们就来看看这个问题的答案。Dijkstra算法的步骤看上去有点复杂不过其中最关键的两步是第一个是每次选择最小的mw第二个是假设被选中的最小mw所对应的结点是x那么查看和x直接相连的结点并更新它们的mw。
### 2.为什么每次都要选择最小的mw
最小的、非无穷大的mw值对应的结点是还没有加入F集合的、且和s有通路的那些结点。假设当前mw数组中最小的值是mw\[x\]对应的结点是x。如果边的权重都是正值那么通路上的权重之和是单调递增的所以其他通路的权重之和一定大于当前的mw\[x\]因此即使存在其他的通路其权重也会比mw\[x\]大。
你可以结合这个图,来理解我刚才这段话。
![](https://static001.geekbang.org/resource/image/c6/d3/c6d1365f398861d997a8b443a6fdfbd3.jpg?wh=1142*654)
图中的虚线表示省去了通路中间的若干结点。mw\[x\]是当前mw数组中的最小值所以它小于等于任何一个mw\[xn\]其中xn不等于x。
我们假设存在另一个通路,通过$x\_{n}$达到x那么通路的权重总和为mw\[$x\_{n}$\] + w\[$x\_{n}$, x\] ≥ mw\[$x\_{n}$\] ≥ mw\[x\]。所以我们可以得到一个结论拥有最小mw值的结点x不可能再找到更小的mw值可以把它放入“已完成“的集合F。
这就是为什么每次都要选择最小的mw值并认为对应的结点已经完成了计算。和广度优先或者深度优先的搜索相比Dijkstra算法可以避免对某些结点重复而且无效的访问。因此每次选择最小的mw就可以提升了搜索的效率。
### 3.为什么每次都要看x直接相连的结点
我们已经确定mw\[x\]是从点s到点x的最小权重那么就可以把这个确定的值传播到和x直接相连、而且不在F中的结点。通过这一步我们就可以获得从点s到这些点、而且经过x的通路中最小的那个权重。我画了张图帮助你理解。
![](https://static001.geekbang.org/resource/image/ec/f2/ec5b72711eba1bf5c4e2f9c03beedaf2.jpg?wh=1142*584)
在这个图中x直接相连$y\_{1}$$y\_{2}$,…,$y\_{n}$。从点s到点x的mw\[x\]已经确定了那么对于从s到yn的所有通路只有两种可能经过x和不经过x。如果这条通路经过x那么其权重的最小值就是mw\[$y\_{i}$\] = mw\[x\] + w\[x, $y\_{i}$\]中的一个1≤i≤n我们只需要把这个值和其他未经过x结点的通路之权重对比就足够了。这就是为什么每次要更新和x直接相连的结点之mw。
这一步和广度优先策略中的查找某个结点的所有相邻结点类似。但是之后Dijkstra算法重复挑选最小权重的步骤既没有遵从广度优先也没有遵从深度优先。即便如此它仍然保证了不会遗漏任意一点和起始点s之间、拥有最小权重的通路从而保证了搜索的覆盖率。你可能会奇怪这是如何得到保证的我使用数学归纳法来证明一下。
你还记得数学归纳法的一般步骤吗?刚好借由这个例子我们也来复习一下。
**我们的命题是对于任意一个点Dijkstra算法都可以找到它和起始点s之间拥有最小权重的通路。**
首先当n=1的时候也就是只有起始点s和另一个终止点的时候Dijkstra算法的初始化阶段的第3步保证了命题的成立。
然后我们假设n=k-1的时候命题成立同时需要证明n=k的时候命题也成立。命题在n=k-1时成立表明从点s到k-1个终点的任何一个时Dijkstra算法都能找到拥有最小权重的通路。那么再增加一个结点xDijkstra算法同样可以为包含x的k个终点找到最小权重通路。
这里我们只需要考虑x和这k-1个点连通的情况。因为如果不连通就没有必要考虑x了。既然连通x可能会指向之前k-1个结点也有可能被这k-1个结点所指向。假设x指向了y而z指向了xy和z都是之前k-1个结点中的一员。
![](https://static001.geekbang.org/resource/image/59/b1/59dfee4aefe052d5a7da2cea7bf20cb1.jpg?wh=1142*690)
我们先来看x对y的影响。如果x不在从s到y的最小权重通路上那么x的加入并不影响mw\[y\]的最终结果。如果x在从s到y的最小权重通路上那么就意味着mw\[x\] + w\[x, y\]≤mw\[y\]mw表示没有引入结点x的时候mw的值。
所以有mw\[x\]≤mw\[y\]这就意味着Dijkstra算法在查找最小mw的步骤中会在mw\[y\]之前挑出mw\[x\]也就是找到了从s到y且经过x的最小权重通路。
我们再来看z对x的影响。假设有多个z指向x分别是$z\_{1}$, $z\_{2}$, …,$z\_{m}$从s到x的通路必定会经过这m个z结点中的一个。Dijkstra算法中找最小mw的步骤一定会遍历mw\[$z\_{i}$\]1<=i<=m而更新权重的步骤可以并保证从(mw\[$z\_{i}$\] + w\[$z\_{i}$, x\])中找出最小值最终找到从s到x的最优通路。
有了详细的推导,想要写出代码就不难了。我这里只给你说几点需要注意的地方。
在自动生成图的函数中,你需要把广度优先搜索的相应代码做两处修改。第一,现在边是有向的了,所以生成的边只需要添加一次;第二,要给边赋予一个权重值,例如可以把边的权重设置为\[0,1.0)之间的float型数值。
为了更好地模块化你可以实现两个函数findGeoWithMinWeight和updateWeight。它们分别对应于我之前提到的最重要的两步每次选择最小的mw更新和x直接相连的结点之mw。
每次查找最小mw的时候我们需要跳过已经完成的结点只考虑那些不在F集合中的点。这也是Dijkstra算法比较高效的原因。此外如果你想输出最优路径上的每个结点那么在updateWeight函数中就要记录每个结点的前驱结点。
如果你能跟着我进行一步步的推导并且手写代码进行练习相信你对Dijkstra算法会有更深刻的印象。
## 小结
我们使用Dijkstra算法来查找地图中两点之间的最短路径而今天我所介绍的Dijkstra使用了更为抽象的“权重”。如果我们把结点作为地理位置边的权重设置为路上所花费的时间那么Dijkstra算法就能帮助我们找到任意两个点之间耗时最短的路线。
除了时间之外你也可以对图的边设置其他类型的权重比如距离、价格这样Dijkstra算法可以让用户找到地图任意两点之间的最短路线或者出行的最低价格等等。有的时候边的权重越大越好比如观光车开过某条路线的车票收入。对于这种情况Dijkstra算法就需要调整一下每次找到最大的mw更新邻近结点时也要找更大的值。所以你只要掌握核心的思路就可以了具体的实现可以根据情况去灵活调整。
![](https://static001.geekbang.org/resource/image/48/9f/48b3029c0e5310bf9b5f2e5564463a9f.jpg?wh=1242*1441)
## 思考题
今天的思考题和地图数据的特殊情况有关。
1. 如果边的权重是负数我们还能用今天讲的Dijkstra算法吗
2. 如果地图中存在多条最优路径也就是说多条路径的权重和都是相等的那么我刚刚介绍的Dijkstra算法应该如何修改呢
欢迎在留言区交作业,并写下你今天的学习笔记。你可以点击“请朋友读”,把今天的内容分享给你的好友,和他一起精进。