Bellman-Ford算法(下文中简称为BF)与Dijkstra算法一样,解决的是单源最短路径问题。两者不同之处在于,后者只适用于无负权边的图,而BF无此限制:无论是否有向,无论是否有负权边,只要图中没有负权环,则该算法可以正确地给出起点到其余各点的最短路径,否则报告负权环的存在。
很多资料(比如维基百科)在解释BF时都会提到它的基础或者核心是松弛操作。自然地,理解BF的关键也是理解这一点,所以下面就来专门讲讲它究竟是个什么意思。
“松弛”,翻译自英文的relaxation,原本指数学上的一种迭代求解方程组的方法,表示通过改进近似解来不断地逼近最终解或者说最优解的方法。而我们下面可以看到,BF正是这么一个迭代改进的过程。
岔开一笔,我不知道当初数学家们为什么要选用relaxation这个词,但我觉得它的字面意义正好与它所代表的实际过程相反(在BF中尤其如此)。更糟的是,数学中另有一个“松弛”的概念,使用的是同一个词。它表示的是一种解决问题的技巧:如果问题难以解决,则放宽某些限制,将其转化成容易解决的问题,以求得近似的解决方案(这倒是名副其实)。所以,在理解BF时,看到“松弛”这个词,如果觉得它有误导之嫌,不妨在脑中将其替换为“逼近”或者“改进”。
那么BF中的松弛改进是个怎么样的操作呢?
首先,松弛改进的对象很明显,就是从起点到其余各点的距离。给定图G和起点s,G[u][v]
表示边(u, v)的长度,且用D[u]
表示从s点到某个u点已知的(但不一定是最优的)最短路径的长度,那么对于图中任何从该u点出发的边(u, v),如果D[u] + G[u][v]
小于D[v]
,则将D[v]
松弛改进为D[u] + G[u][v]
。我们可以用Python给出下面的实现(代码出自Python Algorithms一书,稍有改动,下同):
inf = float('inf')
def relax(G, u, v, D, P):
o = D.get(v, inf) # 若D[v]不存在则返回inf
n = D.get(u, inf) + G[u][v]
if n < o:
D[v], P[v] = n, u
return True # 若有改进,则返回True
return False
其次,根据定义,它肯定是一个迭代的过程。照上面的分析和代码,我们可以将每次松弛改进和某条边对应起来。讲到这里,那么BF的核心思想其实就很容易描述了:不断地选择一条边,做松弛改进操作,直到得出正确的解答。
接下来的问题自然就是:
- 这种思路能提供一个正确的算法吗?换言之,我们如何通过选择
松弛改进边的顺序,使得对应的BF最终完成运行? - 如何选择
松弛改进边的顺序,使得对应的BF效率最高?
我们先来考察如下的情况:如果对图里每条边按照随机的顺序都做一次松弛改进(称之为一轮松弛改进),能得到什么?能够保证起点s的任一邻点(记作u)都得到正确的D[u]
(最短路径长度)和P[u]
(最短路径中的上一节点)吗?显然不能。比如下图中,如果依次松弛改进(s, a)、(s, b)、(s, c)、(a, b)、(b, c),那么一轮下来,确实a点b点c点都能得到正确答案。但如果顺序变成(b, c)、(a, b)、(s, a)、(s, b)、(s, c),那么b点的答案就是错的(读者可自行推演验证)。
怎么去找这么个最优的顺序呢?这样的话,只需一轮松弛改进就可以解决问题了。其实这是不现实的。因为要得到这个最优顺序,从本质上来讲,必须得将各点以距起点s的最短距离从小到大作一个排序,而这正就是要解决的问题。这是个“循环依赖”,没有出路。
回到上图完成一轮松弛改进之时。可以发现,虽然b点的答案不一定正确,但是a点和c点的答案,不论顺序如何,都是正确的。这是一个非常关键的性质。换句话说,完成第1轮松弛改进后,对于任一节点u,如果s到u存在一条边数(注意不是长度)为1的最短路径,那么从s到u点的(某条)边数为1最短路径的就一定能解出来。推而广之,做完第k轮松弛改进后,对于任一节点u,如果从s到u存在边数为k的最短路径,那么这样的一条最短路径一定会被找出来。我们可以用数学归纳法进行证明。假设k-1轮后的情况已经得证,再假设s到某个点u有一条边数为k的最短路径,为[s, m1, m2, ..., mk-2, u],且s与u中间不存在边数小于k的最短路径(D[u]
还未记录最短路径的长度),那么,通过反证法可知,[s, m1, m2, ..., mk-2]肯定是从s到mk-2的一条最短路径,据前面的假设,这条路径的值已经算出来了,进而在第k轮处理(mk-2, u)的时候,一定会对D[u]
和P[u]
的值有所改进(也就是说relax
方法返回True
),两者的值都会是最终正确的解答而且不会再发生改变了。综上,前面的命题得证。
另外,还有一个特别重要的引理:如果一个节点数为n的图中没有负权环,那么其任意两个节点之间一定存在最短路径,且其边数不会超过n-1。这一引理从直观上很好理解,所以这里不给出严谨的数学证明。这条引理非常重要,因为它有两个很关键的推论:
- 在无负权环、节点数为n的图中,遵循上面的思路,我们最多只需要进行n-1轮
松弛改进,就可以解决单源最短路径问题 - 对于节点数为n的图,如果如上进行n轮
松弛改进,且最后一轮还能够有所改进,则说明图中必有负权环
以上就是BF的整个思路。依此可以用Python做出如下代码实现:
def bellman_ford(G, s):
D, P = {s: 0}, {s: None}
for _ in G: # 轮数等于节点数
improved = False
for u in G:
for v in G[u]: # 任意的顺序遍历所有边
if relax(G, u, v, D, P):
improved = True
if not improved: # 如果某轮没有任何改进
break # 说明问题已经解决,退出循环
else: # 否则,说明第n轮也有改进,存在负权环
raise ValueError('negative cycle')
return D, P
很显然,上面算法的时间复杂度为O(nm),其中n和m分别为节点和边的数目。时间复杂度超过Dijkstra算法的O(mlgn),但BF的优势,正如一开始所说的,在于它允许负权边的存在而且能够检测到负权环的存在。