跳转至

图匹配

引入

匹配 或是 独立边集 是一张图中不具有公共端点的边的集合。图匹配算法是信息学竞赛中常用的算法,大致可以分为最大匹配以及最大权匹配两类。因为 二分图 中的匹配等价于网络流问题,性质良好,相对容易处理,所以,此处将先从二分图开始介绍两类算法,再讨论一般图的算法。

图的匹配

G=(V,E) 是一张无向图,其中,V 是顶点集,E 是边集。如果一组边 ME 不包含自环,且两两之间没有公共顶点,那么,边集 M 就称为图 G 的一个 匹配(matching)或 独立边集(independent edge set)。一条边 eE,如果出现在匹配 M 中,就称为 匹配边,否则称为 非匹配边。相应地,一个顶点 vV,如果它是一条匹配边的一个端点,就称为 匹配点,否则称为 未匹配点

匹配 M 的大小,就是它包含的边的数量。对于(加权)无向图中的匹配,常常会考虑如下概念:

  • 极大匹配(maximal matching):无法继续增加匹配边的匹配。极大匹配不一定是最大匹配。

    maximal matching

  • 最大匹配(maximum matching or maximum cardinality matching):匹配边数最多的匹配。最大匹配可能有不止一个,但最大匹配的边数是确定的,而且不可能超过图中顶点数的一半。

    maximum cardinality matching

  • 最大权匹配(maximum weight matching):加权图中,边权和最大的匹配。

    maximum weight matching

  • 最大权最大匹配(maximum weight maximum cardinality matching):匹配数最多的前提下,边权和最大的匹配。即所有最大匹配中,边权和最大的匹配。

    maximum weight maximum cardinality matching

  • 完美匹配(perfect matching):每个顶点都是匹配点的匹配。完美匹配一定是最大匹配。顶点数为偶数的完全图,必然存在完美匹配。

  • 近完美匹配(near-perfect matching):有且只有一个未匹配点的匹配。这只能发生在图的顶点数是奇数时。近完美匹配也一定是最大匹配。顶点数为奇数的完全图,必然存在近完美匹配。

算法竞赛中涉及的图的匹配问题,主要指的是图的最大匹配或最大权匹配。

增广路

图匹配算法中,增广路是用于改进匹配的核心结构。

定义

对于图 G=(V,E) 和它的一个匹配 M,可以定义如下两种(简单)路径:

  • 交错路(alternating path)是由匹配边与非匹配边交错而成的路径;
  • 增广路(augmenting path)是始于未匹配点且终于未匹配点的交错路。

因为增广路上非匹配边比匹配边数量多 1,所以增广路中边的数量一定是奇数。如果将增广路上的匹配边和非匹配边反转,那么它依然是交错路,而且匹配数量会增加 1。寻找增广路并反转它以增加匹配大小的过程,就称为 增广(augmentation)。用数学语言说,增广相当于将匹配 M 与增广路 P 取对称差,得到新的匹配 MP

下图展示了在一次增广操作后,匹配数量由 2 增加为 3 的过程。

augment-1

Berge 引理

Berge 引理说明,利用增广路改进匹配的方法是充分的。也就是说,当找不到增广路时,就说明已经得到了最大匹配。

Berge 引理

对于图 G=(V,E) 和它的一个匹配 M,匹配 M 是最大匹配,当且仅当不存在相对于匹配 M 的增广路。

证明

前文已经说明,存在增广路 P 时,匹配 MP 是比 M 更大的匹配,因此 M 一定不是最大匹配。

反过来,需要说明,如果存在比匹配 M 更大的匹配 M,那么,一定存在相对于 M 的增广路 P。为此,考察对称差 MM。图 (V,MM) 中顶点的度数只能是 012;这样的图的连通分量必然是路径、环路、孤立点之一。而且,与度数为 2 的顶点相邻的两条边必定来自不同的匹配,所以,这些环路中来自 MM 的边的数量是一样的。因为 MM 大,所以存在至少一条路径中来自 M 的边的数量多于 M;记该路径为 P。那么,P 的起点和终点都是 M 的未匹配点,且 P 是相对于 M 的交错路,所以 P 一定是相对于 M 的增广路。这就完成了证明。

由此定理可知我们求最大匹配的核心思路:

  • 枚举所有未匹配点,找增广路径,直到找不到增广路径。

事实上,每次增广操作结束后,不需要重新遍历一次所有未匹配点。在整个求最大匹配的过程中,每个顶点只需要遍历一次就好。

证明

只需要说明,如果在枚举进行到顶点 v 时,不存在以 v 为起点的增广路,那么在若干轮增广之后,也不存在以 v 为起点的增广路。这就说明,即使增广引起了匹配的改变,也不需要再次检查之前已经枚举过的未匹配点。

假设不然。也就是说,假设 v 是已经枚举过的未匹配点,在某一轮沿着自 uw 的增广路 P 增广后,新增了之前不存在的以 v 为起点的增广路 P。那么,路径 P 必然与 P 有公共边;否则,沿着 P 增广不会引起 P 中的边的匹配状态改变,P 也就不是因为此次增广而新增的增广路。

augment-2

(图中黑色表示非匹配边,红色和蓝色表示不同的匹配状态)

x 是自 v 出发,沿着路径 P 最先到达的 P 中的顶点。因为在本次增广前,就存在自 vx 的交错路,所以 x 必然是匹配点,也就不能是顶点 u 或顶点 w 中的一个。因此,在增广路 P 上,与 x 相邻的边有两条,且它们的匹配状态相反。这说明,无论沿着以 v 为起点的交错路到达顶点 x 时,边的匹配状态如何,都可以沿着路径 P 将交错路延长至 uw 中的一个。这说明,增广之前就已经存在以 v 为起点的增广路,与假设矛盾。

交错树

另一个与增广路紧密相关的概念是交错树。它是从未匹配点 r 进行 DFS 或 BFS 寻找增广路的过程中产生的树。

对于图 G=(V,E) 和它的一个匹配 M,如果子图 HG 是以未匹配点 r 为根的树,且连接 r 和任意 vH 的路径都是交错路,那么,就称 H 是一个 交错树(alternating tree)。其中,树上深度为偶数的点称为偶点,树上深度为奇数的点称为奇点。

下图展示了自未匹配点 1 开始进行 BFS 可能得到的一个交错树。(图中,红边为匹配边,黑边为非匹配边;深色顶点为匹配点,浅色顶点为未匹配点。)

完美匹配的存在性

图匹配理论中,有两个重要的存在性定理,可以用于判定二分图或一般图中完美匹配是否存在。

Hall 定理

假设 G=(X,Y,E) 是二分图,且 |X||Y|。对于图 G 的一个匹配 M,如果 X 中的所有顶点都是匹配点,那么就称 M 是一个 X‑完美匹配,有时也简称作(二分图 G)的完美匹配。这是二分图中可能达成的最大的匹配。Hall 定理提供了判断这种匹配是否存在的充要条件。

Hall 定理说明,只要保证对于 X 的任何子集,Y 中都有足够多的顶点可以与它匹配,就一定存在 X‑完美匹配。

Hall 定理

假设 G=(X,Y,E) 是二分图,且 |X||Y|。对于任何 WX,记 NG(W) 为图 G 中所有与 W 中的顶点相邻的顶点集合。那么,X‑完美匹配存在,当且仅当 |W||NG(W)| 对于所有 WX 都成立。

证明

条件显然是必要的。假设 X‑完美匹配 M 存在,那么 X 中的每个顶点都匹配到了 Y 中的不同顶点。集合 NG(W) 至少包括了与 W 中顶点匹配的那些顶点,所以它的大小至少为 |W|

条件也是充分的。假设 X‑完美匹配不存在,那么一定有最大匹配 M 使得顶点 vX 仍然是未匹配点。设 Z 是所有可以通过由 v 出发的交错路到达的顶点集合,并设 S=ZXT=ZY。集合 S{v} 一定全部是匹配点,否则就会出现奇环,与 G 是二分图矛盾;集合 T 也一定全部是匹配点,否则就存在增广路,根据 Berge 引理,这与 M 是最大匹配矛盾。因为全部是匹配点,且匹配只能发生在 XY 之间,所以集合 S{v} 和集合 T 中的顶点一一对应,也就是说,|T|=|S|1。同时,因为 T 中的顶点已经和 S 中顶点匹配,所以至少有 TNG(S);但是,NG(S) 中并不存在未匹配点 u,因为如果设它与 S 中的 v 相邻,那么,必然可以通过延长到达 v 的交错路得到到达 u 的交错路:这说明 T=NG(S)。这些论证说明 |NG(S)|<|S|,这与 Hall 定理所设条件矛盾。这就说明了 X‑完美匹配存在。

推论

所有正则的二分图都有完美匹配。

证明

正则二分图中,所有顶点的度数都相同,设为 k。首先验证 Hall 条件成立,即对于任何 WX,都有 |NG(W)||W|。因为与 W 中顶点相邻的边的数量是 k|W|,而集合 NG(W) 中每个顶点至多只能与其中 k 条边相邻,所以必然有 k|W|k|NG(W)|,也就是 |W||NG(W)|。特别地,有 |X||Y|;因为 XY 是对称的,所以有 |X|=|Y|。这说明,正则二分图中,X‑完美匹配也一定是完美匹配。由于 Hall 定理保证了 X‑完美匹配存在,那么完美匹配也一定存在。

Tutte 定理

Tutte 定理提供了判断一般图中是否存在完美匹配的充要条件。这个条件源于一个直接的观察:顶点数量为奇数的图中一定不存在完美匹配。

Tutte 定理

G=(V,E) 存在完美匹配,当且仅当对于任何 UV,都有 odd(GU)|U|,其中,GU 表示从图 G 中删去 U 中的顶点以及与之相邻的边得到的子图,而 odd(GU) 表示子图 GU 中顶点数量为奇数的连通分量的数量。

证明

只需要考虑简单图即可,因为重边和自环不影响 Tutte 条件和完美匹配的存在性。

条件的必要性相对容易。假设存在完美匹配 M。对于任意 UV,从图 G 中删去 U 中的顶点之后,每一个顶点数量为奇数的连通分量都至少有一个无法与同一个连通分量顶点匹配的顶点,这些顶点只能寻求与 U 中的顶点匹配。这样的匹配存在,至少要求 odd(GU)|U|。这就是 Tutte 条件。

条件的充分性较为复杂。假设 G 满足 Tutte 条件,但是没有完美匹配。因为向 G 中添加任何边都会使得 Tutte 条件依然成立,所以不妨设 G 是一个极大的这样的图,也就是说,G 不存在完美匹配,但是,向 G 中添加任何尚不存在的边 e,都会使得 G+e 存在完美匹配。设 UV 是所有度数为 |V|1 的顶点的集合。可以证明,GU 的每一个连通分量都是一个完全图。由此,可以构造出一个 G 的完美匹配:首先取每个 GU 的连通分量的最大匹配,这样只有连通分量顶点数量为奇数时,才会出现一个未匹配点;将这些未匹配点匹配到 U 中顶点;因为 G 的顶点数量为偶数(在 Tutte 条件中取 U=),所以,U 中剩余的尚未匹配的顶点数量也是偶数,将它们两两配对即可。这一矛盾就说明,不存在满足 Tutte 条件但是没有完美匹配的 G

关键是要证明 GU 的每一个连通分量都是一个完全图。假设不然。不妨设顶点 x,y,z 属于这样的一个连通分量,且 (x,y)E(y,z)E(x,z)E。而且,因为 yU,必然存在 wVU 但是 (y,w)E。由于 G 的极大性,图 G+(x,z) 和图 G+(y,w) 中分别存在完美匹配 M1M2。考察它们的对称差 M1M2。因为图 (V,M1M2) 中所有顶点的度数要么是 0 要么是 2,所以 M1M2 实际上是若干个偶环的不交并,且每个偶环都是 M1M2 中的匹配边交错组成的。

如图所示,可以分两种情形:

  • (x,z)(y,w) 位于不同的环路(如图左所示):设 (y,w) 所在环路为 C,那么,边集 M2C 就是图 G 的完美匹配;
  • (x,z)(y,w) 位于相同的环路(如图右所示):由对称性,不妨设环路依次经过 x,y,w,z,因此可以取环路上从 y 经过 w 到达 z 的路径 P,记 {(y,z)}P 为环路 C,那么,边集 M2C 同样是图 G 的完美匹配。

无论是哪种情形,都与 G 的选取矛盾。这个矛盾说明了 GU 的每一个连通分量都是一个完全图。

推论

无桥 3‑正则图都有完美匹配。

证明

为了验证 Tutte 条件成立,任取 UV,需要证明 odd(GU)|U|。设 G1,,GnGU 的顶点数为奇数的所有连通分量。设 mi 是连接 Gi 中顶点和 U 中顶点的边的数量。简单的计数可知

3|V(Gi)|=vV(Gi)d(v)=2|E(Gi)|+mi.

因此,mi 必然是奇数。因为 G 中没有桥(即割边),所以 mi3。这就说明

odd(GU)=n13i=1nmi13vUd(v)=|U|.

因此,Tutte 条件成立,图 G 必然有完美匹配。

常见算法

组合优化中的一个基本问题是求图的最大匹配和最大权匹配。

二分图最大匹配

详见 二分图最大匹配 页面。

在无权二分图中,可以使用 Kuhn 算法在 O(|V||E|) 时间内解决,也可以使用 Hopcroft–Karp 算法在 O(|V|1/2|E|) 时间内解决。

二分图最大权匹配

详见 二分图最大权匹配 页面。

在加权二分图中,可用 Hungarian 算法解决。如果在寻找最短路时使用 Bellman–Ford 算法,时间复杂度为 O(|V|2|E|);如果使用 Dijkstra 算法或 Fibonacci heap,可在 O(|V|2log|V|+|V||E|) 时间内解决。

一般图最大匹配

详见 一般图最大匹配 页面。

无权一般图中,可以使用 Edmonds' blossom 算法在 O(|V|2|E|) 时间内解决。

一般图最大权匹配

详见 一般图最大权匹配 页面。

加权一般图中,可以使用 Edmonds' blossom 算法在 O(|V|2|E|) 时间内解决。

相关问题

最大(权)匹配与其它图论问题有着紧密的联系。本节仅讨论一般图,关于二分图的结论可以参考 二分图最大匹配 页面。

最大权最大匹配

最大权最大匹配问题和最大权匹配问题可以相互归约。它们之间一个很显著的区别是,最大权最大匹配中可能存在负权边,但是最大权匹配中不会存在负权边。

首先,最大权匹配问题可以归约为最大权最大匹配问题。首先,将图 G 的所有负权边的权重设为 0;然后,通过连接若干权重为 0 的边,将图扩充为完全图 G。注意到,边权非负的完全图中,最大权最大匹配和最大权匹配是一致的。所以,只需要计算 G 的最大权最大匹配 M,再删去 M 中的所有零权边,得到的边集 M 就是图 G 的最大权匹配。1

graph-match

反过来,最大权最大匹配问题也可以归约为最大权匹配问题。只需要对图 G 所有边的边权都加一个足够大的正数 K,就可以保证得到的图 G 的最大权匹配也一定是最大匹配,故而必然是最大权最大匹配。这是因为计算图 G 的最大权匹配相当于在图 G 的所有匹配中最大化

K|M|+eMw(e).

K 充分大时,多匹配一条边带来的增益 K,会超过后面一项的权值和的变化。因此,算法会首先尽可能地多匹配边,然后才会最大化匹配边的边权和。常数 K 的选择,只要保证它严格大于两个可能的匹配的差值即可。一个显然的选择是

K=eE|w(e)|+1.

graph-match

最小(权)边覆盖

另一个与最大(权)匹配紧密相关的问题是最小(权)边覆盖。边覆盖与匹配(又称边独立集)的关系,和点覆盖与独立集的关系相似。

G=(V,E) 中的一组边 CE,如果任意顶点 vV 都是 C 中某条边的端点,那么,就称 C 是图 G 的一组 边覆盖(edge cover)。讨论边覆盖时,总是假设图 G 没有孤立点。

对于无权图,最小边覆盖问题几乎就是最大匹配问题。对于图 G 的任何最大匹配 M,只要为每个未匹配点都加入一条相连的边,就可以得到一个最小边覆盖 C。它们的大小满足简单的数量关系:|M|+|C|=|V|。下图是一些最小边覆盖的例子:

graph-match

对于加权图,最小权边覆盖问题可以归约为一个 最小权完美匹配 问题。首先,将图 G=(V,E) 拷贝一份得到 G~=(V~,E~),边权与原图一致;然后,将每个顶点 vV 都与它的拷贝 v~V~ 连接起来,边权为图 G 中与 v 关联的边的权值最小值。这样得到的图记作 G=(V,E)。如果图 G 是二分图或稀疏图,那么图 G 同样分别是二分图或稀疏图。而且,图 G 的最小权边覆盖问题,就归约为图 G 的最小权完美匹配问题2:对于图 G 的最小权完美匹配 M,只要保留 E 中的边,再将所有匹配到的 (v,v) 替换成图 G 中与 v 关联的权值最小的边,就得到图 G 的最小权边覆盖。

参考资料

  1. Wikiwand - Matching (graph theory)
  2. Wikiwand - Blossom algorithm
  3. 2015 年《浅谈图的匹配算法及其应用》- 陈胤伯
  4. 演算法笔记 - Matching
  5. the-tourist/algo
  6. Bill Yang's Blog - 带花树学习笔记
  7. 二分图的最大匹配、完美匹配和匈牙利算法
  8. Wikiwand - Hopcroft–Karp algorithm
  9. Bondy, John Adrian, and Uppaluri Siva Ramachandra Murty. Graph theory with applications. Vol. 290. London: Macmillan, 1976.

  1. 当然,这并不是唯一的归约方式。对于图 G=(V,E),还可以将它的一份拷贝 G~=(V~,E~) 逐点地连接到原来的图上,并将所有相对于原图 G 新加的边(包括拷贝中的边)的权重设为 0,得到图 G=(V,E)。换句话说,新图 G 的顶点集是 VV,而它的边集除了图 G 中的边之外,还将所有顶点 vV 都与它的拷贝 v~V 用零权边连接,且对于所有边 (u,v)E,都将 u~v~ 用零权边连接。图 G 中的所有匹配 M 都对应着图 G 中的一个权值和相同的完美匹配:只需要将 G 中所有未匹配点 v 都与它的拷贝 v~ 匹配,而对于所有匹配边 (u,v),都将 u~v~ 匹配。因此,图 G 中的最大权最大匹配,也就是最大权完美匹配,限制到 E 上,就得到图 G 的最大权匹配。这样归约的好处是,如果图 G 是二分图或稀疏图,那么扩充得到的图 G 也分别是二分图或稀疏图。 

  2. 对于图 G 的每个完美匹配 M,都可以按照此处描述的方式得到一个图 G 的边覆盖 C,且后者的权值和为前者的一半;将这个构造过程反过来,对于图 G 的每个边覆盖 C,都可以构造出一个图 G 的完美匹配 M,且后者的权值和不超过前者的二倍。这就说明归约是成立的。