与图论的邂逅03：Lengauer-Tarjan

zoukankan html css js c++ java

与图论的邂逅03：Lengauer-Tarjan
　　回想一下，当我们在肝无向图连通性时，我们会遇到一个神奇的点——它叫割点。假设现在有一个无向图，它有一个割点，也就是说把割点删了之后图会分成两个联通块A,B。设点u∈A，v∈B，在原图中他们能够互相到达，而删了割点后他们就不能了。于是类似的，我们能不能够在有向图里面也找出这样的“割点”呢？也就是说，现在有两个点u,v，其中u可以到达v；而删去割点后，u不能再到达v。

　　在解决这个问题前，我们先吃一盘开胃菜——我们先给图中的边都取个名字。众所周知，用深度优先搜索遍历一张图，过程中走过的边和点会共同构成一棵树，它叫做这个图的搜索树。现在我们有一张有向图，我们找出它的搜索树之后，来观察一下这些边：

　　红色边和所连的点就是搜索树。画出这么一个玩意儿之后，我们给这些边都取个名字：
1.树枝边：E(u,v)在搜索树中 2.前向边：搜索树中连向v的边 3.后向边：搜索树中v连出去的边 4.横叉边：不在搜索树上的边
　　现在我们开始愉快地找规律。我们首先算出这些点的时间戳。假设图中每个点的时间戳都与自己的编号相同(假设是成立的)。先从树枝边开始，我们看E(1->2)并观察两个端点的时间戳，我们会发现，dfn[1]<dfn[2]；我们再观察E(2->3)，我们又发现dfn[2]<dfn[3]；我们再观察E(3->4)......观察完所有的树枝边，我们会发现一个规律：对于任意E(u->v)∈dfs tree，其中u∈V,v∈V，都有dfn[u]<dfn[v]。其实根据时间戳和搜索树的定义也是能够直接推出这个结论的。

　　由于前向边和后向边都是包含于树枝边的，我们现在先不管它。我们看看横叉边。E(5->2)就是横叉边，我们发现，dfn[5]>dfn[2]。那是不是对于任意E(u->v)∉dfs tree，其中u∈V,v∈V，都有dfn[u]>dfn[v]呢？看完图中所有横叉边之后，我们发现这个猜想仍然成立。但这是不是正确的结论呢？显然是的。下面来证一下，顺便加深一下我们对时间戳和搜索树的认识。

　　　　证明：假设我们搜索到了u，且图中存在E(u->v)，且v已经被搜索过，现在在搜索树中。设u的时间戳为dfn[v]，因为v已经被搜索过，所以E(u->v)不会加入到搜索树中，否则会形成环。易得出dfn[u]>dfn[v]，所以对于任意E(u->v)∉dfs tree，其中u∈V,v∈V，都有dfn[u]>dfn[v]。证毕。

　　好弱鸡的证明。。。但当时证这个的时候确实让我对时间戳和搜索树的认识加深了不少(其实还是我太弱了)。

　　看完这些乱七八糟的边之后，我们再整些点来玩(sang xin bing kuang)。

　　先看一下流图的定义：有向图G中，若存在一点r，从r出发能够到达图中所有的点，则称G为流图，记为(G,r)。

　　于是又有了一些新东西：

　　1.必经点。若(G,r)中r到v的所有路径都经过点u，则称u是v的必经点，记为u dom v(易懂吧)。v的所有必经点构成的集合记为dom(y)，dom(y)={x|x dom y}。

　　2.最近必经点。最接近v的必经点。首先，v的必经点的dfn肯定<v的dfn，在搜索树上越往上走，dfn越小。所以最接近v的必经点就是dom(v)中dfn最大的那个点。由于最近必经点唯一，可以记为idom(v)。

　　搞了这么大半天，我们到底要干些什么?!不清楚......啪！好吧，我们来给自己出一题：给定一张有向图(G,r)，求出对于每个点，有多少点以它为必经点。

　　考虑暴力怎么写。考虑特殊情况，我们认为dom(r)={r}。然后对于其余任意点v，考虑它的所有前驱节点的所有必经点。为了方便，我们设v的前驱节点集合为pre。设存在u1∈pre,u2∈pre，并且存在w dom u1。若|pre|=2，即v的前驱节点只有u1,u2，现有两种情况：w dom u2和!(w dom u2)。若是第一种情况，可以推出w同样是v的必经点；而第二种情况则w不是v的必经点。推广为|pre|>=2的情况，我们可以得出v的必经点集合就是v的所有前驱节点的必经点集合的交集，即∩_u∈predom(u)。于是我们得出了一种通过前驱节点来更新必经点的做法。所以我们可以从r开始往外算，若是DAG则根据拓补序计算，若是一般图则迭代一下。时间复杂度为O(N²)。但是连模板都跑不了。

　　那我们换一种思路求解。既然直接求出必经点太过突兀(?)，我们为何不通过求出一个弱鸡一点的东西，再进一步求出必经点呢？

　　所以我们再引入一个概念：

　　半必经点。能通过走非树枝边到达v的深度最小的v的祖先u。其实这个定义也没说清楚。假设u是v的半必经点，存在一条u到v的路径，把u和v都去掉后，路径上所有点的dfn都大于v的dfn。这样的u就是v的半必经点。当然，若路径上去掉u和v就没点了，那u就是v的半必经点。画个图：

　根据那个讲得不是很清楚的定义可以得出，一个点的半必经点是唯一的，u的半必经点记为semi(u)。

　　可以得出半必经点的一些性质：

1.x的半必经点一定是x在搜索树上的祖先，即dfn[semi[x]]<dfn[x].

2.半必经点不一定是必经点。

3.idom[x]是semi[x]在搜索树上的祖先(semi[x]也是自己的祖先)。

　　第一条是显而易见的。然后我们看第二条，假设半必经点就是必经点，下面给一个图推翻假设：

　　而第三条也是显然成立的，否则idom[x]就会位于semi[x]到x的路径上，而semi[x]到x的路径显然不止一条。

　　那么我们怎么求半必经点呢？
int tmp=+∞; for(each v∈pre(u)) if(dfn[v]<dfn[u]) tmp=min(tmp,dfn[v]);//E(v,u)为树枝边 else for(each w∈anc(v)) if(dfn[w]>dfn[u]) tmp=min(tmp,dfn[semi[w]]);//E(v,u)为横叉边 semi[u]=id[tmp];
　　这里的第二层for循环可以省掉。具体的做法是：用带权并查集来维护v的dfn最小的祖先，其权值就是dfn的值，用路径压缩可以达到logN级别，再加上按秩合并可以达到α(N)级别，增长率比log还慢，接近线性。然而我太弱了，只会打路径压缩。。。那么求出所有点的半必经点的时间复杂度就是0(NlogN)。

　　然而这只是半必经点而已，并不是必经点。所以我们还要通过半必经点来求出必经点。其实是求出最近必经点。

　　那么最近必经点怎么求呢？设semi[x]到x的路径上去掉了semi[x]之后的点构成的集合为path。
int y=id[min{dfn[semi[z]]|z∈path}]; if(semi[x]==semi[y]) idom[x]=semi[x]; else idom[x]=idom[y];
　　那么这两个东西的求法怎么证呢？(太弱了证不出来)这一块等层次练高了再补上。

　然后就该解决问题了。我们来看一个神奇的东西：支配树。

　　支配树：从每个点的最近必经点往它连一条有向边。由于每个点的最近必经点是唯一的，所以新连的边和原图的点就构成了一棵树。这棵树叫支配树。也就是说树上的点支配着它的子树嘛。支配树中存在E(u,v)当且仅当u=idom(v)。树中存在u到v的路径当且仅当u dom v。

　　所以我们可以先求出有向图的支配树，那么对于一个点，它是多少点的必经点就等于它在支配树中有多少儿子了。怎么求呢？求支配树有一个算法，由Lengauer和Tarjan提出，那名字当然叫Lengauer-Tarjan啦~这个算法的原理是：

　　　　1.建出搜索树并算出每个点的时间戳

　　　　2.根据半必经点定理按时间戳从大到小计算出每个点的半必经点

　　　　3.根据必经点定理，通过算出的半必经点得出每个点的最近必经点

　　具体的过程：

　　　　1.每计算一个点时，把这个点放进生成森林中，用并查集维护

　　　　2.根据半必经点定理，若dfn[x]>dfn[y]，计算semi[y]时则需要考虑x祖先中dfn大于y的点

　　　　3.由于按时间戳从大到小的顺序计算，比y时间戳小的点还未加入生成森林，所以直接在生成森林中考虑x的祖先即可

　　　　4.令dfn[semi[x]]为x到其父亲的边的权值，用带权并查集可以求出边权的最小值

　　于是代码就能写得出来：
#include <stdio.h> #include <string.h> #define maxn 200001 #define maxm 300001 struct graph{ struct edge{ int to,next; edge(){} edge(const int &_to,const int &_next){ to=_to,next=_next; } }e[maxm]; int head[maxn],k; inline void init(){ memset(head,-1,sizeof head); } inline void add(const int &u,const int &v){ e[k]=edge(v,head[u]),head[u]=k++; } }a,b,c,d; inline int read(){ register int x(0); register char c(getchar()); while(c<'0'||'9'<c) c=getchar(); while('0'<=c&&c<='9') x=(x<<1)+(x<<3)+(c^48),c=getchar(); return x; } int bel[maxn],val[maxn],semi[maxn],idom[maxn]; int fa[maxn],dfn[maxn],id[maxn],tot; int n,m,size[maxn]; void dfs(int u){ dfn[u]=++tot,id[tot]=u; for(register int i=a.head[u];~i;i=a.e[i].next){ int v=a.e[i].to; if(!dfn[v]){ fa[v]=u; dfs(v); } } } int find(int u){ if(bel[u]==u) return u; int tmp=find(bel[u]); if(dfn[semi[val[bel[u]]]]<dfn[semi[val[u]]]) val[u]=val[bel[u]]; return bel[u]=tmp; } inline void lengauer_tarjan(){ int u,v; for(register int i=tot;i>1;i--){ u=id[i]; for(register int i=b.head[u];~i;i=b.e[i].next){ if(dfn[v=b.e[i].to]){ find(v);//带权并查集维护最小边权 if(dfn[semi[val[v]]]<dfn[semi[u]]) semi[u]=semi[val[v]]; } } c.add(semi[u],u); bel[u]=fa[u],u=fa[u]; for(register int i=c.head[u];~i;i=c.e[i].next){ find(v=c.e[i].to); if(semi[val[v]]==u) idom[v]=u; else idom[v]=val[v]; }//半必经点定理 } for(register int i=2;i<=tot;i++){ u=id[i]; if(idom[u]!=semi[u]) idom[u]=idom[idom[u]]; }//必经点定理 } void dfs_ans(int u){ size[u]=1; for(register int i=d.head[u];~i;i=d.e[i].next){ int v=d.e[i].to; dfs_ans(v); size[u]+=size[v]; } } int main(){ a.init(),b.init(),c.init(),d.init(); n=read(),m=read(); for(register int i=1;i<=m;i++){ int u=read(),v=read(); a.add(u,v),b.add(v,u); } dfs(1); for(register int i=1;i<=n;i++) bel[i]=val[i]=semi[i]=i; lengauer_tarjan(); for(int i=2;i<=n;i++) d.add(idom[i],i); dfs_ans(1); for(register int i=1;i<=n;i++) printf("%d ",size[i]);puts(""); return 0; }
　　等厉害一点了再回来写证明......(逃)
查看全文

相关阅读:
记-码农的“启蒙”之《程序设计语言-实践之路》和《面向对象分析和设计》两书
 记-阅读以及书籍推荐（2014年9月7日更新）
初探领域驱动设计（1）为复杂业务而生
 异步编程 In .NET
Windows平台分布式架构实践
 Windows平台分布式架构实践
 一不小心写了个WEB服务器
 MVC5
从Membership 到 .NET4.5 之 ASP.NET Identity
bootstrap + requireJS+ director+ knockout + web API = 一个时髦的单页程序

原文地址：https://www.cnblogs.com/akura/p/10741782.html