重谈DFS序、时间戳和欧拉序
本篇随笔复习总结一下算法竞赛中的DFS序、时间戳、欧拉序的相关知识。
DFS序的部分抄的是本蒟蒻今年年初的博客,链接放在下面:
DFS序的概念
先来上张图:
树的DFS序列,也就是树的深搜序,它的概念是:树的每一个节点在深度优先遍历中进出栈的时间序列。
树的DFS序,简单来讲就是对树从根开始进行深搜,按搜到的时间顺序把所有节点排队。
就比如上面这棵树,它的一个DFS序就是:
1 4 6 6 3 9 9 3 4 7 7 2 5 5 8 8 2 1
注意两点:
首先,一棵树的DFS序不唯一。因为深搜的时候选择哪个子节点的顺序是不一样的。
其次,对于一棵树进行DFS序,需要把回溯的时候的节点编号也记录一下,这就是为什么每个数字在DFS序中会出现两遍的原因。
很容易发现的是,树的DFS序的长度是(2N)。
求DFS序的代码实现
代码实现很简单,就是从根节点开始深搜,然后按顺序打标记就可以了。
在下面的代码中,(id[])数组就是DFS序的数组,(cnt)就是计时变量,上传参数的(f)表示当前节点(x)的父亲。
#include<cstdio>
using namespace std;
const int maxn=1e5+10;
int n;
int tot,to[maxn<<1],nxt[maxn<<1],head[maxn];
int id[maxn],cnt;
void add(int x,int y)
{
to[++tot]=y;
nxt[tot]=head[x];
head[x]=tot;
}
void dfs(int x,int f)
{
id[++cnt]=x;
for(int i=head[x];i;i=nxt[i])
{
int y=to[i];
if(y==f)
continue;
dfs(y,x);
}
}
int main()
{
scanf("%d",&n);
for(int i=1;i<n;i++)
{
int x,y;
scanf("%d%d",&x,&y);
add(x,y);
add(y,x);
}
dfs(1,0);
for(int i=1;i<=cnt;i++)
printf("%d ",id[i]);
return 0;
}
DFS序的性质
观察上图:
和这棵树的一个DFS序:
1 2 8 8 5 5 2 7 7 4 3 9 9 3 6 6 4 1
我们发现,一个数字两次出现的位置所夹的区间,正好是以这个数为根的一个子树。比如:
2 8 8 5 5 2
就表示以2为根的子树是:2 8 5
我们发现:DFS序的一个性质就是把一棵子树放在一个区间里。这个优秀的性质把树状结构变成了线性结构。方便我们进行统计。
DFS序的部分应用
刚刚提到的DFS序的性质让DFS序列成为了描述树的一种方式。准确地来说,DFS序让我们把树状结构变成了一个线性的结构。我们只需要在这个线性结构上进行区间修改、区间查询,而不需要再一遍遍地遍历整个子树来做到修改和查询。
这种性质的最显然应用就是在树链剖分中。树链剖分就是把树拆成一条条轻重链来把树的所有点映射到一棵线段树上来进行树上的修改与统计。它的实现原理就是DFS序。
如果有兴趣学习树链剖分的读者,请移步这篇博客:
树上的很多问题都可以用到DFS序,这里不再一一列举。希望读者能掌握:树转区间的这个性质。在以后的OI生涯中加以应用。
关于时间戳
时间戳的概念是:按照深度优先遍历的过程,按每个节点第一次被访问的顺序,依次给予这些节点(1-N)的标记,这个标记就是时间戳。
在鄙人的理解中,时间戳是DFS序的反向映射。
就是:DFS序的概念是按照深搜时间顺序的节点编号序列,数组下角标存的是时间。
而时间戳的概念是按照深搜时间顺序的时间编号序列,数组下角标存的是节点编号。
也就是:
(id[i]=x),i是时间,x是节点,id是DFS序。
(dfn[x]=i),i是时间,x是节点,dfn是时间戳。
很好理解吧。
一个误区
网上很多讲解说树链剖分是用的DFS序,严格地说,这个说法是不太严谨的,事实上它是通过维护时间戳来实现树转连续区间的。并且,因为树剖是轻重链剖分,并不是严格的深度优先遍历,所以也不能武断地说它就是DFS序或者时间戳。但是这么久了大家都这么说,况且时间戳也就是DFS序的一个“反函数”,所以大家这么说其实也没太大问题。这个部分仅表示蒟蒻个人观点,欢迎大佬们和蒟蒻探讨相关问题。
欧拉序的概念和一些性质
还是这张图:
欧拉序的定义是:从根节点出发到回到根节点为止,按深度优先遍历的顺序所经过的所有点的顺序。
比如上面的树的一个欧拉序就是:
1 2 8 2 5 2 1 7 1 4 3 9 3 4 6 4 1
和DFS序相似的,欧拉序也不唯一。
并且,可以探究出的性质是,每个点在欧拉序中出现的次数等于这个点的度数,因为DFS到的时候加进一次,回去的时候也加进。
所以欧拉序的长度是(n+n-1=2n-1)。
欧拉序的应用
欧拉序最主要的应用是求解LCA问题。
也就是将树上的LCA问题,转为区间的RMQ问题(最值)。
根据欧拉序的性质,两个节点第一次出现的位置之间一定有它们的LCA,并且,这个LCA一定是这个区间中深度最小的点。(应该很好理解)
所以当我们预处理欧拉序和深度时,就可以把树上的LCA问题变成两个节点在欧拉序中的深度最小值RMQ。即解决了问题。