一、差分
有这样一道题目:给你一个m×n的矩阵,然后使用k块地毯铺地。每片地毯都给出左下角和右上角坐标。问所有地毯铺完之后,还有多少个整点(所谓整点,即横、纵坐标均为整数的点)没有被地毯覆盖。
很显然对于这道题我们不难知道裸暴力就是枚举每个地毯,然后对于覆盖了的点就标记一下,最后我们扫一遍,看有哪些点没被标记。显然这个算法是O(kmn)的,让你T的飞起来。
那么,我们应该如何优化这个算法呢?我们考虑一下,主要的时间就是用在枚举地毯和枚举被地毯覆盖的整点上,我们可以对这里进行优化。因为对于每块地毯,每一行,覆盖的肯定是一个连续区间。所以我们可以考虑一下前缀和。通过前缀和的方式考虑每个点被地毯覆盖的次数。如下面表格所示(1表示地毯在该行的左端点):
0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
通过对数组求前缀和,我们便能得到以下的表格:
0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
我们便会发现,通过这种前缀和的形式,能够在O(1)的时间里,实行对一行从某个左端点开始一段区间的修改。但是,我们这个题目中地毯除了有左边界,还有右边界啊?不要紧,我们在右边界后面再减去1,就可以保证没有被覆盖到的地毯不会受到影响。而由于右端点也包括在被覆盖的范围内,所以我们要让r+1减去1.用上面的表格,如果我的地毯在该行覆盖了[2,6]整个区间,我们就将原数组修改成以下所示:
0 | 1 | 0 | 0 | 0 | 0 | -1 | 0 |
求前缀和之后,数组就变成如下:
0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
这样子我们就会发现,所有被地毯覆盖的点都会变成1,而对于每一行,这种操作都是O(1)的,所以k块地毯全部考虑完毕的时间复杂度为O(kn),最后每行做前缀和的时间复杂度为O(nm),这样子便对以上暴力算法进行了有效的优化。
以上大概就是差分的基本思想了。
二、树上差分(树的前缀和)
近年的noip,似乎对于树上差分的题目考察越来越热(参见2015年提高组 运输计划,2016年提高组 天天爱跑步)。这些题目都要知道在树上从某个点到另一个点的所有路径。但是,暴力求解这种题目经常会TLE。这种题目需要使用树上差分。在讲树上差分之前,首先需要知道树的以下两个性质:
(1)任意两个节点之间有且只有一条路径。
(2)一个节点只有一个父亲节点
这两个性质都很容易证明。那么我们知道,如果假设我们要考虑的是从u到v的路径,u与v的lca是a,那么很明显,如果路径中有一点u'已经被访问了,且u'≠a,那么u'的父亲也一定会被访问,这是根据以上性质可以推出的。所以,我们可以将路径拆分成两条链,u->a和a->v。那么树上差分有两种常见形式:(1)关于边的差分;(2)关于节点的差分。
①关于边的差分:
将边拆成两条链之后,我们便可以像差分一样来找到路径了。因为关于边的差分,a是不在其中的,所以考虑链u->a,则就要使cf[u]++,cf[a]--。然后链a->v,也是cf[v]++,cf[a]--。所以合起来便是cf[u]++,cf[v]++,cf[a]-=2。然后,从根节点,对于每一个节点x,都有如下的步骤:
(1)枚举x的所有子节点u
(2)dfs所有子节点u
(3)cf[x]+=cf[u]
那么,为什么能够保证这样所有的边都能够遍历到呢?因为我们刚刚已经说了,如果路径中有一点u'已经被访问了,且u'≠a,那么u'的父亲也一定会被访问。所以u'被访问几次,它的父亲也就因为u'被访问了几次。所以就能够找出所有被访问的边与访问的次数了。路径求交等一系列问题就是通过这个来解决的。因为每个点都只会遍历一次,所以其时间复杂度为O(n).
②关于点的差分:
还是与和边的差分一样,对于所要求的路径,拆分成两条链。步骤也和上面一样,但是也有一些不同,因为关于点,u与v的lca是需要包括进去的,所以要把lca包括在某一条链中,最后对cf数组的操作便是cf[u]++,cf[v]++,cf[a]--,cf[father[a]]--。其时间复杂度也是一样的O(n).
最后大家可以看看这道题:运输计划