CF731C Socks并查集(森林),连边，贪心，森林遍历方式，动态开点释放内存

zoukankan html css js c++ java

CF731C Socks并查集(森林),连边，贪心，森林遍历方式，动态开点释放内存
http://codeforces.com/problemset/problem/731/C

这个题的题意是。。小明的妈妈给小明留下了n只袜子，给你一个大小为n的颜色序列c

代表第i只袜子的颜色，小明的妈妈在以后的m天要求小明每天穿编号为l[i],r[i]所组成的一双袜子

小明觉得如果颜色不一样的话很丢人。。想一次把袜子的颜色全部改好。。使得。。既按照妈妈的指令去做

又能使每天穿的一双袜子颜色相同，问，最少改变几只袜子的颜色(能满足条件)

因为这个题是水题嘛，所以说我考虑了三种实现的方式

之前没有认真分析题的时候我去线性地遍历这个序列。。然后去乱搞。。瞎猜。。反证都没有

线性遍历是无法保证题目条件的

事实证明这样的做法是最费力不讨好的

那么如果我们深入这个题的话。。会观察得到一个性质。。小明每天穿的两只袜子颜色必然相同

那么这就相当于建立了一种联系，即给题目中的变量建立了联系，于是我们如何来维护这个联系呢

第一我们可以把他们都放到一个集合里面。。(我们找集合里面出现次数最多的颜色就好了)这个得实现方法，标记每个点的所属集合。。。vis数组

还可以用并查集(不过这个题没有查询操作不必强行并查集)，还可以直接连边（这样连边连在一起的一颗森林，他们的颜色必定相同）

你用并查集可以非常容易地把那些点放到一个集合里去，当我们放进去之后。。问题来了。。

我一开始想的是。。如果你使用了并查集的路径压缩，那么你可以在很短的时间内找到一个点的所属集合的标号

我们只要扫一遍所有的元素就能遍历所有的集合。。但是如何分开统计呢。。我想到的是cnt[maxn][maxn]

第一维集合编号。。第二维。。记录每种颜色的个数。。集合编号最多2e5,颜色最多2e5,4e10的空间。。你怕不怕

但是这都是不经过仔细思考的结果。。然后我因为空间上这点事放弃了通过点找集合的遍历方法

但是如果你要通过集合编号要找所属的元素的话。。首先你不知道有哪些集合编号。。其次你也不知道集合里放了哪些元素

经典的并查集结构只能判定点的集合编号。。通过集合很难找到点。。需要枚举。。

第一枚举集合，第二枚举元素，2e5的两层循环，加了vis访问数组都超时了。。（即遍历过的元素不再跑）

而且如果你仍然用cnt[颜色值]++来统计的话。。每次遍历完一个集合。。你就要清空。。（这里的清空是重新赋值，应当与STL的clear不同）

那么这样你是铁定n^2复杂度了，T的你连妈妈都不认识哦

那么接下来我们怎么走呢？我们是一定需要记得之前的矛盾的。。

矛盾1，cnt[maxn][maxn]开不下。。首先有一点我们要清楚。。第一维是一定要开满的。。不遍历完你永远不知道

有几个集合，那第二维统计颜色，颜色值的数量与集合数量并不能同时取到最大。。具体来说。。如果你第二维开满

很多时候很多的颜色值将是空的。。这就造成了空间上的浪费。。因为第二维最多一共需要maxn个位置，而不是maxn*maxn

所以我们想到了动态开点释放内存。。这个还是不那么好写的。。我们可以用map<int,int>数组啊！！，然后统计完遍历map数组统计答案

这样我们就能通过点找集合的方式快速统计。。下面贴上代码
#include <iostream> #include <cstdio> #include <cstring> #include <map> using namespace std; const int maxn=2e5+7; int n,m,k; int c[maxn]; int l,r; int fa[maxn]; bool vis[maxn]; map<int,int> mp[maxn]; void init(){ int i; for(i=1;i<=n;++i){ fa[i]=i; } } int getFa(int v){ if(v==fa[v]) return v; return fa[v]=getFa(fa[v]); } void Mix(int a,int b){ int af=getFa(a); int bf=getFa(b); if(af!=bf){ fa[bf]=af; } } int main(){ scanf("%d%d%d",&n,&m,&k); int i,j; for(i=1;i<=n;++i){ scanf("%d",&c[i]); } init(); for(i=1;i<=m;++i){ scanf("%d%d",&l,&r); Mix(l,r); } int sum=0;int all,mx; for(i=1;i<=n;++i){ int father=getFa(i); mp[father][c[i]]++; } for(i=1;i<=n;++i){ int cnt=0,mx=0; for(map<int,int>::iterator it=mp[i].begin();it!=mp[i].end();++it){ if(it->second>mx) mx=it->second; cnt+=it->second; } sum+=cnt-mx; } printf("%d ",sum); return 0; }
第二种方法我们仍然使用并查集。。我们还可以采用集合遍历元素的方法来遍历并查集森林

但是我们并查集的原始结构可是不支持的。。你要是按这样的映射方式去统计的话。。仍然是要

第一维枚举集合编号。。第二维枚举所有元素。。两重循环爆炸(某些情况两重循环可并不一定是n^2的复杂度哦)

然后这时候其实一个通常的普遍的想法不容易想到。。那就是空间换时间。。因为它最普遍所以它也最不容易被想到

那么又出现了上面那个问题二维数组行吗？由于二维数组非常地死板。。所以一定会在空间上就爆炸

那么我们仍然选择用STL容器数组，动态开点，释放内存(clear()),由于我们只需要取元素。。vector就可以满足我们的需求

我们每次合并的时候，如果是不同集合的东西。。(相同集合就不要管了。。免得重复统计)，那么我们就选择把数量小的森林

合并到大的森林里去。。然后把小森林的vector clear掉，

那么我一开始想的是这个事情很难实现。。原因是我考虑了这样一种情况。。如果合并的两颗森林里。。某一颗森林还包含了链向其他

编号的森林（因为会合并嘛），那你用vector怎么合并呢。。这个问题第一不好存储。。第二不好合并。。

但是你仔细想一下。。如果你从第一次开始。。每次都合并。。那么在vector里面这个就是线性的结构。集合里每个元素的父亲都严格

相等，那么每次都是线性的。。后面就不会有这种情况啊

Tips：我经常会问自己这样的问题。。那么以后在想的时候一定还记得要思考。。我思考的这个样例在什么条件下成立。。条件有可能被满足吗

在当前想法的前提下。。是否会出现这种状况。。走什么样的流程会导致这样的样例。。这个流程合法吗

不符合题意。。不符合条件的样例毫无意义。。会把你困死。。所以每当困惑的时候我们要找出出现困惑样例的前提条件，周遭的主要联系和关键

不要老是复杂化一个问题

Tips：实现在Mix里的vector合并有一个经典的错误。。通过size是否等于0来判断它是不是一个新的没计算过的集合。。，那么我们还要考虑有没有

相同的情况，但是当你第一次写下这个判断的时候当前发生的语句还真没有歧义。。当你合并完。。集合。。每一个集合clear了。。那么它的size就变

成了0，但是它并不是新的没有计算过的集合。。那么你应该马上意识到这一点。。并重新考虑判断条件。。并且你引入的新的辅助判断条件仍然不能有

歧义。。并且你还要时刻小心后面新加的操作仍然对判断语句造成歧义

合并之后我们就可以按照一个集合一个集合的顺序来统计答案，那么遍历的时候如何统计呢。。如果用cnt[maxn]。。每次都要情况。。

这样就又是n方了。。那么这里又有一个技巧。。

Tips:clear是要比memset快的。。（这个题来说），当我们发现有类似的矛盾可以尝试用clear或者其他动态开点的手段来解决

所以我们用一个map来统计颜色。。每统计完一个我们就清空map..因为map只需要清空很少的值。。而cnt不管如何都要强行全部清零

不过在这里我又想到了一种方法。。那就是记录一下都用到了哪些颜色。。我们只对这些元素进行清零。。(但是还是clear稳一点感觉)

下面贴上代码
#include <iostream> #include <cstdio> #include <vector> #include <map> using namespace std; int n,m,k; const int maxn=2e5+7; int c[maxn],fa[maxn]; vector<int> Set[maxn]; map<int,int> mp; void init(){ int i; for(i=1;i<=n;++i){ fa[i]=i; } } int getFa(int v){ return (v==fa[v])?v:(fa[v]=getFa(fa[v])); } void Mix(int x,int y){ int a=getFa(x); int b=getFa(y); if(a!=b){ int sz1=Set[a].size(); int sz2=Set[b].size(); if(sz2>sz1) swap(a,b); if(Set[a].size()==0) Set[a].push_back(a); if(Set[b].size()==0) Set[a].push_back(b); for(int i=0;i<Set[b].size();++i){ Set[a].push_back(Set[b][i]); } Set[b].clear(); fa[b]=a; } } int main(){ scanf("%d%d%d",&n,&m,&k); int i,j; for(i=1;i<=n;++i){ scanf("%d",&c[i]); } int l,r; init(); for(i=1;i<=m;++i){ scanf("%d%d",&l,&r); Mix(l,r); } int sum=0; for(i=1;i<=n;++i){ int mx=0; for(j=0;j<Set[i].size();++j){ int t=Set[i][j]; // printf("I:%d t:%d ",i,t); mp[c[t]]++; mx=max(mx,mp[c[t]]); } sum+=Set[i].size()-mx; mp.clear(); } printf("%d ",sum); return 0; }
下面是直接利用邻接表连边。。构造出森林。。然后直接dfs遍历关系的集合森林。。dfs的先序过程中即可统计答案

这也算是并查集的另外一种实实在在的结构。。并查集能转化为邻接表的树。。那么森林也是可以表示并查集的。。相互转化

下面贴上代码
#include <iostream> #include <cstdio> #include <map> #include <vector> using namespace std; const int maxn=2e5+7; int n,m,k; int c[maxn]; map<int,int> mp; vector<int> edge[maxn]; bool vis[maxn]; int mx,all; void dfs(int v){ int i; mp[c[v]]++;all++;mx=max(mx,mp[c[v]]); for(i=0;i<edge[v].size();++i){ int t=edge[v][i]; if(!vis[t]){ vis[t]=true; dfs(t); } } } int main(){ scanf("%d%d%d",&n,&m,&k); int i; for(i=1;i<=n;++i){ scanf("%d",&c[i]); } int l,r; for(i=1;i<=m;++i){ scanf("%d%d",&l,&r); edge[l].push_back(r); edge[r].push_back(l); } int sum=0; for(i=1;i<=n;++i){ if(vis[i]) continue; vis[i]=true; all=0;mx=0; dfs(i); sum+=all-mx; mp.clear(); } printf("%d ",sum); return 0; }
按这种写法在dfs(i)之前我们就应该vis[i]=true;

如果仅仅是为了防止死循环。。那我们可以判断！=fa来防止dfs死循环
查看全文

相关阅读:
CTFHub题解-技能树-Web-文件上传（00截断、双写后缀）【三】
CTFHub题解-技能树-Web-文件上传（.htaccess、MIME绕过、文件头检查）【二】
CTFHub题解-技能树-Web-文件上传（无验证、前端验证）【一】
CTFHub题解-技能树-Web-SQL注入（Cookie注入、UA注入、Refer注入）【三】
记一次centos7重启后docker无法启动的问题
 ctfshow——web_AK赛
 Windows10安装MongoDB
centOS7安装docker和docker-compose
xray—学习笔记
 ctfhub技能树—sql注入—过滤空格

原文地址：https://www.cnblogs.com/linkzijun/p/6111198.html