~set~
set可能算是一种比较冷门的STL容器了,
喜欢用它的人觉得set真牛逼
不喜欢它的人觉得set真垃圾
很不幸,我属于第一种
set作为一种封装好的数据容器
最吸引人的地方是它的自动排序功能
这也就是说你可以拥有一个实时的排好序的序列
或者可以用一个序列同时实现大根堆和小根堆
时间复杂度和空间都是两者和的1/2
善于运用set的自动排序特性可以为解题省去不少麻烦
啊就爽,就很爽。
继承STL容器的传统
set也有它自己专属的头文件 <set>
这个头文件内包含两种容器
set和multiset
set是自动排序还附带去重的序列(有序集合),其中的元素不可重复
multiset是自动排序不去重的序列(有序多重集),其中可以有许多相同的元素
个人感觉在实际OI问题中比较常用的是multiset这种不去重的
两者的实现原理都是一颗我不会打的红黑树,它们支持的函数基本相同
步入正题
首先我们来看一下怎么声明一个set和multiset并往其中插入元素
#include <iostream>
#include <set>
using namespace std;
struct Node {
int l, r, val;
};
bool operator <(const Node &a, const Node &b)
{ return a.val < b.val; }
int main()
{
set<int> p;//声明方式与其他容器并无太大差异
multiset<int> q;
set<Node> fuc;//压入set的东西类型必须定义"<"
}
当然,你也可以这么写(友元版)
与上面的写法没有什么区别,但是友元比较难理解点
#include <iostream>
#include <set>
using namespace std;
struct Node {
int l, r, val;
bool friend operator <(const Node &a, const Node &b)
{return a.val < b.val;}
set<Node> fuc;
};
int main()
{
set<int> p;
multiset<int> q;
}
这样就完成了以普通数据类型和结构体的sethemultiset的声明
同时切记:set和multiset内的数据类型必须已定义小于号
学完了声明就该学如何往容器内插入元素
(size函数,empty函数,clear函数在set中也有,与在vector中作用无异,故此处不提)
与vector不同,往set内插入元素不需要指定位置
元素进入set后自动根据“<”的定义找到自己的位置
set和multiset都使用insert函数插入元素
时间复杂度为O(logn)
代码如下
#include <iostream>
#include <set>
using namespace std;
int x;
int main()
{
set<int> p;
multiset<int> q;
int n;
cin>>n;
for(int i = 1; i <= n; i++)
{
cin>>x;
q.insert(x);
p.insert(x);
}
}
如此即可实现向set p和multiset q中插入n个元素
插入完元素后我们可以对这些元素进行操作
首先需要注意的是set不支持随机访问
也就是说不能通过下标的方式访问set中的元素
想想也很好理解,即使这货能用下标你也不知道排完序后哪个元素是哪个
所以set给了我们与之替代的两种数据查找方式
迭代器(可以理解为STL的指针)和find函数
set的迭代器声明方式与在vector中的声明方式无异
同样是声明一个名为it的迭代器
有set<int>::iterator it;
如果++it,
则it指向set中的下一个元素
因为set是有序集合,所以++it所表示的元素就是刚好比it所指向的元素大的第一个元素
同时set也有begin和end函数用来取队首和队尾(的迭代器)
begin在set中取的是最小元素的迭代器
end函数跟vector中一样返回队尾下个元素的迭代器
所以--end()表示的是队尾元素的迭代器
我们看一段遍历set的代码来帮助我们理解这些抽象的概念
#include <iostream>
#include <set>
using namespace std;
int main()
{
set<int> a;
multiset<int> b;
a.insert(1);
a.insert(2);
a.insert(3);
a.insert(1);
b.insert(1);
b.insert(2);
b.insert(3);
b.insert(1);
cout<<"set 中的元素依次是 ";
for(set<int>::iterator it = a.begin(); it != a.end(); it++)
cout<<*it<<" ";
cout<<endl;
cout<<"multiset 中的元素依次是 ";
for(multiset<int>::iterator it = b.begin(); it != b.end(); it++)
cout<<*it<<" ";
cout<<endl;
return 0;
}
程序输出结果是
set 中的元素依次是 1 2 3
multiset 中的元素依次是 1 1 2 3
在这个例子中我们可以了解到set中迭代器的用法和set与multiset的本质区别
有助于我们搞明白并在程序上实现set的基本操作
了解了迭代器
我们再来看看我认为能与迭代器平起平坐帮了大忙的find函数
find函数能够找到set中大小为x的元素并返回指向该元素的迭代器。
如果set中并不存在元素x则返回s.end()
x 多次出现则返回第一次出现时的迭代器
样例如下
#include <iostream>
#include <set>
using namespace std;
int main()
{
set<int> p;
multiset<int> q;
p.insert(1);
p.insert(2);
p.insert(3);
p.insert(1);
q.insert(1);
q.insert(2);
q.insert(3);
q.insert(1);
int a = *p.find(1);
int b = *q.find(3);
cout<<a<<" "<<b<<endl;
return 0;
}
聪明的你已经看出来了
我这么写返回的一定是要查找的那个数
其实就是没屁用
啊就有的题可能会出现需要用到find函数的地方(装不下去了)
在实际应用中,我们需要对不需要的元素进行删除
set给了我们一个强大的数据删除函数erase()
括号内既可以是一个迭代器
erase删除这个迭代器所指的元素
括号内也可以是个值或者啥东西
erase在set或multiset中查找并删除和括号内这个东西一样的全部元素
那问题来了
在用multiset解决实际问题时
很多情况下我们并不想把所有相同的元素都删除
只想删除一个两个或几个(erase说没门儿
此时find函数突然出现
“劳资返回的是迭代器hahahahaha”
于是你就可以用find函数定位到元素x第一次出现的位置并返回此时的迭代器
再用erase通过迭代器删除的功能删除这个x
由于multiset恒为有序所以删除哪个x无关紧要
反正修改后的multiset都一样
所以我们就解决了这个问题(find函数大放异彩)
最后要介绍的是count函数和lower_bound/upper_bound这三个函数
首先count函数在multiset中比较常见(set里根本不能用)
count(x)返回multiset中x的出现次数(在set里用肯定返回0或1,可以作为判断元素是非在集合内的方法,比遍历慢一点)
目前还没有碰到过需要用count这个函数的题(我可能直接遍历了?大雾)
lower_bound/upper_bound是二分函数,在其他STL容器中也有出现
跟find函数类似
lower_bound(x)返回的是>=x的元素中最小的一个
upper_bound(x)返回的是>x的元素中最小的一个
当然你也可以用find+迭代器完成这一项功能
不过难写一点,而且lower_bound和upper_bound的时间复杂度和find一样为O(logn)
所以二分的时候何乐而不为呢?