3、【C++ STL】容器之关联式容器

zoukankan html css js c++ java

3、【C++ STL】容器之关联式容器
一、关联式容器

　　关联容器在存储时是以关键字key为下标进行存储的，标准的STL关联容器分为set和map两大类，之后的衍生版本有multiset和multimap，它们的区别是在存储时是否容许出现关键字key相同的情况。这些容器的底层机制均以RB-tree(红黑树)完成。

　　此外，SGI STL还提供了一个不在标准规格之列的关联式容器：hash table，以及基于hash table而完成的hash_set和hash_map。但在C++11中，因为标准化的推进，unordered_map原来属于boost分支和std::tr1中，而hash_map属于非标准容器。尽量使用unordered_，代替hash_，二者在底层上实现机理是一样的。

1、对组pair类型提供的操作

对组pair包含两个数据值。具体的使用方法如下：
1 pair<T1, T2> p1;
创建一个空的pair对象，它的两个元素分别是T1和T2类型，采用值初始化。
1 pair<T1, T2> p1(v1, v2);
创建一个pair对象，它的两个元素分别是T1和T2类型，其中first成员初始化为v1，second成员初始化为v2。
1 make_pair(v1, v2);
以v1和v2值创建一个新的pair对象，其元素的类型分别是v1和v2的类型。
1 　　p1 < p2;
两个pair对象之间的小于运算，其定义遵循字典次序：如果p1.first<p2.first或者!(p2.first<p1.first)&&p1.second<p2.second，返回true。
1 　　p1 == p2;
如果两个pair对象的first成员和second成员依次相等，则这两个对象相等，该运算使用其元素的==操作符。
1 　　p.first、p.second;
返回p中名为first、second的公有数据成员。

2、pair的创建和初始化

　　在创建pair对象时，必须提供两个类型名，pair对象的两个数据成员各自对应一个，这两个类型名可以不同。如果在创建pair对象时不提供显示初始化，则调用默认构造函数对其成员进行初始化；也可以在创建对象时使用( )直接显示初始化式：
1 pair<类型1, 类型2> 对象名;
如果使用多个相同的pair对象，也可以使用typedef简化其声明：
1 　　typedef pair <string, string> Author; 2 　　Author 对象名(初始值1，初始值2);
对于pair类可以直接访问其数据成员，其成员都是公有的，分别命名为first成员和second成员，使用点操作符即可访问。

3、set和map

　　一般来说，关联式容器的内部结构是一个平衡二叉树，以便获得良好的搜寻效率，平衡二叉树有很多种类型，包括AVL-tree，RB-tree等，最被广泛使用的是RB-tree。

　　(1)   搜索二叉树，因为它的查找平均性能是O(lgN)，因此查询中多用这种结构，但如果建立搜索二叉树的时候数据不够随机，可能会导致这棵二叉树出现“左重右轻“之类的失衡情况，这个时候平衡二叉树便体现出它的作用了。

　　(2)   所谓的树形平衡与否，并没有一个绝对的测量标准，大致意义是没有任何一个节点过深。AVL树中定义是任何节点的左右子树高度相差最多为1，在插入新的元素的时候，可能会导致这棵AVL树失去平衡，这个时候就需要用到”单旋转”和“双旋转”两种操作来调节AVL树使之重新平衡。

　　(3)   RB-tree是另一种二叉平衡树，它对“平衡”的定义更弱，它的规则如下：

　　A．每个节点不是红色就是黑色

　　B．根节点为黑色

　　C．如果节点为红色，那么它的子节点必须为黑色

　　D．任一节点至NULL的任何路径中，所含的黑色节点数必须相同

　　所以对于RB-tree的插入和删除是一个很复杂的过程，其中，插入有3中情况，删除有4中情况，但是它能很好地保证查询的效率，通常来说，比其他的平衡二叉树提高25%。

　　在RB-tree中，有两个函数很重要，一个是pair<iterator,bool>insert_unique(const Value_type &x)，这个是将x插入到红黑树中，并且保持节点的独一无二(通常来说，如果使用insert函数在map插入新的元素，如果是重复元素，则不会真正插入，而是直接返回)，返回值是一个pair类型，bool标志插入是否成功，iterator根据插入是否成功则指向新插入的节点或者NULL，另外一个是pair<iterator,bool> insert_equal(constValue_type &x)，这个函数再插入节点时允许节点关键字key重复，这便是multiset和multimap实现的关键了，这也是它们和set及map最大的区别了。

4、hash_set和hash_map

　　二叉搜索树具有对数平均时间的表现，但这样的表构建在一个假设之：输入数据足够随机。除此之外，还有另外一种数据结构，它在插入、删除、搜寻等操作上也具有常数平均时间，而且这种表现是以统计为基础，不需要依赖元素的随机性，它就是hash table。

　　哈希表在处理冲突时有线性探测，二次探测以及开链等方式，SGI则是采用开链的方式，即将冲突的元素构成一个链表，在SGI提供的hashtable中表格内的元素为桶子(bucket)，它是用vector来承载元素。

　　虽然在开链法中并不要求表格大小必须为质数，但是SGI STL仍然以质数来设计表格，它是将预先选取的28个质数保存在表中，当用户要求分配多少个桶时，则返回不小于且最接近的一个质数作为表格大小。

       Hash_set和hash_map同样只需要调用hashtable中的函数即可。由于现在经常使用unordered_系列代替了hash_，所以对于hash_的具体用法就不赘述了。

二、set

1、set/multiset

　　（1）所有元素都会根据元素的键值自动排列，set的键值就是实值，并且set不允许两个元素相同的键值。

　　（2）不能通过set的迭代器改变set的元素值，因为set的元素值就是键值，因此这关系到排列规则，如果我们擅自修改元素值，会破坏set内部的排列规则。也正因为这样，STL的set的迭代器是const_iterator。

　　（3）STL集合的底层结构是红黑树。因此掌握了红黑树的基本操作，那么学习集合set将会很容易，几乎set的所有操作都是转调用红黑树的操作而已。

　　（4）set内的相同数值的元素只能出现一次，multiset内可包含多个数值相同的元素。

【示例】
1 #include <iostream> 2 #include <set>//用set和multiset前，必须包含头文件<set> 3 4 using namespace std; 5 6 int main() 7 { 8 //type of the collection 9 typedef set<int> IntSet; 10 11 IntSet coll;//set container for int values 12 //不能够用push_back()因为是自动排序 13 coll.insert(1); 14 coll.insert(6); 15 coll.insert(2); 16 17 IntSet::const_iterator pos; 18 for(pos = coll.begin(); pos != coll.end(); pos++) 19 cout << *pos << " "; 20 cout << endl; 21 22 return 0; 23 }
2、map/multimap

　　（1）map的元素是成对的键值/实值，内部的元素依据其值自动排序；

　　（2）map内的相同数值的元素只能出现一次，multimap内可包含多个数值相同的元素。

　　（3）STL集合的底层结构是红黑树。因此掌握了红黑树的基本操作，那么学习集合set将会很容易，几乎set的所有操作都是转调用红黑树的操作而已。

【示例】
1 #include <iostream> 2 //用map/multimap前，必须包含头文件<map> 3 #include <map> 4 #include <string> 5 6 using namespace std; 7 8 int main() 9 { 10 //type of the collection 11 typedef multimap<int, string> intStringMMap; 12 13 intStringMMap coll;//container for int/string 14 //make_pair()便捷函数，返回一个pair对象：pir(first, second) 15 coll.insert(make_pair(6, "strings")); 16 coll.insert(make_pair(1, "is")); 17 coll.insert(make_pair(3, "multimap")); 18 19 intStringMMap::iterator pos; 20 for(pos = coll.begin(); pos != coll.end(); pos++) 21 { 22 cout << pos->first << " " << pos->second << endl;; 23 } 24 cout << endl; 25 26 return 0; 27 }
查看全文

相关阅读:
如何看内存占用情况，vue反复操作tab标签页面内存一直在涨，系统反应越来越慢，内存快占用1个G
正则表达式（二）- 位置匹配攻略
 正则表达式（一）- 字符匹配攻略
 判断是否闰年
 vue切换Tab标签滚到相应位置，鼠标滚轮滚动，tab标签自动切换到相应位置
 el-cascader获取lable的值
 金额最多只能输入两位小数
 npm镜像源管理工具
 pinyin-match与pinyin-engine的区别
 el-select优化TSelect，下拉框只能选末级，启用状态

原文地址：https://www.cnblogs.com/Long-w/p/9817007.html

最新文章
UVAL
CodeForces
CodeForces
UVa
HDU
HDU
UVa
UVa
SGU -1500
SGU

3、【C++ STL】容器之关联式容器

一、关联式容器

1、对组pair类型提供的操作

2、pair的创建和初始化

3、set和map

4、hash_set和hash_map

二、set

1、set/multiset

2、map/multimap