zoukankan      html  css  js  c++  java
  • 第十一章:关联容器

    • 关联容器的元素按照关键字来保存和访问,而顺序容器的元素是按照在容器中的位置来保存和访问
    • 关联容器支持高效的关键字查找和访问
    • 2种关联容器:
      • map中的元素是关键字-值对(key-value对),关键字作为索引,值表示与索引相关的数据
      • set中的元素只包含关键字
    • 8个关联容器:
      • 类型:或者是map,或者是set
      • 关键字能否重复:或者是multi,或者不是
      • 关键字是否顺序保存:或者是unordered_,或者不是
    • 4个头文件:
      • mapmultimap定义于map头文件
      • setmultiset定义于set头文件
      • unordered_mapunordered_multimap定义于unordered_map头文件
      • unordered_setunordered_multiset定义于unordered_set头文件
    • 关联容器类型见表11.1 tab_11_1

    使用关联容器

    • map类型常称为关联数组字典),但其下标不必是整数,且通过关键字而不是位置来查找值
    • set是关键字的简单集合,只想知道一个值是否存在或出现的次数时,很有用
    • 例子:使用map
    1
    2
    3
    4
    5
    6
    7
    
    map<string,size_t> word_count;          //默认初始化字典
    string word;
    while(cin>>word)
        ++word_count[word];                 //关键字存在则递增其值,关键字不存在则初始化其值为0后递增
    for(const auto &w:word_count)           //遍历字典元素
        cout<<w.first<<" occurs "<<w.second //字典元素是pair,其first成员是key,second成员是value
            <<((w.second>1)?" times":" time")<<endl;
    
    • map是模板,使用时必须在模板参数中指定key和value类型。
    • 对map使用key作为下标访问其value,若key不存在则创建一个新元素,其关键字为给定key,值初始化为0
    • map的元素都是pair类型,pair也是模板,保存两个public数据成员(firstsecond)。map使用的pair的first成员是关键字,second是值
    • 例子:使用set
    1
    2
    3
    4
    5
    6
    
    map<string,size_t> word_count;              //默认初始化字典
    set<stirng> exclude={"The","But","And"};    //列表初始化集合
    string word;
    while(cin>>word)
        if(exclude.find(word)==exclude.end())   //在集合中查找元素,返回迭代器若为end则未找到
            ++word_count[word];
    
    • set是模板,使用时必须在模板参数中指定元素类型
    • 可以对关联容器(set和map都可)做列表初始化
    • set的find方法返回一个迭代器,若给定关键字在set中则返回指向它的迭代器,否则返回end

    关联容器概述

    • 所有关联容器都支持表9.2中的通用容器操作,但不支持顺序容器特有的操作
    • 关联容器的迭代器都是双向迭代器

    定义关联容器

    • 定义map时需在模板参数中给出key和value的类型,定义set时需在模板参数中给出关键字类型
    • 定义关联容器的4种方法:
      • 关联容器都有默认构造函数,生成空容器
      • 可将关联容器初始化为另一个同类型容器的拷贝
      • 可用元素范围初始化关联容器,只要这些元素可转换为关联容器所需类型
      • C++11允许对关联容器使用值初始化(列表初始化
    • 对map做列表初始化时,每个元素也是一个花括号列表,其中包含两个值
    • map和set的关键字必唯一,但multimap和multiset允许多个元素有相同关键字

    关键字类型的要求

    • set的关键字就是元素,map的关键字是元素的first成员
    • 对于有序关联容器(map、multimap、set、multiset),关键字类型必须有序,默认使用元素类型的<算符。
    • 可提供自定义操作代替<算符,要求自定义操作在关键字类型上定义严格弱序
      • 两关键字不能同时“小于等于”对方
      • “小于等于”具有传递性
      • 若两关键字都不“小于等于”对方,则称为“等价”,“等价”具有传递性
    • 若两关键字等价,则关联容器认为它们相等。用作map的key时,只能有一个value与这两个key关联,用任一个key访问都得到这个value
    • 若使用自定义的严格弱序函数,则定义关联容器时,必须在模板参数中给出该函数指针类型,在构造函数参数中给出该函数
    • 例子:自定义严格弱序
    1
    2
    3
    4
    5
    6
    
    //定义严格弱序
    bool compareIsbn(const Sales_data &lhs, const Sales_data &rhs){
        return lhs.isbn()<rhs.isbn();
    }
    using SalesSetType=multiset<Sales_data,decltype(compareIsbn) *>;    //自定义了严格弱序的multiset类型
    SalesSetType bookstore(compareIsbn);                                //自定义了严格弱序的multiset对象
    

    pair类型

    • pair类型定义于utility头文件中
    • 一个pair保存两个public的数据成员,分别叫first和second
    • pair是模板,创建时需在模板参数中指定两个数据成员的类型
    • pair的默认构造函数对数据成员做值初始化
    • pair的操作在表11.2 tab_11_2
    • 可用make_pair函数和auto来创建pair,其类型由传入make_pair的实参(即pair的两个成员)推出
    • C++11中可用返回值做列表初始化
    • 例子:返回值做列表初始化
    1
    2
    3
    4
    5
    6
    
    pair<string int> process(vector<string> &v){
        if(!v.empty())
            return {v.back(),v.back().size()};  //列表初始化返回值
        else
            return pair<string,int>();          //隐式构造返回值
    }
    

    关联容器操作

    • 关联容器独有的类型别名见表11.3 tab_11_3
    • 对于set,其key_typevalue_type都是元素类型,即关键字类型。它没有mapped_type
    • 对于map,其key_type是关键字类型,mapped_type是值类型,value_type是key-value对的pair类型
    • 不可改变关键字,故关键字类型都是const:
      • set的key_typevalue_type都是const
      • map的key_typevalue_type.first都是const
    • 使用这些类型别名时,需用作用域指明容器类型,例如map<string,int>::key_type

    关联容器迭代器

    • 迭代器解引用
      • 解引用关联容器迭代器时,得到一个类型为容器的value_type的引用。
      • set迭代器解引用得到的都是关键字引用,故都是常量引用。虽然同时存在iterator和const_iterator类型,但都不可写
      • map迭代器解引用得到的是pair的引用,first为const。其iterator可写second,const_iterator不可写
    • map和set都有beginend成员函数,可得到迭代器用于遍历元素
    • 关联容器很少使用泛型算法
      • 通常不对关联容器使用泛型算法。因为关键字是const,元素不可改变也不可重排。
      • 关联容器只可使用只读算法,但这些算法在关联容器中搜索时效率低下。例如用关联容器的find成员函数泛型find函数快得多
      • 如果真要对关联容器使用泛型算法,则只能把它当源序列,或当目的位置用inserter插入

    添加元素

    • 关联容器的insert成员函数向容器中添加一个元素或元素范围
    • 关联容器的insert/emplace操作见表11.4 tab_11_4
    • 对于无重复关键字的map和set,若插入元素的key在容器中已存在,则插入失败,insert不做任何事
    • insert有两个版本
      • 接受一对迭代器,这些迭代器指向的类型可转为该容器的value_type
      • 接受initializer_list,即花括号列表,该列表用于构造一个value_type
    • 例子:对map进行insert的4种方法
    1
    2
    3
    4
    
    word_count.insert({word,1});                                //花括号列表转为initializer_list
    word_count.insert(make_pair(word,1));                       //make_pair函数生成pair
    word_count.insert(pair<string,size_t>(word,1));             //显式构造pair
    word_count.insert(map<string,size_t>::value_type(word,1));  //显式构造value_type
    
    • insert/emplace的返回值依赖于容器类型和参数
    • 向set/map添加单一元素,则insert/emplace返回一个pair,其first为迭代器,second为bool。
      • 若关键字不在容器中,则插入。first指向插入的元素,second为true
      • 若关键字在容器中,则插入失败。first指向给定元素,second为false
    • 向multiset/multimap添加单一元素,总是插入成功,insert/emplace返回一个迭代器指向插入的元素
    • 例子:对map做insert
    1
    2
    3
    4
    5
    6
    7
    8
    
    map<string,size_t> word_count;
    string word;
    while(cin>>word){
        //ret的类型是pair<map<string,size_t>::iterator,bool>
        auto ret=word_count.insert({word,1});   //尝试插入关键字和初始计数值1
        if(!ret.second)                         //如果插入失败,说明关键字已存在,只需将值递增
            ++ret.first->second;                //ret.first指向插入的元素,其second是值
    }
    

    删除元素

    • 关联容器定义了3个版本的erase,如表11.5 tab_11_5
    • 关联容器的特殊erase操作:可提供一个关键字,删除与其相关的所有元素,并返回删除元素的数量。对于关键字不重复的容器,erase总返回0或1

    map的下标操作

    • map和unordered_map的下标操作如表11.6: tab_11_6
    • 只适用于关键字不可重复的map容器:
      • map和unordered_map都有下标算符和at函数
      • multimap和unordered_multimap都不支持下标,因为一个关键字可能有多个值
      • 所有的set类型都不支持下标,因为没有值
    • map/unordered_map下标接受一个关键字,访问与其关联的值。若关键字不在容器中,则创建元素插入容器,关联值进行值初始化
    • 例子:map用下标插入元素时值初始化为0
    1
    2
    3
    4
    5
    6
    7
    
    map<string,size_t> word_count;
    word_count["Anna"]=1;
    /*上一行的操作步骤:
     *1、容器中搜索关键字"Anna",未找到
     *2、创建新key-value对,key是const string,value被值初始化为0
     *3、提取新插入的元素,为其赋值为1
     */
    
    • 由于下标可能插入新元素,故只可对非const的map/unordered_map使用下标
    • 通常解引用迭代器和下标返回的类型一样,但map/unordered_map不一样,它们解引用迭代器得到value_type,下标得到mapped_type
    • map的下标返回左值

    访问元素

    • 在关联容器中查找元素的方法如表11.7 tab_11_7
    • find判断一个关键字是否在容器中,若在则返回指向第一个key相同的元素的迭代器,否则返回end
    • count返回容器中有多少个相同的给定关键字
    • 查找时应用find而不是下标,因为下标的副作用会导致元素未找到时插入,即改变容器
    • 若multiset/multimap中有重复关键字,则它们相邻存放,因此可找到第一个,然后递增迭代器
    • lower_boundupper_bound成员函数查找范围:
      • 若给定关键字在容器中,则lower_bound返回第一个匹配元素的迭代器,upper_bound返回最后一个匹配元素之后的迭代器
      • 若给定关键字不在容器中,则lower_bound和upper_bound都返回指向第一个大于该关键字的元素的迭代器,该位置称为安全插入点,即在此处insert该关键字可保持容器中关键字的顺序
      • lower_bound和upper_bound都不支持无序容器
    • equal_range成员函数相当于用同样的关键字调用lower_bound和upper_bound,它返回一个迭代器pair。
      • 若关键字在容器中,则first是指向第一个匹配元素的迭代器,second是指向最后一个匹配元素之后的迭代器
      • 若关键字不在容器中,则返回指向第一个大于该关键字的元素的迭代器,即安全插入点
    • 例子:关联容器查找元素
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    
    multimap<string,string> authors;
    authors.insert({"Barth, John","Sot-Weed Factor"});
    authors.insert({"Barth, John","Lost in the Funhouse"});
    string search_item("Alain de Botton");
    //法1:用find查找迭代器,count计数
    auto entries=authors.count(search_item);
    auto iter=authors.find(search_item);
    while(entries){
        cout<<iter->second<<endl;
        ++iter;
        --entries;
    }
    //法2:用lower_bound和upper_bound查找范围
    for(auto beg=ahthors.lower_bound(search_item),end=ahthors.upper_bound(search_item);
        beg!=end;++beg)
        cout<<beg->second<<endl;
    //法3:用equal_range查找范围
    for(auto pos=authors.equal_range(search_item);
        pos.first!=pos.second;++pos.first)
        cout<<pos.first->second<<endl;
    

    一个单词转换的map

    • 例子:给定缩写对照表和需要转换的文本,输出转换后的文本
      //缩写对照表示例:
      brb be right back
      k okay?
      y why
      r are
      u you
      pic picture
      thk thanks!
      l8r later
      //要转换文本示例:
      where r u
      y dont u send me a pic
      k thk l8r
      //转换后的文本:
      where are you
      why dont you send me a picture
      okay? thanks! later
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    
    //读取对照表,存为字典
    map<string,string> buildMap(ifstream &map_file){
        map<string,string> trans_map;
        string key,value;
        while(map_file>>key && getline(map_file,value)) //利用&&的执行顺序,先读一个单词,再取剩下的一行
            if(value.size()>1)                          //若转换规则存在
                trans_map[key]=value.substr(1);         //取子串,忽略getline读到的第一个空格
            else
                throw runtime_error("no rule for "+key);
        return trans_map;
    }
    //转换单个词语
    const string &transform(const string &s, const map<string,string> &m){
        auto map_it=m.find(s);  //在字典中查找
        if(map_it!=m.cend())    //不等于end则查找到
            return map_it->second;
        else
            return s;
    }
    //读取对照表和输入,打印输出
    void word_transform(ifstream &map_file, ifstream &input){
        auto trans_map=buildMap(map_file);          //对照表生成字典
        string text;
        while(getline(input,text)){                 //逐行处理
            istringstream stream(text);             //一行字符串作为一个流处理
            string word;
            bool firstword=true;
            while(stream>>word){                    //逐个单词处理
                if(firstword)   firstword=false;    //如果不是第一个单词,则输出之前打印空格
                else            cout<<" ";
                cout<<transform(word,trans_map);    //转换单词
            }
            cout<<endl;
        }
    }
    

    无序容器

    • C++11定义了4个无序关联容器,它们组织元素的方式不是关键字的序,而是哈希函数==算符
    • 使用无序容器的情形:
      • 关键字不存在序
      • 维护关键字的序代价较高
    • 无序容器在存储上组织为一组,每个桶中保存0个或多个元素。即,层次化的存储
    • 无序容器使用一个哈希函数,将关键字映射到桶。访问元素时先计算关键字的哈希值来判断在哪个桶中,再在桶内搜索。
    • 哈希值相同的关键字放在同一桶中,因此关键字相同的元素都在同一桶中
    • 无序容器的性能依赖于:哈希函数的质量、桶数量、桶大小
    • C++允许查询无序容器的状态,并可改变映射和存储的策略,管理桶的函数如表11.8: tab_11_8
    • 默认情况下,无序容器用关键字类型的==算符比较元素,用hash<key_type>类型的对象来生成元素的哈希值。
    • 标准库为内置类型(包括指针)string智能指针提供了hash函数,因此可直接定义这些类型为无序容器的关键字
    • 无序容器可使用自定义的==算符和哈希函数,只需在模板参数中给出函数指针类型,并在构造函数参数中给出函数指针即可
    • 对于有==算符的类型,可以只自定义哈希函数
    • 例子:自定义==算符和哈希函数
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    
    //定义哈希函数
    size_t hasher(const Sales_data &sd){
        return hash<string>()(sd.isbn()); //用一个成员的哈希作为该类的哈希
    }
    //定义==算符
    bool eqOp(const Sales_data &lhs, const Sales_data &rhs){
        return lhs.isbn()==rhs.isbn(); //用一个成员的==算符作为该类的==算符
    }
    //使用自定义的哈希函数和==算符定义类型并初始化
    using SD_multiset=unordered_multiset<Sales_data, decltype(hasher) *, decltype(eqOp) *>;
    SD_multiset bookstore(42,hasher,eqOp);
  • 相关阅读:
    最大公约数与最小公倍数
    素数筛
    基础数学问题
    考试前打模板
    斐波那契公约数
    期望及期望dp
    状压dp总结
    树链剖分学习
    B君的教育
    [noip2016]愤怒的小鸟
  • 原文地址:https://www.cnblogs.com/updown/p/14280955.html
Copyright © 2011-2022 走看看