zoukankan      html  css  js  c++  java
  • c++概念字符串操作 (转)

    本文转自:http://www.jb51.net/article/37410.htm

    一、char_traits 字符特征类 
    1)意义:包装特定串元素的通用行为界面,以便容器实现时依据特征信息而执行特定行为 
    2)定义了通用类型名 

    typedef _Elem char_type; 
    typedef int int_type; 
    typedef streampos pos_type; 
    typedef streamoff off_type; 
    typedef mbstate_t state_type; 

    其中 int_type 表示字符元素转换到特定编码时的整型表示,pos_type, off_type 分别作为字符串索引和字符串元素偏移的类型,类似容器迭中的指针,迭代类型和指针,迭代器的偏移类型。最后的 state_type 用于存储流状态,如出错,格式控制等等。 

    3)定义了字符 / 字符串操作的包装界面,以便通用算法的调用 

    assign(a, b) 定义将 b 字符赋值给 a 字符的过程,实现 a.operator = 的行为 
    eq(a, b) 定义 a 字符和 b 字符的相等关系,实现 a.operator == 的行为 
    lt(a, b) 定义 a 小于 b 的关系,实现 a.operator < 的行为 
    compare(a_ptr, b_ptr, cnt) 定义两组字符串的比较,返回 int 类型,实现类似 memcmp 的行为 
    length(ptr) 定义取字符串长度,实现类似 strlen 的行为 
    copy(a_ptr, b_ptr, cnt) 定义两组字符串的复制,实现类似 memcpy 的行为 
    move(a_ptr, b_ptr, cnt) 定义两组字符串的不重叠复制,实现类似 memmove 的行为 
    assign(ptr, cnt, ch) 定义了填充字符串的过程,实现类似 memset 的行为 
    to_int_type(ch) 定义了 char_type 到 int_type 整型的转换过程 
    to_char_type(n) 定义了 int_type 到 char_type 字符型的转换过程 
    eq_int_type(a, b) 定义两个和当前 char_type 类型对应的 int_type 的相等关系 
    eof() 定义字符串结尾符,使用整型表示 
    not_eof(n) 定义非字符串结尾符,若输入结尾符,则返回 1,其他输入返回原值,即总是不返回 eof() 

    4)int_type 类型应是当前字符类型的整型编码 

     

    二、std::string 并不是序列容器,没有 front() 和 back() 界面用于取出前端和尾端的元素,使用 std::string::operator [] 并传递 streampos 类型取得特定元素,如 std::string::size() - 1 作为索引取得最后一个字符 


    三、basic_string 支持的初始化 
    1)默认初始化 
    2)分配器 
    3)复制构造 
    4)局部复制 [_Roff, _Roff + _Count) 
    5)局部复制 + 分配器 
    6)C 字符串 [_Ptr, <null>) 
    7)C 字符串 + _Count [_Ptr, _Ptr + _Count) 
    8)C 字符串 + 分配器 
    9)C 字符串 + _Count + 分配器 [_Ptr, _Ptr + _Count)

    10)_Count * _Ch 
    11)_Count * _Ch + 分配器 
    12)迭代器 [_ItF, _ItL) 
    13)迭代器 + 分配器 

    字符到串不能初始化,但支持 operator = 赋值和 operator += 累加赋值运算。 

     

    四、字符串的区间有效性 
    对串的索引访问在超过字符串的有效区间时,因为串的在实现上对内置的字符缓冲区执行下标访问,所以不会导致异常,但是将得到不可预知的结果,通常是不可用的。
    将其他字符串作为右值输入时,对该串取出计数大于串大小时按串大小计算。 
    std::basic_string::size_type 的实际类型为 size_t,在 Visual C++ 7.1 中实现为 unsigned,std::basic_string::npos 被静态设定为 

    (basic_string<_Elem, _Traits, _Alloc>::size_type)(-1); 

    在查找子字符串等操作时,函数返回 npos 的值表示非法索引。 


    五、比较字符串 
    允许的比较对象 
    1)compare(s2) 其他同类型字符串 
    2)compare(p) C 风格字符串 
    3)compare(off, cnt, s2) [off, off + cnt) 同 s2 执行比较 
    4)compare(off, cnt, s2, off2, cnt2) [off, off + cnt) 同 s2 [off2, cnt2) 执行比较 
    5)compare(off, cnt, p) [off, off + cnt) 同 [p , <null>) 执行比较 
    6)compare(off, cnt, p, cnt2) [off, off + cnt) 同 [p, p + cnt2) 执行比较 

    返回 -1, 0, 1 作为小于、等于和大于的比较结果。 

     

    六、附加数据 
    1)使用 operator += 接受其他字符串,C 风格字符串和字符 
    2)使用 push_back() 在尾部附加字符,并使得通过字符串构造的 back_iterator 可以访问 
    3)append() 附加 
            1、append(s) 追加字符串 
            2、append(s, off, cnt) 追加字符串 s [off, off + cnt) 
            3、append(p) 追加字符串 [p, <null>) 
            4、append(p, cnt) 追加字符串 [p, p + cnt) 
            5、append(n, c) 填充 n * c 
            6、append(InF, InL) 追加输入流 [InF, InL) 

    4)insert() 插入 
            1、insert(off, s2) 插入字符串 
            2、insert(off, s2, off2, cnt2) 插入字符串 s [off2, off2 + cnt2) 
            3、insert(off, p) 插入字符串 [p, <null>) 
            4、insert(off, p, cnt) 插入字符串 [p, p + cnt)

            5、insert(off, n, c) 插入 n * c 
            6、insert(iter) 元素默认值填充 
            7、insert(iter, c) 插入特定元素 
            8、insert(iter, n, c) 插入 n*c 
            9、insert(iter, InF, InL) 插入 [InF, InL) 

    5)operator +(a, b) 
    字符串关联运算符重载中支持 operator + 的形式 
            1、s + s 
            2、s + p 
            3、s + c 
            4、p + s 
            5、c + s 

     

    七、查找、替换和清除 
    1)find() 查找 
            1、find(c, off) 在 s [off, npos) 中查找 c 
            2、find(p, off, n) 在 s [off, npos) 中查找 [p, p + n) 
            3、find(p, off) 在 s [off, npos) 中查找 [p, <null>) 
            4、find(s2, off) 在 s [off, npos) 中查找 s2 

    2)find() 的变种 
            1、rfind() 具有 find() 的输入形式,反序查找 
            2、find_first_of() 具有 find() 的输入形式,返回第一个匹配的索引 
            3、find_last_of() 具有 find() 的输入形式,返回倒数第一个匹配的索引 
            4、find_first_not_of() 具有 find() 的输入形式,返回第一个不匹配的索引 
            5、find_last_not_of() 具有 find() 的输入形式,返回倒数第一个不匹配的索引 

    3)replace() 替换 
            1、replace(off, cnt, s2) 将 s [off, off + cnt) 替换成 s2 
            2、replace(off, cnt, s2, off2, cnt2) 将 s [off, off + cnt) 替换成 s2 [off2, off2 + cnt2)
            3、replace(off, cnt, p) 将 s [off, off + cnt) 替换成 [p, <null>) 
            4、replace(off, cnt, p, cnt2) 将 s [off, off + cnt) 替换成 [p, p + cnt2)

            5、replace(off, cnt, n, c) 将 s [off, off + cnt) 替换成 c * n 

    使用迭代器的情况: 
            6、replace(InF, InL, s2) 将 [InF, InL) 替换成 s2 
            7、replace(InF, InL, p) 将 [InF, InL) 替换成 [p, <null>) 
            8、replace(InF, InL, p, cnt) 将 [InF, InL) 替换成 [p, p + cnt) 
            9、replace(InF, InL, n, c) 将 [InF, InL) 替换成 n * c 
            10、replace(InF, InL, InF2, InL2) 将 [InF, InL) 替换成 [InF2, InL2) 

    4)erase() 删除 
            1、erase(off, cnt) 从字符串 s 中删除 s [off, off + cnt) 
            2、erase(iter) 从字符串 s 中删除 *iter 
            3、erase(ItF, ItL) 从字符串 s 中删除 [ItF, ItL) 

     

    八、取出字符串 
    1)取得 C 风格字符串 
    c_str() 返回常量类型的 C 风格字符串指针,copy(ptr, cnt, off = 0) 则将指定大小的字符串复制到特定指针。data() 在 Visual C++ 7.1 中仅仅调用了 c_str() 实现。 
    2)取得子字符串 
    substr(off, cnt) 取得 s [off, off + cnt) 的副本。  
    3)复制子字符串 
    copy(p, off, cnt) 将 s [off, off + cnt) 复制到 p。 


    九、字符串的缓冲区管理 
    字符串具有类似 std::vector 的缓冲区管理界面。  
    size() 取得有效元素长度 
    max_size() 取得当前内存分配器能分配的有效空间 
    reserve() 为缓冲区预留空间 
    capacity() 取得缓冲区的容量 
    resize() 重设串的长度,可以为其指定初始化值 

     

      十、定义输入迭代器的尾端 
    向 istream_iterator 传递输入流对象以创建输入迭代器,输入迭代器持有输入流对象的指针,默认创建和读取流失败的情况下该指针被设置为 0。并且在实现输入迭代器间的 operator == 相等运算时,进行持有的流对象指针的相等比较,这样,默认创建的输入迭代器将被用于匹配输入流的结束。 

    * 当输入流读取失败,用户执行 if, while 条件判断时,实际上先将判断值转换成 void* 类型,或者根据 operator ! 运算符的返回结果,对输入流重载 operator void* 和 operator ! 运算符,可以定义输入流在布尔表达式中的行为,使得当流读取失败的情况下,输入迭代器可以通过布尔表达式来确认,而不是显式访问 fail() 成员函数. 

  • 相关阅读:
    201671010417 金振兴 词频统计软件项目报告
    201671010417 金振兴 实验三 作业互评与改进
    读构建之法提出的问题
    201671010422 结对项目报告
    201671010422 马亮 实验三作业互评与改进报告
    实验十四 个人学习总结
    201671010422 词频统计软件项目报告
    201671010423马丽莎 《英文文本统计分析》结对项目报告
    201671010423 词频统计软件项目报告
    201671010423马丽莎 实验三作业互评与改进报告
  • 原文地址:https://www.cnblogs.com/tshua/p/5730641.html
Copyright © 2011-2022 走看看