zoukankan      html  css  js  c++  java
  • C++string中有关字符串内容修改和替换的函数浅析

    1.assign()

    原型:

    //string (1)
    basic_string& assign (const basic_string& str);
    //substring (2)
    basic_string& assign (const basic_string& str, size_type subpos, size_type sublen);
    //c-string (3)
    basic_string& assign (const charT* s);
    //buffer (4)
    basic_string& assign (const charT* s, size_type n);
    //ill (5)
    basic_string& assign (size_type n, charT c);
    //range (6)
    template <class InputIterator>
       basic_string& assign (InputIterator first, InputIterator last);
    
     

    ps:charT是类模板basic_string的第1个参数,指定了字符串中字符的类型。用char实例化basic_string,得到string(可参考在下的“C++ string到底是什么”)。所以, 在string中,charT就是char。

    示例:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        string str1("123456");
        string str = "123456789";
        char* str2 = "abcdef";
        str.assign(str1);
        cout << str << endl;//123456   可见执行assign()后,str将被重写
        str.assign(str1, 2, 3);
        cout << str << endl;//345   从位置2开始的3个字符
        str.assign(str1, 1, 20);//超出范围
        cout << str << endl;//23456
        cout << str.length() << endl;//5 可见没有空格
        str.assign(str1, 2, str1.npos);//后面介绍npos
        cout << str << endl;//3456   从位置2到末尾的字符给str
        str.assign(5, 'X');
        cout << str << endl;//XXXXX
        str.assign(str1.begin(), str1.end() - 1);
        cout << str << endl;//12345 从开头到结尾-1(即倒数第个字符)
        //str.assign(str1.begin() + 4, str1.end() - 4);//不能反着来,即试图将以str1.begin() + 4(5)开头,以str1.end() - 4(2)结尾的5432给str是不行的
        //cout << str << endl;                         //这样会出现运行时错误
        str.assign(str1.begin() + 2, str1.end() - 3);//前后指向同一字符(3),这样可以
        cout << str << endl;//3
        str.assign(str1.begin() + 2, str1.end() - 4);//这个却可以
        cout << str << endl;//空行
        cout << str.length() << endl;//0
        str.assign("abcdefg", 6);
        cout << str << endl;//abcdef 将abcdefg的前6个字符给str
        str.assign("abcdefg", 20);//超出范围
        cout << str << endl;//abcdefg+乱码
        cout << str.length() << endl;//10   说明将"abcdefg+3个空格"给了str
        str.assign(3, 0x41);
        cout << str << endl;//AAA   可以使用16进制的ASCII码 0x41换成10进制是65,是A的ASCII码
        str.assign(str2);
        cout << str << endl;//abcdef 
        str.assign(str2, 2, 3);
        cout << str << endl;//cde   对char*型也可以
        return 0;
    }

    以上代码中有一句
    str.assign(str1, 2, str1.npos);
    这里我们解释npos:
    它的定义如下:
    std::string::npos
    static const size_t npos = -1;
    它是size_t类型的最大值,有些编译器也将它置为string对象的最大容量(按字节算,包括''),而有些编译器不是,我们在后边将会看到。
    为什么是最大呢?
    -1用反码存储(32位),就是32个1,而size_t是无符号整型,所以,32个1的2进制转化为10进制就是2的32次方-1,即4294967295。
    看下面一段验证代码:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        string str1 = "123456789";
        cout << str1.npos << endl;//4294967295
        cout << (str1.npos == -1) << endl;//1
        cout << str1.max_size() << endl;//4294967294   1073741820(=2^30-4)
        return 0;
    }

    其中,4294967294是VS2013上的结果,可见max_size()不包括'',1073741820是CodeBlocks12.11上的结果。
    由此,我们可知,str.assign(str1, 2, str1.npos);等价于str.assign(str1, 2, 4294967294);

    另外,在C++11中,还有两个重载的assign()函数,它们的原型分别是:

    //initializer list(7)
    basic_string& assign (initializer_list<charT> il);
    //move (8)
    basic_string& assign (basic_string&& str) noexcept;

    其中,(7)与list容器有关,而(8)与右值引用和移动语义有关,这里我们暂不详述。
    对于(8)中的noexcept关键字,它声明了函数不会抛出异常(当然函数不是真的就永远都不会抛出异常,比如该函数A(声明为noexcept)中调用了另一个函数B,而函数B中有抛出异常语句,那么,当我们调用函数A是,就可能抛出异常),由于noexcept不是本文的重点,这里我们不详述,有兴趣的读者可以自行查阅资料了解学习相关内容。

    2.swap()

    原型:void swap (basic_string& str);
    只有这一个,要交换就交换整个字符串,这里没有针对子串的操作。
    不举例。

    3.erase()

    原型:

    //sequence (1)
    basic_string& erase (size_type pos = 0, size_type len = npos);
    //character (2)
         iterator erase (iterator p);
    //range (3)
         iterator erase (iterator first, iterator last);

    说明:
    注意到basic_string& erase (size_type pos = 0, size_type len = npos);给出了默认参数,这样,我们在使用该函数时,就可以省略第2个参数,效果是删除从第1个参数所指位置(包括该位置)起的所有字符(正如下边示例中有关str3的操作和输出)。原因是len=npos,而npos一定大于string对象的最大长度。

    示例:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        string str1("123456789");
        string str2("123456789");
        string str3("123456789");
        string str4("123456789");
        string str5("123456789");
        string str6("123456789");
        string str7("123456789");
        string str8("123456789");
        str1.erase(2, 3);
        cout << str1 << endl;//126789
        str2.erase(2, 10); cout << endl;//空行
        str3.erase(7);//注意这里的参数值不能超过str3.length(),否则会出现运行时错误等于是输出空行,相当于删除''及其后面的(当然后面什么也没有,
                      //因为''已经是最后一个)
        cout << str3 << endl;//1234567   当省略第2个参数时,删除第1个参数所指位置起(即包括该位置)的所有字符
        //str4.erase(10, 5);//这么做不行
        //cout << str4 << endl;
        str4.erase(str4.begin());
        cout << str4 << endl;//23456789
        str5.erase(str5.begin() + 2);
        cout << str5<< endl;//12456789
        //str6.erase(str6.begin() + 10);//这么做不行
        //cout << str6 << endl;
        str6.erase(str6.end() - 2);
        cout << str6 << endl;//12345679
        //str7.erase(str7.end() - 10);//这么做不行
        //cout << str7 << endl;
        str7.erase(str7.begin()+2,str7.end()-2);
        str7.erase(str7.begin() + 2, str7.end() - 2);
        cout << str7 << endl;//1289   删除从str7.begin()+2(包括str7.begin()+2)到str7.end() - 2(包括str7.end() - 2)的所有字符
        //str8.erase(str8.begin() + 7, str8.end() - 5);//这么做不行
        //cout << str8 << endl;
        return 0;
    }

     4.clear()

    原型:

    void clear() noexcept;

    作用:
    删除字符串的所有内容。

    示例:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        string str("123456789");
        str.clear();
        cout << str << endl;//空行
        cout << str.length() << endl;//0
        return 0;
    }

     5.insert()

    原型:

    //string (1)
    basic_string& insert (size_type pos, const basic_string& str);
    //substring (2)
    basic_string& insert (size_type pos, const basic_string& str,
                          size_type subpos, size_type sublen);
    //c-string (3)
    basic_string& insert (size_type pos, const charT* s);
    //buffer (4)
    basic_string& insert (size_type pos, const charT* s, size_type n);
    //fill (5)
    basic_string& insert (size_type pos,   size_type n, charT c);
         iterator insert (const_iterator p, size_type n, charT c);
    //single character (6)
         iterator insert (const_iterator p, charT c);
    //range (7)
    template <class InputIterator>
         iterator insert (iterator p, InputIterator first, InputIterator last);
    //initializer list (8)
    basic_string& insert (const_iterator p, initializer_list<charT> il);

    说明:
    1)原型(8)与list容器有关,是C++11新标准,这里赞不详述。
    2)以上原型中出现的返回值和参数有iterator和InputIterator与迭代器有关,这里也暂不详述,可以将其简单地理解为指针,begin()和end()的返回值与它们匹配。

    示例:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
       /*
        *测试basic_string& insert (size_type pos, const basic_string& str);
       */
        string st1("123456789");
        //string st2("123456789");
        string str1("abc");
        st1.insert(3, str1);
        cout << st1 << endl;//123abc456789   注意是在pos所指位置前插入
        //st2.insert(10, str1);//超出范围
        //cout << st2 << endl;//不可以
        /*
        **测试basic_string& insert (size_type pos, const basic_string& str,size_type subpos, size_type sublen);
        */
        string st2("123456789");
        string st3("123456789");
        string str2("abcdefg");
        st2.insert(3, str2, 2, 3);
        cout << st2 << endl;//123cde456789
        st3.insert(3, str2, 4, 9);//超出范围
        cout << st3 << endl;//123efg456789   可见如果超出字符串的长度,则一直到字符串的最后,不补空格
        /*
        **测试basic_string& insert (size_type pos, const charT* s);
        */
        string st4("123456789");
        string st5("123456789");
        char* str3 = "abc";
        st4.insert(3, str3);
        cout << st4 << endl;//123abc456789
        st5.insert(3, "abc");
        cout << st5 << endl;//123abc456789
        /*
        **测试basic_string& insert (size_type pos, const charT* s, size_type n);
        */
        string st6("123456789");
        string st7("123456789");
        st6.insert(3, "abcdefg", 3);//n可以为0,为0时什么也不加 当n为负值时会出现运行时错误
        cout << st6 << endl;//123abc456789
        st7.insert(3, "abcdefg", 20);//超出范围
        cout << st7 << endl;//123abcdefg i n v a l i 456789  调大n值(如500)进行测试,发现中间多出来的是报错的语句和乱码,且每次运行的输出可能不一样
                            //CodeBlocks12.11上中间直接就是乱码
        /*
        **测试basic_string& insert (size_type pos,   size_type n, charT c);  和  iterator insert (const_iterator p, size_type n, charT c);
        */
        string st8("123456789");
        string st9("123456789");
        st8.insert(3, 2, 'a');
        cout << st8 << endl;//123aa456789
        st9.insert(st9.begin() + 3, 2, 'a');
        cout << st9 << endl;//123aa456789
        /*
        **测试iterator insert (const_iterator p, charT c);
        */
        string ss1("123456789");
        ss1.insert(ss1.begin()+3, 'a');//由原型知,这里不能将ss1.begin()+3改为3
        cout << ss1 << endl;//123a456789
        /*
        **测试template <class InputIterator>
        **    iterator insert (iterator p, InputIterator first, InputIterator last);
        */
        string ss2("123456789");
        string str4("abcdefg");
        ss2.insert(ss2.begin() + 3, str4.begin(), str4.begin()+3);//超出范围会出现运行时错误
        cout << ss2 << endl;//123abc456789
        return 0;
    }

     6.append()

    原型:

    //string (1)
    basic_string& append (const basic_string& str);
    //substring (2)
    basic_string& append (const basic_string& str, size_type subpos, size_type sublen);
    //c-string (3)
    basic_string& append (const charT* s);
    //buffer (4)
    basic_string& append (const charT* s, size_type n);
    //fill (5)
    basic_string& append (size_type n, charT c);
    //range (6)
    template <class InputIterator>
    basic_string& append (InputIterator first, InputIterator last);
    //initializer list(7)
    basic_string& append (initializer_list<charT> il);

    (7)不详述。
    示例:

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        /*
        **测试basic_string& append (const basic_string& str);
            */
        string st1("123456789");
        string str1("abc");
        string& ss = st1.append(str1);
        cout << ss << endl;//123456789abc
        cout << st1 << endl;//123456789abc
        /*
        **测试basic_string& append (const basic_string& str, size_type subpos, size_type sublen);
            */
        string st2("123456789");
        string st3("123456789");
        string str2("abcdefg");
        st2.append(str2, 2, 3);
        cout << st2 << endl;//123456789cde
        st3.append(str2, 3, 20);//超出范围
        cout << st3 << endl;//123456789defg    当用数字表示范围时,若超出范围,则直到字符串的结尾,不会补空格,也不会出现运行时错误
        cout << st3.length() << endl;//13      尽管如此,在实际编程时,也必须保证不超范围
        /*
        **测试basic_string& append (const charT* s);
            */
        string st4("123456789");
        st4.append("abc");
        cout << st4 << endl;//123456789abc
        /*
        **测试basic_string& append (const charT* s, size_type n);
        */
        string st5("123456789");
        st5.append("abc", 5);//超出范围
        cout << st5 << endl;//123456789abc+乱码
        /*
        **测试basic_string& append (size_type n, charT c);
        */
        string st6("123456789");
        st6.append(3, 0x41);//可以用16进制的ASCII码
        cout << st6 << endl;//123456789AAA
        /*
        **测试template <class InputIterator>
        **basic_string& append (InputIterator first, InputIterator last);
        */
        /*
        string st7("123456789");
        string str3("abcdefg");
        st6.append(str3.begin() + 2, str3.begin() + 10);//超出范围
        cout << st7 << endl;//当使用迭代器时,若超出范围,则会出现运行时错误
        */  
        return 0;
    }

     7.replace()

    原型:

    //string (1)
    basic_string& replace (size_type pos,     size_type len,     const basic_string& str);
    basic_string& replace (const_iterator i1, const_iterator i2, const basic_string& str);
    //substring (2)
    basic_string& replace (size_type pos, size_type len, const basic_string& str,
                           size_type subpos, size_type sublen);
    //c-string (3)
    basic_string& replace (size_type pos,     size_type len,     const charT* s);
    basic_string& replace (const_iterator i1, const_iterator i2, const charT* s);
    //buffer (4)
    basic_string& replace (size_type pos,     size_type len,     const charT* s, size_type n);
    basic_string& replace (const_iterator i1, const_iterator i2, const charT* s, size_type n);
    //fill (5)
    basic_string& replace (size_type pos,     size_type len,     size_type n, charT c);
    basic_string& replace (const_iterator i1, const_iterator i2, size_type n, charT c);
    //range (6)
    template <class InputIterator>
      basic_string& replace (const_iterator i1, const_iterator i2,
                           InputIterator first, InputIterator last);
    //initializer list (7)
    basic_string& replace (const_iterator i1, const_iterator i2, initializer_list<charT> il);

    (7)不详述
    示例:(这里仅给出部分原型的测试,其它的读者可参照前面几个函数的实例自行测试)

    #include<iostream>
    #include<string>
    
    using namespace std;
    
    int main()
    {
        /*
        **测试basic_string& replace (size_type pos,     size_type len,     const basic_string& str);
        */
        string st1("123456789");
        string str1("abcde");
        string str2("ab");
        st1.replace(2, 3, str1);//将位置2开始的3个字符(345)换成abcde
        cout << st1 << endl;//12abcde6789
        string st2("123456789");
        st2.replace(1, 7, str1);
        cout << st2 << endl;//1abcde9
        string st3("123456789");
        st3.replace(6, 9, str2);//超出范围
        cout << st3 << endl;//123456ab
        /*
        **测试basic_string& replace (const_iterator i1, const_iterator i2, const basic_string& str);
        */
        /*string st4("123456789");
        st4.replace(st4.begin() + 8, st4.begin() + 10, str1);   //迭代器超范围,出现运行时错误
        cout << st4 << endl;*/
        /*
        **测试basic_string& replace (size_type pos,     size_type len,     const charT* s, size_type n);
        */
        string st5("123456789");
        st5.replace(2, 3, "abcdefg", 5);
        cout << st5 << endl;//12abcde6789
        string st6("123456789");
        st6.replace(2, 3, "abc", 20);//超出范围
        cout << st6 << endl;//12abc+乱码+6789   对于char*类型,若超出范围,就会出现乱码
        return 0;
    }

    以上各函数的原型及参数的意义大同小异,读者可以触类旁通。现结合以上各示例,对“超出范围”这一特殊情况给出一般性的规律总结:
    1.对于string类型,用数字表示范围,超出时,自动截止到字符串的末尾,不会补空格,不会有乱码,也不会出现运行时错误。
    2.对于string类型,用迭代器表示范围,超出时,出现运行时错误。
    3.对于char*类型,用数字表示范围(只能用数字表示,char*是基本类型,没有迭代器),超出时,会出现乱码。

  • 相关阅读:
    漫谈架构读书笔记
    软件架构怎样进行架构
    大型网站技术架构阅读笔记6
    beta里程碑总结
    团队总结
    用户体验
    小强大扫荡
    团队测试计划
    团队第二次冲刺第十天
    团队第二次冲刺第九天
  • 原文地址:https://www.cnblogs.com/zpcdbky/p/4464170.html
Copyright © 2011-2022 走看看