zoukankan      html  css  js  c++  java
  • C++常用字符串分割方法

    一、用strtok函数进行字符串分割

    原型: char *strtok(char *str, const char *delim);

    功能:分解字符串为一组字符串。

    参数说明:str为要分解的字符串,delim为分隔符字符串。

    返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。

    其它:strtok函数线程不安全,可以使用strtok_r替代。

    strtok内部记录上次调用字符串的位置,所以不支持多线程,可重入版本为strtok_r,有兴趣的可以研究一下。它适用于分割关键字在字符串之间是“单独”或是 “连续“在一起的情况。

    注意:因为函数内部会修改原字符串变量,所以传入的参数不能是不可变字符串(即不能是字符串常量区)。

    如 char *tokenremain ="abcdefghij"//编译时为文字常量,不可修改。

    strtok(tokenremain,"cde");

    strsep(&tokenremain,"cde");

    编译通过,运行时会报段错误。

    这种情况必须先把字符串赋值为可修改的变量。

    //借助strtok实现split
    #include <string.h>
    #include <stdio.h>
     
    int main()
    {
        char s[] = "Golden Global   View,disk * desk";
        const char *d = " ,*";
        char *p;
        p = strtok(s,d);
        while(p)
        {
            printf("%s
    ",p);
            p=strtok(NULL,d);  //注意这里,strtok内部记录了上次的位置
        }
     
        return 0;
    }

    还有strsep函数,自己百度一下例子。[http://www.cnblogs.com/longzhao1234/archive/2012/05/31/2528317.html]

    strsep返回值为分割后的开始字符串,并将函数的第一个参数指针指向分割后的剩余字符串。它适用于分割关键字在两个字符串之间只严格出现一次的情况。

    二、用STL进行字符串的分割

    涉及到string类的两个函数find和substr:
    1、find函数
    原型:size_t find ( const string& str, size_t pos = 0 ) const;
    功能:查找子字符串第一次出现的位置。
    参数说明:str为子字符串,pos为初始查找位置。
    返回值:找到的话返回第一次出现的位置,否则返回string::npos

    2、substr函数
    原型:string substr ( size_t pos = 0, size_t n = npos ) const;
    功能:获得子字符串。
    参数说明:pos为起始位置(默认为0),n为结束位置(默认为npos)
    返回值:子字符串

    #include <iostream>
    #include <string>
    #include <vector>
     
    //字符串分割函数
    std::vector<std::string> split(std::string str,std::string pattern)
    {
      std::string::size_type pos;
      std::vector<std::string> result;
      str+=pattern;//扩展字符串以方便操作
      int size=str.size();
     
      for(int i=0; i<size; i++)
      {
        pos=str.find(pattern,i);
        if(pos<size)
        {
          std::string s=str.substr(i,pos-i);
          result.push_back(s);
          i=pos+pattern.size()-1;
        }
      }
      return result;
    }
     
    int main()
    {
      std::string str;
      std::cout<<"Please input str:"<<std::endl;
      //std::cin>>str;
      getline(std::cin,str);
      std::string pattern;
      std::cout<<"Please input pattern:"<<std::endl;
      //std::cin>>pattern;
      getline(std::cin,pattern);//用于获取含空格的字符串
      std::vector<std::string> result=split(str,pattern);
      std::cout<<"The result:"<<std::endl;
      for(int i=0; i<result.size(); i++)
      {
        std::cout<<result[i]<<std::endl;
      }
     
      std::cin.get();
      std::cin.get();
      return 0;
    }

    三、用Boost进行字符串的分割

    用boost库的正则表达式实现字符串分割

    #include <iostream>
    #include <cassert>
    #include <vector>
    #include <string>
    #include "boost/regex.hpp"
     
    std::vector<std::string> split(std::string str,std::string s)
    {
        boost::regex reg(s.c_str());
        std::vector<std::string> vec;
        boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1);
        boost::sregex_token_iterator end;
        while(it!=end)
        {
            vec.push_back(*it++);
        }
        return vec;
    }
    int main()
    {
        std::string str,s;
        str="sss/ddd/ggg/hh";
        s="/";
        std::vector<std::string> vec=split(str,s);
        for(int i=0,size=vec.size();i<size;i++)
        {
            std::cout<<vec[i]<<std::endl;
        }
        std::cin.get();
        std::cin.get();
        return 0;
    }

    boost里面有自带的split的函数,如果用boost的话,还是直接用split的好

    #include <iostream>
    #include <string>
    #include <vector>
    #include <boost/algorithm/string/classification.hpp>
    #include <boost/algorithm/string/split.hpp>
      
    using namespace std;
      
    int main()
    {
     string s = "sss/ddd,ggg";
     vector<string> vStr;
     boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on );
     for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it )
      cout << *it << endl;
     return 0;
    }

    使用Boost库

    1)使用boost::split。根据字符来split,注意is_any_of的意思是集合中的任何一个,而不是equals的意思,那如何根据字符串split原字符串?请看2和3。

    #include <iostream>
    #include <vector>
    #include <string>
    #include <boost/algorithm/string.hpp>
    using namespace std;
    int main()
    {
        string str( "dfa&fda|dfdf");
        vector<string> tokens;
        boost::split(tokens, str, boost::is_any_of("&|"));   
        for (size_t i = 0; i < tokens.size(); ++ i)
        {
            cout << tokens[i] << endl;
        }
        return 0;
    }

    2) 使用boost::tokenize,注意 boost::char_separator<char>分隔符一样是集合的概念!但划分方法和boost::split不大一样,详看boost文档。

    #include <iostream>
    #include <vector>
    #include <string>
    #include <boost/tokenizer.hpp>
    using namespace std;
    int main()
    {
        string str("dfa||fda||dfdf");
        vector<string> tokens;
        boost::char_separator<char> sep("|");
        boost::tokenizer<boost::char_separator<char> > tok(str, sep);
        tokens.clear();
        std::copy(tok.begin(), tok.end(), std::back_inserter(tokens));   
        for (size_t i = 0; i < tokens.size(); ++ i)
        {
            cout << tokens[i] << endl;
        }
        return 0;
    }

    3)使用boost::regex

    #include <iostream>
    #include <vector>
    #include <string>
    #include <boost/regex.hpp>
    using namespace std;
    int main()
    {
        string str("dfa||fda||dfdf");
        vector<string> tokens;
        boost::regex reg("\|\|");
        boost::sregex_token_iterator it(str.begin(), str.end(), reg, -1);
        boost::sregex_token_iterator end;
        while (it!=end)
        {
            tokens.push_back(*it++);
        }
        for (size_t i = 0; i < tokens.size(); ++ i)
        {
            cout << tokens[i] << endl;
        }
        return 0;
    }
  • 相关阅读:
    BootStrap .row-cols 类的用法
    苹果手机浏览器$(document).on(“click”,function(){})点击无效的问题
    $("节点名").html("字符串")和$("节点名").text("字符串")区别
    linux 安装Nginx
    linux安装nginx
    vue dev开发环境跨域和build生产环境跨域问题解决
    正在载入中......loading页面的几种方法
    浏览器断点调试js
    vue组件之间传值方式解析
    基于Vue + Vuex + Vue-router + Webpack 2.0打造微信界面
  • 原文地址:https://www.cnblogs.com/bohaoist/p/5041236.html
Copyright © 2011-2022 走看看