zoukankan      html  css  js  c++  java
  • 使用boost库拆分字符串

    作者:朱金灿

    来源:http://blog.csdn.net/clever101

     

              在日常开发中经常会遇到分割字符串的要求,boost库为我们提供了一个方便的分词器——boost::tokenizer。现在就让我们学习一下boost库的分词器。

    #include <string>
    #include <iostream>
    
    #include <boost/format.hpp>
    #include <boost/tokenizer.hpp>
    #include <boost/algorithm/string.hpp>
    
    int _tmain(int argc, _TCHAR* argv[])
    {
        // 待分割的字符串
    	std::string strTag = _T("I Come from China");
        // 定义分割方式为英文逗号,中文逗号和空格,构造一个分词器,
    	boost::char_separator<char> sep(" ,,");
    	typedef boost::tokenizer<boost::char_separator<char> >
    		CustonTokenizer;
    	CustonTokenizer tok(strTag,sep);
    
    	// 输出分割结果
    	std::vector<std::string> vecSegTag;
    	for(CustonTokenizer::iterator beg=tok.begin(); beg!=tok.end();++beg)
    	{
    		vecSegTag.push_back(*beg);
    	}
    
    	for (size_t i  =0;i<vecSegTag.size();i++)
    	{
    		std::cout<<vecSegTag[i]<<std::endl;
    	}
    
    	// 尝试下分割中文字符
    	vecSegTag.clear();
        std::string strTag2 = _T("我叫小明,你呢,今天天气不错");
    	CustonTokenizer tok2(strTag2,sep);
    	for(CustonTokenizer::iterator beg=tok2.begin(); beg!=tok2.end();++beg)
    	{
    		vecSegTag.push_back(*beg);
    	}
    
    	for (size_t i  =0;i<vecSegTag.size();i++)
    	{
    		std::cout<<vecSegTag[i]<<std::endl;
    	}
    
    	getchar();
    	return 0;
    }
    

            

             但是boost::tokenizer的一个缺点是它不支持分割unicode字符串。所以要分割unicode字符串我们需要使用boost库提供的另一个接口——boost::split。它的使用比boost::tokenizer还要方便,请看下面代码:

    #include <string>
    #include <iostream>
    
    #include <boost/format.hpp>
    #include <boost/tokenizer.hpp>
    #include <boost/algorithm/string.hpp>
    
    int _tmain(int argc, _TCHAR* argv[])
    {
    	std::wcout.imbue(std::locale("chs"));
        // 待分割的字符串
    	std::wstring strTag = _T("I Come from China");
    
    	std::vector<std::wstring> vecSegTag;
         // boost::is_any_of这里相当于分割规则了
    	boost::split(vecSegTag, strTag,boost::is_any_of(_T(" ,,")));
    
    	for (size_t i  =0;i<vecSegTag.size();i++)
    	{
    		std::wcout<<vecSegTag[i]<<std::endl;
    	}
    
    	vecSegTag.clear();
    	std::wstring strTag2 = _T("我叫小明,你呢,今天天气不错");
    	boost::split(vecSegTag, strTag2, boost::is_any_of(_T(" ,,")));
    
    	for (size_t i  =0;i<vecSegTag.size();i++)
    	{
    		std::wcout<<vecSegTag[i]<<std::endl;
    	}
    	getchar();
    	return 0;
    }
    


          如果你觉得我的博客对你有帮助,请在下面网址中博客之星评选活动投我一票:

    http://vote.blog.csdn.net/item/blogstar/clever101(单击候选人介绍下面的投他一票那个按钮)

    参与投票有机会获奖:

         最佳贡献奖:通过微博分享活动就有机会获得30元充值卡一张(每周抽选5名)
        幸运奖:凡参与投票用户就有机会获得精美小礼品一份。(每周抽选5名)
        积极参与奖:所有参与投票并符合条件的用户均可获得20个下载积分。



  • 相关阅读:
    Windows常用命令的使用
    Windows网络命令的相关指令(1)
    HashMap源码解析
    Head First 设计模式【一、设计模式入门】
    软技能-代码之外的生存指南【职业篇】
    记第一个项目结束时的感想
    2019年总结
    深入理解计算机系统【五】-存储器层次结构
    深入理解计算机系统【四】-程序的机器级表示
    深入理解计算机系统【三】
  • 原文地址:https://www.cnblogs.com/lanzhi/p/6470807.html
Copyright © 2011-2022 走看看