zoukankan      html  css  js  c++  java
  • 提取中文字符串

        protected void Page_Load(object sender, EventArgs e)
        {
            string str = "asdf进杂货";
            Response.Write(GetChineseWords(str));
            Response.Write("<br/>");
            foreach (char c in str)
            {
                if (Regex.IsMatch(c.ToString (), "^[\u4E00-\u9FFF]+$"))
                    Response.Write(c);
            }
        }
     
        private string GetChineseWords(string str)
        {
            string strRet = string.Empty;
            int start = Convert.ToInt32("4e00", 16);    //范围(0x4e00~0x9fff)
            int end = Convert.ToInt32("9fff", 16);
     
            foreach (char c in str)
            {
                int ci = (int)c;
                if (ci >= start && ci <= end)
                {
                    strRet += c;
                }
            }
            return strRet;
        }

    4e00~9fff是中文字符在unicode中的范围。

    作者:KKcat
        
    个人博客:http://jinzhao.me/
        
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
  • 相关阅读:
    DeepLearning之路(三)MLP
    DeepLearning之路(二)SoftMax回归
    DeepLearning之路(一)逻辑回归
    自然语言处理工具
    一个 11 行 Python 代码实现的神经网络
    对联广告
    Java多线程
    QT数据库操作
    QT笔记
    C++基础入门
  • 原文地址:https://www.cnblogs.com/jinzhao/p/1351988.html
Copyright © 2011-2022 走看看