zoukankan      html  css  js  c++  java
  • 正则表达式——去除文本中的非汉字(VB2005)

      本人由于工作关系,需要一段代码,将给定的字符串中的非汉字去除,只保留汉字部分。

      这个一般用正则表达式比较简单,网上有一些匹配汉字的正则表达式,拿来经过改造就能实现我前面的要求。

      

      注释一下,正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符。

      代码格式修正于2012年1月5日 

    Imports System.Text.RegularExpressions
    Public Class clsT
      Public Function OnlyChinese(ByVal mText As String) As String
        Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
      End Function
    End Class
    作者:万仓一黍
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
  • 相关阅读:
    mysql 安装失败 start service执行不下去
    C# 打开钱箱支持北洋、佳博、爱普生
    CF1093E Intersection of Permutations [分块 +bitset]
    CF895C Square Subsets [线性基]
    线性基学习笔记
    长链剖分学习笔记
    GSS 系列题解
    P3206 [HNOI2010]城市建设 [线段树分治+LCT维护动态MST]
    线段树分治学习笔记
    [CF662C Binary Table][状压+FWT]
  • 原文地址:https://www.cnblogs.com/grenet/p/1622117.html
Copyright © 2011-2022 走看看