zoukankan      html  css  js  c++  java
  • 利用正则表达式来替换文本,可以最大程序的灵活替换或删除文本内容。

    首先要学会使用正则表达式

    关于替换文本的最主要的功能就是 对正则表达式类的学习

    学习正则表达式,推荐 下面这个网址(30分钟 学会正则表达式)

    http://deerchao.net/tutorials/regex/regex.htm

    在程序中引用 using System.Text.RegularExpressions;

    在程序中使用  Regex.Replace  来完成文本替换工作

    Regex  是正则表达式类。来源于上面那个引用

    Regex.Replace(要替换的原始文本,正则表达式内容,替换后的内容,选项)

    选项有  RegexOptions  来指定。

    举个例子

    using System.Text.RegularExpressions;

            public static string ReplaceText(string text, string search, string replace)
            {
                return Regex.Replace(text, search, replace, RegexOptions.Singleline);
            }

    这是一个替换文本的函数

    使用方法

    using System.IO;  //这里的 File 类是在这个空间里引用的。

    string text = File.ReadAllText(filename, Encoding.GetEncoding("gb2312"));

    text = ReplaceText(text, "<span.*?>", "");

    将 以<span开始 以 > 结尾 中间有不限数量个任意字符(由于设定 RegexOptions.Singleline)所以,任意字符中也包括换行符回车符\n

    具体的含义:请参考正则表达式教程。

    File.WriteAllText(newfilename, text, Encoding.GetEncoding("gb2312"));

  • 相关阅读:
    Java中文语言处理HanLP
    python的jieba分词词性标注(转载)
    solr 自聚类实现
    IntelliJ IDEA 创建 java Maven项目
    javat Itext实践 pdf
    java 中PriorityQueue优先级队列使用方法
    java实现 tf-idf
    Solr6.6 IK 中文分词的配置和使用
    yaha分词
    实现自动文本摘要(python,java)
  • 原文地址:https://www.cnblogs.com/lujin49/p/2124380.html
Copyright © 2011-2022 走看看