zoukankan      html  css  js  c++  java
  • 使用RegularExpressions去除HTML标签的字符串

    网友要求做一个文章摘要,由于文章包含有Html标签,在截取文章头200个字符串时,得到的字符串将是一些意想不到的结果。因此让Insus.NET为他解决去除html标签,然后再从去除Html标签之后的结果截取200个字符串。

    实现这个功能,可以使用RegularExpressions正则表达式:

    .   匹配除 "\n" 之外的任何单个字符。

    *  匹配前面的子表达式零次或多次。

    ?  匹配前面的子表达式零次或一次。

    因此只要把文章的"<.*?>"替换为String.Empty即可。

    接下来,Insus.NET写一个函数,在写函数之前,先引用一个命名空间:

    using System.Text.RegularExpressions;

    函数:

    public static string RemoveHtmlTag(string articleString)
        {
            return Regex.Replace(articleString, "<.*?>"string.Empty);
        }
  • 相关阅读:
    acwing793. 高精度乘法
    acwing788. 逆序对的数量
    acwing791. 高精度加法
    acwing787. 归并排序
    acwing789. 数的范围
    acwing790. 数的三次方根
    acwing786. 第k个数
    acwing792. 高精度减法
    1.9
    课程总结
  • 原文地址:https://www.cnblogs.com/insus/p/2470430.html
Copyright © 2011-2022 走看看