使用RegularExpressions去除HTML标签的字符串 - 走看看

zoukankan html css js c++ java

使用RegularExpressions去除HTML标签的字符串

网友要求做一个文章摘要，由于文章包含有Html标签，在截取文章头200个字符串时，得到的字符串将是一些意想不到的结果。因此让Insus.NET为他解决去除html标签，然后再从去除Html标签之后的结果截取200个字符串。

实现这个功能，可以使用RegularExpressions正则表达式：

. 匹配除 "\n" 之外的任何单个字符。

* 匹配前面的子表达式零次或多次。

? 匹配前面的子表达式零次或一次。

因此只要把文章的"<.*?>"替换为String.Empty即可。

接下来，Insus.NET写一个函数，在写函数之前，先引用一个命名空间：

using System.Text.RegularExpressions;

函数：

public static string RemoveHtmlTag(string articleString)
    {
        return Regex.Replace(articleString, "<.*?>", string.Empty);
    }

查看全文

相关阅读:
hibernate理解
 struts理解
 网上书城项目
 编码过程中遇到的问题
 JS回调函数
 requirejs 一个拆分js项目的类库
 jq插件开发总结
 转载-- 魔兽哈希算法封装和测试
 转载--C# PLINQ 内存列表查询优化历程
 Oracle删除死锁进程的方法

原文地址：https://www.cnblogs.com/insus/p/2470430.html

Copyright © 2011-2022 走看看