C#中,我们有时需要过滤掉字符串中的部分html标签,以下是一些简单的html标签过滤方法,使用的主要方式是正则表达式
public static string ClearHtml(string html) { if(string.IsNullOrEmpty(html)) { return ""; } //去除a标签 html = Regex.Replace(html, @"<as*[^>]*>", "", RegexOptions.IgnoreCase); html = Regex.Replace(html, @"</a>", "", RegexOptions.IgnoreCase); //去除span标签 html = Regex.Replace(html, @"<spans*[^>]*>", "", RegexOptions.IgnoreCase); html = Regex.Replace(html, @"</span>", "", RegexOptions.IgnoreCase); //去除所有的样式 html = Regex.Replace(html, @"sstyle=""([^"";]+;?)+""", "", RegexOptions.IgnoreCase); //去除所有的html标签 html = Regex.Replace(html, @"<[^>]*>| ", "", RegexOptions.IgnoreCase); return html; }