zoukankan      html  css  js  c++  java
  • 过滤Html标签代码

        public string FilterHtmlTag(string HtmlString)
        
    {
            System.IO.StreamReader sr 
    = new StreamReader("d:\\bb.html", System.Text.Encoding.UTF8);
            
    string HtmlString = sr.ReadToEnd();
            
    string Temp = HtmlString.Substring(HtmlString.IndexOf("<body>"));       //
            string Stup1 = Regex.Replace(Temp, @"<script>[\s\S]*</script>""");    //过滤Js代码;
            string Stup2 = Regex.Replace(Stup1, @"<style[\s\S]*</style>""");      //过滤Css样式
            string Stup3 = Regex.Replace(Stup2, "<.+?>""");                       //过滤html标签
            string Stup4 = Regex.Replace(Stup3, @"\s""");                         //过滤/n/r等特列字符
            return Stup4;
        }


    以上代码能过滤结构比较规范的HTML页面,如页面结构比较复杂,请自己自行修改。修改后更完整的代码也希望能回传一份。
    邮箱:pweixu@163.com  大家一起分享
  • 相关阅读:
    JDK6和JDK7中的substring()方法
    考试结束
    今天之总结
    暂别
    珍惜
    放弃
    我男神
    心态
    稳住,我或许能赢
    还是做好自己吧
  • 原文地址:https://www.cnblogs.com/weixu/p/860460.html
Copyright © 2011-2022 走看看