zoukankan      html  css  js  c++  java
  • asp.net去掉HTML标记

    using System;
    using System.Web;
    using System.Text.RegularExpressions;

    public static string NoHTML(string Htmlstring)  
      {  
       //删除脚本  
       Htmlstring   =   Regex.Replace(Htmlstring,@"<script[^>]*?>.*?</script>","",RegexOptions.IgnoreCase);  
       //删除HTML  
       Htmlstring   =   Regex.Replace(Htmlstring,@"<(.[^>]*)>","",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"([\r\n])[\s]+","",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"-->","",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"<!--.*","",RegexOptions.IgnoreCase);  
       
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(quot|#34);","\"",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(amp|#38);","&",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(lt|#60);","<",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(gt|#62);",">",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(nbsp|#160);","   ",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(iexcl|#161);","\xa1",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(cent|#162);","\xa2",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(pound|#163);","\xa3",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,@"&(copy|#169);","\xa9",RegexOptions.IgnoreCase);  
       Htmlstring   =   Regex.Replace(Htmlstring,   @"&#(\d+);","",RegexOptions.IgnoreCase);  
       
       Htmlstring.Replace("<","");  
       Htmlstring.Replace(">","");  
       Htmlstring.Replace("\r\n","");  
       Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();  
       
       return   Htmlstring;  
      }

    取出文本中的图片地址:

    public   static   string   GetImgUrl(string   HTMLStr)  
      {  
        string   str   =   string.Empty;  
        string   sPattern   =   @"^<img\s+[^>]*>";  
        Regex   r   =   new   Regex(@"<img\s+[^>]*\s*src\s*=\s*([']?)(?<url>\S+)'?[^>]*>",  
                RegexOptions.Compiled);  
        Match   m   =   r.Match(HTMLStr.ToLower());  
        if   (m.Success)  
            str   =   m.Result("${url}");  
        return   str;  
     }

    本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/TQY2008/archive/2008/09/26/2983594.aspx

  • 相关阅读:
    PAT 1065. A+B and C (64bit) (20)
    PAT 1042. Shuffling Machine (20)
    PAT 1001. A+B Format (20)
    HDU 2082 找单词 母函数
    NYOJ 138 找球号(二) bitset 二进制的妙用
    POJ 1151 Wormholes spfa+反向建边+负环判断+链式前向星
    POJ 1511 Invitation Cards 链式前向星+spfa+反向建边
    zzuli 2130: hipercijevi 链式前向星+BFS+输入输出外挂
    NYOJ 323 Drainage Ditches 网络流 FF 练手
    POJ 1273 Drainage Ditches 网络流 FF
  • 原文地址:https://www.cnblogs.com/feifeiwzh/p/1501232.html
Copyright © 2011-2022 走看看