zoukankan      html  css  js  c++  java
  • 去除字符串中的HTML标签

     public static string Html2Text(string htmlStr)
    2
    3 {
    4
    5     if (String.IsNullOrEmpty(htmlStr))
    6
    7     {
    8
    9         return "";
    10
    11     }
    12
    13     string regEx_style = "<style[^>]*?>[\s\S]*?<\/style>"; //定义style的正则表达式
    14
    15     string regEx_script = "<script[^>]*?>[\s\S]*?<\/script>"; //定义script的正则表达式  
    16
    17     string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式  
    18
    19     htmlStr = Regex.Replace(htmlStr, regEx_style, "");//删除css
    20
    21 htmlStr = Regex.Replace(htmlStr, regEx_script, "");//删除js
    22
    23     htmlStr = Regex.Replace(htmlStr, regEx_html, "");//删除html标记
    24
    25     htmlStr = Regex.Replace(htmlStr, "\s*| | | ", "");//去除tab、空格、空行
    26
    27     htmlStr = htmlStr.Replace(" ", "");
    28
    29     htmlStr = htmlStr.Replace(""", "");//去除异常的引号" " "
    30
    31     htmlStr = htmlStr.Replace(""", "");
    32
    33     return htmlStr.Trim();
    34
    35 }

  • 相关阅读:
    Swagger3.X和2.X—从入门到实战
    Java工具—Lombok
    使用Java伪造测试数据
    URL
    Java 16个超级实用的工具类
    Redis一篇从入门到实战
    MongoDB一篇从入门到实战
    admin后台管理
    auth模块
    day12_01闭包函数
  • 原文地址:https://www.cnblogs.com/haimingkaifa/p/5803048.html
Copyright © 2011-2022 走看看