zoukankan      html  css  js  c++  java
  • 去除字符串中的HTML标签

     public static string Html2Text(string htmlStr)
    2
    3 {
    4
    5     if (String.IsNullOrEmpty(htmlStr))
    6
    7     {
    8
    9         return "";
    10
    11     }
    12
    13     string regEx_style = "<style[^>]*?>[\s\S]*?<\/style>"; //定义style的正则表达式
    14
    15     string regEx_script = "<script[^>]*?>[\s\S]*?<\/script>"; //定义script的正则表达式  
    16
    17     string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式  
    18
    19     htmlStr = Regex.Replace(htmlStr, regEx_style, "");//删除css
    20
    21 htmlStr = Regex.Replace(htmlStr, regEx_script, "");//删除js
    22
    23     htmlStr = Regex.Replace(htmlStr, regEx_html, "");//删除html标记
    24
    25     htmlStr = Regex.Replace(htmlStr, "\s*| | | ", "");//去除tab、空格、空行
    26
    27     htmlStr = htmlStr.Replace(" ", "");
    28
    29     htmlStr = htmlStr.Replace(""", "");//去除异常的引号" " "
    30
    31     htmlStr = htmlStr.Replace(""", "");
    32
    33     return htmlStr.Trim();
    34
    35 }

  • 相关阅读:
    vs2010创建文件夹
    strlen源码,远没有想象中的那么简单、、、、
    排序
    字符数组,字符指针,sizeof,strlen总结
    QT中的QInputDialog的小例子
    QT实现启动画面
    QT中Dialog的使用

    QT中的文件浏览
    Python日期操作
  • 原文地址:https://www.cnblogs.com/haimingkaifa/p/5803048.html
Copyright © 2011-2022 走看看