zoukankan      html  css  js  c++  java
  • 清除html中的标记,只留下文字

    /// <summary>
    /// 清除html中的标记,只留下文字。
    /// </summary>
    /// <param name="HTML"></param>
    /// <returns></returns>
    public string ClearHTMLTags(string HTML)
    {
        if (string.IsNullOrEmpty(HTML)) return "";
        string[] Regexs ={
                    @"<script[^>]*?>.*?</script>",
                    @"<(/s*)?!?((w+:)?w+)(w+(s*=?s*(([""'])(file://[%22%22'tbnr]%7c[%5e/7])*?7|w+)|.{0})|s)*?(/s*)?>",
                    //@"([ ])[s]+",//换行
                    @"&(quot|#34);",
                    @"&(amp|#38);",
                    @"&(lt|#60);",
                    @"&(gt|#62);",
                    @"&(nbsp|#160);",
                    @"&(iexcl|#161);",
                    @"&(cent|#162);",
                    @"&(pound|#163);",
                    @"&(copy|#169);",
                    @"&#(d+);",
                    @"-->",
                    @"<!--.* "
    };

        string[] Replaces ={
                        "",
                        "",
                        //"",//换行
                        """,
                        "&",
                        "<",
                        ">",
                        " ",
                        "xa1", //chr(161),
                        "xa2", //chr(162),
                        "xa3", //chr(163),
                        "xa9", //chr(169),
                        "",
                        " ",
                        ""
    };

        string s = HTML;
        for (int i = 0; i < Regexs.Length; i++)
        {
            s = new Regex(Regexs[i], RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s, Replaces[i]);
        }
        //s.Replace("<", "");
        //s.Replace(">", "");
        //s.Replace(" ", "");

        return s;
    }

    上面的方式去除的有时候并不太准,其实可以换种想法,若是之前用富文本框编辑的,则可以实例化一个富文本框,然后设置 this.richTextBox.Ref = "";然后再取出this.richTextBox.Text。这种方式虽然笨,但比较准确。用此方法需注意一点:若是数据比较多,这个功能要单独做,不要对这条数据做这样的转换之后再去做其它的事,这样会大大增加循环的时间,从而导致出现一些不莫名奇妙的问题。
  • 相关阅读:
    YII2操作mongodb笔记(转)
    MongoDB创建数据库和集合命令db.createCollection详解(转)
    MongoDB设置访问权限、设置用户(转)
    使用Robomongo 连接MongoDB 3.x 报 Authorization failed 解决办法(转)
    Yii2框架与MongoDB拓展、Redis拓展的安装流程
    YII2 Model 类切换数据库连接
    Centos6.5搭建java开发环境
    YII切换开发和生产环境(命令)
    YII2 实现后台操作记录日志(转)
    phpstorm2018激活方法--使用激活码
  • 原文地址:https://www.cnblogs.com/pnljs/p/3169287.html
Copyright © 2011-2022 走看看