zoukankan      html  css  js  c++  java
  • 使用RegularExpressions去除HTML标签的字符串

    1、需求场景

      因为需要做一个推送数据的服务,需要调用webservice,由于某种原因需要使用用http发送soap请求,而推送的数据是json格式的,在测试过程中发现请求失败,服务端webservice返回400错误。返回400错误,应该就是请求的数据格式不对,由于我这个情况特殊,请求的数据既要能够格式化为xml格式,里面某个节点里的内容还要能够正确格式化为json字符串,发现请求的数据里有HTML标签,需要过滤掉再请求。

    2、实现功能

      使用RegularExpressions正则表达式:

      .   匹配除 " " 之外的任何单个字符。

      *  匹配前面的子表达式零次或多次。

      ?  匹配前面的子表达式零次或一次。

           只要把文章的"<.*?>"替换为String.Empty即可。

           代码实现 

    using System.Text.RegularExpressions;
    
    public static string RemoveHtmlTag(string articleString)
    {
          return Regex.Replace(articleString, "<.*?>", string.Empty);
    }       
  • 相关阅读:
    ACS 20070108 更新
    道德沦丧 还是意识淡薄
    Alienwave.CommunityServer 20070103 更新
    无题
    《白马啸西风》之李文秀
    突然感觉自己像拉皮条的
    数据库日志文件(x.ldf)如何打开?
    调试.NET出错
    老大离开南京了
    最近太任性了
  • 原文地址:https://www.cnblogs.com/zhao-gang/p/8373171.html
Copyright © 2011-2022 走看看