zoukankan      html  css  js  c++  java
  • 使用正则表达式替换提取字符

     将 td th 标签替换,保留标签内容

      public  string TextFilter(string CommandText)
        {
            CommandText = Regex.Replace(CommandText, @"(?<part1>(<td>
    *
    *))(?<part2>(%?[^%]+))(?<part3>(</td>))", new MatchEvaluator(TextFilter), RegexOptions.IgnoreCase | RegexOptions.Multiline);
            CommandText = Regex.Replace(CommandText, @"(?<part1>(<td[^>]*>
    *
    *))(?<part2>(%?[^%]+))(?<part3>(</td>))", new MatchEvaluator(TextFilter), RegexOptions.IgnoreCase | RegexOptions.Multiline);        
            CommandText = Regex.Replace(CommandText, @"(?<part1>(<th[^>]*>
    *
    *))(?<part2>(%?[^%]+))(?<part3>(</th>))", new MatchEvaluator(TextFilter), RegexOptions.IgnoreCase | RegexOptions.Multiline);
            CommandText = Regex.Replace(CommandText, @"(?<part1>(<td[^>]*>
    *
    *))(?<part2>(</td>))", new MatchEvaluator(TextFilter2), RegexOptions.IgnoreCase | RegexOptions.Multiline);    
            return CommandText;
        }
        public string TextFilter(Match match)
        {
            string part1 = match.Groups["part1"].Value;
            string part2 = match.Groups["part2"].Value;
            string part3 = match.Groups["part3"].Value;
            return part2.Replace("&nbsp;", "").Trim();
        }

    提取span里面的内容,如未包含span则返回原始字符串

      public string SpanText(string CommandText)
        {
            Regex reg = new Regex(@"(?<part1>(.*<span[^>]*>
    *
    *))(?<part2>(%?[^>]+))(?<part3>(</span>))", RegexOptions.IgnoreCase | RegexOptions.Multiline);
            var result = reg.Match(CommandText).Groups;
    
            if (result["part2"] != null && result.Count > 1)
            {
                return result["part2"].Value;
            }
            else
            {
                return CommandText;
            }        
        }
  • 相关阅读:
    利用python在windows环境下爬取赶集网工作信息。
    扔骰子
    python 输入英语单词,查看汉语意思
    获取指定日期的上一个月日期
    爬取代理IP,并判断是否可用。
    递归实现 十进制转换其他进制(2-16)
    特殊回文数
    python 实现无序列表
    python 实现剪刀石头布(三局两胜)
    python 实现简单语音聊天机器人
  • 原文地址:https://www.cnblogs.com/CoreXin/p/5848875.html
Copyright © 2011-2022 走看看