zoukankan      html  css  js  c++  java
  • c#正则获取html里面a标签href的值

    获取单个a中href的值:

    string str = "<a href="http://www.itsve.com">下载</a>";
                string reg = @"<a[^>]*href=([""'])?(?<href>[^'""]+)1[^>]*>";
                var item = Regex.Match(str, reg, RegexOptions.IgnoreCase);
                Console.WriteLine(item.Groups["href"].Value);

    获取多个a中的href的值:

    string str = "<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">"
                    + "<html xmlns="http://www.w3.org/1999/xhtml">"
                    + "<head>"
                    + "<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>"
                    + "<meta content="怎样用c 正则表达式解析HTML中a 超链接 址 .NET技术 ASP.NET" name="Keywords"/>"
                    + "<meta content="是用c 正则表达式 是在后台 不是js正则表达式 是要获取a href属性值" name="description"/>"
                    + "<title>怎样用c#正则表达式解析HTML中a的超链接地址 - .NET技术 / ASP.NET</title>"
                    + "<li><a href="http://news.csdn.net/" target="_blank">资讯</a>|</li>"
                    + "<li><a href="http://mobile.csdn.net/" target="_blank">移动</a>|</li>"
                    + "<li><a href="http://cloud.csdn.net/" target="_blank">云计算</a>|</li>"
                    + "<link href="http://c.csdn.net/bbs/t/5/t5.css" rel="stylesheet" type="text/css" />"
                    + "<link href="http://www.csdn.net/images/favicon.ico" rel="SHORTCUT ICON" />";
                Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""s]?)(?<href>[^'""s]*)1[^>]*?>");
                MatchCollection match = reg.Matches(str);
                foreach (Match m in match)
                {
                    Response.Write(m.Groups["href"].Value + "<br/>");
                }
    //C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下:
    
    Regex regImg = new Regex(@"(?is)<a[^>]*?href=(['""s]?)(?<href>([^'""s]*.doc)|([^'""s]*.docx)|([^'""s]*.xls)|([^'""s]*.xlsx)|([^'""s]*.ppt)|([^'""s]*.txt)|([^'""s]*.zip)|([^'""s]*.rar)|([^'""s]*.gz)|([^'""s]*.bz2))1[^>]*?>"
  • 相关阅读:
    IllegalStateException
    TimeUnit简析
    Cron表达式
    任务调度之Timer与TimerTask配合
    Executor简析
    this逃逸
    SQL、SQL Server、MySQL与Oracle
    数据库与实例
    vw 、vh、vmin 、vmax
    逻辑(内存)分页与物理分页
  • 原文地址:https://www.cnblogs.com/tianciliangen/p/6832694.html
Copyright © 2011-2022 走看看