zoukankan      html  css  js  c++  java
  • c#正则获取html里面a标签href的值

    获取单个a中href的值:

    string str = "<a href="http://www.itsve.com">下载</a>";
                string reg = @"<a[^>]*href=([""'])?(?<href>[^'""]+)1[^>]*>";
                var item = Regex.Match(str, reg, RegexOptions.IgnoreCase);
                Console.WriteLine(item.Groups["href"].Value);

    获取多个a中的href的值:

    string str = "<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">"
                    + "<html xmlns="http://www.w3.org/1999/xhtml">"
                    + "<head>"
                    + "<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>"
                    + "<meta content="怎样用c 正则表达式解析HTML中a 超链接 址 .NET技术 ASP.NET" name="Keywords"/>"
                    + "<meta content="是用c 正则表达式 是在后台 不是js正则表达式 是要获取a href属性值" name="description"/>"
                    + "<title>怎样用c#正则表达式解析HTML中a的超链接地址 - .NET技术 / ASP.NET</title>"
                    + "<li><a href="http://news.csdn.net/" target="_blank">资讯</a>|</li>"
                    + "<li><a href="http://mobile.csdn.net/" target="_blank">移动</a>|</li>"
                    + "<li><a href="http://cloud.csdn.net/" target="_blank">云计算</a>|</li>"
                    + "<link href="http://c.csdn.net/bbs/t/5/t5.css" rel="stylesheet" type="text/css" />"
                    + "<link href="http://www.csdn.net/images/favicon.ico" rel="SHORTCUT ICON" />";
                Regex reg = new Regex(@"(?is)<a[^>]*?href=(['""s]?)(?<href>[^'""s]*)1[^>]*?>");
                MatchCollection match = reg.Matches(str);
                foreach (Match m in match)
                {
                    Response.Write(m.Groups["href"].Value + "<br/>");
                }
    //C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下:
    
    Regex regImg = new Regex(@"(?is)<a[^>]*?href=(['""s]?)(?<href>([^'""s]*.doc)|([^'""s]*.docx)|([^'""s]*.xls)|([^'""s]*.xlsx)|([^'""s]*.ppt)|([^'""s]*.txt)|([^'""s]*.zip)|([^'""s]*.rar)|([^'""s]*.gz)|([^'""s]*.bz2))1[^>]*?>"
  • 相关阅读:
    c# 启动线程的方式
    c# 打开文件夹获取所有文件
    windows server 2008 R2 SP1 安装SQL Server 2008 R2时提示 "此操作系统不支持此版本的 SQL Server 版本"
    mongodb 备份 指定用户名密码
    c# 线程启动的两种方式与传参
    vs 2015 密钥
    c# 时间格式yyyy-MM-ddTHH:mm:ss
    c# oledb sql 报错 标准表达式中数据类型不匹配
    CentOS下yum安装dnsmasq,并强制替换为最新版
    使用QUOTA(磁盘配额)来限制用户空间
  • 原文地址:https://www.cnblogs.com/ly77461/p/7131181.html
Copyright © 2011-2022 走看看