zoukankan
html css js c++ java
正则-匹配超链接地址及内容
今天做文章抓取程序的完善开发,碰到了以下问题
“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。
自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之
Code
1
MatchCollection mc
=
Regex.Matches(htmlstring,
@"
<a\s+href=(?<url>.+?)>(?<content>.+?)</a>
"
);
2
foreach
(Match m
in
mc)
3
{
4
url
=
m.Groups[
"
url
"
].Value;
5
6
content
=
m.Groups[
"
content
"
].Value;
7
}
其中htmlstring 为输入代码
查看全文
相关阅读:
C#调用Delphi的dll 详解
C# 用API截取桌面屏幕
C# 控件代码设置置顶和置底属性
C#用API 获取电脑桌面背景图地址
利用JS使IE浏览器默认打开是全屏显示
aspx页面生成xml数据
MacOS下安装Anaconda+Pycharm+TensorFlow+Keras
GitHub编辑README
Win10(64位)下安装Anaconda+Tensorflow(GPU)
Win7(64位)下安装Anaconda+Tensorflow(CPU)
原文地址:https://www.cnblogs.com/wfwup/p/1336133.html
最新文章
pyhive连接hive(失败)
DGA域名检测
【ElasticSearch】查询流程
一、ElasticSearch倒排索引的概念
HashMap源码分析
kafka 磁盘写满导致 InternalError
学习笔记:Apache Kylin 概述
win7 ie8 离线升级1E 10 补丁
java jdk 11.0.6 LTS版本环境变量设置
QT error
热门文章
[转]利用正则表达式,统计代码行数
QT安装
windows 10 1809 语言包/ADK/SDK/WDK ISO
Windows10 LTSB/LTSC版安装应用商店与UWP
VCDebug、Ollydbg、WinDbg字符串条件断点
转: windbg-跳过初始断点(调试技巧)
windows 快捷键
JS 替换字符串中包含的所有的空格,或其他字符
C# 设置开机自动启动
C# 利用API 模拟键盘按键
Copyright © 2011-2022 走看看