zoukankan
html css js c++ java
正则-匹配超链接地址及内容
今天做文章抓取程序的完善开发,碰到了以下问题
“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。
自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之
Code
1
MatchCollection mc
=
Regex.Matches(htmlstring,
@"
<a\s+href=(?<url>.+?)>(?<content>.+?)</a>
"
);
2
foreach
(Match m
in
mc)
3
{
4
url
=
m.Groups[
"
url
"
].Value;
5
6
content
=
m.Groups[
"
content
"
].Value;
7
}
其中htmlstring 为输入代码
查看全文
相关阅读:
webpack学习(一)—— 入门
AMD 规范
CommonJS 规范
webpack 故障处理
webpack 开发环境
webpack 插件
webpack 配置文件
webpack 使用
webpack Loader
webpack常用的插件安装命令
原文地址:https://www.cnblogs.com/wfwup/p/1336133.html
最新文章
Poj-1274-The Perfect Stall-匈牙利算法
poj 2406 Power Strings KMP匹配
关于两个时间(00:00:00)相加的实现方法
安装TeX及中文支持
互联网+(怎样保证小孩的安全) 2
Python图像处理(15):SVM分类器
uva:10487
Leetcode--easy系列4
Leetcode_num1_Single Number
PCA(Principal Components Analysis)主成分分析
热门文章
算法练习:两指针之三数之和为0
poj 2777 Count Color(线段树、状态压缩、位运算)
浅析Java抽象类和接口的比較
jQuery——map()函数以及它的java实现
POJ 1655 Balancing Act (树形dp 树的重心)
HDU 4828 (卡特兰数+逆元)
Session小案例-----简单购物车的使用
10个小众网
为什么不该加班
eclipse中配置Tomcat
Copyright © 2011-2022 走看看