zoukankan
html css js c++ java
正则-匹配超链接地址及内容
今天做文章抓取程序的完善开发,碰到了以下问题
“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。
自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之
Code
1
MatchCollection mc
=
Regex.Matches(htmlstring,
@"
<a\s+href=(?<url>.+?)>(?<content>.+?)</a>
"
);
2
foreach
(Match m
in
mc)
3
{
4
url
=
m.Groups[
"
url
"
].Value;
5
6
content
=
m.Groups[
"
content
"
].Value;
7
}
其中htmlstring 为输入代码
查看全文
相关阅读:
angularjs 学习笔记(一)
iconfont项目成员添加不进去的问题
服务器webapi集成极光推送学习笔记
winform closing事件注册
asp.net core webapi 似乎未安装在 IIS 中承载 .NET Core 项目所需的 AspNetCoreModule。请尝试修复 Visual Studio 以纠正该问题。
css 行内元素设置宽高
透过浏览器看HTTP缓存[转载]
矢量字体图标
HTML5新特性之WebRTC[转]
一个前后端分离方案[转载]
原文地址:https://www.cnblogs.com/wfwup/p/1336133.html
最新文章
[HEOI2016/TJOI2016]字符串
[HAOI2018]染色
[SDOI2013]森林
[NOI2015]寿司晚宴
[POI2012]SZA-Cloakroom
-bash: ll: 未找到命令
转圈 箭头 ⟳ 10227 27F3 刷新 HTML常用的特殊符号总结
CentOS6.7系统文本安装-2020
《我常用的股票投资工具与网站》v2.0
普通工程师和高级工程师的差别在哪里?
热门文章
Win10 禁用摄像头的方法及注意事项
CentOS 7 进入单用户模式图文详解
救援模式(Rescue Mode)、单用户模式(Single-User Mode)、紧急模式(Emergency Mode)的区别与联系
单用户模式和救援模式
HAProxy从零开始到掌握
ckplayer iis6 mp4 播放404错误
.netcore webapi 在startup中读取配置字符串
bootstrap collapse 无法收回
JwtBearerAppBuilderExtensions.UseJwtBearerAuthentication(IApplicationBuilder
包含了重复的“Content”项。.NET SDK 默认包含你项目目录中的“Content”项。可从项目文件中删除这些项;如果希望将其显式包含在项目文件中,可将“EnableDefaultContentItems”属性设置为“false”
Copyright © 2011-2022 走看看