zoukankan
html css js c++ java
正则-匹配超链接地址及内容
今天做文章抓取程序的完善开发,碰到了以下问题
“<a href=aaa.html>A页</a><a href=bbb.html>B页</b>” 利用正则从中分别取出 aaa.html ,A页 ,bbb.html,B页。
自己写了俩正则 算是都能实现,但是是先匹配出所有的href对应的Html,再匹配出类似"A页"标题这段。 但是感觉很麻烦,从网上一搜,果然看到有位大侠写的正则很简炼,贴出记下,膜拜之
Code
1
MatchCollection mc
=
Regex.Matches(htmlstring,
@"
<a\s+href=(?<url>.+?)>(?<content>.+?)</a>
"
);
2
foreach
(Match m
in
mc)
3
{
4
url
=
m.Groups[
"
url
"
].Value;
5
6
content
=
m.Groups[
"
content
"
].Value;
7
}
其中htmlstring 为输入代码
查看全文
相关阅读:
Oracle 用 sqlprompt 修改 sqlplus 提示符
Oracle cursor pin S wait on X 等待事件 说明
Oracle 利用 rowid 提升 update 性能
Oracle 从缓存里面查找真实的执行计划
Linux 进程状态 说明
Oracle 用户 对 表空间 配额(quota ) 说明
Upon startup of Linux database get ORA27102: out of memory LinuxX86_64 Error: 28: No space left on device
异常宕机 Ora00600 [Kccpb_sanity_check_2] 错误解决方法
Oracle ORA04031 错误 说明
Oracle Shared pool 详解
原文地址:https://www.cnblogs.com/wfwup/p/1336133.html
最新文章
Linux 格式化分区 报错Could not stat No such file or directory 和 partprobe 命令
Oracle cursor_sharing 参数 详解
Oracle ASH(Active Session History) 说明
Oracle v$session_longops 视图说明
Oracle 单实例 迁移到 RAC 实例 使用RMAN 异机恢复
Oracle 11gR2 deferred segment creation 与 exp/imp 说明
HeapOrganized table 和 IndexOrganized table 说明
Oracle Recursive Calls 说明
How to Convert a SingleInstance ASM to Cluster ASM [ID 452758.1]
Oracle BTree Index 原理
热门文章
还原真实的 cache recovery
临时表 DML 产生redo 问题说明
Oracle 下 unpin 的cursor 才能被移除
AWR 报告 查看 数据库 负载
Oracle Buffer Cache 原理
Orace ITL(Interested Transaction List) 说明
Oracle RAC ASM 实例 从10.2.0.1 升级到 10.2.0.4 说明
MySQL 引擎 和 InnoDB并发控制 简介
Oracle 10.2.0.4和10.2.0.5 中 OEM bug 8350262
根据 dba_errors 制定 数据库报警邮件
Copyright © 2011-2022 走看看