正则 - 走看看

zoukankan html css js c++ java

正则
摘抄自http://social.msdn.microsoft.com/Forums/en-US/4305d5d4-1709-4c0f-86ae-3db78d08bced/url

在写一个采集网页源代码的时候遇到一个问题：

匹配URL，以前发过贴子遇到一位大牛提到了一个正则如下：
```
(https://|http://)?([w-]+.)+[w-]+(/[w- ./?%&=]*)?
```
这样可以匹配到大量的URL，但是在匹配类似http://www.ok.com.This is a URL.****

这样的句子的时候会匹配成http://www.ok.com.This

希望求二个正则表达式。第一个能正常匹配http://www.ok.com,www.ok.net/,ok.com,www.ok.net/这样顶级域名形式的正则。

再求一个能匹配下面含分类的正则。比如：http://www.ok.com/this-is-a-article.html或者http://www.ok.com/******/
自己解决了。使用的是：

(?i)(http://|https://)?(w+.){1,3}(com(.cn)?|cn|net|info|org|us|tk)
查看全文

相关阅读:
C# 如何保证对象线程内唯一：数据槽（CallContext）【转载】
关于面试！（简历篇）
以Windows服务方式运行ASP.NET Core程序【转载】
.Net Core 项目在Windows服务中托管【转载】
【转载】Ocelot网关的路由热更新
 Kafka的配置文件详细描述
 C#枚举中的位运算权限分配浅谈
 CSS 三角形
 Entity Framework 7 动态 DbContext 模型缓存 ModelCaching
ASP.NET5 MVC6 利用Middleware 创建可访问HttpContext 的业务类工厂。（代替HttpContext.Current）

原文地址：https://www.cnblogs.com/zhiguopingtianxia/p/3994805.html

Copyright © 2011-2022 走看看