zoukankan      html  css  js  c++  java
  • 正则表达式匹配URL

    最近在做一些关于URL匹配的项目,本来对正则表达式了解的不多,上网搜索了好多前辈写的正则表达式,发现很少能被我使用的,现将我自己写的正则表达式贴出来,供大家参考。

    %<本人做的是asp.net的项目,内容是阻止一个文本框中的某些URL>%

    首先,正则表达式:

           String check = @"((http|ftp|https)://)(([a-zA-Z0-9._-]+.[a-zA-Z]{2,6})|([0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9&%_./-~-]*)?";

    关于该正则表达式的说明:

    ①:该正则表达式匹配的字符串必须以http://、https://、ftp://开头;

    ②:该正则表达式能匹配URL或者IP地址;(如:http://www.baidu.com 或者 http://192.168.1.1)

    ③:该正则表达式能匹配到URL的末尾,即能匹配到子URL;(如能匹配:http://www.baidu.com/s?wd=a&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=1236)

    ④:该正则表达式能够匹配端口号;

    阻止某些指定的URL:

    如果我们在输入的文本框中要阻止http://www.baidu.com这个URL,传统的方法是用上面的正则表达式去匹配文本框中的URL,读出所有的URL之后在跟要阻止的URL去比较,但是这种方法有一个弊端,就是我们读出的URL是一直到子URL,而我们在配置文件中可能就写一个母URL,这样要对check出来的URL进行切割,加上网站默认的端口号是:80,我们要去比较端口号等等,我想出了一种新的方法:

    从配置文件中读出要阻止的URL,组成一个正则表达式,去匹配文本框中,如果能够匹配到,则阻止掉。

    配置文件中应该写:<add key="DomainCheckBlackUrl" value="baidu.com" />

    在代码中实现:

    现在一个正则表达式由3部分组成:

    1:正则表达式的开头,可能由任意的字符组成;

    2:正则表达式的中间部分:从配置文件中读出来的部分;

    3:正则表达式的结尾部分:可能有一些子目录或者端口号等;

    首先,从配置文件中读出URL:string[] serverlist = ConfigurationManager.AppSettings["DomainCheckBlackUrl"].Split(',');(配置文件中以“,”分割)

    其次,string start = @"((http|ftp|https)://)([a-zA-Z0-9_-]+.)*";(正则表达式的开头)

    然后,正则表达式的结尾: end = @"(:[0-9]{1,4})?((/[a-zA-Z0-9&%_./-~-]*)|(?=[^a-zA-Z0-9.]))";

    组合之后的正则表达式: string check = start + @"((?<=[^a-zA-Z0-9])(" + CutStr + "))" + end;

    以上是本人的一些小见解,希望对大家能有所帮助。

    注:

    string regexStr = @"((http|ftp|https)://)(([a-zA-Z0-9._-]+.[a-zA-Z]{2,6})|([0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9&%_./-~-]*)?";
    Regex regex = new Regex(regexStr, RegexOptions.IgnoreCase);
    MatchCollection matches = regex.Matches(content);
    if (matches.Count == 1)
    {
    content = content.Replace(matches[0].Value, dataDictionaryList.Where(i => i.DicValue == currentUser.GongHao).ToList()[0].DicRemark);
    }

  • 相关阅读:
    日期验证正则表达式
    删除数据表中重复的记录
    转:精选15个国外CSS框架
    WEB打印大全(转)
    document.execCommand()方法使用的语法
    Jquery 1000 demo
    完成 ajax.net 的cross domain ajax功能实现
    "方案改进:直接通过User Control生成HTML", 我的改进意见
    实现Mashup的基本技术手段: cross domain ajax
    你还在用GUID作数据库表的主键吗?
  • 原文地址:https://www.cnblogs.com/zhouyunbaosujina/p/3831445.html
Copyright © 2011-2022 走看看