zoukankan      html  css  js  c++  java
  • java匹配http或https的url的正则表达式20180912

    package org.jimmy.autosearch20180821.test;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    public class TestUrlRegularExpression {
    
        public static void main(String[] args) {
            //默认是贪婪匹配,暂时还没尝试写一个正则匹配
            String urlRegex = "https?://(\w|-)+(\.(\w|-)+)+(/(\w|-)+(/((\w|-)+\.(\w|-)+)|/(\w|-)*)|(/((\w|-)+\.(\w|-)+)|/(\w|-)+)|/?)/(((\w|-)+\.(\w|-)+)|(\w|-)+(\?\w+=(\w|-|%|[u4e00-u9fa5])+(\&\w+=(\w|-|%|[u4e00-u9fa5])+)*)?)";
         修改为:
         urlRegex = "https?://(\w|-)+(\.(\w|-)+)+(/(\w|-)+(/((\w|-)+\.(\w|-)+)|/(\w|-)*)|(/((\w|-)+\.(\w|-)+)|/(\w|-)+)|/?)/(((\w|-)+\.(\w|-)+)|(\w|-)*(\?\w+=(\w|-|%|[u4e00-u9fa5])+(\&\w+=(\w|-|%|[u4e00-u9fa5])+)*)?)";
         urlRegex = "https?://(\w|-)+(\.(\w|-)+)+(/(\w+(\?(\w+=(\w|%|-)*(\&\w+=(\w|%|-)*)*)?)?)?)+";//修改版 String urlRegex2
    = "https?://(\w|-)+(\.(\w|-)+)+(/(\w|-)+(/((\w|-)+\.(\w|-)+)|/(\w|-)*)|(/((\w|-)+\.(\w|-)+)|/(\w|-)+)|/?)"; //我在百度搜索了java 正则表达式,然后复制了放在url里面的 String url = "https://www.baidu.com/s?wd=java%20%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F&rsv_spt=1&rsv_iqid=0xf233885e000326c0&issp=1&f=8&rsv_bp=0&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_sug3=24&rsv_sug1=8&rsv_sug7=100&rsv_t=0d31XJ5IR0T98Bv150wUMKQHirYYsh2IgKsJFk0FH4wGur10ND3LypRnWtdrcFCsDH%2F3&rsv_sug2=0&inputT=6942&rsv_sug4=6942"; //这个就是不带参数的url了 String url2 = "https://www.baidu.com"; Pattern pattern = Pattern.compile(urlRegex); Matcher matcher = pattern.matcher(url); String isSuccess = "不匹配"; if(matcher.matches()){ isSuccess = "匹配"; } System.out.println(isSuccess); pattern = Pattern.compile(urlRegex2); matcher = pattern.matcher(url2); isSuccess = "不匹配"; if(matcher.matches()){ isSuccess = "匹配"; } System.out.println(isSuccess); } }

    还是直接上代码.

    运行结果见下图:

     修复了之前不能匹配微软必应搜索的url地址.

    2015年10月-2016年3月 总计:5个月.
    2016年11月-2017年6月 总计:7个月.
    2017年7月-2018年4月 总计:9个月.
    2018年5月-2018年5月 总计:1个月.
    2018年6月-2018年12月 总计:6个月.
    2019年1月-2019年12月 总计11个月.
    2020年2月-2021年2月 总计13个月.
    所有总计:5+7+9+1+6+11+13=52个月(4年4个月).
    本人认同二元论.我是理想主义者,现实主义者,乐观主义者,有一定的完美主义倾向.不过,一直都是咸鱼(菜鸟),就算有机会,我也不想咸鱼翻身.(并不矛盾,因为具体情况具体分析)
    英语,高等数学,考研,其他知识学习打卡交流QQ群:946556683
  • 相关阅读:
    angularjs
    HTML5
    Java Concurrency —— 《Java并发编程实战》读书笔记
    java IO
    Struts2 文件上传下载
    SQL join
    Annotation
    if表达式
    Ext js 下拉框下拉的同时输入模糊查询
    JSP如何把一个页面的值传到另一个页面
  • 原文地址:https://www.cnblogs.com/JimmySeraph/p/9633839.html
Copyright © 2011-2022 走看看