zoukankan      html  css  js  c++  java
  • 使用Python正则表达式自己实现解析URL各参数

    不使用库,自己可以利用正则表达式实现解析域名各部分参数:协议、域名、端口、路径、载荷等。

    使用的正则表达式如下:

    r'''(?x)A
    ([a-z][a-z0-9+-.]*)://             # Scheme
    ([a-z0-9-._~%]+                 # IPv4 host
    |[[a-z0-9-._~%!$&'()*+,;=:]+])       # IPv6 host
    (:[0-9]+)?                     # Port number
    ([a-zA-Z0-9-/._~%!$&'()*+]+)?        # path
    (?[a-zA-Z0-9&=]+)?                # query
    '''               
    

      例如,对于"https://www.baidu.com/xxx/xxx?s=xxx"网址,解析出来各部分为:

    ('https', 'www.baidu.com', None, '/xxx/xxx', '?s=xxx')
    

      

  • 相关阅读:
    .NET 4.6.1 给cookie添加属性
    Blog目录
    1019 数字黑洞
    1018 锤子剪刀布
    1017 A除以B
    1016 部分A+B
    1015 德才论
    1014 福尔摩斯的约会
    1013 数素数
    1012 数字分类
  • 原文地址:https://www.cnblogs.com/ingd/p/6182571.html
Copyright © 2011-2022 走看看