zoukankan      html  css  js  c++  java
  • urllib parse

    1、urlparse

    作用:解析url

    from urllib import parse
    
    url = "https://book.qidian.com/info/1004608738"
    
    result = parse.urlparse(url=url)
    print(result)

    结果:

    ParseResult(scheme='https', netloc='book.qidian.com', path='/info/1004608738', params='', query='', fragment='')
    scheme:表示协议
    netloc:域名
    path:路径
    params:参数
    query:查询条件,一般都是get请求的url
    fragment:锚点,用于直接定位页
    面的下拉位置,跳转到网页的指定位置
    

    2、urlunparse

    作用:上传url

    from urllib import parse
    
    url_params = ('https', 'book.qidian.com', '/info/1004608738', '', '', '')
    
    _url = parse.urlunparse(url_params)
    print(_url)
    
    # https://book.qidian.com/info/1004608738

    3、urljoin

    作用:拼接url

    from urllib import parse
    
    
    url_1 = "https://book.qidian.com/"
    url_2 = "info/1004608738"
    
    new_url = parse.urljoin(url_1, url_2)
    print(new_url)
    
    # https://book.qidian.com/info/1004608738

    4、urlencode

    作用:url的参数,字典格式->url格式

    from urllib import parse
    
    params = {
        'page': 10,
        'job': 'python'
    }
    url = "https://test.job.com/"
    url_params = parse.urlencode(params)
    
    new_url = parse.urljoin(url, url_params)
    print(new_url)
    #  https://test.job.com/page=10&job=python

    5、quote

    作用:将中文->url的编码

    from urllib import parse
    
    key = "海贼王"
    
    _key = parse.quote(key)
    print(_key)
    url = "https://www.sogou.com/web?query={}".format(_key)
    print(url)
    
    
    # https://www.sogou.com/web?query=%E6%B5%B7%E8%B4%BC%E7%8E%8B

     6、unquote

    url编码->中文

    from urllib import parse
    url = "https://www.sogou.com/web?query=%E6%B5%B7%E8%B4%BC%E7%8E%8B"
    unquote_url = parse.unquote(url)
    print(unquote_url)
    
    #   https://www.sogou.com/web?query=海贼王
  • 相关阅读:
    编译 | 更新标准库_交叉编译工具链
    论文 | 图文_学科
    编码 | 二进制格式设计方案
    图片 | 图片上传管理
    进程 | 查询进程中包含多少线程
    第二周02:Fusion ICP逐帧融合
    exe文件当前目录搜索文件
    第一周:读取XML深度数据并将其重建为三维点云
    第二周:01 ICP迭代交互
    C++文件读写(转载)
  • 原文地址:https://www.cnblogs.com/wt7018/p/11896975.html
Copyright © 2011-2022 走看看