zoukankan      html  css  js  c++  java
  • python爬虫(二) urlparse和urlsplit函数

    urlparse和urlsplit函数:

    urlparse:

    url='http://www.baidu.com/s?wd=python&username=abc#1'
    
    result=parse.urlparse(url)
    
    print(result)

     输入的结果为解析之后的各部分

    输出对应的参数:

    url='http://www.baidu.com/s?wd=python&username=abc#1'
    
    result=parse.urlparse(url)
    
    # print(result)
    print('scheme:',result.scheme)
    print('netloc:',result.netloc)
    print('path:',result.path)
    print('params:',result.params)
    print('query:',result.query)
    print('fragment:',result.fragment)

    结果就是输入的网址各个部分

     urlsplit:

    url='http://www.baidu.com/s?wd=python&username=abc#1'
    result=parse.urlsplit(url)
    print(result)

     这个里面没有params这个参数

    因为在urlparse中,

     在这个网址问好前面加一个分号,分号和问好中间加一个hello

     urlparse这个函数的params这个参数就是为了获得分号和问号中间的值

    在平时使用中两个函数是一样的。

  • 相关阅读:
    java线程池笔记
    java多线程简单用法
    Java 常用工具类整理
    Linux nohup命令详解
    Java八种基本类型
    isms项目tomcat运行配置
    2017计划
    ES6 Reflect 与 Proxy
    ES6 Map与Set
    ES6 Symbol类型
  • 原文地址:https://www.cnblogs.com/zhaoxinhui/p/12358196.html
Copyright © 2011-2022 走看看