zoukankan      html  css  js  c++  java
  • 爬虫(三)-之Urllib库的基本使用

    什么是Urllib

    Urllib是python内置的HTTP请求库

    包括以下模块

    urllib.request  请求模块

    urllib.error  异常处理模块

    urllib.parse    url解析模块

    urllib.robotparser  robots.txt解析模块

    urlopen

    关于urllib.request.urlopen参数的介绍:

    urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None)

    url参数的使用

    先写一个简单的例子:

    import urllib.request
    
    response = urllib.request.urlopen('http://www.baidu.com')
    print(response.read().decode('utf-8'))

    urlopen一般常用的有三个参数,它的参数如下:
    urllib.requeset.urlopen(url,data,timeout)
    response.read()可以获取到网页的内容,如果没有read(),将返回如下内容

    data参数的使用

    上述的例子是通过请求百度的get请求获得百度,下面使用urllib的post请求

  • 相关阅读:
    python模拟shell
    10.LIKE 操作符
    9.TOP 子句--mysql limit
    8.INSERT INTO 语句 UPDATE 语句
    7.ORDER BY 子句
    6.AND & OR 运算符
    5.WHERE 子句
    4.SELECT DISTINCT 语句
    3.SELECT 语句
    2.sql分类
  • 原文地址:https://www.cnblogs.com/sanqiansi/p/10302416.html
Copyright © 2011-2022 走看看