zoukankan      html  css  js  c++  java
  • 爬虫1

    import urllib.request

    import urllib.parse

    import string

    url = "http://www.baidu.com/s?wd="

    name="中文"

    #python urllib库 不支持中文 必须将中文转换成 ascii 不然会报错 这也是初学者的一个大坑

    encode_name = urllib.parse.quote(name,safe = string.printable)

    #url地址拼接 

    final_url = url + encode_name

    #目标网页请求 https 是需要有请求头的 这里用http 请求

    response = urllib.urlopen(final_url)

    #解读 并转化成 utf-8

    data = response.read().decode("utf-8")

    #这样我们就获得了目标网站的信息了

    #如果name为字典 我们先要将name转化一下

    str_name = urllib.parse.urlencode(name)

    #然后如果有中文再转换中文 没中文直接拼接url就成

    str_dict = urllib.parse.urlencode(dict)
  • 相关阅读:
    B-树与B+树
    RPC原理
    高可用
    Srpingboot与dubbo整合的三种方式
    html
    SQL5
    SQL4
    SQL3
    SQL2
    SQL语句1
  • 原文地址:https://www.cnblogs.com/MaDon/p/11248567.html
Copyright © 2011-2022 走看看