zoukankan      html  css  js  c++  java
  • 爬虫1

    import urllib.request

    import urllib.parse

    import string

    url = "http://www.baidu.com/s?wd="

    name="中文"

    #python urllib库 不支持中文 必须将中文转换成 ascii 不然会报错 这也是初学者的一个大坑

    encode_name = urllib.parse.quote(name,safe = string.printable)

    #url地址拼接 

    final_url = url + encode_name

    #目标网页请求 https 是需要有请求头的 这里用http 请求

    response = urllib.urlopen(final_url)

    #解读 并转化成 utf-8

    data = response.read().decode("utf-8")

    #这样我们就获得了目标网站的信息了

    #如果name为字典 我们先要将name转化一下

    str_name = urllib.parse.urlencode(name)

    #然后如果有中文再转换中文 没中文直接拼接url就成

    str_dict = urllib.parse.urlencode(dict)
  • 相关阅读:
    通过dockerfile制作nginx镜像
    docker存储卷
    docker容器网络配置
    状态模式
    抽象工厂模式
    观察者模式
    建造者模式
    外观模式
    模板方法模式
    原型模式
  • 原文地址:https://www.cnblogs.com/MaDon/p/11248567.html
Copyright © 2011-2022 走看看