zoukankan      html  css  js  c++  java
  • python学习笔记(6)--有道翻译爬虫

    说明:

    1. 导入三个模块,urllib.request.urlopen用来打开url链接,urllib.parse的urlencode方法将浏览器network里的data对象转为urlopen的第二个参数data,json.loads()方法把response.read返回的字符串转为json格式。

    2. data对象是从审查元素的network里的translate?开头的Headers里最下面的formdata里的所有属性。

    3. urlopen(url,data)里的data要先encode编码成utf-8,得到返回值后的result要再decode解码回utf-8。

     1 import urllib.request
     2 import urllib.parse
     3 import json
     4 
     5 userinput = ""
     6 while  userinput != "exit":
     7     userinput = input("输入要翻译的话(exit退出):")
     8     url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=https://www.baidu.com/link"
     9     data = {}
    10     data["type"] = "AUTO"
    11     data["i"] = userinput
    12     data["doctype"] = "json"
    13     data["xmlVersion"] = "1.8"
    14     data["keyfrom"] = "fanyi.web"
    15     data["ue"] = "UTF-8"
    16     data["action"] = "FY_BY_CLICKBUTTON"
    17     data["typoResult"] = "true"
    18     data = urllib.parse.urlencode(data).encode("utf-8")
    19     response = urllib.request.urlopen(url,data)
    20     result = response.read().decode("utf-8")
    21     result = json.loads(result)
    22     result = result["translateResult"][0][0]["tgt"]
    23     print(result)
  • 相关阅读:
    day03 字符串
    day02 运算符和编码
    day01 初识Python
    windows 安装yaml支持和pytest支持等
    Python自动补全缩写意义
    关于python接口测试connect error
    关于Python的post请求报504错误
    python函数参数*args **kwargs
    利用Python语言Appium启动ios app
    shell 中| 用法
  • 原文地址:https://www.cnblogs.com/Jacklovely/p/6504780.html
Copyright © 2011-2022 走看看