zoukankan      html  css  js  c++  java
  • python --爬虫--爬取百度翻译

    import requests
    import json


    class baidufanyi:
    def __init__(self, trans_str):
    self.lang_detect_url = 'https://fanyi.baidu.com/langdetect' # 语言检测地址
    self.trans_str = trans_str
    self.headers= {'User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36'}

    def parse_url(self,url,data):
    resonpse = requests.post(url,data=data,headers=self.headers)
    return json.loads(resonpse.content.decode()) #将字符串转化为字典
    def run(self):
    # 1 获取语言类型
    # 1.1 准备post 的url的地址 post_data
    lang_detect_data = {'query': self.trans_str}
    # 1.2 发送post 请求 获取数据
    lang = self.parse_url(self.lang_detect_url,lang_detect_data)['lan']
    # 1.3 提取语言类型
    # 2 准备post 数据
    # 3 发送请求 , 获取响应
    # 4 提取翻译结果


    if __name__ == '__main__':
    baidufanyi = baidufanyi()
    baidufanyi.run()

  • 相关阅读:
    代码重构编译---make
    clickhouse日期函数
    连续登陆天数+最大登陆天数
    clickhouse基本使用
    数组
    CK优化
    Hive查询优化~布隆过滤器使用
    Presto常见问题优化
    Presto原理解析
    几种排序说明
  • 原文地址:https://www.cnblogs.com/baili-luoyun/p/10341272.html
Copyright © 2011-2022 走看看