Google翻译 - 走看看

zoukankan html css js c++ java

Google翻译

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6EmUbbW&id=564564604865

YouTube教程

Python Web Scraping Signature Series Tutorial 1 : Get Request with Python, Google Translate Part 1

检测---network---第二个single？client=。。。。。 ---preview可见翻译结果

name：第二个文件single?client=....

headers

request url:

http://translate.google.cn/translate_a/single?client=t&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&source=btn&srcrom=1&ssel=3&tsel=6&kc=0&tk=749722.875867&q=signature

复制这个链接，打开新的网页会下载一个txt

其内容是对具体的翻译解释

出现urllib2.HTTPError: HTTP Error 403: Forbidden错误是由于网站禁止爬虫，可以在请求加上头信息，伪装成浏览器访问

#伪装浏览器头
headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

req = urllib2.Request(url = 'http://topic.csdn.net/u/20110123/15/F71C5EBB-7704-480B-9379-17A96E920FEE.html',headers = headers)

feeddata = urllib2.urlopen(req).read()

#或者
#opener = urllib2.build_opener()

#feeddata = opener.open(request).read()

print feeddata.decode('u8')

查看全文

相关阅读:
document.getElementById(“id”)与$("#id")的区别
 sqlserver 无法打开备份文件a.bak
xnconvert 图片转换工具
 基于jQuery的 h5移动端抽奖页面插件
 nodeJS 简单启动express服务器
 jquery 按钮切换插件
 微信判断手机有没有APP，有则打开，没有则跳到应用商城
 jQuery 文字向上轮播
 Node.js制作爬取简书内容的爬虫
 jquery手机端轮播图，点击放大手动轮播

原文地址：https://www.cnblogs.com/webRobot/p/5267978.html

Copyright © 2011-2022 走看看