爬虫（GET）——传递要查询的关键字

工具：python3

目标：传递关键字，爬取任意关键字的页面

import urllib.request

# 定义User-Agent，要爬取的url，以及要查询的关键字
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36"}
url = "http://www.baidu.com/s"
kd = input("请输入要查询的关键字：")

# 将关键字进行url编码，传递到urlencode（）中的字符类型为字典
wd = {"wd": kd}
wd = urllib.parse.urlencode(wd)

# 构造完整的url
fullurl = url + "?" + wd
print(fullurl)

# 构造服务器请求信息
request = urllib.request.Request(fullurl, headers=headers)
print(request)

# 向服务器发送请求
response = urllib.request.urlopen(request)

# 将爬取到的内容存入文件baidu.txt
content = response.read()
f = open("baidu.txt", "w")
f.write(str(content))
f.close()

查看全文

相关阅读:
asp.net 进行发送邮箱验证
 获取微信签名,并保存在xml文件中
 webform获取微信用户的授权
 [转载]将json字符串转换成json对象
 使用authentication进行身份验证,与Forms表单登陆
 解决在IE下LABEL中IMG图片无法选中RADIO的几个方法
 php网页切图/js切图
 最近新装系统windows8.1+Mac。。。还没装驱动就遇到一堆问题。。。
百度地图api根据定位获取附近商家（只获取屏幕内）
ios ZBar扫二维码奇奇怪怪的错误

原文地址：https://www.cnblogs.com/gaoquanquan/p/9088970.html