4.17

Python爬虫request模块

首先安装：pip install requests

爬取搜狗尝试：

# 案例1. 抓取搜狗搜索内容
kw = input("请输⼊你要搜索的内容:")
response =
requests.get(f"https://www.sogou.com/web?query=
{kw}") # 发送get请求
# print(response.text) # 直接拿结果(⽂本)
with open("sogou.html", mode="w", encoding="utf8") as f:
 f.write(response.text)

百度翻译案例：

# 案例2.抓取百度翻译数据
# 准备参数
kw = input("请输⼊你要翻译的英语单词:")
dic = {
 "kw": kw # 这⾥要和抓包⼯具⾥的参数⼀致.
}
# 请注意百度翻译的sug这个url. 它是通过post⽅式进⾏提交
的. 所以我们也要模拟post请求
resp =
requests.post("https://fanyi.baidu.com/sug",
data=dic)
# 返回值是json 那就可以直接解析成json
resp_json = resp.json()
# {'errno': 0, 'data': [{'k': 'Apple', 'v': 'n.
苹果公司，原称苹果电脑公司'....
print(resp_json['data'][0]['v']) # 拿到返回字典中的
内容

查看全文

相关阅读:
Mysql问题1862
S3TC IAP15F2K61S2点亮一个发光二极管keil和stc-isp软件操作
 .NET练习计算平方根
 求一个整数以内的素数(函数实现)
判断一个数是不是素数(函数实现)
#号在进制输出值的作用，美化输出
 分类——决策树模型（附有决策树生成步骤）
分类：贝叶斯分类之新闻组数据组学习（查看数据类型的方法）（环境:Pycharm）
分类：K-近邻分类之鸢尾花数据集学习（包含数据预处理中的标准化）（环境：Pycharm）
编写一个程序，求2～n间的素数，n由键盘输入，循环变量分别从2到n、2到(int)sqrt(n)，分别测出两个循环的所用时间。

原文地址：https://www.cnblogs.com/zhaoyids/p/14902627.html