python使用urlopen/urlretrieve下载文件时出现403 forbidden的解决方法

在学习Python爬虫的时候，突然报错：urllib.error.HTTPError: HTTP Error 403: Forbidden

问题原因：出现该错误的原因是服务器开启了反爬虫，一般情况下只需要设置header模拟浏览器即可，但是urlretrieve并未提供header参数。

解决方案一：使用urlopen直接下载文件：（亲测好用）

header = {                      #伪造浏览器头部，不然获取不到网易云音乐的页面源代码
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0' #根据浏览器不同进行替换，实例为火狐
}
def get_music(rs):
    response = requests.get(rs, headers=header).content  # 必须要加headers信息，不然获取不到
    f = open(name + ".mp3", 'wb')  # 以二进制的形式写入文件中
    f.write(response)
    f.close()

解决方案二：使用urlretrieve进行下载：（亲测，不是太好用）

opener=urllib.request.build_opener()
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')]
urllib.request.install_opener(opener)
urllib.request.urlretrieve(url, Path)

愿我们漂泊半生，归来仍少年！

查看全文

相关阅读:
POJ1486 Sorting Slides 二分图or贪心
 POJ2060 Taxi Cab Scheme 最小路径覆盖
 POJ3083 Children of the Candy Corn 解题报告
 以前的文章
 POJ2449 Remmarguts' Date K短路经典题
 这一年的acm路
 POJ3014 Asteroids 最小点覆盖
 POJ2594 Treasure Exploration 最小路径覆盖
 POJ3009 Curling 2.0 解题报告
 POJ2226 Muddy Fields 最小点集覆盖

原文地址：https://www.cnblogs.com/Lonnn/p/13041657.html