zoukankan      html  css  js  c++  java
  • 亚马逊商品页面的简单爬取 --Pyhon网络爬虫与信息获取

    1、亚马逊商品页面链接地址(本次要爬取的页面url)

    https://www.amazon.cn/dp/B07BSLQ65P/

    2、代码部分

    import requests
    url = "https://www.amazon.cn/dp/B07BSLQ65P/"
    try:
    kv = {'user-agent': 'Mozilla/5.0'}
    # 修改了发起请求的请求头中的user-agent的值,告诉目的url这是由浏览器发送的请求
    r = requests.get(url, headers=kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
    except:
    print("爬取页面失败!")

    3、打印结果

    根据打印出的信息,很明显不是爬取到的目的url页面。可以将爬取到的页面在浏览器中打开,可以看到爬取到的其实是这样的页面:

    其实,这应该是亚马逊网站反爬虫的策略。对于如何爬取亚马逊商品页面,当然应该会有方法的,暂时先记录到这里吧!

  • 相关阅读:
    CVE-2019-0708
    windows powershell的常用命令
    sqli-lab(8)
    DVWA--CSP Bypass
    认清自己
    sqli-libs(7)
    DVWA--upload
    sqli-labs(6)
    python学习之路(22)
    BZOJ2434:[NOI2011]阿狸的打字机——题解
  • 原文地址:https://www.cnblogs.com/qikeyishu/p/9354687.html
Copyright © 2011-2022 走看看