zoukankan      html  css  js  c++  java
  • python selenium爬取QQ空间方法

    from selenium import webdriver
    import time
    # 打开浏览器
    dr = webdriver.Chrome()
    # 打开某个网址
    dr.get('https://user.qzone.qq.com/2330331400/main')
    # 切换框架
    dr.switch_to_frame('login_frame')
    time.sleep(1)
    dr.find_element_by_link_text('帐号密码登录').click()
    # 输入账号
    dr.find_element_by_xpath('//*[@id="u"]').send_keys('2330331400')
    time.sleep(8)
    # 点击登录
    dr.find_element_by_xpath('//*[@id="login_button"]').click()
    time.sleep(2)
    # 点击个人档
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(2)
    # 请求好友的空间地址
    dr.get('https://user.qzone.qq.com/481135195')
    time.sleep(3)
    # dr.switch_to_alert()
    # dr.find_element_by_link_text('我知道了').click()
    # 点击好友的个人档
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(1)
    # 切换框架
    dr.switch_to_frame('app_canvas_frame')
    # 点击好友的个人资料
    dr.find_element_by_link_text('个人资料').click()
    # dr.find_element_by_link_text('//*[@id="info_link"]').click()
    # 输入当前页面的源代码
    print(dr.page_source)
    
    dr.get('https://user.qzone.qq.com/495483884')
    time.sleep(3)
    # dr.switch_to_alert()
    # dr.find_element_by_link_text('我知道了').click()
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(1)
    dr.switch_to_frame('app_canvas_frame')
    dr.find_element_by_link_text('个人资料').click()
    # dr.find_element_by_link_text('//*[@id="info_link"]').click()
    print(dr.page_source)

     

  • 相关阅读:
    架构师图谱
    P3398 仓鼠找sugar
    NOIP 2017小凯的疑惑
    P2568 GCD
    自动AC机
    qbxt国庆刷题班 游记&总结
    【学习笔记】manacher算法
    [ZROI]分组
    BSGS与扩展BSGS
    Crt and ExCrt
  • 原文地址:https://www.cnblogs.com/duanlinxiao/p/9847706.html
Copyright © 2011-2022 走看看