zoukankan      html  css  js  c++  java
  • python selenium爬取QQ空间方法

    from selenium import webdriver
    import time
    # 打开浏览器
    dr = webdriver.Chrome()
    # 打开某个网址
    dr.get('https://user.qzone.qq.com/2330331400/main')
    # 切换框架
    dr.switch_to_frame('login_frame')
    time.sleep(1)
    dr.find_element_by_link_text('帐号密码登录').click()
    # 输入账号
    dr.find_element_by_xpath('//*[@id="u"]').send_keys('2330331400')
    time.sleep(8)
    # 点击登录
    dr.find_element_by_xpath('//*[@id="login_button"]').click()
    time.sleep(2)
    # 点击个人档
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(2)
    # 请求好友的空间地址
    dr.get('https://user.qzone.qq.com/481135195')
    time.sleep(3)
    # dr.switch_to_alert()
    # dr.find_element_by_link_text('我知道了').click()
    # 点击好友的个人档
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(1)
    # 切换框架
    dr.switch_to_frame('app_canvas_frame')
    # 点击好友的个人资料
    dr.find_element_by_link_text('个人资料').click()
    # dr.find_element_by_link_text('//*[@id="info_link"]').click()
    # 输入当前页面的源代码
    print(dr.page_source)
    
    dr.get('https://user.qzone.qq.com/495483884')
    time.sleep(3)
    # dr.switch_to_alert()
    # dr.find_element_by_link_text('我知道了').click()
    dr.find_element_by_xpath('//*[@id="menuContainer"]/div/ul/li[6]/a').click()
    time.sleep(1)
    dr.switch_to_frame('app_canvas_frame')
    dr.find_element_by_link_text('个人资料').click()
    # dr.find_element_by_link_text('//*[@id="info_link"]').click()
    print(dr.page_source)

     

  • 相关阅读:
    spring-data-jpa 二、多对一结构、Repository
    bootstrap学习(二)页面
    bootstrap学习(一)栅格、布局
    ArrayList源码学习
    python学习-Pillow图像处理
    python学习-抓取知乎图片
    python-os创建文件夹-create_dir_if_not_exist.py
    python-shutil学习
    python-argparse批量修改后缀名-batch_file_rename.py
    python-argparse使用
  • 原文地址:https://www.cnblogs.com/duanlinxiao/p/9847706.html
Copyright © 2011-2022 走看看