selenium模拟登陆，然后再用Requests爬取

from urllib.parse import urljoin
from selenium import webdriver
import requests
import time 

BASE_URL = 'https://login2.scrape.center/'
LOGIN_URL = urljoin(BASE_URL, '/login/')
INDEX_URL = urljoin(BASE_URL, '/page/1')
USERNAME = 'admin'
PASSWORD = 'admin'

browser = webdriver.Chrome()
browser.get(BASE_URL)
browser.find_element_by_css_selector('input[name="username"]').send_keys(USERNAME)
browser.find_element_by_css_selector('input[name="password"]').send_keys(PASSWORD)
browser.find_element_by_css_selector('input[type="submit"]').click()
time.sleep(10)


# get cookies from selenium
cookies = browser.get_cookies()
print('Cookies', cookies)
browser.close()


# set cookies to requests
session = requests.Session()
for cookie in cookies:
  session.cookies.set(cookie['name'], cookie['value'])

response_index = session.get(INDEX_URL)
print('Response Status', response_index.status_code)
print('Response URL', response_index.url)

来自拉勾教育52讲轻松搞定网络爬虫

查看全文

相关阅读:
分析建模中的行为分析
 SOLID总结（未完待续）
分析建模的五个子过程中为什么有个编码子过程？
用例建模的五个子过程
 类之间的关系
 python cx_Freeze安装详解、打包exe文件简解
 pyautoit：OSError: [WinError 193] %1 不是有效的 Win32 应用程序
 Python 动态导入类并运行其中的方法
 比较2个字符串，输出看起来一样，但比较起来不同
 pyautogui 文档（五）：截图及定位功能

原文地址：https://www.cnblogs.com/zhzhang/p/15179005.html