selenium基础-跳过验证码
一、方法
- 设置万能验证码或者屏蔽验证码(最常用的方法)
- 使用验证码识别工具识别验证码
- 通过selenium操作cookies
- 直接使用配置文件的webdriver
二、用selenium操作cookie绕过验证码
cookies和session都是有服务器生成,cookie将保留在浏览器本地,session记录在服务器端
cookie的几大属性
- name:名字(键),cookies的必须字段
- values:值
- domain:域,cookie的作用域名
- path:表示路径,/表示当前域名下所有的网页都能使用该cookie
- domain和path结合在一起使用限定了cookie的使用范围
- expires:生命周期,限定cookie的使用时间。如果生命周期中有session的说明cookie只在当前回话中有效,关闭浏览器后立即失效
- sessionID:本次访问回话留下的ID
通过sessionID加载cookie
通过sessionID的键和值来确定cookie
from selenium import webdriver import time driver=webdriver.Firefox() driver.get('https://www.baidu.com') time.sleep(3) #加载cookie driver.add_cookie({'name':'BDUSS','value':'NiTDdnM0dLcGYxfkRWVnk1anFUdmRNemsxYWIzNlJDcWJHLU1WNkduOEZ
nNWhkRVFBQUFBJCQAAAAAAAAAAAEAAAApKJxdtLrM7MDvMTAyNQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAX2cF0F9nBddX'}) driver.refresh() time.sleep(3) driver.quit()