这种方式只能对简单的验证码起作用,复杂的就获取不到了。
验证码识别思路:
1、获取整个屏幕截图
2、获取验证码图片的坐标
3、抠图获取验证码图片
4、使用pytesseract识别验证码
示例代码
import os
from time import sleep
import pytesseract
from selenium import webdriver
from PIL import Image
class TestCase():
def __init__(self):
self.driver = webdriver.Chrome()
self.driver.maximize_window()
self.driver.get('http://es.bnuz.edu.cn/')
def test01(self):
#获取屏幕截图
self.driver.get_screenshot_as_file(os.path.dirname(__file__)+'/屏幕截图.png')
#获取验证码图片元素
ele = self.driver.find_element_by_xpath('//*[@id="yzm_dd"]/img')
#获取验证码图片左上角的坐标
location = ele.location
size = ele.size
print(location)
print(size)
#验证码图片的大小
left = location['x']
top = location['y']
right = size['width'] + left
height = size['height'] + top
#如果是retina屏幕,需要这样
dpr = self.driver.execute_script('return window.devicePixelRatio')
#抠图获取验证码图片
im = Image.open(os.path.dirname(__file__)+'/屏幕截图.png')
im_new = im.crop((left*dpr,top*dpr,right*dpr,height*dpr))
im_new.save(os.path.dirname(__file__)+'/验证码图片.png')
sleep(3)
self.driver.quit()
def test02():
img = Image.open(os.path.dirname(__file__)+'/验证码图片.png')
res = pytesseract.image_to_string(img)
print(res)
if __name__ == '__main__':
TestCase.test02()
获取到的整个屏幕截图:
验证码图片:
输出结果: