zoukankan      html  css  js  c++  java
  • 爬虫23-验证码识别

    1.tesseract

    import pytesseract
    from PIL import Image
    pytesseract.pytesseract.tesseract_cmd=r"H:PythonTesseract_dev20170510Tesseract-OCR	esseract.exe"
    
    image=Image.open('a.png')
    
    text=pytesseract.image_to_string(image)
    print(text)
    

      

    2.识别拉勾网图形验证码

    #encoding: utf-8
    
    import pytesseract
    from urllib import request
    from PIL import Image
    import time
    
    def main():
        pytesseract.pytesseract.tesseract_cmd = r"H:PythonTesseract_dev20170510Tesseract-OCR	esseract.exe"
        url = "https://passport.lagou.com/vcode/create?from=register&refresh=1513082291955"
        while True:
            request.urlretrieve(url,'captcha.png')
            image = Image.open('captcha.png')
            text = pytesseract.image_to_string(image)
            print(text)
            time.sleep(2)
    
    
    if __name__ == '__main__':
        main()
    

      

  • 相关阅读:
    div 背景透明,字体不透明
    弹性盒子(1)
    小练习(4)
    小练习(3)
    图标文字上拉效果
    小练习(2)
    小练习
    css的使用(1)
    复合的使用
    表单元素的使用 form input
  • 原文地址:https://www.cnblogs.com/wcyMiracle/p/12500041.html
Copyright © 2011-2022 走看看