zoukankan      html  css  js  c++  java
  • tf识别非固定长度图片ocr(数字+字母 n位长度可变)- CNN+RNN+CTC

    先安装必须的库

    tensorflow_gpu==1.15.0
    numpy
    opencv_python
    

    github: 

    https://github.com/bai-shang/crnn_ctc_ocr_tf

      

    下载数据集:

    http://www.robots.ox.ac.uk/~vgg/data/text/mjsynth.tar.gz
    要10G

    然后解压缩,估计完整解压完需要1天

     

    find ./mnt/ | xargs ls -d | grep jpg > image_list_all.txt
    
    # use some of data to train and eval
    cat image_list_all.txt | head -n 1000 > image_list.txt
    

      

     

     这个文件的图片txt将会作为输入,然后生成tfrecord

    python create_synth90k_tfrecord.py --image_dir C:UsersMcKayPycharmProjects	est8	fdemodata --anno_file ./image_list.txt --char_map_json_file ../char_map/char_map.json
    

      

     

    然后就是训练了

    参数:

    --data_dir ../data/tfrecords/ --model_dir ./model/ --batch_size 32 --char_map_json_file ../char_map/char_map.json
    

      

    没有GPU,训练了4个小时,也只是7%的正确率

    果断中断,有缘再用GPU训练。

  • 相关阅读:
    一步一步来
    性能管理分析
    css架构
    bootstrap栅格系统的div高度怎样定?
    有效地重构代码
    模块化开发
    性能优化和模块化
    表单只能输入数字
    SpringMVC拦截器
    整合SSM
  • 原文地址:https://www.cnblogs.com/aarond/p/crnn.html
Copyright © 2011-2022 走看看