zoukankan      html  css  js  c++  java
  • 论文阅读(Xiang Bai——【PAMI2017】An EndtoEnd Trainable Neural Network for Imagebased Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读

    1.  论文题目

    Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

    2.  论文思路和方法

    1)  问题范围: 单词识别

    2)  CNN层:使用标准CNN提取图像特征,利用Map-to-Sequence表示成特征向量;

    3)  RNN层:使用双向LSTM识别特征向量,得到每列特征的概率分布;

    4)  Transcription层:利用CTC和前向后向算法求解最优的label序列;

    3.  亮点和创新点

    1)  端到端可训练(把CNN和RNN联合训练)

    2)  任意长度的输入(图像宽度任意,单词长度任意)

    3)  训练集无需有字符的标定

    4)  带字典和不带字典的库(样本)都可以使用

    5)  性能好,而且模型小(参数少)

    4.  相关链接

    1)   白翔的个人主页:http://mc.eistar.net/~xbai/

    2)   论文的下载地址:https://arxiv.org/pdf/1507.05717v1.pdf

    3)   代码的下载地址:

    http://mc.eistar.net/~xbai/CRNN/crnn_code.zip

    5.  论文细节

    1)   论文的框架

    2)   特征提取层

    3)   序列标定层

    4)   翻译层

    5)   网络训练

    6)   实验

    7)   总结

    8)   问题




  • 相关阅读:
    csp-s模拟110
    csp-s模拟109
    留念
    csp-s 2019 游记
    HEOI2020
    CSP-S2019记
    堆积的$TIPS$
    低错复习
    倍增并查集
    4.26
  • 原文地址:https://www.cnblogs.com/lillylin/p/6035815.html
Copyright © 2011-2022 走看看