A method for detecting text of arbitrary shapes in natural scenes that improves text spotting
https://github.com/wqtwjt1996/UHT
https://openaccess.thecvf.com/content_CVPRW_2020/papers/w34/Wang_A_Method_for_Detecting_Text_of_Arbitrary_Shapes_in_Natural_CVPRW_2020_paper.pdf
Qitong Wang, Yi Zheng, and Margrit Betke
Boston University
Boston, MA 02215
{wqt1996, yizheng, betke}@bu.edu
是CVPR-2020的一篇论文,介绍了一个基于流水线的文本识别框架,它可以检测和识别具有复杂背景的自然场景图像中各种字体、形状和方向的文本。主要解决任意形状的文本的识别。
- 主要贡献是文本检测组件,称之为UHT,即UNet、Heatmap和Textfill的缩写。
- UHT使用UNet计算候选文本区域的热图,并使用textfill算法在候选文本中的每个单词周围产生紧密的多边形边界。
- 该方法利用从groundtruth注释提供的文本边界多边形中获取的groundtruth热图训练UNet。
- 作者提出的文本识别框架,称为UHTA,结合了UHT与最先进的文本识别系统ASTER。