javacv文字识别系列:
javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别
前言
上一章我们实现了图片的文字识别和提取,本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取
javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。
读取视频帧javacv已经帮我们封装好了,直接就可以读取到视频帧,麻烦的是,测试的时候发现javacv设置像素格式不起效果,所以我们只能通过BufferedImage进行转换后才能进行图片文字识别,性能上肯定会有折扣,后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给tesserac进行识别。
那么,就让我们开始吧。
注意:由于我们是每一帧都进行识别,而且视频播放和识别是相同线程,会阻塞,所以视频播放速度会很慢。
实现功能
1、视频读取
2、视频帧获取
3、视频帧转换为java的BuffredImage图片
4、图片转像素
5、使用像素数据进行tesserac ocr文字识别
完整阅读本章:https://eguid.blog.csdn.net/article/details/106044521