zoukankan
html css js c++ java
ocr之splitLine()函数
ocr之splitLine()函数
该函数的功能是为实现对每行的文字分段而设计的。流程如下:
一. 针对时间格式,提前取出来
def processTimeStr(timeFound,lineText):
该函数是针对每行的文本lineText中的时间格式,提前取出来
其中,用正则表达式匹配,匹配到各种时间格式就标记为
elemList[i]['Delete'] = 1
,然后判断有Delete键的字符就删除,这样elemList就剩下去掉时间格式之后的文本。
二. 删除时间以及英文单词之间的以外的空格
三. 先把上下多行有重叠部分的摘出来,这个不必进行分段,默认为同段
四. 对于非重叠的,则进行分段,依据各字符之间的间隔的不同作为分组条件
五. 求gap,先摘出所有字符紧挨着的gap,赋予groupId = -1,剩余的不紧挨的,按gap排序,然后一次赋值0 1。。。
六. 根据gapList中的groupId进行分组,按照顺序从左到右,遇到groupId不同的,就是分组边界,最后,再按照每组中的第一个元素的x坐标,进行组排序
查看全文
相关阅读:
卡拉OK歌词原理和实现高仿Android网易云音乐
LRC歌词原理和实现高仿Android网易云音乐
Android项目实战之高仿网易云音乐创建项目和配置
Android项目实战之高仿网易云音乐项目介绍
WPS for Linux 与统一操作系统 UOS 完成适配,WP越来越强大
2020 年,Linux 设备或将爆炸式增长
随机电话号码生成器怎么在线使用?
Chrome是老大,Firefox 是老二,Edge 不是老三
2020 年的云世界三个方面:新联盟、无服务器和安全挑战
电话号码生成器手机版,苹果和安卓手机均可用
原文地址:https://www.cnblogs.com/monkey-moon/p/9260762.html
最新文章
AnimatedGifPlayer--GIF Android 播放不起 出现白色图片
iOS:bugly符号表上传
深度学习(001)-深度学习简介
javascript基础(001)-js加减乘除注意事项(含类型转换)
安卓逆向基础(003)-安卓逆向用到的一些命令(随时更新)
安卓逆向基础(002)-android虚拟机
安卓逆向基础(001)-APK安装流程
Git 常用基本命令汇总
Sublime常用插件安装大全
Vue+Webpack之 代码及打包优化
热门文章
windows + flutter +android+ vscode 安装配置运行流程(详细版本)
Vue.js实现大文件分片md5断点续传
CROSS-ENV不同环境配置
Vue2.0的三种常用传值方式、父传子、子传父、非父子组件传值
css3之图形绘制
JS常用公共方法封装
网页解析的全过程(输入url到展示页面)
从 0 使用 SpringBoot MyBatis MySQL Redis Elasticsearch打造企业级 RESTful API 项目实战
从0使用Ruby on Rails打造企业级RESTful API项目实战之我的云音乐
【第二版】高仿Android网易云音乐企业级项目实战课程介绍
Copyright © 2011-2022 走看看