zoukankan
html css js c++ java
ocr之splitLine()函数
ocr之splitLine()函数
该函数的功能是为实现对每行的文字分段而设计的。流程如下:
一. 针对时间格式,提前取出来
def processTimeStr(timeFound,lineText):
该函数是针对每行的文本lineText中的时间格式,提前取出来
其中,用正则表达式匹配,匹配到各种时间格式就标记为
elemList[i]['Delete'] = 1
,然后判断有Delete键的字符就删除,这样elemList就剩下去掉时间格式之后的文本。
二. 删除时间以及英文单词之间的以外的空格
三. 先把上下多行有重叠部分的摘出来,这个不必进行分段,默认为同段
四. 对于非重叠的,则进行分段,依据各字符之间的间隔的不同作为分组条件
五. 求gap,先摘出所有字符紧挨着的gap,赋予groupId = -1,剩余的不紧挨的,按gap排序,然后一次赋值0 1。。。
六. 根据gapList中的groupId进行分组,按照顺序从左到右,遇到groupId不同的,就是分组边界,最后,再按照每组中的第一个元素的x坐标,进行组排序
查看全文
相关阅读:
thinkphp3.2源码(错误和异常处理)
linux升级openssl和php_openssl模块
详解PhpSpreadsheet设置单元格
MySQL字符集 utf8 和 utf8mb4 区别及排序规则 general_ci 和 unicode_ci 和 bin 的区别
Cocos Creator cc.Button (脚本事件内容)
cocos creator 重写源码按钮Button点击音频封装
Cocos Creator JS web平台复制粘贴代码(亲测可用)
JS 获取最近(前)7天(一周内)和最近(前)3天日期
Cocos Creator 构建发布... APP ABI(选项)
Cocos Creator JS 时间戳日期转换
原文地址:https://www.cnblogs.com/monkey-moon/p/9260762.html
最新文章
usage memcache in linux
essay sundry
补充笔记
SyntaxError: expected expression, got ")" void() : 1: 5
tp的增删改查的结果判断?
联想笔记本更换显示屏?
easyui的datagrid的使用记录
tp的ajaxReturn后, 还要用echo $rt吗?
tp使用ajaxReturn返回二维数组格式的字符串,前台如何获取非乱码
在easyui-tabs中的href或 content的多种条件下的不同页面内容和页面地址的赋值?
热门文章
关于在php中变量少写了一个$和页面不断转圈的问题排查和vim的自动补全方式
开发过程中 的一些 补充知识点 + 关于mysql中的日期和时间函数?
关于html中的 script标签中的 代码写法有效性? easyui tabs的href不能载入内容页面,tab标签页中使用content: iframe加载本地内容
mysql数据库的优化?
xueping wang 记录2
旧版本firefox添加扩展addons的地址
MySQL 设计与开发规范
linux 压缩、解压、zip/unzip/jar
flutter、rn、uni-app比较
Canal
Copyright © 2011-2022 走看看