TensorFlow 使用预训练好的卷积神经网络和循环神经网络（lstm）模型处理图片转文字（im2txt）

zoukankan html css js c++ java

TensorFlow 使用预训练好的卷积神经网络和循环神经网络（lstm）模型处理图片转文字（im2txt）

TensorFlow 使用预训练好的卷积神经网络和循环神经网络（lstm）模型处理图片转文字（im2txt）

这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文，介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间，GPU下可能需要 2weeks ，如果是浦东（普通）的笔记本，天呢，估计需要一年的时间（当然夸张了，一个月的时间还是需要的，根据美国team看需要的时间大约是gup 时间的 10倍，也就是 20 weeks ，小半年时间了）。

外界，至少我本人曾经以为AI能够处理的信息应该是巨大的，整理完这个模型的使用方法和模型本身内部的结构（解剖）就在内心充满了失望，悲剧的感情在整个身体流淌。因为AI确实什么事情都干不了，恐怕这个时间要持续五年，十年，五十年甚至更久远。单纯就从计算机技术来讲，区块链在上面提到的时间内更具有核弹威力，更通俗下讲就是更容易make money ，也更容易出成绩。跟金融，财务税收，发票，更简单的讲跟fund or money 有关的领域到可以用blockchin 。

找不到生活的方向，也找不到人生的意义，我抑郁。

先说明下什么是图片转文字，道理非常简单，就是根据图片上的信息，有算法把该信息提炼出来转成文字打印到平台上，如果是有能力做成小程序的话，也许意义会变的大一点，可是目前不具备这个能力哼哼抑郁

先上代码 code 地址： https://github.com/haohaixingyun/im2txt-ethan-tensorflow

在本次实验中用到的工具版本如下，

Python 3.6.2

TF ： 1.3.0 ,更高版本1.10.0尝试过也是可以的。

拿到code 和配置完成环境变量后直接run run_inference.py 这个script 就能够得到你想的结果。

由于训练样本选择的原因，让本模型去识别一些不登大雅之堂的图片是办不到的。在家里的laptop 上试验过。其中一个重要的原因是本模型根本就没有哪些个特殊的单词或是描述。

两仪式

上面的图片预测出来是：

基本上搞不懂预测的是什么，不过好在是一个女孩做在bed 上是可以明白的，泰迪熊是怎么来的，不知道

the good result :

查看全文

相关阅读:
MAXSCRIPT 连数据库（转）
Docker安装部署ELK教程 (Elasticsearch+Kibana+Logstash+Filebeat)
ArrayList知识点
 HashMap知识点
 使用docker 安装nacos
记录docker 安装sonarqube和安装的一些坑
 sql优化
 Centos7下安装Docker
使用docker安装gitlab
docker安装jenkins

原文地址：https://www.cnblogs.com/TendToBigData/p/10501171.html