zoukankan      html  css  js  c++  java
  • TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

    TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

    这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文,介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间,GPU下可能需要 2weeks ,如果是浦东(普通)的笔记本,天呢,估计需要一年的时间(当然夸张了,一个月的时间还是需要的,根据美国team看 需要的时间大约是gup 时间的 10倍,也就是 20 weeks ,小半年时间了) 。

    外界 ,至少我本人曾经以为AI能够处理的信息应该是巨大的,整理完这个模型的使用方法和模型本身内部的结构(解剖)就在内心充满了失望,悲剧的感情在整个身体流淌 。因为AI确实什么事情都干不了,恐怕这个时间要持续五年,十年,五十年 甚至更久远。单纯就从计算机技术来讲,区块链在上面提到的时间内更具有核弹威力 ,更通俗下讲就是更容易make money ,也更容易出成绩 。跟金融,财务 税收 ,发票 ,更简单的讲 跟fund or money 有关的领域 到可以用blockchin 。

    找不到生活的方向,也找不到人生的意义,我抑郁。

    先说明下 什么是图片转文字 ,道理非常简单 ,就是 根据图片上的信息 ,有算法 把该信息 提炼出来 转成文字 打印到平台上,如果是有能力做成小程序的话 ,也许意义会变的大一点,可是目前不具备这个能力 哼哼 抑郁

    先上代码 code  地址 : https://github.com/haohaixingyun/im2txt-ethan-tensorflow

    在本次实验中用到的 工具版本如下,

    Python 3.6.2

    TF : 1.3.0  ,更高版本1.10.0尝试过也是可以的 。

    拿到code 和配置完成环境变量后 直接run run_inference.py 这个script 就 能够得到你想的结果 。

    由于训练样本选择的原因 ,让本模型去识别一些不登大雅之堂的图片是办不到的 。在家里的laptop 上试验过 。其中一个重要的原因是本模型根本就没有哪些个特殊的单词 或是描述 。

    两仪式

    上面的图片预测出来是:

    基本上搞不懂预测的是什么 ,不过好在是一个女孩 做在bed 上是可以明白的,泰迪熊是怎么来的 ,不知道

    the good result :

  • 相关阅读:
    SQLServer中给表增加组合唯一约束
    使用axis调用WebService服务端
    SQLServer查询锁表
    SQLServer修改字段类型
    SQLServer中修改字段为空
    查看SQLserver编码格式的SQL语句
    查询表结构sql
    Sublime Text3 如何开启Debug
    JMeter——JMeter如何进行汉化
    Redis——redis使用redis-dump,redis-load导出导入数据——【三】
  • 原文地址:https://www.cnblogs.com/TendToBigData/p/10501171.html
Copyright © 2011-2022 走看看