zoukankan      html  css  js  c++  java
  • TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

    TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

    这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文,介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间,GPU下可能需要 2weeks ,如果是浦东(普通)的笔记本,天呢,估计需要一年的时间(当然夸张了,一个月的时间还是需要的,根据美国team看 需要的时间大约是gup 时间的 10倍,也就是 20 weeks ,小半年时间了) 。

    外界 ,至少我本人曾经以为AI能够处理的信息应该是巨大的,整理完这个模型的使用方法和模型本身内部的结构(解剖)就在内心充满了失望,悲剧的感情在整个身体流淌 。因为AI确实什么事情都干不了,恐怕这个时间要持续五年,十年,五十年 甚至更久远。单纯就从计算机技术来讲,区块链在上面提到的时间内更具有核弹威力 ,更通俗下讲就是更容易make money ,也更容易出成绩 。跟金融,财务 税收 ,发票 ,更简单的讲 跟fund or money 有关的领域 到可以用blockchin 。

    找不到生活的方向,也找不到人生的意义,我抑郁。

    先说明下 什么是图片转文字 ,道理非常简单 ,就是 根据图片上的信息 ,有算法 把该信息 提炼出来 转成文字 打印到平台上,如果是有能力做成小程序的话 ,也许意义会变的大一点,可是目前不具备这个能力 哼哼 抑郁

    先上代码 code  地址 : https://github.com/haohaixingyun/im2txt-ethan-tensorflow

    在本次实验中用到的 工具版本如下,

    Python 3.6.2

    TF : 1.3.0  ,更高版本1.10.0尝试过也是可以的 。

    拿到code 和配置完成环境变量后 直接run run_inference.py 这个script 就 能够得到你想的结果 。

    由于训练样本选择的原因 ,让本模型去识别一些不登大雅之堂的图片是办不到的 。在家里的laptop 上试验过 。其中一个重要的原因是本模型根本就没有哪些个特殊的单词 或是描述 。

    两仪式

    上面的图片预测出来是:

    基本上搞不懂预测的是什么 ,不过好在是一个女孩 做在bed 上是可以明白的,泰迪熊是怎么来的 ,不知道

    the good result :

  • 相关阅读:
    Linux安装Gradle
    MySQL 使用自增ID主键和UUID 作为主键的优劣比较详细过程(从百万到千万表记录测试)
    Websocket实现即时通讯
    Java线程池的使用
    Html5视频播放器-VideoJS+Audio标签实现视频,音频及字幕同步播放
    几种常用的认证机制
    Spring 接口参数加密传输
    Java 三种方式实现接口校验
    Spring AOP实现 Bean字段合法性校验
    RabbitMQ进程结构分析与性能调优
  • 原文地址:https://www.cnblogs.com/TendToBigData/p/10501171.html
Copyright © 2011-2022 走看看