zoukankan      html  css  js  c++  java
  • 阿里云机器学习tensorflow实践

    1,前言

    伴随人工智能和深度学习的应用越来越普及,越来越多的开发人员开始投入到智能算法的编程中。由于算法成熟且公开,软件编码这一块不存在难度;但模型训练和预测所需的时间与硬件设备的配置有极大关系,很多开发人员并不具备GPU计算能力,如此只能在cpu上计算将耗费太多时间,对于模型调试和实际应用产生实质性阻碍。

    好在大公司已经将其软硬件能力提供为PAAS、SAAS服务,让普通用户能使用其超强计算平台进行大数据计算。比如百度云、阿里云。本文对阿里云提供的机器学习产品进行体验。

    2,建立项目一

    阿里云机器学习产品有很多服务,本人对其中的tensorflow服务比较关注。阿狸的文档比较全面,基本安装其指导就能正常使用了。具体可参考:

    https://help.aliyun.com/document_detail/49571.html#OSS

    (1)开通OSS存储服务。地区选择华东2,费用可选择半年40G空间9元。

    (2)开通机器学习服务,建立项目。模板选择“tensorFlow图片分类”。勾选“开启GPU”。目前公测期免费。

    3,配置项目一

     tensorFlow图片分类项目,默认配置了oss文件存储,一个TF模型训练和一个TF结果预测。

    oss文件默认配置共用数据,但两个TF流程的输出目录都需要指向自己的OSS目录。

    4,运行项目一

     配置完成后,先运行训练过程。在左侧TF图标上点击“运行到此处”,开始运行,直至结束。此时训练模型已经保存到指定的oss目录下。运行时间24分钟。

     然后再运行右侧流程。如下图。但运行了超过1小时也没有结束,就终止了。

    5,建立并运行项目二

    https://yq.aliyun.com/articles/72841?spm=5176.100239.0.0.aLlJGY

    按照以上文章中的步骤,建立图像识别项目。

    训练配置如下,训练速度很快,20分钟完成。

    识别的配置如下:

    执行只需1分钟多,但识别结果错误,正确答案是:this is a bird

    load data done
    oss://jackkwok-001/tf_test/check_point/model/model.tfl
    [0.0, 0.9939602613449097, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.006039762869477272]
    [0.0, 0.9939602613449097, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.006039762869477272]
    This is a automobile

    再次运行预测部分,仍然是automobile。

    重新运行训练和预测两部分,结果这次正确了。

    load data done
    oss://jackkwok-001/tf_test/check_point/model/model.tfl
    [0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
    [0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
    This is a bird

     而且只要训练模型正确,以后无论运行多少次预测,结果都是正确的,且置信度都是1。

  • 相关阅读:
    sphinx-2.1.9的安装使用
    lnmp源码安装
    lvs的负载均衡测试
    Packet Tracer路由器简单配置
    虚拟机克隆系统
    虚拟机永久磁盘和非永久磁盘的应用
    虚拟机和物理机之间的传输的六种方法
    数据库系列(二)之 开发规则与优化
    数据库系列(一)之 底层
    IT之快速提高效率的方法与思考
  • 原文地址:https://www.cnblogs.com/jackkwok/p/7229357.html
Copyright © 2011-2022 走看看