zoukankan      html  css  js  c++  java
  • MS Batch AI

       微软的Batch AI服务是一项新服务,它可以帮助你在GPU pool上训练和测试机器学习模型,包括深度学习模型。它简化了在当前许多流行的深度学习框架(如TensorFlow、Microsoft认知工具包等)上集群创建和模型训练的过程

        

       Ubuntu DSVM 在Batch AI中作为本地VM映像支持的。Ubuntu DSVM预安装有许多深度学习框架、GPU驱动、CUDA和cuDNN组件,所以很容易就可以开始一个深度学习项目

       

    • 数据科学家可以在单个DSVM上使用较小的数据集开发一个模型的初始版本,然后使用 Batch AI 轻松地扩展到多个DSVM和更大的数据集
    • 在Batch AI中使用相同的DSVM映像可以最小化创建集群设置时间,并减少Batch AI和开发环境之间的不兼容性。
    • Microsoft Batch AI处理设置集群的细节,可以根据需求自动伸缩,并支持低优先级的vm,以节省额外的成本。
    • Microsoft Batch AI还允许您并行地运行参数扫描。
    • 管理数据是深度学习的一个重要组成部分,Batch AI包括对文件共享和NFS服务器的本机支持

      What is Batch AI?


         BatchAI提供了专门用于人工智能训练和测试的资源管理和作业调度。主要功能包括:

    • 运行长期运行的批作业、迭代试验和交互式训练
    • 使用GPU或CPU自动或手动缩放VM集群
    • 在vm和远程访问之间配置SSH通信
    • 支持任何深度学习或机器学习框架,对流行的工具包进行优化配置,比如微软的认知工具包(CNTK)、TensorFlow和Chainer。
    • 基于优先级的作业队列以共享集群,并利用低优先级的vm和预留实例
    • 灵活的存储选项,包括Azure文件和托管的NFS服务器
    • 将远程文件共享到VM和optional container
    • 为VM故障提供工作状态和重新启动
    • 访问输出日志、stdout、stderr和模型,包括来自Azure存储的流
    • Azure命令行界面(CLI),Python、cjava和Java的sdk,在Azure门户中进行监视,以及与Microsoft AI工具的集成

    Batch AI SDK支持编写脚本或应用程序来管理training pipelines并与工具集成。SDK目前提供了Python、cjava和REST api。
    批处理AI使用Azure资源管理器进行控制操作(创建、列表、get、delete)。Azure Active Directory用于身份验证和基于角色的访问控制。

    参考资料


  • 相关阅读:
    NYOJ 625 笨蛋的难题(二)
    NYOJ 102 次方求模
    ZJU Least Common Multiple
    ZJUOJ 1073 Round and Round We Go
    NYOJ 709 异形卵
    HDU 1279 验证角谷猜想
    BNUOJ 1015 信息战(一)——加密程序
    HDU 1202 The calculation of GPA
    "蓝桥杯“基础练习:字母图形
    "蓝桥杯“基础练习:数列特征
  • 原文地址:https://www.cnblogs.com/tgzhu/p/7811025.html
Copyright © 2011-2022 走看看