zoukankan      html  css  js  c++  java
  • MS Batch AI

       微软的Batch AI服务是一项新服务,它可以帮助你在GPU pool上训练和测试机器学习模型,包括深度学习模型。它简化了在当前许多流行的深度学习框架(如TensorFlow、Microsoft认知工具包等)上集群创建和模型训练的过程

        

       Ubuntu DSVM 在Batch AI中作为本地VM映像支持的。Ubuntu DSVM预安装有许多深度学习框架、GPU驱动、CUDA和cuDNN组件,所以很容易就可以开始一个深度学习项目

       

    • 数据科学家可以在单个DSVM上使用较小的数据集开发一个模型的初始版本,然后使用 Batch AI 轻松地扩展到多个DSVM和更大的数据集
    • 在Batch AI中使用相同的DSVM映像可以最小化创建集群设置时间,并减少Batch AI和开发环境之间的不兼容性。
    • Microsoft Batch AI处理设置集群的细节,可以根据需求自动伸缩,并支持低优先级的vm,以节省额外的成本。
    • Microsoft Batch AI还允许您并行地运行参数扫描。
    • 管理数据是深度学习的一个重要组成部分,Batch AI包括对文件共享和NFS服务器的本机支持

      What is Batch AI?


         BatchAI提供了专门用于人工智能训练和测试的资源管理和作业调度。主要功能包括:

    • 运行长期运行的批作业、迭代试验和交互式训练
    • 使用GPU或CPU自动或手动缩放VM集群
    • 在vm和远程访问之间配置SSH通信
    • 支持任何深度学习或机器学习框架,对流行的工具包进行优化配置,比如微软的认知工具包(CNTK)、TensorFlow和Chainer。
    • 基于优先级的作业队列以共享集群,并利用低优先级的vm和预留实例
    • 灵活的存储选项,包括Azure文件和托管的NFS服务器
    • 将远程文件共享到VM和optional container
    • 为VM故障提供工作状态和重新启动
    • 访问输出日志、stdout、stderr和模型,包括来自Azure存储的流
    • Azure命令行界面(CLI),Python、cjava和Java的sdk,在Azure门户中进行监视,以及与Microsoft AI工具的集成

    Batch AI SDK支持编写脚本或应用程序来管理training pipelines并与工具集成。SDK目前提供了Python、cjava和REST api。
    批处理AI使用Azure资源管理器进行控制操作(创建、列表、get、delete)。Azure Active Directory用于身份验证和基于角色的访问控制。

    参考资料


  • 相关阅读:
    sql试题
    sql中的游标
    SQL Server存储过程 对数组参数的循环处理
    MongoDB安装并随windows开机自启
    延长或控制Session的有效期的方法总结
    回忆我们经典的开发工具(转)
    多线程实例,占用CPU过多
    啥叫单例模式?
    判断字符或字符串里是否有汉字
    百年历19552055年
  • 原文地址:https://www.cnblogs.com/tgzhu/p/7811025.html
Copyright © 2011-2022 走看看