百度BML
一、产品介绍
百度机器学习BML(Baidu Machine Learning)是一款端到端的AI开发和部署平台。基于BML,用户可以一站式完成数据处理、模型训练与评估、服务部署等工作。平台提供了高性能的集群训练环境,海量算法框架与模型案例,以及操作便捷的预测服务工具。用户可以专注于模型与算法本身,并得到优质的模型与预测效果。
二、应用场景
BML可以帮助企业和开发者实现图像识别、视频分析、语音识别、推荐、预测等多种业务场景,赋能金融、教育、医疗、安防、零售、工业制造等多种行业。
用户类型,工作区适合公民数据科学家,关注易用性和使用时长;训练适合专家数据科学家,关注性能和资源利用率;预测适合业务管理和运维人员,关注性能和资源利用率。
模型训练,支持多种深度/机器学习框架,一键发起大规模训练作业,最大化提升训练效率及效果。主要包括四部分:深度学习作业、机器学习作业、AutoDL作业、AutoML作业。
1.深度学习作业,集成了多种开源的深度学习框架。用户可以使用不同的框架,编写代码进行多轮训练和迭代,并将产生的模型和各种数据上传到BOS存储上。
2.机器学习作业,自主研发的丰富、高效、成熟的机器学习算法和开源RAPIDS-cuML GPU版本机器学习算法。主要应用于大数据的统计与分析、数据挖掘、模型训练、商业智能等领域。
3.AutoDL作业,自动深度学习产品,利用先进的迁移学习或者神经网络架构搜索技术,针对业务提供数据进行训练。初学者只需提交数据便可得到高品质模型,经验丰富的工程师拿到平台提供的高品质模型后可继续研究。
4.AutoML作业,简化算法建模和模型调参的繁琐过程,自动进行超参数学习,进而自动构建高精度模型,节省人力,降低机器学习门槛。
三、产品特色
1.快速上手,点开即用的Jupyter Lab运行环境,内置多种框架和常用软件包,为您免去配置环境带来的困扰。同时支持多种Auto算法,简化算法建模和模型调参的繁琐过程,自动进行超参数学习,进而自动构建高精度模型,节省人力。
2.一站式开发和部署,在控制台进行简单点击或使用API调用,可一站式完成发起训练任务、获取训练模型、启动预测服务,覆盖了AI开发&部署的全流程。
3.灵活,支持主流框架如TensorFlow/Pytorch/Keras/Caffe/Mxnet/PaddlePaddle/XGBoost/Scikit-Learn等,支持用户CCE私有集群,CPU实例支持自定义第三方软件库。三个核心服务采用模块式设计,可灵活解耦,与您现有工作流程无缝对接。
4.高性能,所有后端资源采用容器技术,可快速启动和释放,多机多卡的分布式训练和对企业级超大规模数据的支持,可显著缩短训练、调整和部署模型所需时间。
四、产品使用
BML包括三个部分,机器学习是连续的周期过程,工作区数据处理-训练模型-预测服务进行生产部署和实验,然后,您可以结合更多业务数据,根据实际使用情况,重新训练模型来提高预测准确性。
1.工作区:内置了完全托管的交互式编程环境Jupyter Lab,实现数据处理和代码调试。内置TensorFlow、Keras、PyTorch、Caffe、Mxnet、Chainer、CNTK和PaddlePaddle等算法框架的交互式代码编辑及运行环境。
2.训练:支持多种深度/机器学习框架,一键发起大规模训练作业,最大化提升训练效率及效果。包括四部分:深度学习作业、机器学习作业、AutoDL作业、AutoML作业。
(1).深度学习作业,支持新建作业,作业参数配置,以及进行作业的终止、克隆、删除、查看作业详情、作业运行详情、资源信息列表、查看日志分析等功能。
(2).机器学习作业,支持新建作业、数据标准化、训练作业参数配置(逻辑回归二分类、KMeans聚类、RAPIDS-cuML等),以及进行作业的终止、克隆、删除、查看作业详情、查看运行详情、查看作业结果等功能。
(3).AutoDL作业,支持新建作业、数据上传、作业参数配置(图像分类-迁移学习、图像分类-ENAS)、模型预测部署,以及进行作业的终止、克隆、删除、查看作业详情、查看运行详情、查看作业结果等功能。
(4).AutoML作业,支持新建作业、作业参数配置(Logistic Regression)、模型预测部署,以及进行作业的终止、克隆、删除、查看作业详情、查看运行详情、查看作业结果等功能。
逻辑回归通过用户给定的调参训练数据、调参测试数据,自动选择最优的模型训练超参数,再配合模型训练数据,输出一个训练好的模型给用户。
3.预测:快速将训练好的模型部署为高可用的在线服务,灵活选用多种计算部件加速预测执行,并可以通过A/B Testing,灰度升级,服务监控等完成模型试验迭代和服务运维管理。
支持创建预测模型(指定预测模型的数据文件和容器镜像)、创建模板配置(用于配置计算集群资源和服务策略)、创建站点(配置调度服务,搭建高可用预测集群)。
百度Easy DL
一、产品介绍
EasyDL定制化训练和服务平台零算法基础定制高精度AI模型,零算法基础定制高精度AI模型。
二、应用场景
1.图片分类,可识别一张图中是否是某类物体/状态/场景,适用于图片中主体或者状态单一的场景;
2.物体检测,可识别图中每个物体的位置、名称,适合有多个主体、或要识别位置及数量的场景;
3.图片分割,可识别图中每个物体的名称、位置(像素级轮廓)并计数,适合图中有多个主体、需要识别主体位置或轮廓的场景;
4.声音分类,可识别音频中是什么类型的声音,多应用于生产或泛安防场景中监控异常声音等;
5.文本分类,可判断一段文本是否属于某一个自定义的类别,适用于文本筛选、文本归类、文本聚合等多种应用场景;
6.视频分类,定制视频分类模型,可以分析视频的内容,识别出视频内人体做的是什么动作,物体/环境发生了什么变化;
7.商品分类,训练定制化商品检测模型,平台提供海量预置商品图片,开放基于百度大规模零售数据的预训练模型、及数据增强合成技术,实现低成本获得高精度商品检测AI模型服务;
三、产品特色
1.可视化操作,无需机器学习专业知识,模型创建-数据上传-模型训练-模型发布全流程可视化便捷操作,最快15分钟即可获得一个高精度模型;
2.高精度效果,EasyDL底层结合百度 AutoDL/AutoML技术,针对用户数据自动获得最优网络和超参组合,基于少量数据就能获得出色效果和性能的模型;
3.端云结合,训练完成的模型可发布为云端API或离线SDK,灵活适配各种使用场景及运行环境;
4.数据支持,全方位支持训练数据的高质量采集与高效标注,支持在模型迭代过程中不断扩充数据,助力提升模型效果
四、产品使用
1.创建模型,确定模型名称,记录希望模型实现的功能;
2.上传并标注数据,对上传的图片、文本、音频、视频,进行分类标注或拉框标注;
3.训练模型并校验效果,选择应用类型和算法,一键训练模型;
4.发布模型,训练时,选择应用类型,将模型以云端API或SDK的方式发布使用;
百度AI Studio
一、产品介绍
AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。
二、应用场景
百度AI Studio是针对AI学习者的在线一体化开发实训平台。本平台集合了AI教程, 深度学习样例工程, 各领域的经典数据集, 云端的超强运算及存储资源, 以及比赛平台和社区。
从而解决学习者在AI学习过程中的一系列难题, 例如教程水平不一, 教程和样例代码难以衔接, 高质量的数据集不易获得,以及本地难以使用大体量数据集进行模型训练。
1.比赛,支持参赛者将使用指定数据集, 分析数据, 然后运用机器学习、深度学习、数据挖掘等知识, 建立算法模型, 解决问题得出结果, 最后将结果提交;通过比赛检测AI技能、知识掌握的水平, 在解决问题中发挥自己的聪明才智, 同时获取奖励。
2.教育,AI Studio教育版是百度大脑推出的云端AI在线教育平台,帮助学校、机构建立自己的线上教学班级,提供从教案项目、AI在线实训环境、教学管理的教学全流程一站式解决方案;
教育版具有如下四大特性,全方位满足您的AI教学需求:
(1).一站式教学服务,解决教学互动、教学测试、学习过程跟踪、学生管理的主要问题;
(2).海量业内最新教案项目, 提供百度官方推荐全套教学课程资料、实践项目;
(3).独家线上高性能教学实践环境, 理论教育与在线实践相结合,边学边练,知行合一;
(4).稳定服务保障,背靠百度技术积累,打造真正安全稳定的在线AI学习环境;
三、产品特色
百度AI Studio平台分为项目大厅、数据集、比赛、教育四大部分,平台预置了Python语言环境, 以及百度PaddlePaddle深度学习开发框架. 同时用户可以在其中自行加载Scikit-Learn等机器学习库;平台还为所有用户提供超强免费算力。
1.项目:2000+优质公开项目,覆盖CV、NLP、推荐算法等众多AI热门领域,完美支持Notebook、脚本及图形化任务。
2.数据集:1000+开放数据集,种类多样,支持数据集预览、下载、上传,单次上传容量高达100G。
3.比赛:新手练习赛、常规赛、高级算法大赛,比赛持续更新上线,奖金礼品丰厚,更有招聘绿色通道等你来拿。
4.教育:合作高校300+,为线上教学提供从教学项目、AI在线实训环境、教学管理的全流程一站式解决方案。
(1).一站式教学管理系统,课堂教育与在线课程打通,解决老师课前教学、课中互动、课后测验的主要问题;追踪学生学习进度,在线批改学生实战项目作业,发布作业成绩;
(2).一键即用云端训练环境,云端集成免安装,联网可用;交互式在线编程环境;
(3).免费CPU/GPU算力资源,免费提供价值千万的CPU/GPU算力;支持千人同时并发深度学习模型训练;
5.算力卡: Notebook项目配备Tesla V100高级算力资源,Tesla V100为当今市场上加速人工智能、高性能计算和图形的数据中心 GPU 中的精尖之作。
四、产品使用
1.项目,用于创建, 管理, 查看各种项目,分为公开项目、我的项目、我的收藏三个板块,进行项目查询、修改、删除、查看项目详情;项目的运行、停止和部署;创建项目,填写信息、选择标签、配置资源、添加数据集,创建成功;
2.数据集,支持公开数据集、个人数据集、收藏数据集三个板块,进行数据集查看、收藏、公开、查询;创建数据集,填写信息,上传文件,创建成功;
3.比赛,分常规赛和技术大赛;常规赛,单轮,提交结果符合指标要求;技术大赛,多轮,在比赛中取得很好的排名;
4.教育,支持一站式教学管理系统、一键即用云端训练环境、免费CPU/GPU算力资源;
(1).教师-教学班级管理,支持教师个人信息修改和班级管理;
(2).教师-学生管理,支持学生新增、删除、修改、邀请、导入和导出;
(3).教师-教学专区,支持教学内容、学习跟踪、教学大纲、项目统计、测评考试等功能;
(4).教师-班级信息,进行班级的后台运维管理;
(5).学生-身份验证,支持邀请码加入班级,或主动加入班级;
(6).学生-项目学习,支持进入班级项目学习、课程课节学习、查看教学大纲等功能;
5.算力卡,支持算力申请、算力使用、算力耗费明显;