深度学习有很多好用的框架,比如:Tensor flow,pytorch,paddlepaddle 。
PaddlePaddle 是起源于百度的开源深度学习平台。它是简单易用的:你可以通过简单的十数行配置搭建经典的神经网络模型;它也是高效强大的:PaddlePaddle可以支撑复杂集群环境下超大模型的训练,在百度内部,已经有大量产品线使用了基于PaddlePaddle的深度学习技术。在这些根植业务的稳定框架中,由百度开发并维护的 PaddlePaddle 是适合中国开发者和企业的深度学习工具,成熟的 PaddlePaddle 官方所维护的模型数量基本上是最多的,包括自然语言处理、计算机视觉和推荐等领域的成熟模型。这些模型很多都是根据百度自身业务积累而开源的,甚至还会提供对应的预训练资源。例如在 NLP 中的情感分析任务上,PaddlePaddle 就会提供基于中文的预训练模型,这对于开发者而言是非常有意义的。
不像基于动态图的pytorch,与基于静态图的tensorflow,paddlepaddle为了兼顾灵活性和高性能,同时为用户提供动态图和静态图两种计算图。静态图是先定义网络结构而后运行,对定义好的图结构进行分析,可以使运行速度更快,显存占用更低,在业务部署上线上的具有非常大的优势,为用户的AI应用落地提供高效支持。但是静态图组网和执行阶段是分开,提供了更方便的动态图模式,所有操作可以立即获得执行结果,而不必等到执行阶段才能获取到结果,这样可以更方便进行模型的调试,同时还减少了大量用于构建Executor等代码,使得编写、调试网络的过程变得更加便捷。用户可以使用更加便捷的动态图模式进行调试、训练,然后可以把训练好的模型转换为静态图的结构,快速上线部署。
Hub是什么?Hub本意是中心,docker有docker Hub,大家可以把自己创建的镜像打包提交到docker hub上,需要的时候再pull下来,非常方便,!很多时候我们不需要从头开始训练模型,如果有预训练好的模型,直接做迁移学习就可以,但是传统的方式基本上都需要从各个官网上去下载,模型比较大,用起来并不轻量。可以直接从Hub上下载预训练的模型做迁移学习或预测,极大的减轻了工作量。
paddle hub是什么,PaddleHub 是基于 PaddlePaddle 开发的预训练模型管理工具,可以借助预训练模型更便捷地开展迁移学习工作,旨在让 PaddlePaddle 生态下的开发者更便捷体验到大规模预训练模型的价值。PaddleHub 目前的预训练模型覆盖了图像分类、目标检测、词法分析、Transformer、情感分析五大类别。未来会持续开放更多类型的深度学习模型,如语言模型、视频分类、图像生成等预训练模型。基于预训练模型,用户可以更便捷地完成自己的AI应用,飞桨为用户提供预训练模型管理和迁移学习组件PaddleHub,可一键加载工业级预训练模型。本次新增发布29个预训练模型,共为用户提供40+预训练模型,覆盖文本、图像、视频三大领域八类模型。PaddleHub提供Fine-tune API,10行代码即可完成大规模预训练模型的迁移学习。PaddleHub还引入「模型即软件」的理念,通过Python API或者命令行工具。
paddlehub与pytorchhub对比,PytorchHub 目前支持18个模型,PaddleHub支持29个,PaddleHub支持的模型数量有绝对的优势;而PytorchHub涉及的方向更多,但是每个方向的模型并不多,对CV的支持更多;PaddleHub涉及的方向只有两个,CV和NLP,但是对NLP的支持尤其多,高达22个,不仅包括目前最潮的BERT,还有百度自己研发的知识增强语义表示模型Ernie,在多个中文NLP任务中表现超过BERT。pytorchHub不支持命令行运行,但PaddleHub支持,命令行运行就是指我们安装PaddleHub后,可以无需进入python环境,即可快速体验PaddleHub无需代码、一键预测的命令行功能。需要注意的是,在PaddleHub中,既可以支持命令行使用,即在终端输入。
目前我想用paddlehub来做一个中文识别的模型。