mobile-deep-learning - 走看看

zoukankan html css js c++ java

mobile-deep-learning

　　现代框架移植到移动端问题不大，caffe2在支持facebook应用需要的layer以及全protobuf情况下小于1MB，核心大概在100多kb，看起来和mdl一致。

　　移动端最重要问题是如何优化。绝大多数数学库优化是针对server或者GPU来做的，移动端可以跑但是跑不快。

　　需要着重考虑的点：

　　1、是否有CPU优化？是否使用NEON？是否有为mobile设计的thread pool？是否有针对CPU框架做超参数的调整（thread number）？

　　2、算法上是否采用了正确的path，比如用Winograd来做卷积，对小矩阵做特殊优化（类似xsmm）等？

　　3、GPU上是否有高效的kernel implementation?如OpenCL/GL, Metal等。

　　4、是否有在mobile上非常有用的功能，如reduced precision。

　　

　　深度学习系统的重量级优化和轻量级部署如何平衡融合？

　　编译优化和执行端分离，直接在优化端进行内存的分配部署，直接把方案保存下来。执行端不再进行内存分配算法，直接按照保存的方案执行即可。在编译优化端打包所需op，舍弃不需要的op，使得执行端更加轻量。

查看全文

相关阅读:
Factorial Trailing Zeroes
Convert Integer A to Integer B
函数防抖、函数节流
 localstorage sessionstorage和cookie的区别
 element中表格中的表头与表格内容边框错位的解决方法
 解决Minio生成图片文件的分享链接无法正常下载的问题
 gin编写后端API的使用技巧
 YOLOV5源码解读-export.py网络结构、配置文件
 《三、YOLOV3细节原理全解析》
《二、YOLOV2细节原理全解析》

原文地址：https://www.cnblogs.com/jianfeifeng/p/11040694.html

Copyright © 2011-2022 走看看