zoukankan      html  css  js  c++  java
  • 基于FPGA的CNN算法移植(五)算法优化方向汇总

           

            以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。

            以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA对算法实现了优化加速,其实不是真正意义上的算法优化。但是如果你面试的时候说了实话,说自己不会做算法优化,不好意思你很可能会被立马刷下来。哈哈哈,是不是很无语。

    优化方式一: 量化 

            通常软件里采用的是32bit 浮点,需要转换成8bit定点。这个对精度影响不大。

    优化方式二:图像预处理 

           很多公司在做CNN硬件移植的时候都做了语义分割。也有做灰度处理的。

    优化方式三:裁剪分支

            卷积之后的分支太多,可以裁剪掉一些不必要分支

    优化方式四:平衡

            有公司提到,在裁剪之后,为了让层与层之间相类似还做了平衡操作。

    优化方式五:二值化

            这个很多公司都在做,适合放FPGA上

    优化方式六:卷积分离

            同层之间卷积之后的结果分离开来,不要一起求和。

     重中之重:选一个好点的网络结构,比如vgg16,yolo之类,然后再想想上面的优化方法你可以用几个

    作者:清霜一梦  

    。。。。。。。。。。。。。。。。。。。。。

    欢迎加入: FPGA广东交流群:162664354

    。。。。。。。。。。。。。。。。。。。。

    。。。。。。。。。。。。。。。。。。。。

  • 相关阅读:
    安全性测试的测试点
    Python基础,,小题目
    Python画小猪佩奇
    Python代码
    Python画圆
    python编写贪吃蛇游戏
    主键、外键的作用,索引的优点与不足
    LoadRunner分为哪三个模块?请简述各模块的主要功能。
    测试结束的标准
    坚持“5W”规则,明确内容与过程
  • 原文地址:https://www.cnblogs.com/sepeng/p/8856436.html
Copyright © 2011-2022 走看看