zoukankan      html  css  js  c++  java
  • Cortex-M7,A8,A9,A15与ADI的BlackFin以及SHARC的DSP性能PK

    说明:
    1、通过此贴让我们对M4和M7的DSP性能有个全面的认识。
    2、测试数据来源于DSP Concepts,对于这家公司的名字,大家可能比较陌生。我们现在用的CMSIS-DSP软件就是由ARM委托这家公司设计的,是一家比较厉害的嵌入式音频DSP解决方案开发商。


    硬件测试平台:
    M4使用一款204MHz的芯片(估计是LPC43XX系列)。
    M7使用Atmel的amV71。
    A8使用TI的AM335x
    A9使用TI的OMAP4430
    A15使用TI的OMAP 5432
    DSP芯片:
    Blackfin  53x ,支持16位定点的DSP
    Blackfin  70x  ,支持16位和32位定点的DSP
    SHARC   21489 , 支持32位定点和32/40位浮点的DSP
    M核的DSP处理单元与专业DSP的区别:
     

    一、FIR滤波器测试
    1、分别测试了5, 10, 20, 50和100阶FIR滤波,采样点数256个
    2、测试结果的单位是钟周期个数。
    3、全部采用浮点测试,而BlackFin采用的定点Q31,测试软件使用DSP Concepts的Audio Weaver。
     
    Cycles Per Sample Per Tap,每阶每个采样点的时钟周期个数。
     

    结论:
    SHARC21489性能最强,M7的FIR性能高于A8和A9,低于A15。

    二、IIR滤波器(Biquad级联)
    1、分别测试了1个,4个,8个和12个IIR的Biquad级联个数,采样点数256个。
    2、测试结果的单位是钟周期个数。
    3、测试软件使用DSP Concepts的Audio Weaver
     
    Cycles Per Sample Per Stage,每个Biquad每个采样点的时钟周期个数。
     

    结论:
    SHARC21489性能最强,M7的IIR性能高于A8和A9,低于A15。

    三、FFT测试:
    1、分别测试了64点, 128点, 256点, 512点和1024点FFT。
    2、测试结果的单位是钟周期个数。
     

    结论:
    SHARC21489性能最强,M7的FFT低于A8,A9和A15。

    四、上面测试都是基于时钟周期的,考虑的主频的影响,结论如下
    Cortex‐M4: 204 MHz
    Cortex‐M7: 300 MHz
    Cortex‐A8: 1 GHz 
    Cortex‐A9: 1 GHz
    Cortex‐A15: 1.5 GHz 
    Blackfin 53x: 700 MHz
    Blackfin BF70x: 400 MHz
    SHARC: 450 MHz
     

    考虑测试的M7是用的300MHz的V71,如果换成现在的H7,主频可以搞到480,那么FIR和IIR性能几乎媲美1GHz的A8。
    五、更详细的测试:
    <ignore_js_op> 
    <ignore_js_op> 




  • 相关阅读:
    BT656与BT1120的区别
    Arria10中PHY的时钟线结构
    Arria10中的IOPLL与fPLL
    Nios内部RAM固化配置
    实现1sym转换成2个sym送给CVI(VGA数据)
    embeded_2_separate_sync
    动态规划--青蛙跳
    动态规划 0--1 背包问题
    模拟题
    动态规划--最大子段和
  • 原文地址:https://www.cnblogs.com/armfly/p/11312847.html
Copyright © 2011-2022 走看看