目的:
目前手上正在OMAP4上做东西,由于涉及到大量运算,交给arm A9双核发现运算速度很慢,不能满足需求。故考虑将大量运算任务(比如FIR、FFT、卷积、图像处理、向量运算等)交给OMAP4内部DSP核,发现国内相关资料很少,国外也不多,在此,作一个学习记录,避免以后忘记了。
ARM+DSP软件架构:
OMAP4作为TI的ARM+DSP架构(不过其ARM是双核,性能更强大),其软件架构如下图所示。其DSP核软件开发,可概括为纯DSP端软件开发,ARM端软件开发和双核交互软件开发这3块。
1、纯DSP端软件开发和传统DSP一样,一般用CCS+仿真器来进行开发调试或者直接命令行开发调试。
2、ARM端软件主要是提供驱动、上层应用(涉及大量运算)等支持。
3、双核交互软件开发需要按TI的Syslink组件,目前最新的改为RPMsg组件支持,在此基础上开发。
DSP核工作配置流程:(本人设想待一步步验证)
1、配置Linux 内核驱动支持OMAP4 DSP核。
2、编译或直接获取DSP映像tesla-dsp.bin。
3、boot并使能DSP核(这个可以看启动打印或者进入/d/remoteproc/omap-rproc.0/参看dsp调试信息)。
4、尝试测试程序实现arm ping DSP。
5、编写简单运算测试代码,分别在arm核与DSP核执行,对比DSP运算速度是否满足需求,确认方案是否可行。
6、在DSP上开发相应算法。
参考资料:
1、官网Tesla wiki介绍
2、论坛问答Using OMAP4430 internal DSP in Pandaboard
3、帮您快速入门 TI 的 Codec Engine