笔者在日前工作当中接触了NEON优化等内容,现将网络上搜集到的资料整理如下,以供参考。如有侵权,尽请告知,即刻删除。
1.官方链接
NEON汇编指令官方文档:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0473j/dom1361289959991.html
NEON Intrinsics官方文档:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491h/Badcdfad.html
快速查找NEON Intrinsics:https://developer.arm.com/technologies/neon/intrinsics
A57优化指南(包含指令Timing(Execution Latancy & Throughput)等信息):http://infocenter.arm.com/help/topic/com.arm.doc.uan0015b/Cortex_A57_Software_Optimization_Guide_external.pdf
2.开源库
Arm Compute library:https://github.com/ARM-software/ComputeLibrary
Ne10:http://projectne10.github.io/Ne10/
ncnn: https://github.com/Tencent/ncnn
3.中文博客
【入门】
NEON指令详解:http://blog.csdn.net/chshplp_liaoping/article/details/12752749
NEON Intrinsics命名方式参考:http://blog.throneclay.com/2015/12/30/armneon/
优化技巧概述:
http://zyddora.github.io/2016/02/28/neon_1/
http://zyddora.github.io/2016/03/16/neon_2/
A64汇编基本语法:https://blog.csdn.net/scarecrow_byr/article/details/79676401
A64 neon汇编常用指令解析:https://jzwdsb.github.io/2018/07/neon_frequently_use/
内嵌汇编调试:https://blog.csdn.net/u012058778/article/details/54564936
【进阶】
汇编代码优化细节:http://blog.csdn.net/yang_qi168/article/details/23935141
4.Tips
4.1 关于定点除法实现的讨论,涉及到牛顿迭代法等:https://community.arm.com/tools/f/discussions/930/division-with-neon
4.2 Linux环境下确认处理器是否支持NEON:
cat /proc/cpuinfo | grep neon
看是否有如下内容
Features : swp half thumb fastmult vfp edsp neon vfpv3 tlsvfpv4 idiva idivt
----------------
如果本文内容对你有帮助,请我喝杯咖啡吧~
(目前仅支持支付宝)