说明:
XMOS这次致力于打造全新的,颠覆性的嵌入式平台,简化开发人员要学一堆东西才能开发一款高性能AIOT产品的痛点。
XCORE.AI集单片机,AI,FPGA,DSP于一身,嵌入式软件开发人员可以灵活的实现各种控制,而不用担心固定的硬件性能/资源不够用的问题。并且性能强劲,可以让物联网终端设备在本地就处理数据,无需上传到云端处理。
引言:
过去的5年中,Amazon Alexa, Google Home, Facebook Portal, Apple Homepod等都是采用的XMOS语音助手方案。大致流程是终端设备采集音频数据,删除回声和噪音,将数据发送到云端,云端回复。
当前的智能设备非常依赖云端,随着自然语音接口引入到嵌入式设备,如果智能音响,智能电视,穿戴设备等,将面临可靠性,隐私问题和成本方面的挑战。
通过将AI功能嵌入到本地设备,提高了安全性,因为重要数据在本地就可以处理,而且降低云端带宽需求,实时性强。
另外当前市场上传统的AI处理器功耗大,价格偏贵,一定程度上限制他们作为智能终端的应用场合。
1、性能
XMOS将XCORE.AI与当前600MHz,M7核心芯片做比较。
AI性能32倍,IO速度16倍,DSP性能15倍,16bit MAC性能的21倍,不细看,还以为是Cortex-M55内核芯片发布了,而且提供FPGA一样的灵活性。
2、特色:
(1)每秒380亿次累加乘
(2)每秒一百万次512点FFT。
(3)128个纳秒级GPIO,并且可以像FPGA一样灵活定制各种IO接口功能,如SPI, QSPI, MII, I2S, I2C, PDM等。
(4)每个内核有512KB TCM RAM,带LPDDR接口。
(5)片上USB高速PHY,带MIPI接口用于摄像头。
(6)16个实时逻辑核心,支持标量/浮点/矢量指令,可根据应用实现灵活性和可扩展性。
(7)用于数字信号处理,机器学习和密码功能的高性能指令集。
3、软件方面
全部采用C编程,使用行业标准的LLVM/Clang编译,AI使用Tensorflow lite,固件可以采用FreeRTOS,并提供大量库。
4、架构
xcore的开发旨在提供类似于FPGA的IO灵活性,并为嵌入式软件工程师提供关键的控制处理,使他们能够创建差异化产品,而不是重复参考设计。
(1)2005年时,发布第1代xcore架构。第一代架构的成功为各种应用程序到IO协议之间架起桥梁,此设计获得数百项设计大奖,典型应用如USB Audio Class 2解决方案和S/PDIF接口 ,所有这些都可以软件实现
(2)第二代xocre加强了控制和DSP性能,使其应用到各种客户解决方案中,以及为XMOS提供了一个平台,使其成为远场语音最杰出的供应商之一。
(3)第三代是通用目的的跨界处理器,集单片机,AI,FPGA,DSP于一身。
xcore体系结构是可伸缩的,单独一个图块是1MB内存,380亿次累加乘速度,两个图块就可以实现2MB内存,760亿次累加乘。图块里面每个logical core都可以作为独立的硬件线程,可以独立运行AI,DSP和IO控制。
实际应用中,用户仅需做一个应用程序,编译器会将各个任务分配几个内核里面。比如一个基于FreeRTOS设计的语言控制程序,含神经网络,麦克风远场处理,PDM,I2C,I2S等。具体到xcore上,就是下面这种效果,这些功能都可以并行独立执行,
总结:
低成本,简单易用,高性能是AIOT主控芯片追求的终极目标,正如XMOS首席执行官所说的,xcore.ai以1美元起步的价格提供了世界低成本,最具灵活行的AI处理器。