zoukankan      html  css  js  c++  java
  • 【转】ARM 指令集版本和ARM 版本

    ----转载自: http://www.cnblogs.com/loleng/archive/2011/06/14/2080447.html

    常常能看到ARM7,ARM9,ARM11,以及armv6k等不同的表达。且在GCC编译中,常常要用到 -march, -mcpu等。他们分别表达什么涵义呢?Sam自己也不很清楚,只是大概有个模糊的概念。今天就仔细研究一下。

    ARM(Advanced RISC Machines)是微处理器行业的一家知名企业。设计了大量高性能、廉价、耗能低的RISC处理器、相关技术及软件。1985年,第一个ARM原型在英国剑桥诞生。ARM公司的特点是只设计芯片,而不生产。ARM将其技术授权给世界上许多著名的半导体、软件和OEM厂商,每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系,ARM很快成为许多全球性RISC标准的缔造者。

    ARM公司定义了6种主要的指令集体系结构版本。V1-V6。(所以上面提到的ARMv6是指指令集版本号)。 即:ARM architecture

    ARMv1:

    该版本的原型机是ARM1,没有用于商业产品。

    ARMv2:

     对V1版进行了扩展,包含了对32位结果的乘法指令和协处理器指令的支持。

    ARMv3:

     ARM公司第一个微处理器ARM6核心是版本3的,它作为IP核、独立的处理器、具有片上高速缓存、MMU和写缓冲的集成CPU。

    ARMv4:

    当前应用最广泛的ARM指令集版本。

    ARM7TDMI、ARM720T、ARM9TDMI、ARM940T、ARM920T、Intel的StrongARM等是基于ARMv4T版本。
    ARMv5:

    ARM9E-S、ARM966E-S、ARM1020E、ARM 1022E以及XScale是ARMv5TE的。

    ARM9EJ-S、ARM926EJ-S、ARM7EJ-S、ARM1026EJ-S是基于ARMv5EJ的。

    ARM10也采用。

    其中后缀意义如下:

    E:增强型DSP指令集。包括全部算法和16位乘法操作。

    J:支持新的Java。

    ARMv6:

    采用ARMv6核的处理器是ARM11系列。

    ARM1136J(F)-S基于ARMv6主要特性有SIMD、Thumb、Jazelle、DBX、(VFP)、MMU。

    ARM1156T2(F)-S基于ARMv6T2 主要特性有SIMD、Thumb-2、(VFP)、MPU。

    ARM1176JZ(F)-S基于ARMv6KZ 在 ARM1136EJ(F)-S 基础上增加MMU、TrustZone。

    ARM11 MPCore基于ARMv6K 在ARM1136EJ(F)-S基础上可以包括1-4 核SMP、MMU。

    ARMv7-A:

    ARM处理器核:

    ARM公司开发了很多ARM处理器核,最新版位ARM11。

    ARM7微处理器系列
    低功耗的32位RISC处理器,冯·诺依曼结构。极低的功耗,适合便携式产品。
     具有嵌入式ICE-RT逻辑,调试开发方便。
     3级流水线结构。能够提供0.9MIPS的三级流水线结构
     代码密度高,兼容16位的Thumb指令集。
     对操作系统的支持广泛,包括Windows CE、Linux、Palm OS等。
     指令系统与ARM9系列、ARM9E系列和ARM10E系列兼容,便于用户的产品升级换代。
     主频最高可达130MIPS。
     主要应用领域:工业控制、Internet设备、网络和调制解调器设备、移动电话等多种多媒体和嵌入式应用。

    ARM7TDMI微处理器
     4种类型:
     ARM7TDMI、ARM7TDMI-S、ARM720T、ARM7EJ。
     ARM7TMDI是目前使用最广泛的32位嵌入式RISC处理器,属低端ARM处理器核。
     注:“ARM核”并不是芯片,ARM核与其它部件如RAM、ROM、片内外设组合在一起才能构成现实的芯片。

    ARM9微处理器系列
     ARM9系列微处理器在高性能和低功耗特性方面提供最佳的性能。
     5级整数流水线,
     哈佛体系结构。
     支持32位ARM指令集和16位Thumb指令集。
     全性能的MMU,支持Windows CE、Linux、Palm OS等多种主流嵌入式操作系统。
     支持数据Cache和指令Cache,具有更高的指令和数据处理能力。
     主要应用:无线设备、仪器仪表、安全系统、机顶盒、高端打印机、数码照相机和数码摄像机。
     3种类型:ARM920T、ARM922T和ARM940T。

    ARM9E微处理器系列
     单一处理器内核提供微控制器、DSP、Java应用系统的解决方案。
     支持DSP指令集。
     5级整数流水线,指令执行效率更高。
     支持32位ARM指令集和16位Thumb指令集。
     支持VFP9浮点处理协处理器。
     全性能的MMU,支持Windows CE、Linux、Palm OS等多种主流嵌入式操作系统。
     MPU支持实时操作系统。
     支持数据Cache和指令Cache,
     主频最高可达300MIPS。
     主要应用:下一代无线设备、数字消费品、成像设备、工业控制、存储设备和网络设备等领域。
     3种类型:ARM926EJ-S、ARM946E-S和ARM966E-S。

    ARM10E微处理器系列
     与同等的ARM9比较,在同样的时钟频率下,性能提高了近50%,功耗极低。
     支持DSP指令集。
     6级整数流水线,指令执行效率更高。
     支持32位ARM指令集和16位Thumb指令集。
     支持VFP10浮点处理协处理器。
     全性能的MMU,支持Windows CE、Linux、Palm OS等多种主流嵌入式操作系统。
     支持数据Cache和指令Cache。
     主频最高可达400MIPS。
     内嵌并行读/写操作部件。
     主要应用:下一代无线设备、数字消费品、成像设备、工业控制、通信和信息系统等领域。
     3种类型:ARM1020E、ARM1022E和ARM1026EJ-S。

    SecurCore微处理器系列
     专为安全需要而设计,提供了完善的32位RISC技术的安全解决方案。
     灵活的保护单元,以确保操作系统和应用数据的安全。
     采用软内核技术,防止外部对其进行扫描探测。
     可集成用户自己的安全特性和其他协处理器。
     主要应用:对安全性要求较高的应用产品及应用系统,如电子商务、电子政务、电子银行业务、网络和认证系统等领域。
     4种类型:SecurCore SC100、SecurCore SC110、SecurCore SC200和SecurCore SC210。

    Xscale处理器
     基于ARMv5TE体系结构的解决方案,是一款全性能、高性价比、低功耗的处理器。
     支持16位的Thumb指令和DSP指令集。
     已使用在数字移动电话、个人数字助理和网络产品等场合。
     Xscale处理器是Intel目前主要推广的一款ARM微处理器

    ARM11:指令集ARMv6,8级流水线,1.25DMIPS/MHz

    Cortex-A8:指令集ARMv7-A,13级整数流水线,超标量双发射,2.0DMIPS/MHz,标配Neon,不支持多核
    Scorpion:指令集ARMv7-A,高通获得指令集授权后在A8的基础上设计的。13级整数流水线,超标量双发射,部分乱序执行,2.1DMIPS/MHz,标配Neon,支持多核
    Cortex-A9:指令集ARMv7-A,8级整数流水线,超标量双发射,乱序执行,2.5DMIPS/MHz,可选配Neon/VFPv3,支持多核
    Cortex-A5:指令集ARMv7-A,8级整数流水线,1.57DMIPS/MHz,可选配Neon/VFPv3,支持多核

    Cortex-A15:指令集ARMv7-A,超标量,乱序执行,可选配Neon/VFPv4,支持多核

      当使用ARM toolchain时,会有-march -mcpu等。

    -mcpu=

    -mtune=

    他们指定目标处理器(target ARM processor)。

    可选的参数为:arm2', `arm250', `arm3', `arm6', `arm60', `arm600', `arm610', `arm620', `arm7', `arm7m', `arm7d', `arm7dm', `arm7di', `arm7dmi', `arm70', `arm700', `arm700i', `arm710', `arm710c', `arm7100', `arm7500', `arm7500fe', `arm7tdmi', `arm7tdmi-s', `arm8', `strongarm', `strongarm110', `strongarm1100', `arm8', `arm810', `arm9', `arm9e', `arm920', `arm920t', `arm922t', `arm946e-s', `arm966e-s', `arm968e-s', `arm926ej-s', `arm940t', `arm9tdmi', `arm10tdmi', `arm1020t', `arm1026ej-s', `arm10e', `arm1020e', `arm1022e', `arm1136j-s', `arm1136jf-s', `mpcore', `mpcorenovfp', `arm1176jz-s', `arm1176jzf-s', `xscale', `iwmmxt', `ep9312',Cortex-A8, Cortex-A9

    -march=

      target ARM architecture。 目标处理器架构。

     `armv2', `armv2a', `armv3', `armv3m', `armv4', `armv4t', `armv5', `armv5t', `armv5te', `armv6', `armv6j', `iwmmxt', `ep9312'. armv7-a等。

    转载:http://blog.sina.com.cn/s/blog_602f87700100kaa3.html

    架构处理器家族
    ARMv1 ARM1
    ARMv2 ARM2ARM3
    ARMv3 ARM6, ARM7
    ARMv4 StrongARMARM7TDMIARM9TDMI
    ARMv5 ARM7EJARM9EARM10EXScale
    ARMv6 ARM11ARM Cortex-M
    ARMv7 ARM Cortex-AARM Cortex-MARM Cortex-R
    ARMv8  

    Thumb

    较新的ARM处理器有一种16-bit指令模式,叫做Thumb,也许跟每个条件式运行指令均耗用4位的情形有关。在Thumb模式下,较小的opcode有更少的功能性。例如,只有分支可以是条件式的,且许多opcode无法访问所有CPU的暂存器。然而,较短的opcode提供整体更佳的编码密度(注:意指代码在存储器中占的空间),即使有些运算需要更多的指令。特别在存储器端口或总线宽度限制在32 以下的情形时,更短的Thumb opcode能更有效地使用有限的存储器带宽,因而提供比32位代码更佳的性能。典型的嵌入式硬件仅具有较小的32-bit datapath寻址范围以及其他更窄的16 bits寻址(例如Game Boy Advance)。在这种情形下,通常可行的方案是编译成 Thumb 代码,并自行优化一些使用(非Thumb)32位指令集的CPU相关程序区,因而能将它们置入受限的32-bit总线宽度的存储器中。

    首颗具备Thumb技术的处理器是ARM7TDMI。所有ARM9和后来的家族,包括XScale,都纳入了 Thumb 技术。

    Jazelle

    ARM还开发出一项技术,Jazelle DBX (Direct Bytecode eXecution),允许它们在某些架构的硬件上加速运行Java bytecode,就如其他运行模式般,当调用一些无法支持bytecodes的特殊软件时,能提供某些bytecodes的加速运行。它能在现存的ARM与Thumb模式之间互相运行。

    首颗具备Jazelle技术的处理器是“ARM7EJ-S”:Jazelle以一个英文字母'J'标示于CPU名称中。它用来让手机制造商能够加速运行Java ME的游戏和应用程序,也因此促使了这项技术不断地开发。

    Thumb-2

    Thumb-2技术首见于“ARM1156 核心”,并于2003年发表。Thumb-2 扩充了受限的16位Thumb 指令集,以额外的32位指令让指令集的使用更广泛。因此 Thumb-2的预期目标是要达到近乎Thumb的编码密度,但能表现出近乎ARM指令集在32位存储器下的性能。

    Thumb-2至今也从ARM和Thumb指令集中派生出多种指令,包含位栏操作、分支建表和条件运行等功能。

    Thumb Execution Environment (ThumbEE)

    ThumbEE,也就是所谓的Thumb-2EE,业界称为Jazelle RCT技术,于2005年发表,首见于 “Cortex-A8”处理器。ThumbEE 提供从 Thumb-2 而来的一些扩充性,在所处的运行环境下,使得指令集能特别适用于运行阶段的编码产生(例如实时编译)。Thumb-2EE是专为一些语言如LimboJavaC#PerlPython,并能让实时编译器能够输出更小的编译码却不会影响到性能。

    ThumbEE所提供的新功能,包括在每次访问指令时自动检查是否有无效指针,以及一种可以运行数组范围检查的指令,并能够分支到分类器,其包含一小部份经常调用的编码,通常用于高级语言功能的实现,例如对一个新对象做存储器配置。

    高级 SIMD (NEON)

    高级SIMD延伸集,业界称为“NEON”技术,它是一个结合64位和128位的单指令多重数指令集(SIMD),其针对多媒体和信号处理程序具备标准化加速的能力。NEON 可以在10 MHz的处理器上运行MP3音效解码,且可以运行13 MHz以下的自适应多速率音频压缩编码。NEON具有一组广泛的指令集、各自的寄存器阵列,以及独立运行的硬件。NEON 支持8、16、32和64位的整数及单精度浮点数据,并以单指令多重数的方式运算,运行图形和游戏处理中关于语音及视频的部分。单指令多重指令集在矢量超级处理机中是个决定性的要素,它具备同时多项处理功能。在NEON技术中,SIMD最高可同时做16个运算。

    VFP

    VFP(矢量浮点)是在协同处理器针对ARM架构的派生技术。它提供低成本的单精度和倍精度浮点运算能力,并完全兼容于ANSI/IEEE Std 754-1985 二进制浮点算数标准。VFP提供大多数适用于浮点运算的应用,例如PDA、智能手机、语音压缩与解压、3D图像以及数字音效、打印机、机上盒,和汽车应用等。VFP架构也支持SIMD平行化的短矢量指令运行。这在图像和信号处理等应用上,非常有助于降低编码大小并增加输出效率。

    在ARM为基础的处理器中,其他可见的浮点、或SIMD的协同处理器还包括了FPA、FPE、iwMMXt。他们提供类似VFP的功能,但在opcode层面上来说并不具有兼容性。

    http://zh.wikipedia.org/wiki/ARM%E6%9E%B6%E6%A7%8B

    作者:逸云沙鸥
    出处:http://www.cnblogs.com/QuLory/
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

  • 相关阅读:
    Excel导出失败的提示
    C#中将一个引用赋值null的作用
    POJ2112Optimal Milking(二分法+floyd最短+网络流量)
    三年流水账
    OpenCV(C++接口)学习笔记1-图像读取、显示、保存
    thinkphp3.2 代码生成并点击验证码
    8.19! 今天我有18生日,点击阅读或顶部 尾随幸运的一天!生日知识!↓——【Badboy】
    如何系统地学习JavaScript
    HDU 3065 病毒在继续 (AC自己主动机)
    使用Canvas和Paint自己绘制折线图
  • 原文地址:https://www.cnblogs.com/QuLory/p/2735142.html
Copyright © 2011-2022 走看看