zoukankan      html  css  js  c++  java
  • 体系结构-指令集结构


    一个完整的指令集结构包括

    Instuction Fetch 
    Instuction Decode
    Operand Fetch
    Excute
    Result Store
    Next Instruction

     我们必须解决的问题包括:

    1. 指令的编码方式(即如何编码)
    2. 操作数和操作结构的存放位置
      1. 存放位置
      2. 多少个现实操作数
      3. 存储器操作数如何定位
      4. 那些操作数可以或不可以放到存储器中
    3. 数据的类型和大小
    4. 支持哪些操作
    5. 下一条指令的地址
      1. jumps,conditions,branches
      2. fetch-decode-execute is implicit
    • 有关ISA的若干问题
      • 分类
        • stack   0 address ADD tos<---tos+next
          Accumulator 1 address ADD A  acc<---acc+mem[A]
          1+x address ADDX A acc<---acc+mem[A+x]
          Register-memory 2 address ADD A B EA[A]<---EA[A]
          3 address add A B C EA[A]<---EA[B]+EA[C]
          Load-Store 3 address add  A B C A<---B+C
          load A B A<---mem[B]
        • 通用寄存器型(R-M   R-R)占主导地位
          • 寄存器比存储器更快
          • 对便一起来说寄存器更容易使用
        • 尾端问题
            • little endian,big endian,在一个字内部的字节顺序问题,例如在地址xxx00指定了一个字(int),存储器中从xxx00连续存放ffff0000,有两种表示方式:
              • 小端方式:xxx00位置是字的最低字节,数值为0000ffff。x86,dec vax,windows NT
              • 大端方式:xxx00位置是字的最高字节,数值为ffff0000。IBM 360/370,Motorola,MIPS
        • 对齐问题
          • 对一个s字节的对象访问,地址为A,如果A mod s ==0,则是边界对齐
          • 这是由于存储器本身的读写要求的。没有对其的对象可能会导致存储器两次读写。
        •  基准测试结果:
          • 偏移寻址、立即数寻址、寄存器寻址方式,其使用频度为75%~99%
          • 偏移字段大小为12~16bits,可满足75%~99%的需求
          • 立即数字段大小为8~16bits,可满足50%~80%的需求


    操作数类型和操作数表示

    类型:是面向应用、面向软件系统处理的各种操作数据类型。整型、浮点型、字符、字符串、向量类型;类型由操作码确定。

    表示:操作数在机器中的表示,硬件结构能够识别,指令系统可以直接使用的表示格式。整型(原码、补码、反码),浮点(IEE 754标准),十进制(BCD码,二进制十进制表示)


    • ISA研究的问题
      • ISA的分类
      • 操作数部分
        • 理解存储器地址(尾端+对齐问题)
        • 寻址方式
        • 操作数的类型、表示和大小问题
      • 操作码部分
        • 支持哪些类型的操作
      • 指令格式
    • 研究的方法:基于统计的方法
    • 结论:
      • 常用的寻址方式:立即数、偏移寻址、寄存器寻址
      • 偏移字段的大小:12~16bits
      • 立即数字段的大小8~16bits
      • 操作数大小:单字、双字的数据访问频率高;64字长更具一般性
    • ISA的功能设计
      • 任务:确定硬件支持哪些操作
      • 方法:统计
      • 类型:CICS和RISC
    • 控制类指令
      • 条件分支最常见
      • 寻址方式:pc-relative和偏移地址至少8位;即动态的转移地址方式
    • CISC
      • 强化指令功能,减少程序中指令条数

    RISC计算机指令集结构的功能设计

    • 特点:
      • 大多数指令在单周期内完成
      • 采用load、store结构
      • 硬布线控制逻辑
      • 减少指令和寻址方式种类
      • 固定的指令格式
      • 注重代码的优化
      • 面向寄存器结构
      • 重视流水线的执行效率--》尽量减少断流
      • 重视优化编译技术
    • RISC为了使流水线高效执行
      • 简单而统一的指令译码
      • 大部分指令可以单周期完成
      • 只有load/store指令访存
      • 简单寻址技术
      • 采用load延迟技术
    • 为了便于优化编译产生优化代码
      • 三地址指令格式
      • 较多适量的寄存器
      • 对称的指令格式
    • RISC的关键技术
      • 延迟转移技术
      • 指令取消技术
      • 重叠寄存器窗口技术
        • 处理器中设置多个寄存器堆,并划分多个窗口
        • 每个过程使用其中相邻的三个窗口和一个公共的窗口
        • 一个与前一个过程公用;一个与下一个过程公用;一个作为局部寄存器
      • 指令调整技术
      • 硬件为主,固件为辅
    • 频率较高的指令:load,store,add,subtract,move register-register,and,shift,compare equal,compare not equal,branch,jump,call,return
    • 控制类指令:conditional branch,jump,procedure calls,procedure returns
    • 控制类指令的寻址方式:pc-relative
      • 编译时不知道转移地址,程序执行时动态确定
      • 转移地址放到某一寄存器中

    • 指令编码方式
      • 长度可变
      • 长度固定
      • 混合
    • MIPS寻址方式/指令格式(所有指令都是32bit)
      • 寄存器直接寻址
      • 立即数寻址
      • 基址寻址
      • pc相对寻址
      • 寄存器间接寻址

    现代编译技术与计算机体系结构设计

    • ISA设计需要了解的有挂compiler的问题
      • 如何分配变量
        • 高级语言分配数据的区域
          • stack
            • 用来分配局部变量;用来存储活动记录(call和return),工作堆栈指针访问其中的内容
          • global data area
            • 用来分配被静态说明的对象,如常亮和全局变量、其中数组和其他聚集类型的数据结构比例大。
          • heap
            • 分配动态对象,用指针访问,通常不是标量。全局变量和堆变量因为存在别名问题而无法分配寄存器
      • 如何寻址变量
      • 需要多少寄存器
      • 优化技术对指令使用频率的影响
      • 使用哪些控制结构
    • MIPS指令集结构
      • MIPS的寄存器
        • 32个64bit通用寄存器(GPRS)
          • r0,r1,...,r31
          • 整数寄存器
          • r0 = 0
        • 32个64bit浮点寄存器(FPRS)
          • f0,f1,...,f31
          • 用来存放32个单精度浮点数(32bit),也可以用来存放32个双精度浮点数(64bit)
          • 存放单精度数时,只用了FPR的一半;
        • 一些特殊寄存器
          • 可以与通用寄存器交换数据
          • 浮点状态寄存器保存浮点操作的结果
      • MIPS的数据表示
        • 整数
          • 字节8bit ;半字16bit;字32bit;双字64bit
          • 浮点数 单精度(32bit),双精度(64bit)
          • 字节、半字、字被装入64位寄存器时,零扩展或符号扩展。
      • 寻址方式
        • 立即数寻址和偏移量寻址,其立即数、偏移量字段都是16bit
        • 寄存器间接寻址是通过把0作为偏移量来实现的
        • 16bit绝对寻址是通过把R0作为基址寄存器来实现
        • mips的存储器按字节寻址,地址为64bit
        • 所有的存储器访问都是边界对齐
      • 指令格式
        • 寻址方式编码到操作码中
        • 所有指令都是32bit
        • 操作码占6bit
        • 3中指令格式
          • I类指令
            • ,立即数字段为16bit,用于提供立即数和偏移量
            • load指令

              访存有效地址:Regs[rs]+immediate

              从存储器取来的数据放入寄存器rt中
              store指令 访存有效地址:Regs[rs]+immediate 从存储器取来的数据放入寄存器rt中
              立即数指令 Regs[rt]<---Regs[rs] op immediate
              分支指令 目标转移地址:Regs[rs]+immediate rt无用
              寄存器跳转、寄存器跳转并连接 转移目标地址为Regs[rs]
          • R类指令
            • 包括ALU指令,专用寄存器读/写指令,move指令
            • ALU指令     Regs[rd]<---Regs[rs] func Regs[rt],func为具体的运算操作编码
          • J类指令
            • 包括跳转指令、跳转并连接指令、自陷指令、异常返回指令;
            • 指令字的低26位是偏移量,左移两位,与pc值相加,形成跳转的地址。
      • 指令的分类(load/store,ALU操作,分支与跳转,浮点操作)
        • 符号的意义
          • x<---ny:从y传送n位到x
          • x,y<---z:把z传送到x和y
          • 下标:表示字段中具体的位;对于指令和数字,按从最高位到最低位(左--》右)顺序依次编号,最高位为第0位,次高位为第1位。
            • 下表可以是数字或者一个范围;Regs[R4]0,即R4的符号位;Regs[R4]56...63的最低位
          • Mem:表示主存,按字节寻址
          • 上标:用于表示对字段进行复制的次数;032一个32位全0的字段
          • 符号##,用于连个字段的拼接,并且可以出现在数据传送的任何一边。eg,R8、R10为64位的寄存器,则Regs[R8]32..63<---32(Mem[Regs[R6]]0)24##Mem[Regs[R6]];表示的是,以R6的内容作为地址访问内存,得到的字节按符号位扩展的32位后存入R8的低32位,R8的高32位(即Regs[R8]0..31)不变。
        • LD R2,20(R3) 装入双字 Regs[R2]<---64(Mem[20+Regs[R3]])
          LW R2,40(R3) 装入字 Regs[R2]<---64(Mem[40+Regs[R3]]0)32 ## Mem[40+Regs[R3]]
          LB R2,30(R3) 装入字节 Regs[R2]<---64(Mem[30+Regs[R3]]0)56 ## Mem[40+Regs[R3]]
          LBU R2,40(R3) 装入无符号字节 Regs[R2]<---64056 ## Mem[40+Regs[R3]]
          LH R2,30(R3) 装入半字 Regs[R2]<---64(Mem[30+Regs[R3]]0)48 ## Mem[30+Regs[R3]]##Mem[31+Regs[R3]]
          L.S F2,60(R4) 装入半字 Regs[F2]<---64Mem[60+Regs[R4]] ## 032
          L.D F2,40(R3) 装入双精度浮点数 Regs[F2]<---64Mem[40+Regs[R3]]
          SD R4,300(R5) 保存双字 Mem[300+Regs[R5]]<---64Regs[R4]
          SW R4,300(R5) 保存字 Mem[300+Regs[R5]]<---32Regs[R4]
          S.S F2,40(R2) 保存单精度浮点数 Mem[40+Regs[R2]]<---32Regs[F2]0..31
          SH R5,502(R4) 保存半字 Mem[502+Regs[R4]]<---16Regs[R5]48..63
        • ALU指令
        • DADDU R1,R2,R3 无符号加  
          DADDIU R4,R5,R6 加无符号立即数  
          LUI R1,#4 把一个立即数装入到一个字的高16位 Regs[R1]<---032 ## 4 ## 016
          DSLL R1,R2,#5 逻辑左移 Regs[R1]<---Regs[R2]<<5
          DSLT R1,R2,R3 置小于

          if(Regs[R2]<Regs[R3]) then Regs[R1]<---1 else Regs[R1]<---0

        • 控制类指令
        • J name 跳转 PC36..63<---  name<<2
          JAL name 跳转并连接 Regs[R31]<-- PC+4;PC36..63<---name<<2;((PC+4)-227)<=neme<((PC+4)+227)
          JALR R3 寄存器跳转并连接 Regs[R31]<--- PC+4;PC<--Regs[R3]
          JR R5 寄存器跳转 PC<-- Regs[R5]
          BEQZ R4,name 等于零时分支 if(Regs[R4]==0) then PC<-- name;((PC+4)-217)<=name<((PC+4)+217)
          BNE R3,R4,name 不相等时分支 ((PC+4)-217)<= name < ((PC+4)+217)
          MOVZ R1,R2,R3 等于零时移动 if(Regs[R3]==0) then Regs[R1]<--Regs[R2]
        • 跳转指令(根据目标指令确定目标指令的方式不同以及是否跳转时连接,可以将跳转指令分为4类)
          • 目标地址的确定方式:把指令中的26位偏移量左移2位后,替换pc中的低28位;由指令中指定的一个寄存器来给出目标转移地址
          • 跳转的两种类型:简单跳转(把目标地址送入程序计数器);跳转并连接,将目标指令送入程序计数器,把返回地址(下一条)放入寄存器R31
        • 分支指令(跳转转移)
          • 分支指令指令的目标地址,由16位带符号偏移量左移两位后和pc相加决定。
          • 浮点条件分支指令:通过测试浮点状态寄存器来决定是否进行分支。
  • 相关阅读:
    TXNLP 01-09
    王某的NLP之路前言
    回归模型(一) 线性回归
    回归模型(三) 岭回归
    回归模型(二) 逻辑回归
    hadoop中的JournalNode
    systemctl详解
    HADOOP HA 报错
    集成学习的不二法门bagging、boosting和三大法宝<结合策略>平均法,投票法和学习法(stacking)
    阿里云集群搭建
  • 原文地址:https://www.cnblogs.com/li-daphne/p/4067241.html
Copyright © 2011-2022 走看看