zoukankan html css js c++ java

体系结构-指令集结构

一个完整的指令集结构包括

Instuction Fetch　

Instuction Decode

Operand Fetch

Excute

Result Store

Next Instruction

我们必须解决的问题包括：

指令的编码方式（即如何编码）
操作数和操作结构的存放位置
1. 存放位置
2. 多少个现实操作数
3. 存储器操作数如何定位
4. 那些操作数可以或不可以放到存储器中
数据的类型和大小
支持哪些操作
下一条指令的地址
1. jumps,conditions,branches
2. fetch-decode-execute is implicit

有关ISA的若干问题

分类

stack	0 address	ADD	tos<---tos+next
Accumulator	1 address	ADD A	acc<---acc+mem[A]
Accumulator	1+x address	ADDX A	acc<---acc+mem[A+x]
Register-memory	2 address	ADD A B	EA[A]<---EA[A]
Register-memory	3 address	add A B C	EA[A]<---EA[B]+EA[C]
Load-Store	3 address	add A B C	A<---B+C
Load-Store	3 address	load A B	A<---mem[B]

通用寄存器型（R-M R-R）占主导地位
- 寄存器比存储器更快
- 对便一起来说寄存器更容易使用
尾端问题
- - little endian,big endian，在一个字内部的字节顺序问题，例如在地址xxx00指定了一个字（int），存储器中从xxx00连续存放ffff0000，有两种表示方式：
    - 小端方式：xxx00位置是字的最低字节，数值为0000ffff。x86，dec vax，windows NT
    - 大端方式：xxx00位置是字的最高字节，数值为ffff0000。IBM 360/370，Motorola，MIPS
对齐问题
- 对一个s字节的对象访问，地址为A，如果A mod s ==0，则是边界对齐
- 这是由于存储器本身的读写要求的。没有对其的对象可能会导致存储器两次读写。
基准测试结果：
- 偏移寻址、立即数寻址、寄存器寻址方式，其使用频度为75%~99%
- 偏移字段大小为12~16bits，可满足75%~99%的需求
- 立即数字段大小为8~16bits，可满足50%~80%的需求

操作数类型和操作数表示

类型：是面向应用、面向软件系统处理的各种操作数据类型。整型、浮点型、字符、字符串、向量类型；类型由操作码确定。

表示：操作数在机器中的表示，硬件结构能够识别，指令系统可以直接使用的表示格式。整型（原码、补码、反码），浮点（IEE 754标准），十进制（BCD码，二进制十进制表示）

ISA研究的问题
- ISA的分类
- 操作数部分
  - 理解存储器地址（尾端+对齐问题）
  - 寻址方式
  - 操作数的类型、表示和大小问题
- 操作码部分
  - 支持哪些类型的操作
- 指令格式
研究的方法：基于统计的方法
结论：
- 常用的寻址方式：立即数、偏移寻址、寄存器寻址
- 偏移字段的大小：12~16bits
- 立即数字段的大小8~16bits
- 操作数大小：单字、双字的数据访问频率高；64字长更具一般性
ISA的功能设计
- 任务：确定硬件支持哪些操作
- 方法：统计
- 类型：CICS和RISC
控制类指令
- 条件分支最常见
- 寻址方式：pc-relative和偏移地址至少8位；即动态的转移地址方式
CISC
- 强化指令功能，减少程序中指令条数

RISC计算机指令集结构的功能设计

特点：
- 大多数指令在单周期内完成
- 采用load、store结构
- 硬布线控制逻辑
- 减少指令和寻址方式种类
- 固定的指令格式
- 注重代码的优化
- 面向寄存器结构
- 重视流水线的执行效率--》尽量减少断流
- 重视优化编译技术
RISC为了使流水线高效执行
- 简单而统一的指令译码
- 大部分指令可以单周期完成
- 只有load/store指令访存
- 简单寻址技术
- 采用load延迟技术
为了便于优化编译产生优化代码
- 三地址指令格式
- 较多适量的寄存器
- 对称的指令格式
RISC的关键技术
- 延迟转移技术
- 指令取消技术
- 重叠寄存器窗口技术
  - 处理器中设置多个寄存器堆，并划分多个窗口
  - 每个过程使用其中相邻的三个窗口和一个公共的窗口
  - 一个与前一个过程公用；一个与下一个过程公用；一个作为局部寄存器
- 指令调整技术
- 硬件为主，固件为辅
频率较高的指令：load,store,add,subtract,move register-register,and,shift,compare equal,compare not equal,branch,jump,call,return
控制类指令：conditional branch,jump,procedure calls,procedure returns
控制类指令的寻址方式：pc-relative
- 编译时不知道转移地址，程序执行时动态确定
- 转移地址放到某一寄存器中

指令编码方式
- 长度可变
- 长度固定
- 混合

寄存器直接寻址
立即数寻址
基址寻址
pc相对寻址
寄存器间接寻址

现代编译技术与计算机体系结构设计

ISA设计需要了解的有挂compiler的问题
- 如何分配变量
  - 高级语言分配数据的区域
    - stack
      - 用来分配局部变量；用来存储活动记录（call和return），工作堆栈指针访问其中的内容
    - global data area
      - 用来分配被静态说明的对象，如常亮和全局变量、其中数组和其他聚集类型的数据结构比例大。
    - heap
      - 分配动态对象，用指针访问，通常不是标量。全局变量和堆变量因为存在别名问题而无法分配寄存器
- 如何寻址变量
- 需要多少寄存器
- 优化技术对指令使用频率的影响
- 使用哪些控制结构

MIPS指令集结构

MIPS的寄存器
- 32个64bit通用寄存器（GPRS）
  - r0,r1,...,r31
  - 整数寄存器
  - r0 = 0
- 32个64bit浮点寄存器（FPRS）
  - f0,f1,...,f31
  - 用来存放32个单精度浮点数（32bit），也可以用来存放32个双精度浮点数（64bit）
  - 存放单精度数时，只用了FPR的一半；
- 一些特殊寄存器
  - 可以与通用寄存器交换数据
  - 浮点状态寄存器保存浮点操作的结果
MIPS的数据表示
- 整数
  - 字节8bit ；半字16bit；字32bit；双字64bit
  - 浮点数单精度（32bit），双精度（64bit）
  - 字节、半字、字被装入64位寄存器时，零扩展或符号扩展。
寻址方式
- 立即数寻址和偏移量寻址，其立即数、偏移量字段都是16bit
- 寄存器间接寻址是通过把0作为偏移量来实现的
- 16bit绝对寻址是通过把R0作为基址寄存器来实现
- mips的存储器按字节寻址，地址为64bit
- 所有的存储器访问都是边界对齐

指令格式

寻址方式编码到操作码中
所有指令都是32bit
操作码占6bit

3中指令格式

I类指令

,立即数字段为16bit，用于提供立即数和偏移量

load指令	访存有效地址：Regs[rs]+immediate	从存储器取来的数据放入寄存器rt中
store指令	访存有效地址：Regs[rs]+immediate	从存储器取来的数据放入寄存器rt中
立即数指令	Regs[rt]<---Regs[rs] op immediate
分支指令	目标转移地址：Regs[rs]+immediate	rt无用
寄存器跳转、寄存器跳转并连接		转移目标地址为Regs[rs]

R类指令
- 包括ALU指令，专用寄存器读/写指令，move指令
- ALU指令 Regs[rd]<---Regs[rs] func Regs[rt]，func为具体的运算操作编码
J类指令
- 包括跳转指令、跳转并连接指令、自陷指令、异常返回指令；
- 指令字的低26位是偏移量，左移两位，与pc值相加，形成跳转的地址。

指令的分类（load/store,ALU操作,分支与跳转，浮点操作）

符号的意义
- x<---_ny:从y传送n位到x
- x,y<---z:把z传送到x和y
- 下标：表示字段中具体的位；对于指令和数字，按从最高位到最低位（左--》右）顺序依次编号，最高位为第0位，次高位为第1位。
  - 下表可以是数字或者一个范围；Regs[R4]₀，即R4的符号位；Regs[R4]_56...63的最低位
- Mem：表示主存，按字节寻址
- 上标：用于表示对字段进行复制的次数；0³²一个32位全0的字段
- 符号##，用于连个字段的拼接，并且可以出现在数据传送的任何一边。eg，R8、R10为64位的寄存器，则Regs[R8]_32..63<---₃₂(Mem[Regs[R6]]₀)²⁴##Mem[Regs[R6]]；表示的是，以R6的内容作为地址访问内存，得到的字节按符号位扩展的32位后存入R8的低32位，R8的高32位（即Regs[R8]_0..31)不变。

LD R2,20(R3)	装入双字	Regs[R2]<---₆₄(Mem[20+Regs[R3]])
LW R2,40(R3)	装入字	Regs[R2]<---₆₄(Mem[40+Regs[R3]]₀)³²## Mem[40+Regs[R3]]
LB R2,30(R3)	装入字节	Regs[R2]<---₆₄(Mem[30+Regs[R3]]₀)⁵⁶## Mem[40+Regs[R3]]
LBU R2,40(R3)	装入无符号字节	Regs[R2]<---₆₄0⁵⁶## Mem[40+Regs[R3]]
LH R2,30(R3)	装入半字	Regs[R2]<---₆₄(Mem[30+Regs[R3]]₀)⁴⁸## Mem[30+Regs[R3]]##Mem[31+Regs[R3]]
L.S F2,60(R4)	装入半字	Regs[F2]<---₆₄Mem[60+Regs[R4]] ## 0³²
L.D F2,40(R3)	装入双精度浮点数	Regs[F2]<---₆₄Mem[40+Regs[R3]]
SD R4,300(R5)	保存双字	Mem[300+Regs[R5]]<---₆₄Regs[R4]
SW R4,300(R5)	保存字	Mem[300+Regs[R5]]<---₃₂Regs[R4]
S.S F2,40(R2)	保存单精度浮点数	Mem[40+Regs[R2]]<---₃₂Regs[F2]_0..31
SH R5,502(R4)	保存半字	Mem[502+Regs[R4]]<---₁₆Regs[R5]_48..63

ALU指令

DADDU R1,R2,R3	无符号加
DADDIU R4,R5,R6	加无符号立即数
LUI R1,#4	把一个立即数装入到一个字的高16位	Regs[R1]<---0³² ## 4 ## 0¹⁶
DSLL R1,R2,#5	逻辑左移	Regs[R1]<---Regs[R2]<<5
DSLT R1,R2,R3	置小于	if(Regs[R2]<Regs[R3]) then Regs[R1]<---1 else Regs[R1]<---0

控制类指令

J name	跳转	PC_36..63<--- name<<2
JAL name	跳转并连接	Regs[R31]<-- PC+4;PC_36..63<---name<<2;((PC+4)-2²⁷)<=neme<((PC+4)+2²⁷)
JALR R3	寄存器跳转并连接	Regs[R31]<--- PC+4;PC<--Regs[R3]
JR R5	寄存器跳转	PC<-- Regs[R5]
BEQZ R4,name	等于零时分支	if(Regs[R4]==0) then PC<-- name;((PC+4)-2¹⁷)<=name<((PC+4)+2¹⁷)
BNE R3,R4,name	不相等时分支	((PC+4)-2¹⁷)<= name < ((PC+4)+2¹⁷)
MOVZ R1,R2,R3	等于零时移动	if(Regs[R3]==0) then Regs[R1]<--Regs[R2]

跳转指令（根据目标指令确定目标指令的方式不同以及是否跳转时连接，可以将跳转指令分为4类）
- 目标地址的确定方式：把指令中的26位偏移量左移2位后，替换pc中的低28位；由指令中指定的一个寄存器来给出目标转移地址
- 跳转的两种类型：简单跳转（把目标地址送入程序计数器）；跳转并连接，将目标指令送入程序计数器，把返回地址（下一条）放入寄存器R31
分支指令（跳转转移）
- 分支指令指令的目标地址，由16位带符号偏移量左移两位后和pc相加决定。
- 浮点条件分支指令：通过测试浮点状态寄存器来决定是否进行分支。

查看全文

相关阅读:
Vue中 el-table大数据量加载，不分页，节省内存的性能优化
 http请求中Content-Type以及qs.stringify的使用
 setTimeout用法（Event Loop简介、for循环中应用、vue中应用）
Vue中关于图片路径配置的填坑日记
 WebSocket
Vue中mockjs的使用
 Vue 作用域插槽slot slot-scope v-slot
Windows Server 2003搭建邮件服务器
 Exchange 2010的部署
 Exchange 2010 详细安装步骤

原文地址：https://www.cnblogs.com/li-daphne/p/4067241.html