zoukankan      html  css  js  c++  java
  • x64汇编第二讲,复习x86汇编指令格式,学习x64指令格式

    x64汇编第二讲,复习x86汇编指令格式,学习x64指令格式

    一丶x86指令复习.

    1.1什么是x86指令.

    代码如下.


    高级代码为:

    int i = 0;
    int *p - &i;
    

    此时产生了3条汇编指令

    mov dword ptr[i],0  	OPCODE = C7 45 F4 00 00 00 00
    lea eax,[i]
    mov dword ptr [p],ea    OPCODE = 89 45 E8
    

    此时观察,有两条 Mov指令. 但是机器码却不同.这个就是我们今天要讲的.

    1.2 x86与x64下的通用寄存器

    在x86下面,我们的通用寄存器有

    eax ebx ecx edx esi edi esp ebp [e 代表 Extend(扩展)]
    

    在x64下面,新加了几个寄存器.并且指令变大了 有16个通用寄存器

    rax rbx rcx rdx rsi rdi rsp rbp
    r8 r9 r10 r11 r12 r13 r14 15
    

    在x86下,我们的寄存器都有自己的编号.

    指令 编号
    eax 000
    ecx 001
    edx 010
    ebx 011
    esp 100
    ebp 101
    esi 110
    edi 111

    1.3 OpCode

    每个指令都有一个或者多个编码.
    如下常见的

    指令 OpCode 说明
    ret 0xC3 返回
    short jump 0xEB 短跳转 8位
    far jump 0xEA 长跳转,可以在4GB空间任意跳转 32位
    je/jz 0x74 判断是否相等
    jne/jnz 0x75 判断是否不等
    nop 0x90 空指令

    1.4 7种寻址方式

    寻址方式 寻址代码
    立即数寻址 mov eax,1
    寄存器寻址 mov eax,ebx
    直接寻址 mov eax,[2000h]
    寄存器间接寻址 mov eax,[ebx]
    寄存器相对寻址 mov eax[ebx + 0x100]
    基址变址寻址 mov eax,[ebx + esi]
    相对基址变址寻址 mov eax,[ebx + esi *n]

    二丶x86指令格式详解.

    在X86下,查看inter手册可以清楚的看到x86汇编的指令格式.
    图标如下

    x64的图表

    以x86为例,有6个部分. 只有Opcode时必须的.前边的可以没有

    2.1 instruction 说明

    instruction prefixes 指令前缀. 如 rep movs bytes ptr[esi]
    rep 就是前缀.

    2.2 Opcode

    Opcode 这个需要查看inter手册.
    如下:

    2.3 ModR/m说明

    ModR/m
    里面分为三部分

    指令 说明
    Mod 表示寄存器的寻址方式.
    Reg/opcode 表示寄存器或者OpCode的编码
    R/M 表示汇编中第一个寄存器的编码.

    Mod 代表寻址方式 2位表示

    指令 说明
    00 寄存器间接寻址
    01 寄存器相对寻址偏移
    10 寄存器先对寻址偏移
    11 寄存器直接寻址

    其它寻址方式放在SIB里面

    Reg/Opcode 代表指令,
    mov [ebp - 38h],eax. 那么就代表eax的编号
    有时候表示寄存器,有时候表示Opcode

    R/M 表示汇编的第一个寄存器
    mov[ebp - 38h],eax 代表的是ebp

    2.4 SIB说明

    SIB 占一个字节.可能有可能没有,是对ModR/M寻址的补充.

    一条汇编指令

    mov eax,[ebx + edi * 4 + 1000h]
    

    根据汇编指令我们可以得出:
    偏移 = 1000h
    倍率 = 4
    基址 = ebx

    那么根据上面我们的SIB解析就好办了

    名称 大小 说明
    scale 2 bit 表示倍率,如上面edi *4 4就是倍率,只能是1 2 4 8 ,00代表倍率为1,01=2 10 = 4 11 = 8
    index 3 bit 表示倍率前边的寄存器 如edx * 4,那么edi的编号就放在这里
    base 3 bit

    那么根木上面说明我们可以拆分如下.

    scale index base
    4 edi ebx

    2.5 Displacement 偏移说明

    Displacement 其实是一个偏移
    如:

    mov eax,[ebx + edi * 4 + 1000h] 
    

    1000h就是偏移,会放在这个字段当中.

    可以是1个字节,可以是2个字节,或者4个字节.

    2.6 immediate 立即数

    immediate 是立即数
    如:

    mov eax,1
    

    在32位中占 1 2 4个字节.

    其中讲到这大概说明白了. 除了Opcode不能省略.其余都是可选的.
    在32位指令最长可以支持17个字节.

    二丶X64 汇编指令格式详解

    x86图表

    x64的图表

    在x64下,只对 x86加了一个 REX (re Extend 在扩展)

    REX是一个字节.但是高4位必须为0100
    REX取值范围在40-4F之间.

    低四位有不同的含义,这是inter手册拿下来的

    W (width)
    如果为0 代表这个指令是32位的
    如果为1 则代表指令是64位的.

    R位

    R主要是对32位下 MOdR/M中的 Reg/Opcode做了扩充.
    以前是3位,现在是4位来表示了.
    因为为了兼容32位.所以32位的表不能动.所以只能在这继续进行扩充.

    X(index}
    这个主要是扩充 SIB 中的index位的.

    32位下 Index代表 倍率的寄存器.如 edi * 4 4是倍率. edi则是
    倍率寄存器.在32位下这个是3位.只能表示一个寄存器
    64下需要对它进行扩种.就是x index.

    B(base)

    这个主要是扩充 32位下 Modr/M 中的 R/M位. 或者 SIB中 Base基址位.

    例子:
    如:

    mov eax,2
    Opcode = b8 10 0 00 00
    

    那么扩展为64位的就是
    48 b8 10 00 00 00 00 00 00 00

    48的意思就是 0100 1000
    就是说 在w 位设置为1,代表的是64位汇编指令.

  • 相关阅读:
    [MCM] PSO粒子群算法解决TSP问题
    [MCM] 2017研究生数学建模竞赛A题 3架飞机 TSP 求总路径最小
    [tool] AI视频翻译 解决英文视频字幕问题(类似youtube自动生成字幕)
    使用vsnprintf后链接错误及解决方法
    Linux Shell编程
    如何把va_list可变参数传送到下一级函数中(如传送到printf)
    ubuntu phone/touch的源码从哪里下载?
    The Native POSIX Thread Library for Linux
    Linux内核头文件与内核与库的关系
    Buildroot阅读笔记
  • 原文地址:https://www.cnblogs.com/iBinary/p/10851743.html
Copyright © 2011-2022 走看看