zoukankan      html  css  js  c++  java
  • CSAPP

    Chapter 3 程序的机器级表示

    程序编码

    计算机执行机器代码(对操作的字节序列编码),编译器:源代码->可执行代码

    汇编代码是机器代码的文本表示,与特定的机器密切相关

    GCC C 编译器:

    • C预处理器扩展源代码,插入以#include指定的文件以及用#define声明指定的宏定义
    • 编译器生成汇编代码
    • 汇编器把汇编代码转换成二进制目标代码(包含所有指令的二进制表示,但是尚未填入全局值的地址)
    • 链接器将目标代码文件与实现库函数的代码合并,产生可执行代码文件

    程序内存通过虚拟地址来寻址,操作系统负责管理虚拟地址以及虚拟地址到物理地址的对应,目前x86-64的虚拟地址的高16位设置为0,寻址范围2^48内的一个字节

    反汇编器:机器代码->类似汇编代码的格式

    机器代码和反汇编表示的特性:

    • x86-64的指令长度从1-15个字节不等,常用的指令以及操作数较少的指令所需的字节数较少,不太常用或操作数较多的指令所需要的字节数较多(尽量缩短平均指令译码时间)
    • 从某个指定的位置开始,可以将字节唯一地解码成机器指令(设计指令格式)

    汇编代码格式:AT&T 和 Intel

    Intel数据格式

    TODO

    TODO

    TODO

    Intel数据传送指令

    MOV类

    movb,movw,movl,movq

    TODO

    作用:更新目的操作数指定的寄存器字节或者内存位置

    注:x86-64中的内存引用总是用四字节的寄存器给出,例如%rax,不管是1,2,4还是8个字节

    movq和movabsq的区别:movq指令只能以表示为32位补码数字的立即数作为源操作数,然后把该数符号扩展得到64位的值放到目的位置,movabsq指令能够以任意的64位立即数值作为源操作数,只能以寄存器为目的

    例外:movl指令以寄存器为目的时,会把寄存器的高4位字节全部设置为0(x86-64惯例:任何为寄存器生成32位值的指令都会把寄存器的高位部分置0)

    源操作数:立即数,存储在寄存器或者内存中

    目的操作数:指定一个位置,寄存器/内存地址

    x86-64限定传送指令的两个操作数不能都指向内存位置,将一个值从一个内存位置复制到另一个内存位置,必须中间通过一个寄存器

    将较小源移动到较大的目的时:

    MOVZ类

    movzbw,movzbl,movzbq,movzwl,movzwq (没有movzlq <=> movl)

    作用:对源数据的高位用0填充,然后复制到目的寄存器

    MOVS类

    movsbw,movsbl,movsbq,movswl,movswq,movslq,cltq

    作用:对源数据的高位用最高位填充,然后复制到目的寄存器

    cltq指令把%eax符号扩展到%rax <=> movslq %eax , %rax

    转移类指令源和目的操作数的五种可能的组合为:

    • Immediate->Register
    • Immediate->Memory
    • Register->Register
    • Register->Memory
    • Memory->Register

    不支持其他的组合,其中Register->Register的情况,源寄存器和目的寄存器的符号都需要与转移字节的size相符

    数据传送指令的实现

    • 间接引用指针(地址),就是将指针放在一个寄存器中,然后在内存引用中使用这个寄存器
    • 局部变量保存在寄存器中,而不是内存中,因为访问寄存器比访问内存快得多

    压入和弹出栈操作

    栈是后进先出的结构,由高地址向低地址扩展

    //UNDONE

  • 相关阅读:
    C++构造与析构 yongmou
    坏习惯 yongmou
    Python 字符串方法
    python 列表推导式轻量级循环
    python 循环遍历字典元素
    python 短路逻辑和条件表达式
    python 迭代器
    一些关于面向对象设计的思考
    python map内建函数
    Python 列表
  • 原文地址:https://www.cnblogs.com/Theffth-blog/p/13341048.html
Copyright © 2011-2022 走看看