zoukankan      html  css  js  c++  java
  • [转]汇编语言的准备知识给初次接触汇编者 1

    汇编语言和CPU 以及内存,端口等硬件知识是连在一起的. 这也是为什么汇编语言没有通用性的原因.
    下面简单讲讲基本知识(针对INTEL x86 及其兼容机)
    ============================
    x86 汇编语言的指令,其操作对象是CPU 上的寄存器,系统内存,或者立即数. 有些指令表面上没有操作
    数, 或者看上去缺少操作数, 其实该指令有内定的操作对象, 比如push 指令, 一定是对SS:ESP 指定的内存
    操作, 而cdq 的操作对象一定是eax / edx.
    在汇编语言中,寄存器用名字来访问. CPU 寄存器有好几类, 分别有不同的用处:
    1. 通用寄存器:
    EAX,EBX,ECX,EDX,ESI,EDI,EBP,ESP(这个虽然通用,但很少被用做除了堆栈指针外的用途)
    这些32 位可以被用作多种用途,但每一个都有"专长". EAX 是"累加器"(accumulator), 它是很多加法乘
    法指令的缺省寄存器. EBX 是"基地址"(base)寄存器, 在内存寻址时存放基地址. ECX 是计数器(counter),
    是重复(REP)前缀指令和LOOP 指令的内定计数器. EDX 是...(忘了..哈哈)但它总是被用来放整数除法产生
    的余数. 这4 个寄存器的低16 位可以被单独访问,分别用AX,BX,CX 和DX. AX 又可以单独访问低8 位(A
    L)和高8 位(AH), BX,CX,DX 也类似. 函数的返回值经常被放在EAX 中.
    ESI/EDI 分别叫做"源/目标索引寄存器"(source/destination index),因为在很多字符串操作指令中, DS:
    ESI 指向源串,而ES:EDI 指向目标串.
    EBP 是"基址指针"(BASE POINTER), 它最经常被用作高级语言函数调用的"框架指针"(frame pointer).
    在破解的时候,经常可以看见一个标准的函数起始代码:
    push ebp ;保存当前ebp
    mov ebp,esp ;EBP 设为当前堆栈指针
    sub esp, xxx ;预留xxx 字节给函数临时变量.
    ...
    这样一来,EBP 构成了该函数的一个框架, 在EBP 上方分别是原来的EBP, 返回地址和参数. EBP 下
    方则是临时变量. 函数返回时作 mov esp,ebp/pop ebp/ret 即可.
    ESP 专门用作堆栈指针.
    2. 段寄存器:
    CS(Code Segment,代码段) 指定当前执行的代码段. EIP (Instruction pointer, 指令指针)则指向该段
    中一个具体的指令. CS:EIP 指向哪个指令, CPU 就执行它. 一般只能用jmp, ret, jnz, call 等指令来改变程
    序流程,而不能直接对它们赋值.
    DS(DATA SEGMENT, 数据段) 指定一个数据段. 注意:在当前的计算机系统中, 代码和数据没有本质
    差别, 都是一串二进制数, 区别只在于你如何用它. 例如, CS 制定的段总是被用作代码, 一般不能通过CS
    指定的地址去修改该段. 然而,你可以为同一个段申请一个数据段描述符"别名"而通过DS 来访问/修改. 自
    修改代码的程序常如此做.
    ES,FS,GS 是辅助的段寄存器, 指定附加的数据段.
    SS(STACK SEGMENT)指定当前堆栈段. ESP 则指出该段中当前的堆栈顶. 所有push/pop 系列指令
    都只对SS:ESP 指出的地址进行操作.
    3. 标志寄存器(EFLAGS):
    该寄存器有32 位,组合了各个系统标志. EFLAGS 一般不作为整体访问, 而只对单一的标志位感兴趣.
    常用的标志有:
    进位标志C(CARRY), 在加法产生进位或减法有借位时置1, 否则为0.
    零标志Z(ZERO), 若运算结果为0 则置1, 否则为0
    符号位S(SIGN), 若运算结果的最高位置1, 则该位也置1.
    溢出标志O(OVERFLOW), 若(带符号)运算结果超出可表示范围, 则置1.
    JXX 系列指令就是根据这些标志来决定是否要跳转, 从而实现条件分枝. 要注意,很多JXX 指令是等价
    的, 对应相同的机器码. 例如, JE 和JZ 是一样的,都是当Z=1 是跳转. 只有JMP 是无条件跳转. JXX 指令分
    为两组, 分别用于无符号操作和带符号操作. JXX 后面的"XX" 有如下字母:
    无符号操作: 带符号操作:
    A = "ABOVE", 表示"高于" G = "GREATER", 表示"大于"
    B = "BELOW", 表示"低于" L = "LESS", 表示"小于"
    C = "CARRY", 表示"进位"或"借位" O = "OVERFLOW", 表示"溢出"
    S = "SIGN", 表示"负"
    通用符号:
    E = "EQUAL" 表示"等于", 等价于Z (ZERO)
    N = "NOT" 表示"非", 即标志没有置位. 如JNZ "如果Z 没有置位则跳转"
    Z = "ZERO", 与E 同.
    如果仔细想一想,就会发现 JA = JNBE, JAE = JNB, JBE = JNA, JG = JNLE, JGE= JNL, JL= JNGE,
    ....
    4. 端口
    端口是直接和外部设备通讯的地方。外设接入系统后,系统就会把外设的数据接口映射到特定的端口
    地址空间,这样,从该端口读入数据就是从外设读入数据,而向外设写入数据就是向端口写入数据。当然
    这一切都必须遵循外设的工作方式。端口的地址空间与内存地址空间无关,系统总共提供对64K 个8 位
    端口的访问,编号0-65535. 相邻的8 位端口可以组成成一个16 位端口,相邻的16 位端口可以组成一个
    32 位端口。端口输入输出由指令IN,OUT,INS 和OUTS 实现,具体可参考汇编语言书籍。

    备注:忘记是在哪里收集的,没能注明原出处,若读者知道还请指出,谢谢

  • 相关阅读:
    Interesting Finds: 2008.03.19
    Interesting Finds: 2008.03.11
    Interesting Finds: 2008.03.27
    Interesting Finds: 2008.03.21
    每日日报
    每日日报
    每日日报
    每日日报
    idea怎么创建properties文件
    移动端rem.js
  • 原文地址:https://www.cnblogs.com/yahue/p/2575372.html
Copyright © 2011-2022 走看看