实践目标
- 本次实践的对象是一个名为pwn1的linux可执行文件。
- 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。
- 该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。
- 我们将学习两种方法
- 利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
- 手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。
实验原理
- 缓冲区溢出:
缓冲区溢出的含义是为缓冲区提供了多于其存储容量的数据,就像往杯子里倒入了过量的水一样。通常情况下,缓冲区溢出的数据只会破坏程序数据,造成意外终止。但是如果有人精心构造溢出数据的内容,那么就有可能获得系统的控制权!如果说用户(也可能是黑客)提供了水——缓冲区溢出攻击的数据,那么系统提供了溢出的容器——缓冲区。
缓冲区在系统中的表现形式是多样的,高级语言定义的变量、数组、结构体等在运行时可以说都是保存在缓冲区内的,因此所谓缓冲区可以更抽象地理解为一段可读写的内存区域,缓冲区攻击的最终目的就是希望系统能执行这块可读写内存中已经被蓄意设定好的恶意代码。按照冯·诺依曼存储程序原理,程序代码是作为二进制数据存储在内存的,同样程序的数据也在内存中,因此直接从内存的二进制形式上是无法区分哪些是数据哪些是代码的,这也为缓冲区溢出攻击提供了可能。
实践过程
直接修改程序机器指令,改变程序执行流程
- 在正式开始实践之前,先对pwn1文件做个备份,命名为20145318
- 使用指令
objdump -d 20145318 | more
对目标文件进行反汇编
-
第一列为内存地址,第二列为机器指令,第三列为汇编指令。
main函数反汇编的第4行,"call 8048491 "是汇编指令,是说这条指令将调用位于地址8048491处的foo函数;其对应机器指令为"e8 d7ffffff",e8为跳转之意。本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但一解释e8这条指令呢,CPU就会转而执行 "EIP + d7ffffff"这个位置的指令。"d7ffffff"是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值(foo函数调用入口)。main函数调用foo,对应机器指令为" e8 d7ffffff",那我们想让它调用getShell,只要修改"d7ffffff"为,"getShell-80484ba"对应的补码就行。用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。
下面修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。
- 使用vi打开后,输入
:%!xxd
,将显示模式切换为16进制模式;输入/e8 d7
查找要修改的内容
- 按
i
键将模式改为插入模式,修改d7为c3;输入:%!xxd -r
转换16进制为原格式,然后存盘退出 - 反汇编,发现原汇编指令已经被成功修改
- 再次执行20145318
通过构造输入参数,造成BOF攻击,改变程序执行流程
- 再次cp备份一个20145318
- 进入gdb调试,输入1111111122222222333333334444444455555555,输入达到28字节时产生溢出
Segmentation fault
- 接下来通过gdb调试来确认输入字符串的哪几个字符会覆盖到返回地址,输入
info r
查看各寄存器的值:
- 观看eip的值,是ASCII码的 1234,也就是说我们输入的“1234”覆盖了它的地址,所以我们只需要将getshell的内存地址替换这4个字符,就可以达到程序向getshell函数转移的目的。
- 我们要构造一串特殊的输入,由于getShell的内存地址是0x0804847d,而其对应的ASCII没有字符,所以我们通过一个简单的perl脚本语言来构造输入值,输入:``perl -e 'print "11111111222222223333333344444444x7dx84x04x08x0a"' > input``
- 使用16进制查看指令
xxd
查看input文件的内容是否如预期:
- 最后将input的输入,通过管道符“|”,作为20145318的输入,执行得到结果