Debug SystemCall by Windbg
前言
昨天在给系统调用入口下硬件断点时发现了两种不同的情况,结合IDA,Windbg,Intel文档思考了许久,记录一下自己的想法,并不保证一定正确,测试环境Win10 1903 x64
第一种情况
- 硬件断点下到
swapgs
之后和mov rsp, qword ptr gs:[7008h]
之前,这时的环境应该是gs已经切换但内核栈还未切换- 这里面其实还包含了一种情况,就是在
swapgs
之后和切换内核页表之前,但是这并不影响IDT处理例程读取内核空间,因为IDT handler会根据KiKvaShadow切换CR3
- 这里面其实还包含了一种情况,就是在
- 在按下
g
之后,Windbg接收到异常,堆栈如下
- 可以看到当调试异常
KiDebugTrapOrFaultShadow
触发时,已经进行了堆栈切换,但是按照我们对x86异常处理的理解,这里由于是从nt!KiSystemCall64Shadow
触发的硬件断点,所以应该不存在权限切换,所以CPU应该不会自动切换堆栈,如下图
- 在Intel文档中查询了x64异常相关的文档后发现在x64上面处理机制有了一些变化,在x64的IDT结构中多了一个3 bits的IST索引,这个索引指向tr指向的x64 TSS结构中的IST。当IST索引为0时,采用x86的传统栈切换机制,如果IST不为0,则栈切换将会无条件进行
- 因此在调用
KiDebugTrapOrFault
时堆栈是正常可靠的0环堆栈,但是在Windbg中可以看到在nt!KiDebugTrapOrFault+0x65
发生了异常,经过分析,在这段代码中用到了异常前的堆栈进行数据存储,也就是说内核调试例程需要内核栈的支持,而我们触发硬件断点时堆栈还没有进行切换,因此在KiDebugTrapOrFault
异常处理例程中又发生了异常,从而引起了nt!KiDoubleFaultAbort
双重异常
第二种情况
- 硬件断点下在
swapgs
这里,也就是gs还有没切换时触发KiDebugTrapOrFaultShadow
,然后Windbg按下g
之后虚拟机和调试器皆会无法响应
-
经过在IDA中分析,以下想法皆为猜测,无法调试验证
- 触发硬件断点后,CPU流程进入
KiDebugTrapOrFaultShadow
,但是由于此时的gs并未指向内核数据kpcr
,因此在KiDebugTrapOrFaultShadow
中读取gs寄存器时触发了SMAP(此时gs指向应用层的TEB)
,从而引发双重异常KiDoubleFaultAbortShadow
,但是由于双重异常处理例程中也使用了gs
,再次发生异常,不断重入KiDoubleFaultAbortShadow
导致进入死循环
- 触发硬件断点后,CPU流程进入
总结
- 经过以上的分析,我们只需要在
gs
和内核栈
设置完成后下硬件断点,Windbg就可以正常断下
- 记录一下64位下各种描述符大小的变化