系统调用的三层机制(上)
基础知识
1、通过库函数的方式进行系统调用,库函数用来把系统调用给封装起来。
2、CPU有四种不同的执行级别:0、1、2、3,数字越小,特权越高。Linux操作系统中采用了0和3两个特权级别,分别对应内核态和用户态。
3、宏观上Linux操作系统的体系架构分为:用户态和内核态。
区分内核态和用户态的方法就是CS:EIP的指向范围。
- 内核态(高指令执行级别):对所有的指令包括特权指令都可以执行,CS:EIP的值可以是任意地址
- 用户态(低级别指令):对于32位的4GB进程地址空间,只能访问0x00000000~0xbfffffff的地址空间。
4、中断:从用户态进入内核态的主要方式。
5、系统调用:为用户态进程与硬件设备进行交互提供了一组接口。
6、系统调用的功能和特性:
- 把用户从底层的硬件编程中解放出来;
- 极大地提高系统安全性;
- 使用户程序具有可移植性。
7、API和系统调用的关系:
API:应用程序编程接口,只是函数定义。
- 系统调用通过软中断向内核发出了中断请求,int指令的执行就会触发一个中断请求。
- libc函数库定义的一些API内部使用了系统调用的封装例程,其主要目的是发布系统调用,使程序员在写代码时不需要用汇编指令和寄存器传递参数来触发系统调用。
- 一个API可能只对应一个系统调用,也可能内部由多个系统调用实现;一个系统调用也可能被多个API调用。
- 涉及与内核空间进行交互的API内部会封装系统调用,不涉及与内核空间进行交互的API内部不会封装系统调用。
- 如果内核增加了一个新的系统调用,但libc函数库没有及时更新为其编写API函数,则可以利用libc提供的syscall函数直接调用。
8、系统调用的三层机制:xyz(),system_call和sys_xyz()
9、内核如何知道用户态进程希望调用的是哪个系统调用?
内核通过给每个系统调用一个编号来区分,即系统调用号,将API函数xyz()和系统调用内核函数sys_xyz()关联起来,用EAX寄存器传递系统调用号参数。
使用库函数API和C代码中嵌入汇编代码触发同一系统调用
使用库函数API进行触发
下面以调用系统库函数getpid()来获取进程识别码为例。
执行结果如下:
C代码中嵌入汇编代码进行触发
查询linux系统调用号表可知,getpid()系统调用号为20,十六进制即0x14。
汇编代码分析:
asm volatile(
"mov $0,%%ebx
" /*把EBX寄存器清零*/
"mov $0x14,%%eax
" /*把0x14放到EAX寄存器中,EAX寄存器用于传递系统调用号,getpid()系统调用号为20,十六进制即0x14*/
"int $0x80" /*触发系统调用陷入内核执行20号系统调用的内核处理函数*/
:"=a"(pid)
);
这里代码中刚开始用的是movl编译提示出错,改为mov后通过。
执行结果如下:
含两个参数的系统调用rename
rename在内核中的系统调用处理函数为sys_rename(),系统调用号为38,其功能是给一个文件重命名。
- 创建文件fxn.c
- 嵌入式汇编代码进行触发
汇编代码分析:
asm volatile(
"movl %1,%%ebx
" /*把oldname存入EBX寄存器中*/
"movl %2,%%ecx
" /*把newname存入ECX寄存器中*/
"movl $0x26,%%eax
" /*把系统调用号38存入EAX寄存器中*/
"int $0x80
" /*触发系统调用陷入内核执行38号系统调用的内核处理函数*/
:"=a"(ret)
:"b"(oldname),"c"(newname) );
执行结果如下:
成功将文件fxn.c改名为fxn20199319.c
- 库函数API进行触发
利用库函数API触发rename系统调用将上述改名后的fxn0199319.c改回fxn.c。
执行结果如下:
总结
Linux下的系统调用是通过中断(int 0x80)来实现的。在执行int 0x80 指令时,寄存器EAX中存放系统调用号,而传给系统调用的参数则按顺序赋值给EBX,ECX,EDX,ESI,EDI,EBP中,参数个数不能超过6个,如果超过则要把某一个寄存器作为指针指向内存。