在C程序main函数中,接收用户输入任意个整数,然后在main中调用使用ARM汇编编写的函数(在该函数中完成对这些整数的排序功能),然后再在C程序main函数中输出这些排好顺序的整数。
main.c
#include <stdio.h>
int main()
{
int i=0;
int num=0;
int *array=NULL;
while(num <= 0) //输入数组中元素的个数
{
printf("please enter the number of elements:\n");
scanf("%d",&num);
if(num > 0)
{
break;
}
}
if(NULL == (array = (int *)malloc(num*sizeof(int))))
{
printf("malloc failed!\n");
exit(-1);
}
printf("please enter the elements:\n");
for(i = 0; i<num; i++) {
printf("\n%d:\t", i);
scanf("%d", array+i);
}
sort(array, num);//调用相应的汇编的函数,注意分析传参过程
printf("The Result is:\n");
for(i = 0; i<num; i++) {
printf("%d:\t%d\n", i, *(array+i));
}
return 0;
}
下面是相应的Sort.s:
.section .text;声明为代码段
.globl sort;声明全局变量
sort: ;linux下需要加冒号
mov r2, #0
mov r8, r0
mov r9, r0
loop1:
sub r1, r1, #1
cmp r2, r1
add r1, r1, #1
beq end
mov r6, r2
add r3, r2, #1
loop2:
cmp r3, r1
beq continue1
mov r3, r3, lsl #2
add r8, r8, r3
ldr r5, [r8]
mov r6, r6, lsl #2
add r9, r9, r6
ldr r4, [r9]
cmp r4, r5
bgt exchange
continue2:
sub r8, r8, r3
mov r3, r3, lsr #2
sub r9, r9, r6
mov r6, r6, lsr #2
add r3, r3, #1
b loop2
exchange:
str r4, [r8]
str r5, [r9]
b continue2
continue1:
add r2, r2, #1
b loop1
end:
注意:通过APCS传过来的两个变量,保存在r0和r1,分别代表是数组的首地址和元素的个数
使用Arm交叉编译通过
/--------------------------------------------------------------------------------------------------------------------------------------
对于ARM体系来说,不同语言撰写的函数之间相互调用(mix calls)遵循的是 ATPCS(ARM-Thumb Procedure Call Standard),ATPCS主要是定义了函数呼叫时参数的传递规则以及如何从函数返回,关于ATPCS的详细内容可以查看ADS1.2 Online Books ——Developer Guide的2.1节。这篇文档要讲的是汇编代码中对C函数调用时如何进行参数的传递以及如何从C函数正确返回。
不同于x86的参数传递规则,ATPCS建议函数的形参不超过4个,如果形参个数少于或等于4,则形参由R0,R1,R2,R3四个寄存器进行传递;若形参个数大于4,大于4的部分必须通过堆栈进行传递。
我们先讨论一下形参个数为4的情况.
实例1:
test_asm_args.asm
//--------------------------------------------------------------------------------
IMPORT test_c_args ;声明test_c_args函数
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存当前lr
ldr r0,=0x10 ;参数 1
ldr r1,=0x20 ;参数 2
ldr r2,=0x30 ;参数 3
ldr r3,=0x40 ;参数 4
bl test_c_args ;调用C函数
LDR pc, [sp], #4 ;将lr装进pc(返回main函数)
END
test_c_args.c
//--------------------------------------------------------------------------------
void test_c_args(int a,int b,int c,int d)
{
printk("test_c_args:\n");
printk("%0x %0x %0x %0x\n",a,b,c,d);
}
main.c
//--------------------------------------------------------------------------------
int main()
{
test_asm_args();
for(;;);
}
程序从main函数开始执行,main调用了test_asm_args,test_asm_args调用了test_c_args,最后从test_asm_args返回main。代码分别使用了汇编和C定义了两个函数,test_asm_args 和 test_c_args,test_asm_args调用了test_c_args,其参数的传递方式就是向R0~R3分别写入参数值,之后使用bl语句对test_c_args进行调用。其中值得注意的地方是用红色标记的语句,test_asm_args在调用test_c_args之前必须把当前的 lr入栈,调用完test_c_args之后再把刚才保存在栈中的lr写回pc,这样才能返回到main函数中。
如果test_c_args的参数是8个呢?这种情况test_asm_args应该怎样传递参数呢?
实例2:
test_asm_args.asm
//--------------------------------------------------------------------------------
IMPORT test_c_args ;声明test_c_args函数
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存当前lr
ldr r0,=0x1 ;参数 1
ldr r1,=0x2 ;参数 2
ldr r2,=0x3 ;参数 3
ldr r3,=0x4 ;参数 4
ldr r4,=0x8
str r4,[sp,#-4]! ;参数 8 入栈
ldr r4,=0x7
str r4,[sp,#-4]! ;参数 7 入栈
ldr r4,=0x6
str r4,[sp,#-4]! ;参数 6 入栈
ldr r4,=0x5
str r4,[sp,#-4]! ;参数 5 入栈
bl test_c_args_lots
ADD sp, sp, #4 ;清除栈中参数 5,本语句执行完后sp指向 参数6
ADD sp, sp, #4 ;清除栈中参数 6,本语句执行完后sp指向 参数7
ADD sp, sp, #4 ;清除栈中参数 7,本语句执行完后sp指向 参数8
ADD sp, sp, #4 ;清除栈中参数 8,本语句执行完后sp指向 lr
LDR pc, [sp],#4 ;将lr装进pc(返回main函数)
END
test_c_args.c
//--------------------------------------------------------------------------------
void test_c_args(int a,int b,int c,int d,int e,int f,int g,int h)
{
printk("test_c_args_lots:\n");
printk("%0x %0x %0x %0x %0x %0x %0x %0x\n",
a,b,c,d,e,f,g,h);
}
main.c
//--------------------------------------------------------------------------------
int main()
{
test_asm_args();
for(;;);
}
这部分的代码和实例1的代码大部分是相同的,不同的地方是test_c_args的参数个数和test_asm_args的参数传递方式。
在test_asm_args中,参数1~参数4还是通过R0~R3进行传递,而参数5~参数8则是通过把其压入堆栈的方式进行传递,不过要注意这四个入栈参数的入栈顺序,是以参数8->参数7->参数6->参数5的顺序入栈的。
直到调用test_c_args之前,堆栈内容如下:
sp->+----------+
| 参数5 |
+----------+
| 参数6 |
+----------+
| 参数7 |
+----------+
| 参数8 |
+----------+
| lr |
+----------+
test_c_args执行返回后,则设置sp,对之前入栈的参数进行清除,最后将lr装入pc返回main函数,在执行 LDR pc, [sp],#4 指令之前堆栈内容如下:
+----------+
| 参数5 |
+----------+
| 参数6 |
+----------+
| 参数7 |
+----------+
| 参数8 |
sp->+----------+
| lr |
+----------+