首先我们先编写汇编
extern choose ; int choose(int a, int b)
[section .data]; 数据在此
num1st dd 3
num2nd dd 4
[section .text] ; 代码在此
global _start ; 我们必须导出_start这个入口,以便让连接器识别
global myprint ; 导出这个函数为了让 bar.c 使用
_start:
push dword [num2nd] ;
push dword [num1st] ;
call choose ; | choose(num1st, num2nd)
add esp, 8
mov ebx, 0
mov eax, 1 ; sys_exit
int 0x80 ; 系统调用
; void myprint(char * msg, int len)
myprint:
mov edx, [esp + 8] ; len
mov ecx, [esp + 4] ; msg
mov ebx, 1
mov eax, 4 ; sys_write
int 0x80 ; 系统调用
ret
上述代码中需要说明的有三点:
- 由于在bar.c中用到函数mprint(),所以要用关键字global将其导出。
- 由于用到本文件外定义的函数choose(),所以要用关键字extern声明。
- 不管是myprint()还是choose(),遵循的都是C调用约定(C Calling Convention),后面的参数先入栈,并由调用者(Caller)清理堆栈。
C语言代码,其中包含函数myprint()的声明和函数choose()的主体。
void myprint(char * msg, int len);
int choose(int a, int b)
{
if (a >= b) {
myprint("the 1st one\n", 13);
} else {
myprint("the 2nd one\n", 13);
}
return 0;
}
编译链接和执行的过程:
~$ ls
bar.c foo.asm
~$ nasm -f elf -o foo.o foo.asm
~$ gcc -c -o bar.o bar.c
~$ ld -s -o foobar foo.o bar.o
~$ ls
bar.c bar.o foo.asm foobar foo.o
~$ ./foobar
the 2nd one
如果当我们执行上面的操作到 ld -s foo.o bar.o -o foobar 会产生 ld: i386 architecture of input file `foo.o’ is incompatible with i386:x86-64 output错误 意思是nasm编译产生的是32位的目标代码,gcc在64位平台上默认产生的是64位的目标代码,这两者在链接的时候出错,gcc在64位平台上默认以64位的方式链接。
方法一:
让gcc产生32位的代码,并在链接的时候以32位的方式进行链接
在这种情况下只需要修改编译和链接指令即可,具体如下:
32位的编译链接指令
$ nasm -f elf foo.asm -o foo.o
$ gcc -m32 -c bar.c -o bar.o
$ ld -m elf_i386 -s foo.o bar.o -o foobar
$ ./foobar
the 2nd one
方法二:
让nasm以64位的方式编译产生目标代码,并让gcc的链接器以默认的方式链接
但是第二种方法并不是仅仅更改nasm的编译方式那么简单,因为64位平台跟32位平台有很大的不同,包括参数的传递,指令集等。所以如果怕麻烦的话完全可以使用第一种方法,让gcc产生32位的目标代码,因为32位的代码可以运行在64位的平台上,这应该就是所谓的向上兼容。不过64位将来应该会是主流,所以研究一下还是很有必要的。
首先对gcc产生的32位于64位的汇编语言进行对比:
32位
gcc -m32 -s -o bar.o bar.c
/************** 32 位的汇编语言 *************/ choose: .LFB0: .cfi_startproc
pushl %ebp
.cfi_def_cfa_offset 8
.cfi_offset 5, -8
movl %esp, %ebp
.cfi_def_cfa_register 5
subl $24, %esp
movl 8(%ebp), %eax
cmpl 12(%ebp), %eax
jl .L2
movl $13, 4(%esp)
movl $.LC0, (%esp)
call myprint
jmp .L3
.L2:
movl $13, 4(%esp)
movl $.LC1, (%esp)
call myprint
movl 8(%ebp), %eax
cmpl 12(%ebp), %eax
jl .L2
movl $13, 4(%esp)
movl $.LC0, (%esp)
上面只取了我们感兴趣的地方:ebp指向的是刚进入choose函数的堆栈栈顶指针,此时只想的是刚入栈的ebp的值,ebp+4指向的函数调用入栈的ip地址(这里应该是段内调用,具体原因不太清楚,因为两个文件之间调用函数属于段内还是段外,我真的不清楚,如果你知道,可以告诉我),ebp+8指向的是调用者压栈的第二个参数,也是从左边数第一个参数,ebp+12 是调用者压栈的第一个参数,也就是从左边数第二个参数。这样我们知道了c语言的参数传递机制,就能编写相应的汇编程序调用C语言了,而C 语言调用汇编函数则以此类推,先将第二个参数压栈,再将第一个参数压栈。不再赘述。
(例: void fun(int a, int b) 函数在调用fun时首先将参数b 压栈,然后将参数 a压栈,这样fun 函数在取参数的时候就能先取a了,然后再取b,因为堆栈是先入后出。如果这样你还不明白,建议你看一下赵迥老师的linux 0.11内核完全剖析的第三章。)
(注:rax:64位,eax:32位 ax:16位
movl: 移动32位,movq:移动64位,movd:移动16位,movb:移动8位
其他带标志的指令类似。)
64位
gcc -c -o bar.o bar.c (64位的操作系统默认)
/************** 64位的汇编程序 ***********/
choose:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
subq $16, %rsp
movl %edi, -4(%rbp)
movl %esi, -8(%rbp)
movl -4(%rbp), %eax
cmpl -8(%rbp), %eax
jl .L2
movl $13, %esi
movl $.LC0, %edi
call myprint
jmp .L3
.L2:
movl $13, %esi
movl $.LC1, %edi
call myprint
movl %edi, -4(%rbp)
movl %esi, -8(%rbp)
movl -4(%rbp), %eax
cmpl -8(%rbp), %eax
jl .L2
movl $13, %esi
movl $.LC0, %edi
注意64位下的参数传递有了改变,而且寄存器也有了改变,不过我们既然使用了nasm汇编,对于64位寄存器的改变暂时不必操心,只需要先关心参数传递的格式。
可以看出参数传递不是用压栈的方式传递了,而是使用的寄存器来传递给被调用者,再由被调用者将其压栈使用。上述代码显示先将第一个参数给edi,然后由被调用者压入-4(%rbp),然后再将第二个参数给esi,由被调用者要入-8(%rbp),这一点倒是和32位下参数的入栈方式一致。
至于用寄存器传递函数参数取代用堆栈传递函数参数的原因,个人感觉是函数的调用者不用再操心入栈和释放栈了,完全由被调用者操心,至少我在函数的调用者里面经常是记得给函数参数入栈,但是函数调用完成后却忘记了把栈恢复。
这样我们就能根据上述规则来修改我们的foo.s,使其能够与64位的gcc产生的目标代码链接在一起。
64位模式下的foo.asm
extern choose ; int choose(int a, int b)
num1st dd 3
num2nd dd 4
global _start ; 我们必须导出_start这个入口,以便让连接器识别
global myprint ; 导出这个函数为了让 bar.c 使用
_start:
mov edi, [num2nd] ;
mov esi, [num1st] ;
call choose ; | choose(num1st, num2nd)
mov ebx, 0
mov eax, 1 ; sys_exit
int 0x80 ; 系统调用
; void myprint(char * msg, int len)
myprint:
;mov edx, [esp + 8] ; len
;mov ecx, [esp + 4] ; msg
mov edx, esi
mov ecx, edi
mov ebx, 1
mov eax, 4 ; sys_write
int 0x80 ; 系统调用
ret