概述
C和C++编译器是集成的,编译一般分为如下四个步骤:
a. 预处理(preprocessing) ------------ cpp/gcc -E
b. 编译(compilation) ------------------ cc1 / gcc -S
c. 汇编(assembly) --------------------- as
d. 链接(linking) ------------------------ ld
下面就以一个经典的hello程序为例了解一下上述的四步
#include <stdio.h>
int main()
{
printf("hello, world\n");
return 0;
}
1. 预处理阶段:预处理器(cpp)根据字符#开头的命令,修改原始的C程序。例如,hello.c中第一行的#include <stdio.h>
命令告诉预处理器读取系统头文件stdio.h的内容,并把它直接插入到程序中。结果得到另一个C程序,通常以.i
作为文件扩展名。
2. 编译阶段:编译器(ccl)将文本文件hello.i翻译成文件本文件hello.s,它包含一个汇编语言程序
。该程序包含函数main
的定义,如下所示:
1 main:
2 subq $8, %rsp
3 movl $.LCO, %edi
4 call puts
5 movl $0, %eax
6 addq $8, %rsp
7 ret
定义中2~7行的的每条语句都以一种文本格式描述了一条低级机器语言指令。汇编语言是非常有用的,因为它为不同高级语言的不同编译器提供了通用的输出语言。例如,C编译器和Frotran编译器产出的输出文件用的都是一样的汇编语言
3. 汇编阶段:接下来,汇编器(as)将hello.s翻译成机器语言指令,并把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存到目标文件hello.o中,hello.o是一个二进制文件,它包含的17个字节是函数main
的指令编码。如果我们在文本编辑器里面打开hello.o文件,看到的将是一堆乱码。
4. 链接阶段:hello程序调用了printf
函数,他是每个C编译器都提供的标准C库的一个函数。printf函数存在于一个名为printf.o
的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的hello.o程序中,链接器(ld)就负责处理这种合并。结果就得到hello文件,他是一个可执行目标文件或简称为可执行文件,可以被加载到内存中,有系统执行。
-
为了更好的理解可以参考下图:
函数库
- 函数库一般分为静态库和动态库两种
- 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a“。
- 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。
静态库生成方法:
ar cr libxxx.a file1.o file2.o
就是把file1.o和file2.o打包生成libxxx.a静态库
使用方法
gcc test.c -L/path -lxxx -o test
动态库生成方法:
gcc -fPIC -shared file1.c -o libxxx.so
也可以分成两部来写
//这一步生成file1.o
gcc -fPIC file1.c -c
gcc -shared file1.o -o libtest.so
使用方法
gcc test.c -L/path -lxxx -o test
- 静态库链接时搜索路径顺序:
- ld会去找GCC命令中的参数-L
- 再找gcc的环境变量LIBRARY_PATH
- 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的
- 动态链接时、执行时搜索路径顺序
- 编译目标代码时指定的动态库搜索路径
- 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
- 配置文件/etc/ld.so.conf中指定的动态库搜索路径
- 默认的动态库搜索路径/lib
- 默认的动态库搜索路径/usr/lib
环境变量
- LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
- LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径