C++相关
重复代码消除
- 可能产生重复代码的位置:
模板
外部内联函数
虚函数表 - 对应的方法:
- 全部保留
- 每个模板的实例单独放在一个段里(外部内联函数和虚函数表也类似),它有一个问题,比如说相同名称的一个段可能会拥有不同的内容,会导致同一个函数编译出来的结果不同。
函数级别链接
- 原因:函数的数量庞大,但是用到的却只有几个,不需要把全部链接
- 作用:把每个函数单独保存在一个段里,当链接器用到某个函数时,把它合并到输出文件中,用不到的就舍弃了。
- 它的优点:可以在很大程度上减小输出文件的长度,减少空间的浪费。
- 它的问题:目标函数的段的数量大大增加,重定位过程也会因为段数目的增加而变得复杂,目标文件的大小也会随着段数目的增加而变得相对较大。
全局构造与析构
- C++的全局对象的 构造函数在main之前被执行;析构函数在main之后执行
- ELF文件的两种特殊的段:
- .init,保存的是可执行指令(在main之前执行)
- .fini,保存着进程终止代码指令(在main之后执行)
要使两个编译器变异出来的目标文件能够相互链接的条件有:
- 采用相同的目标文件格式
- 拥有相同的符号修饰标准
- 变量的内存分布方式相同
- 函数的调用方式相同
- 等等
ABI
- 把符号修饰标准、变量内存布局、函数调用方式等跟可执行代码二进制兼容性相关的内容称为ABI
ABI & API
相同点:
- 都是所谓的应用程序接口
不同点:
- API指源代码级别的接口;ABI是二进制层面的接口,它的兼容性比API更严格
- API更关注源代码层面
决定目标文件之间是否二进制兼容:
- 内置类型的大小和在存储器中的存储方式(大端、小端、对齐方式等)
- 组合类型的存储方式和内存分布
- 外部符号与用户定义的符号之间的命名方式和解析方式
- 函数调用方式
- 堆栈的分布方式
- 寄存器的使用约定
(下面是C++层面对ABI的影响) - 继承类体系的内存分布
- 指向成员函数的指针的内存分布,如何通过成员函数的指针来调用成员函数,如何传递this指针
- 岁的好用虚函数,vtable的内容和分布形式,vtable在object中的位置等
- template如何实例化
- 外部符号的修饰
- 全局对象的构造和析构
- 异常的产生和捕获机制
- 标准库的细节问题
- 内嵌函数访问细节
静态库链接
- 语言库对API进行了包装
- 一个静态库可以看作是一组目标文件的集合,即多个目标文件压缩打包后形成的一个文件