静态链接的一点小总结(二) 《程序员的自我修养》·笔记

静态链接的一点小总结(二)

空间与地址分配

  • 问题引入
      可执行文件与目标文件的格式是类似的,所以,可以说可执行文件中的代码段和数据段都是由输入的目标文件中合并而来的。
      解决方法:

    • 按序叠加
      顾名思义,该方法就是将各个目标文件依次合并叠加

      问题
        合并的过程中,每个段都需要有一定的地址和空间的对齐要求,对于规模稍大的应用程序,对应的输出文件会有成百上千的段,很显然,这种做法很浪费空间。
    • 相似段合并
      就是将同种性质的段进行合并。如下图所示:



        需要注意的是:".bss段"在目标文件和可执行文件中并不会占用文件空间,但是在装载时(重定位后进行装载)会占用地址空间。链接器在合并各个段的时候,也会将".bss段"进行合并(只是没有内容),并且分配虚拟空间。

    “链接器为目标文件分配地址和空间”的两层含义
    1.输出的可执行文件中的空间
    2.装载后的虚拟地址中的虚拟地址空间
    3.需要注意的是,对.text和.data而言,他们在可执行文件和虚拟地址中都需要分配空间,因为他们在这两者中都存在;但是对于.bss段而言,分配空间仅仅限于虚拟地址空间,因为它在可执行文件并没有内容(只有大小的记录)。

    • 两步链接
      1.空间与地址分配:扫描所有的输入文件,获得它们的各个段的长度、属性和位置。将输入文件中的符号表中所有的符号定义和符号引用收集起来,统一放到一个全局符号表。 合并相应段,计算出合并后的段的长度和位置,并建立映射关系。
      2.符号解析与定位:这是链接的核心,使用上一步获取到的信息,读取输入文件中的段信息、重定位信息,进行符号解析和重定位、调整代码中的地址等,进而完成链接。链接前后,目标文件隔断的分配、虚拟地址如下图所示:

        为什么链接器要将ab的代码段分配到ox08048094,数据段分配到ox08049108,而不是从 虚拟地址的0地址开始分配呢?这涉及操作系统的进程虚拟地址空间分配规则,在linux下,ELF可执行文件默认从地址0x08048000开始分配。
      注意:链接后程序中使用的地址已经是虚拟地址,我们关心VMA和size忽略文件偏移。
    • 符号地址的确定
        在虚拟内存中,由上述链接过程可知,各个段的虚拟地址已经知道了,并且各个符号现的段内地址也是知道的,则各个符号的虚拟地址就可以确定了。
        符号的虚拟地址确定了,就可以进行重定位了。
  • 符号的解析与重定位

    • 重定位表
        哪些指令是要被调整的呢?这些指令的哪些部分需要调整?怎么调整?ELF文件中有个叫重定位表的结构专门来保存这些与重定位相关的信息。
        重定位表也叫做重定位段,是ELF文件中的一个段;如果.text有需要被重定位的符号,就会有一个.rel.text的重定位代码段,同理重定数据段也是一样。
        重定位表中存储的主要是重定位入口以及对应的偏移,偏移指的是该入口对应的重定位段中的位置。
    • 符号解析--我们经常遇到的"undefined reference to ''"
        重定位的过程中,每一个重定位的入口都是对一个符号的引用。当连接器要对某个符号的引用进行重定位的时候,就需要确定这个符号的目标地址。
      此时*,链接器就会去查找由所有输入目标文件的符号表组成的全局符号表,找到相应的符号后(结构体中有相应的成员)方可进行重定位。
  • 静态链接过程
      静态链接需要用到静态库,静态库可以简单的看成一组目标文件的集合,即很多目标文件压缩打包后的文件。

    • C语言的运行库中有很多与系统功能相关的代码,编译完成后就会生成相同数量的目标文件,之后使用"ar"压缩程序将这些目标文件压缩到一起,并对那些目标文件进行编号和索引,就会形成linux中libc.a这个静态库文件。
    • 编译完成相应的用户程序之后进行链接操作,使用ld链接器。ld链接器会自动寻找所有的需要的符号以及它们所在的目标文件,并将这些目标文件从libc.a中解压出来(进而构建全局符号表...)(需要注意的是解压的文件不一定就是用户程序需要链接的目标文件,也可能在被解压的目标文件中有各种各样的嵌套,都要解压),最终将它们链接在一起成为可执行文件。
  • 静态连接过程的控制

    • 有一些特殊的程序,如: 操作系统内核、 BIOS 一些在没有操作系统的情况下运行的程序(bootloader/嵌入式系统程序等) 内核驱动等 它们往往受限于一些特殊条件,如需要指定输出文件的各段虚拟地址、段的名称、段的存放顺序等,因为这些特殊的环境,特别是硬件条件的限制,往往对程序的各段地址有特殊的要求。链接器大致提供了三种方式控制链接过程:
      1.命令行参数;
      2.链接指令放在目标文件中,编译器经常使用这种方法向链接器传递参数。PE目标文件 的.drectve段以用来传递参数;
      3.使用链接控制脚本,也是最灵活、最强大的链接控制方法。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容