读《程序员的自我修养》

前前后后花了3个月的闲余时间，认真研读了这本书，知道这本书名，源于进入58时组长交代的一个分享任务——《iOS的内存管理机制》。在研读WWDC相关章节时，对里面的虚拟内存和物理内存的相互转换、物理内存的占用和回收、堆栈的管理等内容，有很多疑问，在网上搜索相关解答时，发现线索最终都指向了《程序员的自我修养》。自己首先找了一份电子版，阅读了第一部分的内容后，有种《桃花源记》中 “初极狭，才通人。复行数十步，豁然开朗” 的感觉，立即毫不犹豫的买了纸质版。

关于内容，书的开头写的很明白：“描述一个应用程序在编译、链接和运行时刻发生的各种事项：代码指令是如何保存的、库文件如何与应用程序代码静态链接，应用程序如何装载到内存中并开始运行，动态链接如何实现，C/C++运行库如何工作，以及操作系统提供的系统服务是如何被调用的。” 内容以Linux和Windows两个系统平台的实现为例，详尽讲解了它们实现的是什么、为什么的问题。

计算机结构

计算机整体分为硬件部分和软件部分。比如大家最关注的内存、CPU、硬盘、显示器等属于硬件部分。而具体使用它的各种程序：办公三件套、IDE、游戏等，则属于软件部分。从最初的软件开始运行，到最终具体的硬件执行，中间使用层层的结构进行传递，这些层次的划分和组织过程，构成了完整的计算机结构。

历史演变

1 结构
计算机硬件部分的核心包括中央处理器（CPU）、内存和I/O控制芯片，作为程序开发者，最多关注的是内存。开始时，CPU频率和内存频率相似，二者连接在同一总线。后来CPU频率大幅提高，人们开始设计北桥系统，使用PCI总线连接CPU和内存、高速图像设备，南桥使用ISA总线连接键盘、鼠标等低速设备，然后通过PCIBridge和北桥相连。
2 内存
刚开始的程序直接运行在物理内存中，但是存在程序可能越界访问的错误，以及多个程序运行时存在的频繁换入、换出问题，后来通过虚拟内存的方式对物理内存进行抽象，解决了该问题。
3 操作系统
为了匹配运行速率不断提高的CPU，依次出现多道作业系统、分时任务系统和多任务操作系统。操作系统做了两件事情：1 为程序运行提供抽象的接口；2 管理硬件资源。硬件资源多入牛毛，操作系统为了适配不同的硬件，为硬件提供一系列接口和框架，由硬件生产厂家负责驱动程序的实现。
4 线程
在CPU运行频率提高到4GHz以后，开始进入了瓶颈期，为了继续提升其计算速度，人们采用了集成多个CPU的方式。通过多线程，可能将一些耗时的任务进行拆分，分别在不同的CPU上进行计算，提高效率。一个标准的线程由线程ID、当前指令指针（PC）、寄存器集合和堆栈组成。多线程执行过程中，涉及到线程安全，通过加锁的方式实现不同线程的同步执行。具体实现方式包括3种：1 信号量；2 互斥量；3 临界区。

静态链接

程序从编译到运行：预编译、编译、汇编、链接、运行。预编译阶段进行宏展开、文件替换、注释删除等；编译阶段进行词法分析、语法分析(成为表达式语法树)、语义分析(添加各表达式语法树节点的类型)，然后编译成中间代码(IR)，最后对中间代码进行优化，比如减少变量、合并指令等；汇编阶段将优化后的中间代码，转变为机器码，成为目标文件；链接阶段将不同的目标文件进行合并，对模块间的变量进行重定位等，最终成为可执行文件，以供运行。

可执行文件本身是一个文件，可执行是它的格式。文件内容是16进制的机器码，其通过段(Section)的方式来组织。可以分为头部、代码段、数据段、BSS 、段表、字符串表和符号表等。通过头部信息，可以确定可执行文件的类型、运行环境、文件机器字节长度、入口地址等信息。代码段存储代码指令，大部分是函数的具体实现。数据段中存储初始化的全局变量、局部变量等。BSS段中存放未初始化的全局变量，其在可执行文件中的大小为0(可以理解为只标识了其起始地址，大小记录在段表中，比较费解，这点也困扰了我好久)。段表记录段的个数和每个段的详情，比如段的名称、大小等信息。字符串表记录文件中所有的字符串信息。符号表存放符号的名称(字符串下标)、所在的段(段表中的下标)、类型、大小等信息。个人认为符号表是理解可执行文件的核心，程序中所定义的函数名、变量名，在可执行文件中是一个个全局唯一的符号，其名称存放在字符串表，其值对应了具体的可执行文件的地址，链接过程就是对它们的有效替换，最终生成了具备可执行能力的目标文件。

静态链接是链接器将不同的目标文件组织起来的过程。比如将目标文件a.o和b.o中的二进制内容，按照.text(a.o)+.text(b.o)、.bss(a.o)+.bss(b.o)等链接为一个统一的整体。在合并的文件中，不同函数和变量的虚拟地址已经确定，使用确定的新值来更新符号表段的内容。接下来依据各个段的重定位表，将引用的符号内容，替换为符号表段中确定的新地址值。自此，一个完成的目标文件已经完成。

最终目标文件的内容形式，由编译器、链接器来决定，编译器和链接器在不同硬件和平台上的实现又不一致。所以不同硬件和平台上生成的二进制目标文件无法相互兼容。为了解决这个问题，人们试图建立目标文件的统一抽象模式，比如BFU库，首先将源代码文件编译为BFU格式的文件，然后由BFU转换为适配不同硬件和平台的目标文件。这样，如果新增一种平台和硬件，只要在BFD库中添加支持即可。

装载与动态链接

1 装载
装载是可执行文件映射到虚拟内存空间的过程。操作系统来实现装载过程，然后由内核态切换到用户态，执行程序。原始的装载方式直接将程序装载到物理内存中，需要开发者管理物理内存的具体分配，比较繁琐。现在的操作系统首先把虚拟内存和物理内存划分为大小相同的页，然后通过页映射的方式实现虚拟内存到物理内存的装载，二者通过硬件MMA实现快速的地址转换。为了适配分页要求，映射的虚拟空间需要对可执行文件中的内容进行合理组织，比如相似段的合并、按照页大小进行放置、BSS空间的分配等，这个过程操作系统通过将不同的Section组织成Segment来实现。
2 动态链接
静态链接出的可执行文件，存在大量相同的依赖库，如果在运行每个进程时，都为这些依赖库分配单独的物理空间，会照成巨大浪费。除此之外，如果依赖中的某个子库进行了更新，那么静态链接的可执行文件也要随之更新，否者就无法使用新功能。为此，动态链接方式应运而生。

动态链接实现相同子库的共享，需要将子库编译为地址无关的形式：对内部变量数据、函数引用改为相对地址寻址方式，对外部变量、函数引用采用全局偏移表(Gobal Offet Table)的间接引用方式。其数据段、BSS段、GOT等部分，在各进程的虚拟空间中创建共享库的副本，适应变化；将地址无关的指令和数据部分进行共享，节省空间。

相比静态链接，动态链接库将可执行文件与依赖子库的的链接过程放到加载阶段，执行时通过GOT的间接方式寻找指令，速度会降低，是操作系统使用时间换取空间的方式。为了节省动态加载占用的时间，操作系统动态加载时采用延迟绑定，在函数第一次被使用时才对引用变量和地址等进行重定位。

库与运行库

通过对C语言运行库 (Runtime) 的实现，让我对运行时的理解更加深刻：它是构建在C语言和操作系统API之间的桥梁，让开发程序的人专注于使用C语言进行逻辑实现，不用关心操作系统相关的问题（进程创建销毁、堆栈管理、图形操作、网络使用、文件管理等）和不同操作系统实现的差异（Linux和Windows平台等）。比如我们常用的函数printf，实际是通过C语言的 Runtime (CRT), 最终调用了操作系统的命令行输出功能，在Windows平台上, CRT 通过调用 Winows API，在Linux平台上通过write函数来实现。推而广之，CRT是高级语言C对系统调用的封装方式，OCRT（OC Runtime）是Object-C对iOS系统的调用方式的封装，ART（Android Runtime）是Java对Android操作系统的封装。一切高级语言都有运行时，通过运行时实现了对底层操作系统的各种封装，让程序开发者愉快地（无脑地）专注于应用实现。运行时支持跨平台（操作系统时），使用该高级语言创建的程序，就能在不同的操作系统上运行。

最后

作为iOS开发者，在内存管理方面，最基本的要求是避免内存泄漏，对其认识从理论上可以解释很清楚，但是具体到系统的内存布局，比如虚拟内存的大小、物理内存的占用计算等，认知往往很模糊。对最终编译的可执行文件MachO,通过MachOView可以看到具体的文件头和段信息，但是对于具体信息的含义，以及如此组织的原因更是一头雾水。具体开发时，涉及到动态库和静态库的具体区别，除了能够说出静态库相比动态库是以空间换时间外，其他的区别就不清楚了。对应用启动时的介绍，不止一遍听过递归加载依赖的动态库，然后进行Rebasing和Rebing，但是对具体的实现过程就云里雾里了...等等很多疑问，在这本书中都得到了解答。

这本书我先通读了一遍，利用假期又精度了一遍，通过不同章节间的相互印证、对实例的反复思考，对整个计算机体系和程序的编译、装载和运行有了更近一步的认识，就像江湖传言中的易筋经，颇有被打通了任督二脉的感觉。虽说具体编程技术日新月异，但是这种沉淀的心法，却稳如基石，以后还需要不断学习，不断领悟。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,098评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,213评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,960评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,519评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,512评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,533评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,914评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,804评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,563评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,644评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,350评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,933评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,908评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,146评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,847评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,361评论 2赞 342