计算机是由硬件和系统软件组成,它们共同工作来运行应用程序。
我们来通过hello程序生命周期,了解当系统在执行hello程序时,系统发生了什么以及为什么会如此运作。
#include <stdio.h>
int main()
{
printf("hello world\n");
}
一、信息是位+上下文
hello程序时从源程序(源文件)开始,源程序由程序员通过编辑器创建并保存为文本文件,文件名为hello.c。源程序实际上是由0和1组成的位(亦比特)序列,这些位被组织成8个一组,称为字节,每个字节表示程序中某个文本字符。
大部分程序采用ASCII标准来表示文本字符,用唯一的字节大小的整数值表示每个字节。
hello.c以字节序列方式存储在文件中,每个字节都有一个整数值,对应于某个字符。例如,第一个字节的整数值是35,对应字符#。每行文本都是以一个看不见换行符"\n"来结束,对应的整数值为10。
hello.c的标识方法说明一个基本思想:系统中所有的信息-----包含磁盘文件、存储器中的程序、存储器中存放的用户数据以及网络上传送的数据,都是由一串比特表示的。区分不同数据对象的唯一方法,读到这些数据对象时上下文。
二、程序被其他程序翻译成不同格式
为了在系统上运行hello.c程序,每条C语句都必须被其他程序转化为一系列的低级机器语言指令,这些指令按照可执行目标程序的格式打包,并以二进制磁盘文件的形式存放起来。
在Unix系统上,从源文件到目标文件的转化是由编译器驱动程序完成,
unix> gcc -0 hello hello.c
gcc编译器驱动程序读取源程序文件hello.c,翻译成一个可执行目标文件hello,这个翻译过程分为四个阶段完成,预处理器、编译器、汇编器、链接器。
- 预处理阶段。预处理(cpp)根据字符#开头的命令,修改原始C程序,直接插入到程序文本中,得到来一个C程序,以.i作为文件扩展名
- 编辑阶段。编译器(ccl)干湖文本文件hello.i翻译成文本文件hello.s,包含汇编语言程序。汇编语言程序中每条语句以一种标准文本格式确切地描述一条低级机器语言指令。汇编语言为不同高级语言的不同编译器提供了通用输出语言
- 汇编阶段。汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成可重定位目标程序格式,将结果保存在目标文件hello.o中,hello.o是二进制文件,字节编码是机器语言指令而不是字符,在文本编辑器打开hello.o文件,呈现乱码
- 链接阶段。链接器(ld)并入标准库函数printf,得到hello可执行文件。可执行文件加载到存储器后,由系统负责执行。
三、了解编译系统如何工作的好处
- 优化程序性能。比如一个switch语句是不是比一系列if-then-else语句高效?一个函数调用代价多少?while循环比do循环更有效吗?为什么两个功能相近的循环的运行时间会有很大的差异?
- 理解链接时出现错误。链接器报无法解析一个引用,是什么意思?静态库和动态库的区别是什么?为什么有些链接错误直到运行时才出现?
- 避免安全漏洞。缓冲区溢出错误造成大多数网络和Internet服务器上的安全漏洞。
四、处理器读并解释在存储器中的指令
(1) 系统硬件组成
为了理解运行hello程序发生了什么,需要理解典型系统的硬件组织。
CPI:中央处理器 ALU:算数/逻辑运算单元 PC:程序计数器 USB:通用串行总线
(a)总线
贯穿整个系统是一组电子管道,称为总线,携带信息字节并在各个部件间传递。总线传送定长字节块
(b)I/O设备
I/O(输入、输出)设备是系统与外界的联系通道。上述有2个I/O设备,用户输入的键盘和鼠标,作为用户输出的显示器,用于长期存储数据和程序的磁盘驱动器。最开始,可执行程序hello放在磁盘上。
每个I/O设备通过控制器或适配器与I/O总线连接起来,控制器和适配器区别在于组成方式。控制器是I/O设备中或系统主印制电路板(通常为主板)上的芯片组,适配器一块插在主板槽上的卡。功能是I/O总线和I/O设备之间传递信息。
(c)主存
临时存储设备,处理器执行程序时,存放程序和程序处理的数据。主存是DRAM动态随机存取存储器芯片组成。逻辑上,存储器由一个线性字节数组组成,每个字节有唯一的地址(数组索引),从零开始。一般来说,组成程序的每条机器指令由不定量字节构成。
(d)处理器
中央处理单元(CPU)简称处理器,执行存储在主存中指令的引擎。处理器核心是一个成为程序计数器(PC)的字长大小的存储设备(或寄存器)。在任何一个时间节点,PC指向主存中的某条机器语言指令(内含地址)
从系统通电开始,直到系统断电,处理器一直在重复执行相同的基本任务:从程序计数器(PC)指向的储存器处读取指令,解释指令中的位,执行只来指示的简单操作,然后更新程序计数器指向下一条指令,这条指令并不一定在存储器中和刚刚执行的指令相邻。
CPU在指令的要求下可能执行的操作
- 加载:从主存拷贝一个字节或者一个字到寄存器,覆盖寄存器原来的内容
- 存储:从寄存器拷贝一个字节或者一个字到主存着某个位置,覆盖这个位置上原来的内容
- 更新:拷贝两个寄存器的内容到ALU,ALU将两个字相加,并将课堂存放到一个寄存器中,覆盖该寄存器中原来的位置
- I/O读:从一个I/O设备中拷贝一个字节或者一个字到寄存器
- I/O写:从一个寄存器拷贝一个字节或一个字到I/O设备
- 转移:从指令本身中抽取一个字,并将这个字拷贝到程序计数器(PC)中,覆盖PC中原来的值
(2)执行hello程序
shell程序执行它的指令,当在键盘上输入字符串./helo,shell程序逐一读取字符到寄存器,再把它存放到存储器中。
当我们岸上enter键,shell知道结束命令的输入,shell执行一系列指令,将hello目标文件中的代码和数据从磁盘拷贝到主存,从而加载hello文件。
利用DMA(随机存储器存取)技术,数据可以不通过处理器直接从磁盘到主存
一旦hello目标文件中的代码和数据加载到存储器,处理器开始执行hello程序的主程序中的机器语言指令。这些指令将hello,world\n串的字节从存储器拷贝到寄存器文件,再从寄存器中文件拷贝到显示设备,最终显示在屏幕上。