前一篇文章描述了Intel x86计算机主板和内存映射图,现在我们来解说一下计算机启动的几个阶段。下面是一个简单图表。
按下电源按钮后计算机开始启动,主板加电以后它开始初始化自己的固件,固件是一些固化在芯片组上面的程序,它会试图去启动CPU。如果这一步失败了(例如CPU坏了或者没插好),你的计算机会死机并且给出错误信息(但是风扇会一直转)。有些版本的主板固件还会发出蜂鸣警告。这种状态被称为“zombie-with-fans”。注意有时候USB或者其他设备也有可能导致这种结果,调试的时候最好拔掉所有非必要可能导致问题的外设。
那么如果没问题的话CPU就开始加电工作了,在多CPU或者多核CPU情况下,某一个CPU会被随机抽选到作为启动CPU(bootstrap processor,BSP)运行BIOS和内核初始化部分的代码。其余的CPU(被称作application processor,AP),会保持停机状态直到操作系统内核显式地使用它们。
CPU启动之后首先进入的是实模式,这种模式下CPU处理的是物理内存地址,也就是说MMU没有开启分页功能,而且最多只能访问1MB的内存。
不过这时候绝大多数的CPU寄存器已经能够正常使用了,其中EIP寄存器是指向CPU要执行的指令内存地址的寄存器。启动之后,Intel CPU会有一个特殊的行为,那就是对EIP的初始值加一个基寄存器的值,让CPU跳转到0xFFFFFFF0这个地址执行那里的第一条指令。之所以称之特殊行为是因为这个地址其实大于实模式下1MB的内存限制。0xFFFFFFF0这个地址也因此被称为重置向量(reset vector)。
接下来主板上的固件会保证位于重置向量处的指令是一条jump指令,该指令清空了加在EIP上的基寄存器的值,让CPU继续跳转到BIOS代码的开始处(物理地址0xF0000)开始执行BIOS。这里让我们来回顾一下内存映射理解整个过程,见图。
接下来CPU就开始执行BIOS里面的指令了,包括初始化一些硬件和加电自检(POST)。如果找不到内存或者键盘都有可能让BIOS停止工作并且打印一些相关的错误信息,如果找不到显卡BIOS会发出蜂鸣警告(因为此时无法显示画面)。
现代BIOS往往会遵循高级配置电源接口(Advanced Configuration Power Interface,ACPI)来在内存中设置好一系列的数据来描述硬件信息,以便被操作系统内核利用。
自检以后BIOS会试图加载操作系统,它会从硬盘,光驱,软驱,网络等几个地方依次寻找操作系统(优先级往往可在BIOS内设定)。如果找不到操作系统,BIOS也会停机并给出错误信息。
这里我们假设BIOS在硬盘上找到了操作系统,它会首先读取该硬盘上的大小为512KB的0号扇区,这个扇区被称作主引导记录(Master Boot Record,MBR),它往往包含着两个重要的部分:第一,一小段帮助操作系统启动的代码;第二,与磁盘上具体文件系统相关的磁盘分区表。下面是一张图片帮助大家理解MBR的结构。BIOS读取完磁盘上的MBR之后会把它拷贝到内存地址0x7c00这个地方,然后跳转到该内存地址执行MBR里面的指令。
MBR里面有什么指令呢?Windows操作系统里面是Windows启动器,Linux的话可能是LILO或者GRUB启动器。而MBR的磁盘分区表部分则是四个16字节的结构,描述了磁盘是如何分区的(这样你就可以在同一磁盘的不同分区上安装不同的操作系统)。所以采用了MBR格式分区表的文件系统最多能安装四个操作系统。