作者:矢泽久雄[日]
译者:李逢俊
本文为对《程序是怎样跑起来的》一书内容的整理和概括,部分图片,文字摘选自书籍,如有任何侵权行为请联系作者第一时间删除,谢谢。
对程序员来说CPU是什么
CPU的内部结构解析
CPU(Central Processing Unit)职责: 解释和运行转换成机器语言的内容。
程序运行流程示例:
- 用C语言等高级语言编写程序。
- 将程序编译后转换成机器语言的EXE文件。
- 程序运行时,在内存中生成EXE文件的副本。
- CPU解释并执行程序内容。
CPU内部组成:寄存器(20~100个),控制器,运算器,时钟(电流信号相互连通)。
寄存器: 暂存指令,数据等处理对象。
一个CPU内部会有20~100个寄存器。
控制器: 把内存上的指令,数据等读入寄存器,并根据指令的结果来控制整个计算机。
时钟: 发出CPU开始计时的时钟信号(clock puzzle,频率越高CPU运行速度越快)。
CPU和内存是由许多晶体管组成的电子部件,通常称为:IC(Integrated Circuit,集成电路)。
内存(main memory,简称主存):主存通过控制芯片等与CPU相连,主要负责储存指令和数据。储存的内容随计算机的关闭而自动清除。通常使用DRAM(Dynamic Random Access Memory,动态随机存取储存器)芯片。
CPU是寄存器的集合体
程序是把寄存器作为对象来描述的。
- 高级语言:使用类似人类的语言的语法来记叙的编程语言的总和。如BASIC,C,C++,Java,Pascal,FORTRAN等。
- 汇编语言(assembly):采用助记符(memonic)来编写程序,每一个原本是电气信号的机器语言指令都会有一个对应的助记符,助记符常为指令功能的单词,如mov和add分别是数据的储存(move)和相加(addtion)的简写。
- 机器语言:CPU能够直接解释和执行的语言。(数字0和1的集合)
通常,将汇编语言编写的程序转化成机器语言的过程称为汇编;反之,机器语言程序转换成汇编语言程序的过程称为反汇编。
把汇编语言转换成机器语言的程序称为汇编器(assembler)。
把高级语言转换成机器语言的程序称为编译器(compiler)。
/* 汇编语言编写的程序事例 */
mov eax, dword ptr [ebp-8] //把数值从内存复制到exa
add eax, dword ptr [ebp-0Ch] //exa的数值和内存的数值相加
mov dword ptr [ebp-4], exa //把exa的数值(上一次相加的结果)储存在内存中
高级语言编写的程序在编译后转换成机器语言,然后通过CPU内部的寄存器来处理。
寄存器中储存的内容既可以是指令也可以是数据。数据分为“用于运算的数值”和“表示内存地址的数值”。
8种寄存器的主要种类和功能 如下表:
种类 | 功能 |
---|---|
累加寄存器( accumlulator register ) | 储存执行运算后的数据和运算后的数据 |
标志寄存器( flag register ) | 储存运算处理后的CPU状态 |
程序计数器( program counter ) | 储存下一条指令所在的内存的地址 |
基址寄存器( base register ) | 储存数据内存的起始地址 |
变址寄存器( index register ) | 储存基址寄存器的相对地址 |
通用寄存器( general purpose register ) | 储存任意数据 |
指令寄存器( instruction register ) | 储存指令。CPU内部使用,程序员无法通过程序对该寄存器进行读写操作 |
栈寄存器( stack register ) | 储存栈区域的起始地址 |
寄存器数量 | 寄存器种类 |
---|---|
仅有一个 | 程序计数器,标志寄存器,累加寄存器 |
含有多个 | 基址寄存器,变址寄存器,通用寄存器 |
CPU是寄存器的集合体
决定程序流程的程序计数器
实际上一个命令和数据通常被储存在多个地址上,为了方便说明把指令和数据分配到一个地址中。
假设地址0100
为程序开始的位置。Windows等操作系统把程序从硬盘复制到内存后,会将程序计数器设定为0100
,然后程序便开始运行。CPU每执行一条指令,程序计数器自动+1。然后CPU的控制器会参照程序计数器的数值,从内存中读取命令并执行。
条件分支和循环机制
程序的流程分为:
- 顺序执行:执行按照地址内容的顺序执行指令。执行一条指令计数器+1。
- 条件分支:根据条件执行任意地址的指令。计数器跳转到指定地址。
- 循环:重复执行同一地址的指令。
条件分支和循环中使用的跳转指令,会参照当前执行的运算结果来判断是否跳转。无论当前累加寄存器的运算结果是负数,零或正数,标志寄存器都会将其保存。(也负责存放溢出和奇偶校验的结果)。
溢出( overflow )是指运算结果超出寄存器的长度范围。
-
奇偶校验( parity check )是指检查运算结果的值是偶数还是奇数。
是否执行跳转指令由CPU在参考标志寄存器的数值后进行判断。运算结果的正负和0三种状态由寄存器的三个字节位(0,1,2)表示。如下图: 0位:运算结果为正则为1。
1位:运算结果为0则为1。
2位:运算结果为负则为1。
函数的调用机制
单纯的跳转指令无法实现函数的调用,而是通过把程序计数器的值设定为函数的储存地址来实现。函数的调用需要在完成函数内部的处理后,处理流程再返回到函数的调用点(函数调用指令的下一地址)。因此,如果只是跳转到函数的入口地址,处理流程就不知道该返回到哪了。
函数的调用使用call指令,在将函数的入口地址设定到程序计数器前,call指令会把调用函数后要执行的指令地址储存在名为栈的主存内。函数处理完后,再通过函数的出口来执行return命令(把保存在栈中的地址设定到程序计数器中)。
栈(stack):在程序领域中,栈表示不断储存各种数据的内存区域。函数调用能够返回调用前的地址就是因为栈。
通过地址和索引实现数组
我们用十六进制数将计算机内存上00000000~FFFFFFF
的地址划分出来。
实际查看的内存地址 = 基址寄存器的值 + 变址寄存器的值
例如:要访问10000000~1000FFFF
地址时,把10000000
存入基址寄存器(基址寄存器的值被固定),然后变址寄存器中的值可在00000000~0000FFFF
内变化,变址寄存器中的值,就相当于高级语言程序中数组的索引功能。
(用一个数组名来表示全体数据,通过索引来区分数组的各个数据。如,一个10元素的数组a,数据表示为a[0] ~ a[9],其中的数字0~9就是索引)
CPU处理简述
下表对CPU能执行的机器语言指令进行分类。
类型 | 功能 |
---|---|
数据转送指令 | 寄存器和内存,内存和内存,寄存器和外围设备之间的数据读写操作 |
运算指令 | 用累加寄存器的执行算术运算,逻辑运算,比较运算和移位运算 |
跳转指令 | 实现条件分支,循环,强制跳转等 |
call/return指令 | 函数的调用 / 返回调用前的结果 |
有关计算机二进制对数据进行表示及处理可参考:
明明是悟空 - 二进制的计算(计算机为什么采用补码储存数据)
张晓军 - 计算机中数的表示及运算
持续更新... ...
作者:SouthBegonia
链接:http://www.jianshu.com/p/q81RER/
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。