概要
主要是对计算机的硬件和操作系统的组成介绍和了解
从一个简单的Hello.c程序进行讲起,如何把我们创建的文本文件编译成可执行文件并输出内容到屏幕上这期间发生了什么、数据是如何在计算机各部分之间传输的。
编译系统
在C语言里把一个源文件(.c)文件编程成可执行文件需要经过以下四个步骤:
- 预处理器(cpp):处理以#开头的命令并修改程序。hello.c ---> hello.i
- 编译器(ccl):将hello.i翻译成文本文件hello.s并包含一个汇编语言程序。汇编语言就是为不同高级语言的不同编译器提供通用的输出语言。
- 汇编器(as):将hello.s翻译成机器语言指令并打包成可重定位目标程序的格式。hello.s --> hello.o
- 链接器(ld):合并由单独预编译的目标文件并得到可执行文件。hello.o --> hello
为什么要了解编译系统
- 优化程序性能(第3、5、6章)
- 理解链接时出现的错误(第7章)
- 避免安全漏洞(第2章) 堆栈原理、缓冲区溢出错误
执行
处理器读取并解释存在内存中的指令,那么处理器是如何获取执行指令?运算结果是如何输出到屏幕的。这些都涉及到计算机的硬件组成。下面先介绍几个概念:
- 总线:总是传输定长字节块,称为字。现在有32位和64位
- I/O设备:(第6、10章) 每个I/O设备都通过控制器或适配器与I/O总线相连。控制器与适配器的区别主要在于它们的封装方式。
- 主存:(第6章)临时存储器,存放程序和程序处理数据。由一组动态随机存储器(DRAM)芯片组成。从逻辑上来说就是一个线性字节数组,每个字节数组都有唯一的地址。
- 处理器:(第3、4、5章)CPU其核心是一个字的存储设备:程序计数器
其模型是指令集架构(指令的效果),具体实现是微体系架构(处理器的具体实现)。
直接存储器存取(DMA,第6章)技术,数据可以不通过处理器而直接从磁盘到达内存
高速缓存(第6章)
一个程序要运行,首先需要把数据从硬盘复制到主存,在复制到寄存器。处理器运行的时,指令从主存复制的处理器。这些复制对于程序员来说都是开销会减慢程序的工作。
根据机械原来,较大的存储设备比较小的存储设备运行慢,而快速设备的造价远高于同类的低速设备。
针对这种处理器与主存之间的差异,系统设计者采用更小更快的存储设备,称为高速缓存存储器。L1和L2高速缓存使用静态随机访问存储器(SRAM)。在程序中我们可以利用高速缓存见程序提高一个数量级。
操作系统
操作系统可以看着应用程序与硬件之间的软件。
操作系统的功能主要有以下两个方面:
- 防止硬件被失控的应用程序滥用
- 向应用程序提供简单一致的机制控制复杂而又通常大不相同的低级硬件设备
那么是如何实现这两个功能的呢?主要是通过以下几个抽象概念:
- 进程: 对处理器、主存、I/O设备的抽象
- 虚拟内存:对主存、I/O设备的抽象
- 文件:对I/O设备的抽象
进程(第8章)
提供一种假象,程序是独占处理器、主存、I/O设备
并发运行:两个进程的指令交错执行,通过时间切换来实现即上下文切换。两个进程的转换是由操作系统内核管理的。内核就是操作系统常驻主存部分。
线程
多个线程构成进程。也被称为轻量级进程。多线程之间比多进程之间更易共享数据。线程一般比进程更高效
虚拟内存(第9章)
为每个进程提供独自内存的假象。每个进程看见的内存都是一致的即虚拟地址空间。
高位:保留给操作系统的代码和数据
低位:用户进程定义的代码和数据
在虚拟内存里面大量准确定义了一些区:
- 程序代码和数据:一开始运行就指定大小
- 堆:动态扩展和收缩
- 共享库:
- 栈:编译器用它来实现函数调用
- 内核虚拟内存:地址空间顶部是为内核保留的
其基本思想是把一个进程虚拟内存的内容存储在磁盘上,然后用主存作为磁盘的高速缓存。
网络通信
计算机之间通信就是把一个主机的信息复制到另外一台主机。它们是通过网络来完成。
Amdahl定律
描述我们对系统某个部分加速时,其对系统整体性能的影响取决于该部分是重要性和加速程度。有以下公式:
S = 1/((1-a) + a/k)
S:加速比
a:提升部分占比
k:加速比例
Amdahl定律的主要观点是 - 要想获得系统的显著性能提升,那么必须对系统的相当大的部分进行性能提升。
并发和并行
计算机的两个持续驱动是:
- 系统处理的事情更多
- 系统运行得更快
并发:有一个同时具有多个活动的系统
并行:是一个系统运行得更快
单处理系统:
多处理系统:是由于多核处理器和超线程的出现
指令级并行
可以同时执行多条指令的属性称为指令级并行
- 流水线
- 超标量:处理器可以达到比一个周期一条指令更快的执行效率
单指令、多数据并行
允许一条指令产生多个可以并行执行的操作