汇编语言的发展
机器语言 :
由0和1组成的机器指令
- 加: 0100 0000
- 减: 0100 1000
- 乘: 1111 0111 1110 0000
- 除: 1111 0111 1111 0000
汇编语言(assembly language) :
使用助记符代替机器语言
- 加:INC EAX 通过编译器 0100 0000
- 减:DEC EAX 通过编译器 0100 1000
- 乘:MUL EAX 通过编译器 1111 0111 1110 0000
- 除:DIV EAX 通过编译器 1111 0111 1111 0000
高级语言(High-level programming language) :
比如Objective-C, swift, C更接近人类语言
- 加:A+B 通过编译器 0100 0000
- 减:A-B 通过编译器 0100 1000
- 乘:A*B 通过编译器 1111 0111 1110 0000
- 除:A/B 通过编译器 1111 0111 1111 0000
代码在终端设备上的执行流程:
-
汇编语言
与机器语言
一一对应, 每条机器指令
都有与其对应的汇编指令
-
汇编语言
可以通过编译得到机器语言
,机器语言
也可以通过反汇编得到汇编语言
-
高级语言
可以通过编译得到汇编语言
,机器语言
; 但汇编语言
,机器语言
几乎不可能还原成高级语言
(因为不同的高级语言
有可能编译成同一条汇编
/机器语言
, 反过来汇编
/机器语言
就不能准确反编译成高级语言
)
汇编语言的特点
- 直接访问, 控制各种硬件设备, 比如存储器, CPU, 能最大限度的发挥硬件的功能.
- 能够不受编译器的控制, 对生成二进制的代码进行完全的控制.
- 目标代码短, 占位内存少, 执行速度快
- 汇编指令是机器指令的助记符, 和机器指令一一对应,每一种CPU都有自己的机器指令集/汇编指令集.
- 不易于编写, 维护, 调试.
- 不区分大小写, MOV和mov是一样的.
汇编语言种类
目前讨论比较多的汇编语言有:
8086汇编: 8086是16bit位的CPU(大学时候学的)
Win32汇编
Win64汇编
ARM汇编(前入式, Mac, iOS)
...
我们iPhone使用的是ARM汇编, 但不同设备也有差异, 因为手机架构不同.
必要常识:
- 学号汇编, 首先需要了解CPU等硬件结构
-
APP/程序执行过程
- 硬件相关最重要的是CPU, 内存.
- 在汇编中, 大部分指令都是与CPU, 内存相关的
总线
- 总线: 一根根导线的集合.
- 每一个CPU都有许多管脚, 这些管脚与总线相连, CPU通过管线与外部器件进行交互.
- 总线分为: 地址总线, 数据总线, 控制总线
举个栗子:
-
CPU从内存的3号单元读取数据
地址总线
地址总线的宽度决定了CPU的寻址能力
8086的地址总线宽度是20, 所以它的寻址能力是2^20 (1M);
- 数据总线
数据总线的宽度决定了CPU单次传递的数据量, 也就是数据的传送速度
8086的数据总宽度是16, 所以单次最大传送数据量是 2个字节
- 控制总线
控制总线的宽度决定了CPU对其他器件的控制能力, 能有多少种控制
内存
- 内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20,可以定位220个不同的内存单元(内存地址范围0x00000~0xFFFFF),所以8086的内存空间大小为1MB
- 0x00000~0x9FFFF:主存储器。可读可写
- 0xA0000~0xBFFFF:向显存中写入数据,这些数据会被显卡输出到显示器。可读可写
- 0xC0000~0xFFFFF:存储各种硬件\系统信息。只读
进制
- 八进制由8个符号组成: 0 1 2 3 4 5 6 7, 逢8进1
- 十进制由10个符号组成: 0 1 2 3 4 5 6 7 8 9, 逢10进1
- N进制就是由N个符号组成: 逢N进1
- 十进制由10个符号组成, 逢10进1, 符号可以自定义!!!
比如: 0 1 3 2 8 A B E S 7
这样做的目的是什么?
传统定义的十进制与我们自定义的十进制不同, 如果我们不将这10个符号表告诉别人, 别人就没法拿到我们具体的数据, 这种方法可用于加密!
好了, 第一篇对于初识汇编的复习和梳理就到这了