在计算机中,使用二进制表达数字,例如,一个字节(8位)可表示的范围是0到255(在不考虑符号的情况下),即00000000到11111111。
考虑到数字有正负,我们第一时间想到,空出一位来表示符号位,例如0表示正,1表示负。则理论上我们表示的范围是-127到+127。这种表达 方式简单明了,好理解,但是有如下几个缺点:
- 当碰到数字0的时候,这个时候有两种表达方式,即-0和+0,这会造成一个数字有两个表达形式
- 当计算的时候,符号位不能参加计算,增加了计算的复杂度
- 计算的时候很据符号不同,需要转换成加法或者减法来计算,这对电路的设计不太友好,增加了设计的复杂度
所以,引入了一个全新的表达形式,补码
原码
在介绍补码之前,我们先来看看几个相关的概念,第一个就是原码
原码(true form)是一种计算机中对数字的二进制定点表示方法。原码表示法在数值前面增加了一位符号位(即最高位为符号位):正数该位为0,负数该位为1(0有两种表示:+0和-0),其余位表示数值的大小。
以一个字节为例,例如:
- +11原码表示为00001011
- -11原码表示为10001011
- +0原码表示为00000000
- -0原码表示为10000000
原码表示有简单易懂的优点,但是原码的符号位不能直接参与运算,必须和其他位分开,这就增加了硬件的开销和复杂性。
反码
反码表示法规定:正数的反码与其原码相同;负数的反码是对其原码逐位取反,但符号位除外。
上面是百度百科的定义和反码的计算方式,我们可以以一种简单的方式概括为:
一个数的反码为这个数的绝对值各位取反
- +11反码和原码表示方式相同,为00001011
- -11原码表示为10001011,按照定义,其反码为保留第一位符号位,其余位数取反,即11110100,按照我们简单的定义,即为11的原码各位取反,即00001011各位取反,也是相同的结果
- +0反码表示为00000000
- -0反码表示为11111111
反码码是数值存储的一种,多应用于系统环境设置,如linux平台的目录和文件的默认权限的设置umask,就是使用反码原理。
补码
来到这边文章的重点了,在计算机里面,定点数既不是使用原码表示,也不是使用反码表示,而是使用补码
百科解释如下
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理。此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
首先,我们阐述下补码的计算方式
- 正数的补码为其原码
- 负数的补码为其反码加1
例如
- +11的补码 = 原码 = 00001011
- -11的补码 = 反码 + 1 = 11110100 + 1 = 11110101
- +0的补码 = 原码 = 00000000
- -0的补码 = 反码 + 1 = 11111111 + 1 = 00000000 (高位溢出)
补码的特性
- 一个负整数(或原码)与其补数(或补码)相加,和为模。
“模”是指一个计量系统的计数范围。如时钟等。计算机也可以看成一个计量机器,它也有一个计量范围,即都存在一个“模”。
以-11举例
-11 原码为 10001011
-11 补码为 11110101
相加为10000000(高位溢出)=128,这个128即为8位定点数的模
- 对一个整数的补码再求补码,等于该整数自身。
这个也是补码的优势之一,原码和补码的转换,可以使用同一套规则,我们以一个负数为例
-11的原码为10001011
通过补码的规则转为之后为11110101,此为-11的补码
该补码再通过相同的规则转换为(11110101的反码加1),10001011
- 补码的正零与负零表示方法相同。
在原码里面,+0和-0的表示方式不同,运算和表达的时候需要增加一些额外的逻辑,在补码里面则没有这个烦恼,补码的+0和-0的表示方式均为00000000(以8位为例)
- 补码的计算的时候,符号位可以加入运算
这也是补码的优势之一,这样可以简化电路逻辑,我们这里面举个简单的例子
11+(-2)
11的补码为00001011
-2的补码为11111110
直接相加加过为00001001=9
总结
补码只是一种相对合理的编码方案。这个方案在负数的机器表示中解决了3个问题:
- 数的表示
- 数的运算
- 自身逻辑意义的完整性