为何要进行内存对齐?
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常, 不是所有的CPU都适配除了了内存不对齐的情况
- 经过内存对齐之后,CPU的内存访问速度大大提升,因为CPU在读取内存的时候是一块一块进行读取的,块的大小称为(memory granularity)内存读取粒度。所以当CPU读取一块就能获取到单个对象,或者单个属性的值,而不需要去访问两次内存,且还要做一些运算。(虽然增加了存储空间但是减少了执行时间)
如何进行内存对齐(对齐规则)?
`内存对齐系数-MemoryAlignMentNumber`概念:即处理器一次读取内存的字节数,
以下例子都默认`MemoryAlignMentNumber `为8。这个系数不是不变的,各个平台可以通过定义的方法来修改这个系数
规则1.:
结构体第一个成员的偏移量是0,以后每个成员相对于结构体首地址的偏移量都是该成员大小和有效对齐值(假设为n)中较小那个的整数倍; 简单来说就是min(n, 该成员大小)的整数倍。
结构体 T 的第一个属性 property1 起始位置为0,长度为该属性所需字节数。
T.property1 = (offset: 0, length: T.property1.length)
第二个属性 property2 的起始位置则需要(根据该属性的字节长度以及内存对齐系数中的 min 值)来计算。
let minNumber = fMin(MemoryAlignMentNumber, t.2.length)
T.property2 = (offset: minNumber*n, length: t.2.length)
其中n是整数,即T.2的起始位置是minNumber的整数倍
即
StructT {
let p1: Int8 (1个字节)
let p2: Int32 (4个字节)
let p3: Int8 (1个字节)
let p4: Int64 (8个字节)
}
T.p1 = (offset: 0, length: 1) -> 目前占用1字节
T.p2 = (offset: 4, length: 4) -> 目前占用8字节
T.p3 = (offset: 8, length: 1) -> 目前占用9字节
T.p4 = (offset: 16, length: 8) -> 目前占用24字节
注意这里 p2 以及 p4 的起始位置,并不是跟在 p1 和 p3 的末尾。 p2 的起始位置是 fmin(MemoryAlignMentNumber, 4)两个数的较小值的整数倍计算而来。
注意,如果将 p3 的位置和 p2 的位置交换一下,那么 StructT 的总占用字节就是 16 了!。
就是因为这个规则,所以良好的代码风格也会替程序节省内存,不过现在大部分的编译器基本都会对此进行优化,所以我们不需要特别关注位置问题。
规则2:
结构体T
占用的总的内存字节大小应当为MemoryAlignMentNumber
的整数倍。
接上一步中的例子
T 的两个属性在内存中的内存布局都知道了。但是 T 所占用的内存空间并不是 T.2 的结尾。 T 所占用内存大小为 MemoryAlignMentNumber 的整数倍。
即
StructT {
let p1: Int64 (8个字节)
let p2: Int8 (1个字节)
}
T.p1 = (offset: 0, length: 8)
T.p2 = (offset: 8, length: 1)
至此 T 的两个属性总共占用9个字节
但是 T 的内存并不是截止于T.p2的末尾,而是总共占用了 16 个字节 是 MemoryAlignMentNumber 的整数倍(2)倍
规则3:
如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍偏移量地址开始存储。
StructA {
let p1: Int8 (1个字节)
let p2: Int64 (8个字节)
}
StructB {
let p1: Int8 (1个字节)
let p2: StructA
}
其中
StructA.p1 = (offset: 0, length: 1)
StructA.p2 = (offset: 8, length: 8)
StructA总计占用了16个字节
而
StructB.p1 = (offset: 0, length: 1)
StructB.p2 = (offset: 8, length: 16)
所以即使`StructB.p1`只占用了1个字节,但是p2还是从第9个字节开始.所以 StructB总计占用了24个字节
而在iOS之中
- 对象的属性是进行的 8 字节对齐,
- 对象自己进行的是 16 字节对齐
- 因为内存是连续的,通过 16 字节对齐规避风险和容错,防止访问出错
- 同时,也提高了寻址访问效率,也就是空间换时间
又是很久没有正儿八经的写点东西了,工作还算挺忙,虽然也是瞎忙。接下来立一个flag,争取每周更新一篇技术学习的分享。