iOS底层探索 --- OC对象原理(上)

image

我们在日常开发中经常会用到类似于下面的一段代码来创建对象:

Person *p = [[Person alloc] init];

大家可以很明显的注意到,创建一个对象,需要经历allocinit两个方法的调用才能实现。那么今天我们就来探索其中的alloc究竟做了什么。


其实作为iOS开发者,大家很清楚,alloc是用来给对象开辟内存的。那么究竟是怎么开辟内存的呢?这是我们今天探索的重点。
首先我们要下载objc4的源码,尽量下载最新的版本的。
其次,下载下来的源码是不能编译的,这里给大家推荐一篇文章,iOS_objc4-756.2 最新源码编译调试。大家可以参考这篇文章编译自己的源码。


alloc源码探索

1、创建Person对象,如下:

image

我们在此处埋下断点,跳进alloc函数,会发现如下的函数调用栈:

  • 「第一步」进入alloc函数的源码:
+ (id)alloc {
    return _objc_rootAlloc(self);
}

  • 「第二步」在alloc源码中,我们会发下,函数进入了_objc_rootAlloc,我们跟进去查看:
// Base class implementation of +alloc. cls is not nil.
// Calls [cls allocWithZone:nil].
id
_objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

  • 「第三步」同样的操作,我们进入callAlloc方法,一探究竟。
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
    if (slowpath(checkNil && !cls)) return nil;
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

这个时候,就有点懵了,源码中出现了不同的分支。这个时候就需要我们进行断点调试了。

在断点调试之前,我们首先来搞清楚callAlloc方法里面几个关键判断的意思。
1、 hasCustomAWZ
首先我们跟进hasCustomAWZ,发现其源码实现是这样的:

bool hasCustomAWZ() const {
        return !cache.getBit(FAST_CACHE_HAS_DEFAULT_AWZ);
    }

接着我们继续跟进FAST_CACHE_HAS_DEFAULT_AWZ,此时我们发现了我们先要的(注意源码注释):

// class or superclass has default alloc/allocWithZone: implementation
// Note this is is stored in the metaclass.
#define FAST_CACHE_HAS_DEFAULT_AWZ    (1<<14)

也就是说cls->ISA()->hasCustomAWZ()是用来获取类或父类中,是否有alloc/allocWithZone:的实现。(很显然,此时我们的Person并没有)

2、 我们知道了fastpath函数的参数是什么意思,下面我们就要看fastpath是什么意思了。

我们跟进入发现:

#define fastpath(x) (__builtin_expect(bool(x), 1))
#define slowpath(x) (__builtin_expect(bool(x), 0))

fastpath&slowpath是两个objc源码中定义的
调用的都是__builtin_expect

__builtin_expect(bool exp, probability)的主要作用是进行条件分支预测。
函数主要有两个参数:
第一个参数:是一个布尔表达式
第二个参数:表明第一个参数为真值的概率,这个参数只能是10;当取值为1时,表示布尔表达式大部分情况下的值为真值;当取值为0时,表示布尔表达式大部分情况下的值是假值。
函数的返回值,就是第一个参数的表达式的值。

那也就是说fastpath(!cls->ISA()->hasCustomAWZ())的结果,其实就是!cls->ISA()->hasCustomAWZ()的结果。那么「第四步」就是进入if里面的_objc_rootAllocWithZone。(这一点根据断点调试也可以判断出来)

3、这里还有一个判断__OBJC2__
在源码中,点不进去,无法知道这个宏定义是干什么用的。但是我们可以根据下面的一段注释来判断大致意思:

image

由此可以推测__OBJC2__是用来判断是否有编译优化


  • 「第四步」_objc_rootAllocWithZone
NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
    // allocWithZone under __OBJC2__ ignores the zone parameter
    // __OBJC2__ 下的 allocWithZone 忽略 zone 参数
    return _class_createInstanceFromZone(cls, 0, nil,
                                         OBJECT_CONSTRUCT_CALL_BADALLOC);
}

  • 「第五步」_class_createInstanceFromZone

_class_createInstanceFromZonealloc整个流程的核心。

static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                              int construct_flags = OBJECT_CONSTRUCT_NONE,
                              bool cxxConstruct = true,
                              size_t *outAllocatedSize = nil)
{
    // 'Realized' --> '实现'
    ASSERT(cls->isRealized());

    // Read class's info bits all at once for performance
    // 为了提高性能,一次性读取类的信息
    bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();
    size_t size;

    // 计算需要开辟的内存大小,根据上一个函数`_objc_rootAllocWithZone`可以知道,此时‘extraBytes’==‘0’
    size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (zone) {
        obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
    } else {
        // 同样的根据`_objc_rootAllocWithZone`可以知道,`__OBJC2__`情况下,会进入这里。
        // calloc --> 申请内存,大小为`size`.
        obj = (id)calloc(1, size);
    }
    if (slowpath(!obj)) {
        if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
            return _objc_callBadAllocHandler(cls);
        }
        return nil;
    }

    if (!zone && fast) {
        // 关联 cls(类) 与 objc指针(isa指针)
        obj->initInstanceIsa(cls, hasCxxDtor);
    } else {
        // Use raw pointer isa on the assumption that they might be
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (fastpath(!hasCxxCtor)) {
        return obj;
    }

    construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
    return object_cxxConstructFromClass(obj, cls, construct_flags);
}

在整个_class_createInstanceFromZone中,最主要的是以下三个步骤:

  • size = cls->instanceSize(extraBytes);计算需要开辟的内存大小。
  • obj = (id)calloc(1, size);申请内存
  • obj->initInstanceIsa(cls, hasCxxDtor);关联isa指针

  • 「第六步」object_cxxConstructFromClass
    该函数的源码也非常容易理解,因为官方的注释给的很清楚。这里就截取关键部分,不再展示完整的源码。
    image

    可以看到object_cxxConstructFromClass的返回值,如果是self就表示构建成功
    如果是nil就表示构建失败

alloc流程图

通过上面的探索,我们总结出alloc函数的调用流程图如下:

image


Tips

上面我们探索了alloc的流程,里面有几个知识点,这里我们扩充一下:

1: 字节对齐 && 内存对齐

这就是在_class_createInstanceFromZone中的size = cls->instanceSize(extraBytes);
这里我们们进入instanceSize:

```
inline size_t instanceSize(size_t extraBytes) const {
    if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
        return cache.fastInstanceSize(extraBytes);
    }

    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    if (size < 16) size = 16;
    return size;
}
```

在没有缓存的情况下,我们会调用alignedInstanceSize(),那么我们就跟进去:

```
// Class's ivar size rounded up to a pointer-size boundary.
// 类的 ivar 大小向上舍入到指针大小边界
uint32_t alignedInstanceSize() const {
    return word_align(unalignedInstanceSize());
}
```

这里我们看一下unalignedInstanceSize()的返回值是多少,跟进去我们发现,该返回值的大小由实例变量的大小决定,依赖于成员变量(ivars)

```
// May be unaligned depending on class's ivars.
uint32_t unalignedInstanceSize() const {
    ASSERT(isRealized());
    return data()->ro()->instanceSize;
}
```

此时,我们的Person没有自定义的成员变量,但是,返回值是8;这是因为NSObject本身有一个isa。如下:

image

Classstruct *类型的:
image

同时objc_class继承自最原始的objc_object:

image

  • 字节的对齐是 --- 8字节对齐
    这一点我们进入word_align函数就能够知道:
    image

    注意WORD_MASK7,根据算法,word_align返回值,永远是8的倍数。

算法讲解:
首先我们知道此时:x = 8 && WORD_MASK = 7
那么函数中的计算公式就是:(8 + 7) & ~7 也就是 15 & ~7
15的二进制是 ---> 0000 1111
7的二进制是 ---> 0000 0111,那么~7为 ---> 1111 1000
那么15 & ~7 就是 0000 1111 & 1111 1000,结果为0000 1000 == 8

  • 内存对齐是 --- 16字节对齐
    instanceSize中,如果有缓存,会调用fastInstanceSize函数:
size_t fastInstanceSize(size_t extra) const
    {
        ASSERT(hasFastInstanceSize(extra));

        if (__builtin_constant_p(extra) && extra == 0) {
            return _flags & FAST_CACHE_ALLOC_MASK16;
        } else {
            size_t size = _flags & FAST_CACHE_ALLOC_MASK;
            // remove the FAST_CACHE_ALLOC_DELTA16 that was added
            // by setFastInstanceSize
            return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
        }
    }

大家可以看到,函数的最后,会调用align16

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

这个也不难理解,算法跟上面字节对齐的算法是一样的。但是这里保证的返回值是16的倍数

2: __builtin_expect(bool exp, probability)

这个函数我们在上面已经简单介绍过了,这里我们再来详细的介绍一下(参考文章:LLVM编译器中的内置(built-in)函数):
这个函数的主要作用是进行条件分支预测。函数主要有两个参数:第一个参数是布尔表达式、第二个参数表明第一个参数的值为真值的概率,这个参数只能取10

当取值为1时,表示布尔表达式大部分情况下的值是真值,而取值为0时,表示布尔表达式大部分情况下的值是假值

函数的返回值就是第一个参数的表达式的值。

在一条指令执行时,由于流水线的作用,CPU可以完成下一条指令的取值,这样可以提高CPU的利用率。在执行一条条分支指令时,CPU也会预取下一条执行,但是如果条件分支跳转到其他指令,那么CPU预取的下一条指令就没用了,这样就降低了流水线的效率。__builtin_expect函数可以优化程序编译后的指令序列,使指令尽可能的顺序执行,从而提高CPU预取指令的正确率。
例如:

if (__builtin_expect (x, 0))
    foo();

表示:x的值大部分情况下可能为,因此foo()函数得到执行的机会比较少。这样编译器在编译这段代码的时候,就不会将foo()函数的汇编指令紧挨着if条件跳转指令。
再比如:

if (__builtin_expect (x, 1))
    foo();

表示:x的值大部分情况下可能为,因此foo()函数得到执行的机会比较大。这样编译器在编译这段代码的时候,就会将foo()函数的汇编指令紧挨着if条件跳转指令。

为了简化函数使用,iOS系统使用两个宏fastpathslowpath来实现这种分支优化判断处理:

#define fastpath(x) (__builtin_expect(bool(x), 1))
#define slowpath(x) (__builtin_expect(bool(x), 0))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,802评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,109评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,683评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,458评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,452评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,505评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,901评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,550评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,763评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,556评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,629评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,330评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,898评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,897评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,140评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,807评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,339评论 2 342

推荐阅读更多精彩内容