iOS runtime 六: 方法缓存Cache_t

数据类型

在过去的版本,cache_t是这样的

struct cache_t {
    struct bucket_t *_buckets;
    mask_t _mask; 
    mask_t _occupied;
public:
    struct bucket_t *buckets();

而最近的版本增加了很多类型安全性和适配性的代码和设计,看起来比较麻烦

struct cache_t {
private:
    explicit_atomic<uintptr_t> _bucketsAndMaybeMask;
    union {
        struct {
            explicit_atomic<mask_t>    _maybeMask;
#if __LP64__
            uint16_t                   _flags;
#endif
            uint16_t                   _occupied;
        };
        explicit_atomic<preopt_cache_t *> _originalPreoptCache;
    };

但是基本的代码逻辑还是没变的,所以打算新旧结合起来看.
随着版本的更迭,我发现对于学习源码的人来说,成员变量变得越来越边缘,关键在于成员函数,
旧版本的数据结构非常直白,而较新的版本都是通过函数来操作成员变量,比如objc_class里的bits,methods,safe_ro等等,
从函数能够更清晰的看出这个数据结构的行为.

typedef uint32_t mask_t;

其中mask_t是4字节,uintptr_t相当于long或者可以认为等于指针的大小,是8字节.
所以,旧版本是8+4+4=16字节;
新版是explicit_atomic<uintptr_t>(8字节) + union(8字节) = 16字节;
新旧是一样的大小,

//较新的版本
struct bucket_t *cache_t::buckets() const
{
    uintptr_t addr = _bucketsAndMaybeMask.load(memory_order_relaxed);
    return (bucket_t *)(addr & bucketsMask);
}

void cache_t::insert(SEL sel, IMP imp, id receiver)
{
    mask_t newOccupied = occupied() + 1;
    unsigned oldCapacity = capacity(), capacity = oldCapacity;
    if (slowpath(isConstantEmptyCache())) {
        // Cache is read-only. Replace it.
        if (!capacity) capacity = INIT_CACHE_SIZE;
        reallocate(oldCapacity, capacity, /* freeOld */false);
    }
    else if (fastpath(newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity))) {
        // Cache is less than 3/4 or 7/8 full. Use it as-is.
    }
    bucket_t *b = buckets();
    mask_t m = capacity - 1;
    mask_t begin = cache_hash(sel, m);
    mask_t i = begin;
    do {
        if (fastpath(b[i].sel() == 0)) {
            incrementOccupied();
            b[i].set<Atomic, Encoded>(b, sel, imp, cls());
            return;
        }
        if (b[i].sel() == sel) {
            // The entry was added to the cache by some other thread
            // before we grabbed the cacheUpdateLock.
            return;
        }
    } while (fastpath((i = cache_next(i, m)) != begin));
    bad_cache(receiver, (SEL)sel);
}

//较旧的版本
struct bucket_t *cache_t::buckets() 
{
    return _buckets; 
}

static void cache_fill_nolock(Class cls, SEL sel, IMP imp, id receiver)
{
    cache_t *cache = getCache(cls);
    cache_key_t key = getKey(sel);
    mask_t newOccupied = cache->occupied() + 1;
    mask_t capacity = cache->capacity();
    if (cache->isConstantEmptyCache()) {
        cache->reallocate(capacity, capacity ?: INIT_CACHE_SIZE);
    }
    else if (newOccupied <= capacity / 4 * 3) {
        // Cache is less than 3/4 full. Use it as-is.
    }
    else {
        // Cache is too full. Expand it.
        cache->expand();
    }
    bucket_t *bucket = cache->find(key, receiver);
    if (bucket->key() == 0) cache->incrementOccupied();
    bucket->set(key, imp);
}

再来看看函数,各贴了两个函数,一个是获取bucket,一个是插入cache.各自的实现不同,但是目的是相同的.
似乎从总体设计上来说,objc4没有大的变化,旨在通过重写设计局部数据结构和函数,来实现更强的适用性和健壮性.

struct cache_t {
    mask_t mask() const;
    mask_t occupied() const;
    Class cls() const;
    struct bucket_t *buckets() const;
    unsigned capacity() const;
    void insert(SEL sel, IMP imp, id receiver);
    bool isConstantEmptyCache() const;
    void incrementOccupied();
    void setBucketsAndMask(struct bucket_t *newBuckets, mask_t newMask);
    static bucket_t *allocateBuckets(mask_t newCapacity);
    void reallocate(mask_t oldCapacity, mask_t newCapacity, bool freeOld);
    void collect_free(bucket_t *oldBuckets, mask_t oldCapacity);
    static bucket_t *emptyBucketsForCapacity(mask_t capacity, bool allocate = true);

cache_t大概有这些关键函数.
既然是缓存,那就有预设的空间,capacity()表示当前的空间,这里指的是可以存几个bucket.
occupied()表示已经占用的空间,和capacity()同理.
buckets()返回的是一个struct bucket_t *,这样它就可以被作为一个bucket_t的数组,通过下标访问.
insert()是添加bucket的函数.
isConstantEmptyCache()表示当前缓存是否为空,也就是occupied为0的时候.
incrementOccupied()里面的实现就是_occupied++.
setBucketsAndMask()用于适配不同的架构,设置_bucketsAndMaybeMask.
allocateBuckets(),reallocate(),collect_free()结合,用于开启新的内存,释放旧内存.
emptyBucketsForCapacity()创建一个空的指定大小的buckets.

struct bucket_t {
    explicit_atomic<uintptr_t> _imp;
    explicit_atomic<SEL> _sel;
    inline SEL sel()
     inline IMP imp(UNUSED_WITHOUT_PTRAUTH bucket_t *base, Class cls)
    void set(bucket_t *base, SEL newSel, IMP newImp, Class cls);

bucket_t大概就是这些内容,一个SEL,一个IMP,以及存取函数.

添加缓存

接下来就是编译objc4,看看void cache_t::insert(SEL sel, IMP imp, id receiver)每一步都干了什么.

@interface MyClass : NSObject
- (int)instanceMethod:(int)a;
@end

//main.m
id myObj = [MyClass alloc];
MyClass *my = (MyClass *)[myObj init];
[my instanceMethod:9];

在init断点,到达断点的时候,在insert里添加第二个断点.然后前往这个断点.
然后可以看到sel是"init".

先看几个相关的定义

#if __arm__  ||  __x86_64__  ||  __i386__
#define CACHE_END_MARKER 1
static inline mask_t cache_fill_ratio(mask_t capacity) {
    return capacity * 3 / 4;
}
#elif __arm64__ && !__LP64__
#define CACHE_END_MARKER 0
static inline mask_t cache_fill_ratio(mask_t capacity) {
    return capacity * 3 / 4;
}
#elif __arm64__ && __LP64__
#define CACHE_END_MARKER 0
static inline mask_t cache_fill_ratio(mask_t capacity) {
    return capacity * 7 / 8;
}
#define CACHE_ALLOW_FULL_UTILIZATION 1
#else
#error unknown architecture
#endif
enum {
#if CACHE_END_MARKER || (__arm64__ && !__LP64__)
    INIT_CACHE_SIZE_LOG2 = 2,
#else
    INIT_CACHE_SIZE_LOG2 = 1,
#endif
    INIT_CACHE_SIZE      = (1 << INIT_CACHE_SIZE_LOG2),
    MAX_CACHE_SIZE_LOG2  = 16,
    MAX_CACHE_SIZE       = (1 << MAX_CACHE_SIZE_LOG2),
    FULL_UTILIZATION_CACHE_SIZE_LOG2 = 3,
    FULL_UTILIZATION_CACHE_SIZE = (1 << FULL_UTILIZATION_CACHE_SIZE_LOG2),
};

一是函数cache_fill_ratio,传进去一个容量安装一定比例返回一个容量最大值,在64位arm是7/8,其他是3/4.
二是CACHE_END_MARKER,在32位是1,在64位是0,和上面一样都是因为32位可用的寄存器或者缓存比较少.
三是CACHE_ALLOW_FULL_UTILIZATION,在64位arm是1.表示允许100%的容量占用比例.

mask_t newOccupied = occupied() + 1;
unsigned oldCapacity = capacity(), capacity = oldCapacity;
if (slowpath(isConstantEmptyCache())) {
        // Cache is read-only. Replace it.
        if (!capacity) capacity = INIT_CACHE_SIZE;
        reallocate(oldCapacity, capacity, /* freeOld */false);
    }
    else if (fastpath(newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity))) {
        // Cache is less than 3/4 or 7/8 full. Use it as-is.
        printf("进入判断1");
    }
#if CACHE_ALLOW_FULL_UTILIZATION
    else if (capacity <= FULL_UTILIZATION_CACHE_SIZE && newOccupied + CACHE_END_MARKER <= capacity) {
        // Allow 100% cache utilization for small buckets. Use it as-is.
      printf("进入判断2");  
    }
#endif
    else {
        capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
        if (capacity > MAX_CACHE_SIZE) {
            capacity = MAX_CACHE_SIZE;
        }
        reallocate(oldCapacity, capacity, true);
    }

为了方便断点,加了两行printf("进入判断1");和printf("进入判断2");不过我是x86_64环境,判断2是肯定不会进了.
这里得到newOccupied是1,表示此时oldCapacity是0,
此时mask()是空,返回0,因此capacity()是0,oldCapacity和capacity是0.
进入isConstantEmptyCache(),然后按照INIT_CACHE_SIZE来初始化容量,INIT_CACHE_SIZE是1<<2,也就是4.
然后调用reallocate重置缓存.

如果newOccupied满足条件,比如在arm64小于capacity的7/8或者CACHE_ALLOW_FULL_UTILIZATION时满足下面的条件,
在缓存空间这方面就不会做什么.
如果不满足,就会扩充空间为2倍.然后reallocate.

再走一次断点,看到sel是"instanceMethod:",这次进入了printf("进入判断1");
给MyClass多加几个实例方法再看看.

- (int)myMethod0;
- (int)myMethod1;
- (int)myMethod2;

//main.m
id myObj = [MyClass alloc];
MyClass *my = (MyClass *)[myObj init];
[my myMethod0];
[my myMethod1];
[my myMethod2];

当走到method1时,newOccupied是3,CACHE_END_MARKER在x86_64下是1,所以进入了扩充容量的逻辑.

    bucket_t *b = buckets();
    mask_t m = capacity - 1;
    mask_t begin = cache_hash(sel, m);
    mask_t i = begin;

//buckets函数
struct bucket_t *cache_t::buckets() const
{
    uintptr_t addr = _bucketsAndMaybeMask.load(memory_order_relaxed);
    return (bucket_t *)(addr & bucketsMask);
}

这里通过 buckets()函数获取一个指针b,可以看做是一个数组指针.
_bucketsAndMaybeMask.store是设值,load是取值,当类第一次调用实例方法的时候,给cache_t申请空间.
在申请空间的时候,调用emptyBucketsForCapacity,会根据容量来申请.
之后调用setBucketsAndMask来给cache_t初始化或者在其他情况下设值.
而_bucketsAndMaybeMask是一个复合含义的变量,与上bucketsMask获得bucket_t的地址.

//cache_hash
static inline mask_t cache_hash(SEL sel, mask_t mask) 
{
    uintptr_t value = (uintptr_t)sel;
#if CONFIG_USE_PREOPT_CACHES
    value ^= value >> 7;
#endif
    return (mask_t)(value & mask);
}

上面经过 buckets()得到了一个数组,它被作为哈希表来运作.
这个数组的长度是capacity
cache_hash这个函数的目的是得到一个索引.
这里的mask传进来的是capacity - 1,所以此时=7.
value是SEL的值,SEL的类型是objc_selector *,是一个指针.
CONFIG_USE_PREOPT_CACHES在arm64真机是为1.如果是1,value右移7位异或自己,相当于只取前面7位,后面全是0.
然后value再和mask按位与,最终得到一个0 ~ mask之间的索引,也就是0 ~ capacity-1.对应这个数组.

这是一个比较简单的哈希算法,mask永远是容量capacity - 1,比如mask=7,也就是0111,这时候和SEL与运算,结果是0000~0111之间,
假如有一个SEL1是1010 11111 0100 有一个SEL2是1111 0000 0100,他们和mask与运算的结果是一样的,就会导致获取的索引是一样的,这就是所谓哈希碰撞.

 do {
        if (fastpath(b[i].sel() == 0)) {
            incrementOccupied();
            b[i].set<Atomic, Encoded>(b, sel, imp, cls());
            return;
        }
        if (b[i].sel() == sel) {
            // The entry was added to the cache by some other thread
            // before we grabbed the cacheUpdateLock.
            return;
        }
    } while (fastpath((i = cache_next(i, m)) != begin));

现在得到了索引,对于数组该索引下的值,有三种情况,第一是存的就是这次需要存的SEL.
第二种是存了其他的SEL,也就是发生了哈希碰撞.
第三种是该位置还是空的.

所以下面就会进行判断.
接下来b[i].sel()获取begin的bucket,查看是否有SEL,如果没有,那就把新的bucket放在这个位置.
如果已经有了,并且就是打算存的这个SEL,那么就什么都不做.
如果该索引不可用,存的也不是目标sel,那就需要通过cache_next获取一个新的索引.

#if CACHE_END_MARKER
static inline mask_t cache_next(mask_t i, mask_t mask) {
    return (i+1) & mask;
}
#elif __arm64__
static inline mask_t cache_next(mask_t i, mask_t mask) {
    return i ? i-1 : mask;
}

cache_next有两种实现,
第一种是+1然后与运算,前面我们知道capacity是4,8,16这样每次翻倍,也就是2^n,mask是 capacity- 1,
所以此时,如果i= 4, 4发生了碰撞, (i +1) & 7 = 5,结果相当于返回i+1.也就是索引后移一位.
当i = mask的时候,比如i= 7的时候,i+1是1000,1000 & 0111 = 0,相当于回到了索引第一位.
第二种是从索引前移一位,如果i=0,就返回最后一个索引,也就是mask.

所以最终全部的索引都有机会尝试,但是如果只是这样的话,当这个表填充的越多,也就是occupied越大,效率就越低,
所以就有了在3/4或者7/8的时候进行扩充,就是为了减少do while的次数.

 bad_cache(receiver, (SEL)sel);

如果最终while循环执行完毕还没有return,就会执行bad_cache.会触发crash并输出信息.

初始化和扩容

bucket_t *cache_t::allocateBuckets(mask_t newCapacity)
{
    bucket_t *newBuckets = (bucket_t *)calloc(bytesForCapacity(newCapacity), 1);
    bucket_t *end = endMarker(newBuckets, newCapacity);
#if __arm__
    end->set<NotAtomic, Raw>(newBuckets, (SEL)(uintptr_t)1, (IMP)(newBuckets - 1), nil);
#else
    end->set<NotAtomic, Raw>(newBuckets, (SEL)(uintptr_t)1, (IMP)newBuckets, nil);
#endif
    if (PrintCaches) recordNewCache(newCapacity);
    return newBuckets;
}

这个函数是初始化bucket散列表的,也就是那个数组,根据newCapacity申请内存空间.
endMarker返回这个数组的最后一个元素.
然后把end赋值,SEL设置为1,IMP指向第一个元素.

void cache_t::reallocate(mask_t oldCapacity, mask_t newCapacity, bool freeOld)
{
    bucket_t *oldBuckets = buckets();
    bucket_t *newBuckets = allocateBuckets(newCapacity);
    setBucketsAndMask(newBuckets, newCapacity - 1);
    if (freeOld) {
        collect_free(oldBuckets, oldCapacity);
    }
}

这个函数是重设散列表,当类第一次调用方法时,或者当需要扩充时,以及copy等操作的时候回调用.

但是可以看到一个问题,那就是旧的buckets没有被赋值到新的位置.也就是没有内存平移,或者用代码进行cpoy的操作.确实如此,因为旧的缓存直接就被丢弃了

验证一下

        id myObj = [MyClass alloc];
        MyClass *my = (MyClass *)[myObj init];
        [my myMethod0];
        [my myMethod1];
        [my myMethod2];

//objc-cache.mm
void cache_t::insert(SEL sel, IMP imp, id receiver){
//...
    bucket_t *b = buckets();
    mask_t m = capacity - 1;
    mask_t begin = cache_hash(sel, m);
    mask_t i = begin;
//...

从第二行开始每一行都加断点,运行到第一个断点的时候,在void cache_t::insert(SEL sel, IMP imp, id receiver)的bucket_t *b = buckets();这一行添加断点.
之后注意每次都要先取消insert的断点,然后再前进,这样.m每个断点都对应insert的一个.因为.m执行一行,insert可能会执行多次.

(lldb) p sel
(SEL) $0 = "init"
(lldb) p occupied()
(mask_t) $1 = 0
(lldb) p capacity
(unsigned int) $2 = 4

首先是第一次进入insert,sel是init方法.这是类第一次调用方法,此时occupied是0,capacity是4.

(lldb) p sel
(SEL) $3 = "myMethod0"
(lldb) p occupied()
(mask_t) $4 = 1
(lldb) p buckets()
(bucket_t *) $5 = 0x0000000120004080
(lldb) p $5[0].sel()
(SEL) $6 = (null)
(lldb) p $5[1].sel()
(SEL) $7 = (null)
(lldb) p $5[2].sel()
(SEL) $8 = "init"

然后是第二次进入,此时sel是myMethod0方法,occupied是1,刚才的init已经缓存进来了
并且可以找到存在索引2的位置.

(lldb) p sel
(SEL) $1 = "myMethod1"
(lldb) p capacity
(unsigned int) $2 = 8
(lldb) p occupied()
(mask_t) $3 = 0

然后是第三次进入insert,
因为我是用mac运行,x86_64环境,走的是newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity)),
此时newOccupied是3,CACHE_END_MARKER是1, cache_fill_ratio(capacity)是3,所以走了扩容.
capacity增加到了8.
但是可以看到此时获取occupied是0,也就是说缓存里是空的.

(lldb) p occupied()
(mask_t) $4 = 1
(lldb) p sel
(SEL) $5 = "myMethod2"
(lldb) p capacity
(unsigned int) $6 = 8
(lldb) p buckets()
(bucket_t *) $7 = 0x000000010912b7f0
(lldb) p $7[0].sel()
(SEL) $8 = (null)
(lldb) p $7[1].sel()
(SEL) $9 = (null)
(lldb) p $7[2].sel()
(SEL) $10 = (null)
(lldb) p $7[3].sel()
(SEL) $11 = (null)
(lldb) p $7[5].sel()
(SEL) $12 = (null)
(lldb) p $7[4].sel()
(SEL) $13 = "myMethod1"
(lldb) p $7[6].sel()
(SEL) $14 = (null)
(lldb) p $7[7].sel()
(SEL) $15 = ""

然后是第四次进入,sel是myMethod2,occupied是1,然后查看了所有的8个bucket_t,确实只有一个有值,就是第三次进入时保存的myMethod1.
所以当扩容的时候,旧的缓存会被丢弃.

最后编辑于：2022.09.28 19:24:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,924评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,781评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,813评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,264评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,273评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,383评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,800评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,482评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,673评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,497评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,545评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,240评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,802评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,866评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,101评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,673评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,245评论 2赞 341

iOS runtime 六: 方法缓存Cache_t

数据类型

添加缓存

初始化和扩容

推荐阅读更多精彩内容