Category底层结构及源码分析

Category的本质

Category编译之后的底层结构是struct category_t ,里面存储着分类的对象方法、类方法、属性、协议信息，在程序运行的时候，runtime会将Category的数据合并到类对象和元类对象中去。

首先我们写一段简单的代码，基于这段代码来进行以下的分析。

Person类
#import <Foundation/Foundation.h>

@interface Person : NSObject

@property (nonatomic, assign) double weight;

- (void)eat;

- (void)run;

@end

#import "Person.h"

@implementation Person

- (void)eat{
    NSLog(@"Person - eat");
}

- (void)run{
    NSLog(@"Person - run");
}

@end

Person的类扩展 Person+Eat
#import "Person.h"

@interface Person (Eat)<NSCopying>

@property (nonatomic, assign) int age;

- (void)eat;

- (void)eat1;

+ (void)eat;

@end

#import "Person+Eat.h"

@implementation Person (Eat)

- (void)eat{
    NSLog(@"Person(Eat) - eat");
}

- (void)eat1{
    NSLog(@"Person(Eat) - eat1");
}

+ (void)eat{
    NSLog(@"Person(Eat) + eat");
}

@end

Person的类扩展Person+Run
#import "Person.h"

@interface Person (Run)

- (void)run;

@end

#import "Person+Run.h"

@implementation Person (Run)

- (void)run{
    NSLog(@"Person(Run) - run");
}

@end

外部调用
        Person *p = [[Person alloc] init];
        [p eat];
        [p run];
        [p eat1];
打印结果
2019-07-09 17:42:58.550703+0800 category底层原理[6834:2245351] Person(Eat) - eat
2019-07-09 17:42:58.550861+0800 category底层原理[6834:2245351] Person(Run) - run
2019-07-09 17:42:58.550871+0800 category底层原理[6834:2245351] Person(Eat) - eat1
2019-07-09 17:42:58.550871+0800 category底层原理[6834:2245351] Person(Eat) + eat

面试题1.Category中能不能添成员变量？为什么？

在上述Person+Eat.h文件中添加_age成员变量，Xcode会直接报错。说明分类中是不能添加成员变量的。为什么呢？

分类中添加成员变量报错

通过runtime的源码，搜索category_t，我们可以找到分类的category_t结构体。

struct category_t {
    const char *name;
    classref_t cls;
    struct method_list_t *instanceMethods; // 对象方法
    struct method_list_t *classMethods; // 类方法
    struct protocol_list_t *protocols; // 协议
    struct property_list_t *instanceProperties; // 属性
    // Fields below this point are not always present on disk.
    struct property_list_t *_classProperties;

    method_list_t *methodsForMeta(bool isMeta) {
        if (isMeta) return classMethods;
        else return instanceMethods;
    }

    property_list_t *propertiesForMeta(bool isMeta, struct header_info *hi);
};

通过源码我们可以看到，分类结构体中存储了对象方法，类方法，协议和属性等。同时分类结构体中是不存储成员变量的。

之前在OC对象的本质中我也说过，通过runtime源码可发现类对象的底层数据结构如下：

class对象结构体

可以看出方法列表，属性列表，协议列表都是可读可写的，但是成员变量列表是只读的。这也说明一个类生成之后，编译时就已经把成员列表信息放在class_ro_t中，不允许再动态的修改。以上都证明不能在分类中添加成员变量。

虽然不能添加成员变量，但是是可以在分类中添加属性。添加的属性系统并没有自动生成成员变量，也没有实现set和get方法，只是生成了set和get方法的声明。这就是为什么在分类中扩展了属性，在外部并没有办法调用。在外部调用点语法设值和取值，本质其实就是调用属性的set和get方法，现在系统并没有实现这两个方法，所以外部就没法调用分类中扩展的属性。

基于最开头的代码，在外部调用一下代码

Person *p = [[Person alloc] init];
p.age = 20;
NSLog(@"%d",p.age);

运行报错
-[Person setAge:]: unrecognized selector sent to instance 0x100709220
-[Person age]: unrecognized selector sent to instance 0x1005639e0

首先能调用p.page=20,和p.age两句，说明系统已经生成了set和get方法的声明；运行时，又会报找不到setAge:和age方法而报错，说明系统没有实现set和get方法。直接调用_age也会报错，说明没有生成成员变量。这样得以证明以上关于分类中属性的结论。

面试题2.Category中添加的方法为什么会覆盖原来类中的方法？解释原理？

通过以上源码我们发现，分类的方法、协议、属性等都是存放在category_t结构体中。那这些信息具体怎么存放，运行时又是如何将这些信息同步到类中的？我们通过底层源码来一一揭秘。

首先我们通过命令行将Person+Eat.m文件转化成c++代码，查看其编译过程。

clang -rewrite-objc Person+Eat.m

在分类转化为c++文件中可以看出_category_t结构体中，存放着类名，对象方法列表，类方法列表，协议列表，以及属性列表。

struct _category_t {
    const char *name;
    struct _class_t *cls;
    const struct _method_list_t *instance_methods;
    const struct _method_list_t *class_methods;
    const struct _protocol_list_t *protocols;
    const struct _prop_list_t *properties;
};

接着我们找到_method_list_t结构体(对象方法列表)

static struct /*_method_list_t*/ {
    unsigned int entsize;  // sizeof(struct _objc_method)
    unsigned int method_count;
    struct _objc_method method_list[2];
} _OBJC_$_CATEGORY_INSTANCE_METHODS_Person_$_Eat __attribute__ ((used, section ("__DATA,__objc_const"))) = {
    sizeof(_objc_method),
    2,
    {{(struct objc_selector *)"eat", "v16@0:8", (void *)_I_Person_Eat_eat},
    {(struct objc_selector *)"eat1", "v16@0:8", (void *)_I_Person_Eat_eat1}}
};

_OBJC_$_CATEGORY_INSTANCE_METHODS_Person_$_Eat从名称可以看出是INSTANCE_METHODS对象方法，结构体中存储了方法占用的内存，方法数量，以及分类中实现的eat，eat1两个对象方法。

再接着我们找到_method_list_t结构体(类方法列表)

static struct /*_method_list_t*/ {
    unsigned int entsize;  // sizeof(struct _objc_method)
    unsigned int method_count;
    struct _objc_method method_list[1];
} _OBJC_$_CATEGORY_CLASS_METHODS_Person_$_Eat __attribute__ ((used, section ("__DATA,__objc_const"))) = {
    sizeof(_objc_method),
    1,
    {{(struct objc_selector *)"eat", "v16@0:8", (void *)_C_Person_Eat_eat}}
};

_OBJC_$_CATEGORY_CLASS_METHODS_Person_$_Eat从名称可以看出是CLASS_METHODS类方法，结构体中存储了方法占用的内存，方法数量，以及分类中实现的eat类方法。

再接着我们找到_protocol_list_t结构体(协议列表)

static struct /*_protocol_list_t*/ {
    long protocol_count;  // Note, this is 32/64 bit
    struct _protocol_t *super_protocols[1];
} _OBJC_CATEGORY_PROTOCOLS_$_Person_$_Eat __attribute__ ((used, section ("__DATA,__objc_const"))) = {
    1,
    &_OBJC_PROTOCOL_NSCopying
};

_OBJC_CATEGORY_PROTOCOLS_$_Person_$_Eat结构体中存储了协议的数量以及分类遵守的NSCoping协议。

_prop_list_t结构体(属性列表)

static struct /*_prop_list_t*/ {
    unsigned int entsize;  // sizeof(struct _prop_t)
    unsigned int count_of_properties;
    struct _prop_t prop_list[1];
} _OBJC_$_PROP_LIST_Person_$_Eat __attribute__ ((used, section ("__DATA,__objc_const"))) = {
    sizeof(_prop_t),
    1,
    {{"age","Ti,N"}}
};

_OBJC_$_PROP_LIST_Person_$_Eat结构体中存储了属性所占的内存，属性数量以及分类中声明的属性age。

最后我们看到了_OBJC_$_CATEGORY_Person_$_Eat结构体，我们将上面分析的结构体一一赋值，把两段代码做一下对照。

struct _category_t {
    const char *name;
    struct _class_t *cls;
    const struct _method_list_t *instance_methods;
    const struct _method_list_t *class_methods;
    const struct _protocol_list_t *protocols;
    const struct _prop_list_t *properties;
};

static struct _category_t _OBJC_$_CATEGORY_Person_$_Eat __attribute__ ((used, section ("__DATA,__objc_const"))) = 
{
    "Person",
    0, // &OBJC_CLASS_$_Person,
    (const struct _method_list_t *)&_OBJC_$_CATEGORY_INSTANCE_METHODS_Person_$_Eat,
    (const struct _method_list_t *)&_OBJC_$_CATEGORY_CLASS_METHODS_Person_$_Eat,
    (const struct _protocol_list_t *)&_OBJC_CATEGORY_PROTOCOLS_$_Person_$_Eat,
    (const struct _prop_list_t *)&_OBJC_$_PROP_LIST_Person_$_Eat,
};

接下来我们来到runtime源码，看看运行时又是如何将这些信息同步到类中的。

首先来到runtime的初始化函数，在objc-os.mm文件文件中搜索_objc_init。

runtime初始化函数

接着我们来到&map_images（images代表镜像或者模块），这个函数又会调用map_images_nolock，接着会调用_read_images，runtime加载模块的函数，我们找到其中加载category的逻辑代码。

加载所有分类数据

这段代码是用来查找项目中的分类的。通过_getObjc2CategoryList函数获取到项目中每个类的分类列表，进行遍历，获取分类中的方法，协议，属性等信息。最后调用了remethodizeClass函数，进行类和元类中的重新组织方法。我们进到函数内部查看。

remethodizeClass内部

接下来进入到attachCategories函数内部。

拼接分类数据

这段代码就是取出分类中方法，属性，协议，然后分别拼接到原有类中。拼接时有个小特点，最后加载的分类，即项目中最后编译的分类中的数据，会放在新的数据数组的最前面。具体流程截图中的注释写的很清楚。方法，属性，协议的拼接都是调用的attachLists函数，接下来我们进入到函数中。

拼接分类方法列表.png

上述源码中有两个重要的数组
array()->lists：类对象原来的方法列表，属性列表，协议列表。
addedLists：传入所有分类的方法列表，属性列表，协议列表。

attachLists函数中最重要的两个方法为memmove内存移动和memcpy内存拷贝。我们先来分别看一下这两个函数

// memmove ：内存移动。
/*  __dst : 移动内存的目的地
*   __src : 被移动的内存首地址
*   __len : 被移动的内存长度
*   将__src的内存移动__len块内存到__dst中
*/
void    *memmove(void *__dst, const void *__src, size_t __len);

// memcpy ：内存拷贝。
/*  __dst : 拷贝内存的拷贝目的地
*   __src : 被拷贝的内存首地址
*   __n : 被移动的内存长度
*   将__src的内存移动__n块内存到__dst中
*/
void    *memcpy(void *__dst, const void *__src, size_t __n);

经过mommove后，内存变化为

// array()->lists 原来方法、属性、协议列表数组
// addedCount 分类数组长度
// oldCount * sizeof(array()->lists[0]) 原来数组占据的空间
memmove(array()->lists + addedCount, array()->lists, 
                  oldCount * sizeof(array()->lists[0]));

memmove操作

经过memmove操作之后，我们发现，虽然本类的方法，属性，协议列表会分别后移，但是本类方法、属性、协议数组对应的指针依然指向原始位置。

memcpy方法之后，内存变化为

// array()->lists 原来方法、属性、协议列表数组
// addedLists 分类方法、属性、协议列表数组
// addedCount * sizeof(array()->lists[0]) 原来数组占据的空间
memcpy(array()->lists, addedLists, 
               addedCount * sizeof(array()->lists[0]));

memcpy操作

经过memcpy操作后，指向本类方法、属性、协议的指针至始至终指向开头的位置。并且经过memmove和memcpy方法之后，分类的方法，属性，协议列表被放在了类对象中原本存储的方法、属性、协议列表前面。

那么为什么要将分类方法的列表追加到本来的对象方法前面呢，这样做的目的是为了保证分类方法优先调用，我们知道当分类重写本类的方法时，会覆盖本类的方法。其实经过上面的分析我们知道本质上并不是覆盖，而是方法顺序发生了变化，系统会优先调用分类中的方法。

本类中的方法依然还是保存在内存中的，我们可以通过打印类中所有的方法名来查看。

- (void)printMethodNamesOfClass:(Class)cls
{
    unsigned int count;
    // 获得方法数组
    Method *methodList = class_copyMethodList(cls, &count);
    // 存储方法名
    NSMutableString *methodNames = [NSMutableString string];
    // 遍历所有的方法
    for (int i = 0; i < count; i++) {
        // 获得方法
        Method method = methodList[I];
        // 获得方法名
        NSString *methodName = NSStringFromSelector(method_getName(method));
        // 拼接方法名
        [methodNames appendString:methodName];
        [methodNames appendString:@", "];
    }
    // 释放
    free(methodList);
    // 打印方法名
    NSLog(@"%@ - %@", cls, methodNames);
}
- (void)viewDidLoad {
    [super viewDidLoad];    
    Preson *p = [[Preson alloc] init];
    [p eat];
    [self printMethodNamesOfClass:[Preson class]];
}

打印结果
2019-07-10 15:25:34.427523+0800 category底层原理[8734:3239719] Person(Eat) - eat
2019-07-10 15:22:47.617090+0800 category底层原理[8708:3228107] Person -  eat, eat,eat1, run, run, setWeight:, weight,

可以看出执行[p eat]时，调用的是Person+Eat分类中的方法。而打印Person类中的所有方法，可以看出Person+Eat分类中的eat，eat1方法，Person+Run分类中的run方法，Person类中的eat，run方法都存在，只是分类中的方法排在了原有类中方法的前面。

多个分类中方法调用也是有顺序的，通过上面的的分析，其结论就是最后编译的分类，最先调用其中方法。我们也可以手动控制编译的顺序，从而控制调用的方法顺序。下面来实践一下。

文章最开头的代码，在Person+Run分类中也实现eat方法。那么Person类中，Person+Eat分类中，Person+Run分类中，都实现了eat方法。由以上结论我们知道，一定会是调用分类中的eat方法，但是先调用那个分类中的方法，如何手动去控制编译顺序呢？

编译顺序和分类方法调用1

编译顺序和分类方法调用2

上面两图，在Xcode->Build Phases中可以看到项目文件的编译顺序，最后编译的分类，会调用其中的方法。编译顺序在xcode中是可以手动拖动的，从而可以自己控制编译的顺序。

总结一下Category的加载处理过程
1.通过runtime加载某各类的所有Category数据
2.把所有Category的方法、属性、协议数据，合并到一个大数组中（后面参与编译的Category数据会在数组的前面）
3.将合并后的分类数据（方法、属性、协议），插入到原来数据的前面

面试题总结

1.Category中能不能添成员变量？为什么？
答：Category中不能添加成员变量。因为objc_class结构体中ivars成员变量信息是放在只读的class_ro_t结构体中，类一旦生成，就不能动态的添加成员变量。Category本身的底层结构category_t中也只保存了方法、属性和协议等信息，并没有保存成员变量信息。综合来说是Category中不能添加成员变量。
但是分类中可以添加属性，系统不会生成对应的成员变量以及set和get方法实现，只会生成set和get方法的声明。

2.Category中添加的方法为什么会覆盖原来类中的方法？解释原理？
分类的实现原理是将category中的方法，属性，协议数据放在category_t结构体中，然后将结构体内的方法、属性，协议数据拷贝到类对象的方法列表中。
runtime首先加载某个类的所有Category数据，然后把所有Category的方法、属性、协议数据，合并到一个大数组中（后面参与编译的Category数据会在数组的前面），最后将合并后的分类数据（方法、属性、协议），插入到原来数据的前面。所以调用方法时会优先到调用Category中的方法，当父类中有同样的方法就不会调用。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

Category底层结构及源码分析

Category的本质

面试题1.Category中能不能添成员变量？为什么？

面试题2.Category中添加的方法为什么会覆盖原来类中的方法？解释原理？

推荐阅读更多精彩内容