block 三种类型
全局block NSGlobalBlock
void (^block)(void) = ^{
NSLog(@"hahah");
};
NSLog(@"%@", block);
- 没有对外界变量进行捕获的时候,它是个函数的区域,直接放在全局区,方便执行调用。
堆区block NSMallocBlock
int a = 10;
void (^block)(void) = ^{
NSLog(@"Cooci - %d",a);
};
NSLog(@"%@",block);
- 访问外界变量的时候,它将进行一些处理,因为访问的变量可能在栈区,堆区,如果在全局区,去访问会比较麻烦,所以block进行了相应的copy。copy到了相应 的一些区域。所以向上面进行了一次强引用的时候。此时是堆block.
栈区block NSStackBlock
这里有个坑点,在iOS14
之前 在block没有进行copy处理的时候它是一个栈区block,而之后却放在了堆里。
NSLog(@"%@",^{
NSLog(@"Cooci - %d",a);
});
- iOS14之前 为栈区,也就是ARC下没有被持有的话,向上面写法为栈区。
- 而现在在堆区。
栈区的block写法
int a = 10;
void (^__weak block)(void) = ^{
NSLog(@"Cooci - %d",a);
};
NSLog(@"%@",block);
- 引用了外部变量,当此时对block进行了了一次弱引用它就在栈区。
block 循环引用
正常释放
当 A 对象 持有 B对象 的时候,B对象 的引用计数 会+1
当A释放的时候会给 B 信号,B接收到 release信号,引用计数 -1 等于0的时候 b的dealloc就会被调用
循环引用
当 A 持有 B ,B也持有 A ,你中有我 我中有你的情况。就会造成循环引用。
循环引用代码示意
///会发生循环引用
self.block = ^(void){
NSLog(@"%@",self.name);
};
///不会发生循环引用
[UIView animateWithDuration:0.2 animations:^{
NSLog(@"%@",self.name);
}];
- 上面的情况我们都知道,对于发生循环引用 我们该怎么解决呢?
解决打破循环引用。
1、__weak typeof(self)weakSelf = self
__weak typeof(self)weakSelf = self
self.block = ^(void){
NSLog(@"%@", weakSelf.name);
};
- 这种情况我们都知道用这个方法来打破那为什么?
- 没有打破之前 的样子是这样的
self
->block
->self
(self
持有block
,block
持有self
) ,
而打破之后 就是这样self
->block
->weakSelf
->self
(self
持有block
,block
持有weakSelf
,weakSelf
持有self
.)那这样就不会导致循环引用了么?weakSelf也持有者 self呢呀 - 因为 weakSelf 是弱引用表中的,和当前的self是同一个指针地址。__weak并不会导致self的引用计数发生变化。
那这样就没问题了吗看下面
__weak typeof(self) weakSelf = self;
self.block = ^(void){
dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(2 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
NSLog(@"%@",weakSelf.name);
});
};
self.block();
此时我们发现 当前页面确实走了 dealloc。但是 当 延时任务回来的时候 ,却发现 打印的为nil. 虽说一个打印任务并无商大雅。但是当里面执行的任务为很重要的时候。我还没走完你就 dealloc,显然不符合我的要求。所以我们正确的用法为 weak - strong -Dance
强弱共舞,保证self的声明周期。
__weak typeof(self) weakSelf = self;
self.block = ^(void){
// 时间 - 精力
// self 的生命周期
__strong __typeof(weakSelf)strongSelf = weakSelf; // 可以释放 when
dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(2 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
NSLog(@"%@",strongSelf.name);
});
};
self.block();
- 在这里我们可以看到 __weak 打破了循环引用。
- __strong 延长了 self的生命周期。
2、通过传参的形式将self 传进block任务中。
self.block = ^(ViewController *vc){
dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(2 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
NSLog(@"%@",vc.name);
});
};
self.block(self);
- 这样的话就打破了block对vc的持有,此时vc是已传参的形式,它在block里就相当于一个临时变量被压栈进来。
3、主动打破循环
__block ViewController *vc = self;
self.block = ^(void){
dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(2 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
NSLog(@"%@",vc.name);
vc = nil;
});
};
self.block();
- __block 为了可以在block里可以进行修改。
- vc = nil 是为了打破循环引用。
- 注意:此时不调用循环引用依旧会存在。
4、NSProxy 也可以,这里就不讲了,自行搜索。
底层探究
定义一个简单的.c文件 如下 ;
int main(){
void(^block)(void) = ^{
printf("LG_Cooci");
};
//block();
return 0;
}
- clang 查看 底层被编译成了什么样
xcrun -sdk iphonesimulator clang -arch x86_64 -rewrite-objc block.c
int main(){
///简化去掉返回值类型
void(*block)(void) =
&__main_block_impl_0 ( __main_block_func_0 , &__main_block_desc_0_DATA ) ;
return 0;
}
- 清晰的看到一个函数
__main_block_impl_0
和两个参数 参数1:__main_block_func_0
参数2:__main_block_desc_0_DATA
查看 __main_block_impl_0
这个函数
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
可以看到
__main_block_impl_0
这个函数它是一个结构体,也就是说block是一个__main_block_impl_0
类型的对象。-
里面有两个 结构体成员 一个为
__block_impl
一个为__main_block_desc_0
类型
__block_impl
结构类型struct __block_impl { void *isa; int Flags; int Reserved; void *FuncPtr; };
__main_block_desc_0
结构类型static void __main_block_func_0(struct __main_block_impl_0 *__cself) { printf("LG_Cooci"); } static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
-
在看一下它(
__main_block_impl_0
)的构造函数。- 给第一个结构体
__block_impl
类型的 成员impl
赋值。
impl
的 isa成员赋值 为 栈block 类型;
impl
的Flages
设置了个标记;
impl
的FuncPtr
成员 赋值为外界 传进来的__main_block_func_0
函数。 - 给第二个成员
Desc
赋值外界传进来的__main_block_desc_0_DATA
的地址。
- 给第一个结构体
-
画图表示一下这个结构
总结: block的本质 是一个结构体 也可以说是一个对象,它内部有两个属性,一个来存放 块任务的,方法 及设置当前块任务类型的isa。另一个属性来计算当前自己结构体所占空间大小。
下面 我们看一下block是如何发起调用的。
依旧是这段代码,打开 下方的 block()调用。
int main(){
void(^block)(void) = ^{
printf("LG_Cooci");
};
block();
return 0;
}
clang 编译期源码
void(*block)(void) =
&__main_block_impl_0 ( __main_block_func_0 , &__main_block_desc_0_DATA ) ;
((__block_impl *)block)->FuncPtr)((__block_impl *)block);
看到这里 我们就明白了,此时发起调用,它是 将 block指针强转为__block_impl
类型。并获取之前存入的 FuncPtr 发起函数调用,并将 block指针作为参数传入。
block如何捕获外界变量的
int main(){
int a =10;
void(^block)(void) = ^{
printf("LG_Cooci%d",a);
};
block();
return 0;
}
clang
int main(){
int a =10;
void(*block)(void) = &__main_block_impl_0 (
__main_block_func_0,
&__main_block_desc_0_DATA,
a
) ;
((__block_impl *)block)->FuncPtr)((__block_impl *)block);
return 0;
}
- 此时我们看到 当block内部引用到了外部变量的时候。
__main_block_impl_0 构造函数
就会动态的向后添加一个 参数。
再次看下__main_block_impl_0
结构体变化
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
int a;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
- 可以看到
__main_block_impl_0结构体
中多了一个int 类型的 a. 通过构造函数 将a赋值。
再次 看 __block_impl
的 FuncPtr
赋值 也就是外界传进来的 __main_block_func_0
函数实现
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
int a = __cself->a; // bound by copy
printf("LG_Cooci%d",a);
}
此时我们可以看到 当block发起调用的时候 此时 将
__main_block_func_0结构体
中的a的值 赋值给了一个临时变量 。由此就可以下结论,此时是值拷贝,外界a的变化 并不会 引起 block内部 a的变化。
为了彻底弄清楚 我们 写一个我们平常的oc 对象,在block块内部引用
请问下面输出什么?
LGPerson * person = [[LGPerson alloc]init];
person.tag = @"等风来不如追风去,总有那么一个人在风景正好的季节来到你的身边";
void(^block)(void) = ^{
NSLog(@"%@",person.tag);
};
person.tag = @"45°仰望天空,该死我那无处安放的魅力";
block();
我们 clang 去看
LGPerson * person = (((void *)objc_msgSend)((id)((LGPerson *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("LGPerson"), sel_registerName("alloc")), sel_registerName("init"));
((void (*)(id, SEL, NSString *))(void *)objc_msgSend)((id)person, sel_registerName("setTag:"), (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_6caa76_mi_0);
///block 构造函数 结构体赋值
void(*block)(void) = &__main_block_impl_0(
__main_block_func_0,
&__main_block_desc_0_DATA,
person,
570425344));
((void (*)(id, SEL, NSString *))(void *)objc_msgSend)((id)person, sel_registerName("setTag:"), (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_6caa76_mi_2);
///发起调用
((__block_impl *)block)->FuncPtr)((__block_impl *)block);
- 此时我们看到 此时
__main_block_impl_0
将person指针
捕获进去了。
再次 看此时的 __main_block_impl_0结构体
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
LGPerson *person;
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc,LGPerson *_person, int flags=0) : person(_person) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
- 可以看到结构体内部已经多了一个 对象指针。
在看一下方法
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
LHPerson *person = __cself->person; // bound by copy
NSLog((NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_6caa76_mi_1,((NSString *(*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("tag")));
}
- 当block 发起调用的时候,首先找到 impl中存入的 方法,并用此方法发起调用,并将 block的结构体对象 当参数,传入。此时可以看到 获取了 block结构体中的 person指针。
- 到现在我们明白了 此时对象类型的捕获的是对象的指针。属于指针copy。也就是浅拷贝。
值copy 此时 内存空间 两个一样的 内容。指针 不一样。也就是深拷贝。
指针 copy 此时 copy了一个指针,两个指针指向同一片内存区域。也就是浅拷贝。
我们对于 值拷贝的基础数据类型的捕获 该如何操作呢?
__block
在什么情况下我们需要用__block的修饰?
- 当block内部需要对外界的变量 修改时,如不用__block修饰,会引起编译器的歧义,导致只能读。
- 当捕获的是临时变量,如不用__block修饰,会导致内外数据不同步。
- 如捕获的是容器类型,容器内容发生更改不需要进行__block修饰。
- 如捕获的是对象,对象的某个属性发生更改,不需要进行__block修饰。
- 如捕获的是 statc修饰的(局部 /全局)变量 或 全局变量 不需要__block修饰。
__block又做了哪些事情?带着疑问向下分析
int main(){
__block int a =10;
void(^block)(void) = ^{
printf("LG_Cooci%d",a);
};
a = 20;
block();
return 0;
}
继续 clang看编译期变成了什么样
struct __Block_byref_a_0 {
void *__isa;
__Block_byref_a_0 *__forwarding;
int __flags;
int __size;
int a;
};
===============================================
__Block_byref_a_0 a = {
0,
(__Block_byref_a_0 *) &a,
0,
sizeof(__Block_byref_a_0),
10
};
void(*block)(void) = &__main_block_impl_0 (
__main_block_func_0,
&__main_block_desc_0_DATA,
(__Block_byref_a_0 *)&a,
570425344
);
(a.__forwarding->a) = 20;
((__block_impl *)block)->FuncPtr)((__block_impl *)block);
此时我们看到了
变量 a
被包装成了 一个__Block_byref_a_0
类型的结构体对象,并相对应的录入变量a
的信息, 对应上面结构体可以清楚的看到 里面存有a的地址
赋值给__forwarding
指针,a的值
,自身大小
等参数。将这个包装后的
a的结构体对象取地址
, 作为block结构体
的构造函数__main_block_impl_0
参数传入 赋值给 block结构体里边的a指针
。调用执行上一行代码 拿到
a结构体指针修改
a变量的值。所以内外同步数据。
继续查看 block结构体__main_block_impl_0
struct __main_block_impl_0 {
struct __block_impl impl;
struct __main_block_desc_0* Desc;
__Block_byref_a_0 *a; // by ref
__main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
impl.isa = &_NSConcreteStackBlock;
impl.Flags = flags;
impl.FuncPtr = fp;
Desc = desc;
}
};
查看 __main_block_func_0
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
__Block_byref_a_0 *a = __cself->a; // bound by ref
printf("LG_Cooci%d",(a->__forwarding->a));
}
- 这里清晰的看到获取到block结构体里面的包装后的
__Block_byref_a_0
类型的 a指针,并通过 a指针拿到__forwarding
也就是 指向外界变量的a地址的指针,并取出 变量a真正的值。 - 这里从不加__Block的值拷贝 变成了 指针拷贝。而这个指针是指向的同 一个结构体地址,这个结构体里面存有 变量 a的地址 和a的值,
咦?那为啥数据就同步了呢,我不用__Block修饰 我捕获一个字符串,它也是指针那为啥 当我在对block发起调用前重新修改 字符串的值,它怎么数据不同步呢?
NSString * str = [NSString stringWithFormat:@"等风来不如追风去啊"];
void (^block)(void) = ^{
NSLog(@"%@,%p",str,str);
};
str = @"总有一个人,在风景正好的季节等着你";
NSLog(@"%@,%p",str,str);
block();
- 看着上面的疑问 在次陷入深思,我们继续看下clang之后的编译期代码
///字符串指针
NSString * str = ((NSString * _Nonnull (*)(id, SEL, NSString * _Nonnull __strong, ...))(void *)objc_msgSend)((id)objc_getClass("NSString"), sel_registerName("stringWithFormat:"), (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_e485f6_mi_0);
/// block
void (*block)(void) =
__main_block_impl_0(
__main_block_func_0,
&__main_block_desc_0_DATA,
str,
570425344
);
///重新赋值 改变指针指向
str = (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_e485f6_mi_2;
/// 打印
NSLog((NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_e485f6_mi_3,str,str);
///发起调用
((__block_impl *)block)->FuncPtr)((__block_impl *)block);
看func函数
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
NSString *__strong str = __cself->str; // bound by copy
NSLog((NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_e485f6_mi_1,str,str);
}
}
- 看到这里的的确确是指针拷贝,func函数里的指针指向 和 block析构函数参数指针指向同一片地址空间。
- 那为啥 我在调用之前更改了 str变量的值里边它里边不同步?
继续带着这个疑问 我们打印一下上下str的指针指向地址。
- 虽然是捕获的是指针,在调用之前 指针的指向被改变,它指向了新的一片地址空间 。
用__block
修饰 运行
- 此时我们知道 str被封装为一个
结构体对象
- 而在调用block之前进行进行对 str修改,此时为结构体
指针copy
。 对它指向的这个结构体地址里的 str的值所占用的内存空间进行了修改。所以数据同步。
为了验证我们的想法 再次查看用block修饰后的cpp
struct __Block_byref_str_0 {
void *__isa;
__Block_byref_str_0 *__forwarding;
int __flags;
int __size;
void (*__Block_byref_id_object_copy)(void*, void*);
void (*__Block_byref_id_object_dispose)(void*);
NSString *__strong str;
===============================================
///byref结构体对象
__Block_byref_str_0 str = {
(void*)0,
(__Block_byref_str_0 *)&str,
33554432,
sizeof(__Block_byref_str_0),
__Block_byref_id_object_copy_131,
__Block_byref_id_object_dispose_131,
((NSString * _Nonnull (*)(id, SEL, NSString * _Nonnull __strong, ...))(void *)objc_msgSend)((id)objc_getClass("NSString"), sel_registerName("stringWithFormat:"), (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_1c411f_mi_0)
};
/// block
&__main_block_impl_0(
__main_block_func_0,
&__main_block_desc_0_DATA,
(__Block_byref_str_0 *)&str,
570425344
);
///重新赋值
(str.__forwarding->str) = (NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_1c411f_mi_2;
///打印
NSLog((NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_1c411f_mi_3,(str.__forwarding->str),(str.__forwarding->str));
///函数调用
(__block_impl *)block)->FuncPtr)((__block_impl *)block);
- 咦这里好像和基本数据类型 int a的包装还不太一样多了两个函数 __Block_byref_id_object_copy 和__Block_byref_id_object_dispose
- 我们重新赋值是改变的 包装后的结构体中的 str指针。
在看一下 func
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
__Block_byref_str_0 *str = __cself->str; // bound by ref
NSLog((NSString *)&__NSConstantStringImpl__var_folders_hp_8p1s5vl9501d23q4rjltk8j80000gn_T_main_1c411f_mi_1,(str->__forwarding->str),(str->__forwarding->str));
}
- 从这里我们就能看出 此时是byref结构体指针copy 通过指针获取 forwarding 地址在取得 str指针指向。
总结
- 捕获的外界变量 底层会包装成一个 __Block_byref_a_0类型的结构体。
- 结构体用来保存 原始的变量的指针 和值。
- 将包装的成的结构体对象地址 传递 给block ,然后block内部就可以对外界变量进行操作。
- 但是其内部是到底是怎么操作的为什么 string对象类型 要比 int基本数据类型 byref会多出两个方法?带着这些疑问向下看。
block真正的类型
打开汇编,并在下面区域打上断点
运行
我们看到到了callq
了 几个很重要的函数 一个
- objc_retainBlock
- objc_storeStrong
- _Block_object_dispose
分别符号断点下这个 看他来自哪个"
星球"
断点 objc_retainBlock
- 看到重要线索 它来自
libobjc
, 并其实真正调用的是_Block_copy
; - 那还等什么去源码看看。
objc4源码全局搜索 objc_retainBlock
id objc_retainBlock(id x) {
return (id)_Block_copy(x);
}
- 嗯没毛病 的确调用的 是 _Block_copy;
全局搜索 _Block_copy
发现Objc并未发现什么
那接着下符号断点吧它肯定不来自这个库了。
- 原来它来自 libsystem_blocks.dylib。
官网找到开源库全局搜索 _Block_copy
// Copy, or bump refcount, of a block. If really copying, call the copy helper if present.
void *_Block_copy(const void *arg) {
// block都是`Block_layout`类型
struct Block_layout *aBlock;
// 没有内容,直接返回空
if (!arg) return NULL;
// The following would be better done as a switch statement
// 将内容转变为`Block_layout`结构体格式
aBlock = (struct Block_layout *)arg;
// 检查是否需要释放
if (aBlock->flags & BLOCK_NEEDS_FREE) {
latching_incr_int(&aBlock->flags);
return aBlock;
}
// 如果是全局Block,直接返回
else if (aBlock->flags & BLOCK_IS_GLOBAL) {
return aBlock;
}
//
else {
// Its a stack block. Make a copy.
// 进入的是栈区block,拷贝一份
// 开辟一个大小空间的result对象
struct Block_layout *result =
(struct Block_layout *)malloc(aBlock->descriptor->size);
// 开辟失败,就返回
if (!result) return NULL;
// 内存拷贝:将aBlock内容拷贝到result中
memmove(result, aBlock, aBlock->descriptor->size); // bitcopy first
#if __has_feature(ptrauth_calls)
// Resign the invoke pointer as it uses address authentication.
//result的invoke指向aBlock的invoke。
result->invoke = aBlock->invoke;
#endif
// reset refcount
// BLOCK_REFCOUNT_MASK|BLOCK_DEALLOCATING :前16位都为1
// ~(BLOCK_REFCOUNT_MASK|BLOCK_DEALLOCATING):前16位都为0
// 与操作,结果为前16位都为0 引用计数为0
result->flags &= ~(BLOCK_REFCOUNT_MASK|BLOCK_DEALLOCATING); // XXX not needed
// 设置为需要释放,引用计数为1
result->flags |= BLOCK_NEEDS_FREE | 2; // logical refcount 1
// 生成desc,并记录了result和aBlock
_Block_call_copy_helper(result, aBlock); //
// Set isa last so memory analysis tools see a fully-initialized object.
// 设置isa为堆区Block
result->isa = _NSConcreteMallocBlock;
return result;
}
}
- 这里我们看到了 block真正的类型 原来它是
Block_layout
类型的结构体 - 仔细看 上面源代码的几个
if else
判断
1、如果需要释放的(堆是由程序员管理的) 也就是 堆block的,增加引用计数 返回
2、如果是全局的,直接返回
3、如果是栈block.:从栈中 copy到 堆中; 过程:malloc开辟空间
->memmove内存拷贝
->invoke 指针拷贝
->flag引用计数 设置为1
->生成desc
->设置isa为堆block
->返回堆block.
查看 Block_layout
struct Block_layout {
void *isa;
volatile int32_t flags; // contains ref count
int32_t reserved;
BlockInvokeFunction invoke;
struct Block_descriptor_1 *descriptor; //
// imported variables
};
- isa : 从静态分析 到 动态库我们都知道了,它就是标记为是什么类型的block。
- flags: 标识码(每一位都有特殊含义)
- reserved : 保留字段
- invoke : block执行函数(存储执行代码块)
- descriptor: Block详细信息
查看 Flags:标识码
// Values for Block_layout->flags to describe block objects
enum {
BLOCK_DEALLOCATING = (0x0001), // runtime
BLOCK_REFCOUNT_MASK = (0xfffe), // runtime
BLOCK_NEEDS_FREE = (1 << 24), // runtime
BLOCK_HAS_COPY_DISPOSE = (1 << 25), // compiler
BLOCK_HAS_CTOR = (1 << 26), // compiler: helpers have C++ code
BLOCK_IS_GC = (1 << 27), // runtime
BLOCK_IS_GLOBAL = (1 << 28), // compiler
BLOCK_USE_STRET = (1 << 29), // compiler: undefined if !BLOCK_HAS_SIGNATURE
BLOCK_HAS_SIGNATURE = (1 << 30), // compiler
BLOCK_HAS_EXTENDED_LAYOUT=(1 << 31) // compiler
};
- flags的赋值。按bit位表示一些block的附加信息,类似 isa中的位域,其中flags的种类有上面几种
查看 Block_descriptor_1
struct Block_descriptor_1 {
uintptr_t reserved;
uintptr_t size;
};
// 可选
#define BLOCK_DESCRIPTOR_2 1
struct Block_descriptor_2 {
// requires BLOCK_HAS_COPY_DISPOSE
BlockCopyFunction copy;
BlockDisposeFunction dispose;
};
#define BLOCK_DESCRIPTOR_3 1
struct Block_descriptor_3 {
// requires BLOCK_HAS_SIGNATURE
const char *signature;
const char *layout; // contents depend on BLOCK_HAS_EXTENDED_LAYOUT
};
- 这里我们看到了 这个 类型拥3个结构体样式。
- 可选类型 descriptor 2 为BLOCK_HAS_COPY_DISPOSE
- 可选类型 descriptor 3 为BLOCK_HAS_SIGNATURE
总结
- block真正的底层结构为block_layout, 它里面包含 isa ,isa为最终确定的类型。还有flag , 类似 isa中的位域 。它里面记录着当前block的状态,如是否需要释放,是否是global ,是否需要签名进行消息发送等。运行时会调用block_copy,通过编译期的flag判断当前block的类型,如果是 需要释放的 操作引用计数并返回,如是全局block不做任何操作返回,如果是栈区的block 需要将 栈区的block Copy 到堆上,(申请内存空间 ,将栈区的block拷贝的堆区 ,将 block的执行函数 invoke拷贝,重新设置 flages 类型,生成对应的 desc,设置 isa类型为堆block) 此时block为最真实的状态。
查看 _Block_call_copy_helper
static void _Block_call_copy_helper(void *result, struct Block_layout *aBlock)
{
struct Block_descriptor_2 *desc = _Block_descriptor_2(aBlock);
if (!desc) return;
(*desc->copy)(result, aBlock); // do fixup
}
- 这里可以看到 如果拥有拓展descriptor2那么会发起一个函数调用
查看descriptor访问操作
#if 0
static struct Block_descriptor_1 * _Block_descriptor_1(struct Block_layout *aBlock)
{
return aBlock->descriptor;
}
#endif
static struct Block_descriptor_2 * _Block_descriptor_2(struct Block_layout *aBlock)
{
if (! (aBlock->flags & BLOCK_HAS_COPY_DISPOSE)) return NULL;
uint8_t *desc = (uint8_t *)aBlock->descriptor;
desc += sizeof(struct Block_descriptor_1);
return (struct Block_descriptor_2 *)desc;
}
static struct Block_descriptor_3 * _Block_descriptor_3(struct Block_layout *aBlock)
{
if (! (aBlock->flags & BLOCK_HAS_SIGNATURE)) return NULL;
uint8_t *desc = (uint8_t *)aBlock->descriptor;
desc += sizeof(struct Block_descriptor_1);
if (aBlock->flags & BLOCK_HAS_COPY_DISPOSE) {
desc += sizeof(struct Block_descriptor_2);
}
return (struct Block_descriptor_3 *)desc;
}
- 这里可以清晰的看到,默认获取 block_layout 里 descriptor信息
- 根据 block_layout里的flags& BLOCK_HAS_COPY_DISPOSE 如果为真 证明 有descriptor_2附加信息。 拿到 descripor1的指针 平移自身大小 得到 descriptor_2。
- 根据 block_layout里的flags& BLOCK_HAS_SIGNATURE 如果为真 证明 有descriptor_3附加结构体信息。首先拿到 拿到 descripor1的指针 平移其自身大小 ,并查看是否有descriptor_2附加结构体,如果有,那么在平移加上 decriptor2大小 ,最终得到 descriptor_3
看到这里我们应该更能体会到 descriptor 属性及上面的附加可选什么意思 下面画个图
以上为我们开了上帝视角 下面我们实际操作 亲眼所看到 从栈block 拷贝到堆的过程
上面我们已经通过阅读源码知道了 当底层调用完Block_copy 其真实的block类型就会确定所以我们在调用之前打断点读取
- 可以看到此时为 NSStackBlock
按住 ctrl + 鼠标点击 向下箭头 ,跳进 objc_retainBlock 方法继续打印
跳进了 objc_retainBlock
- 此时可以看到 依旧为NSStackBlock 地址指针并没有变化
打入objc_retainBlock的全局断点 并继续读取
- 可以看到依旧没有变化
按住 ctrl + 鼠标点击 向下箭头 继续向下走
- 此时可以看到清晰的它调用 libobjc库的 objc_retainBlock方法
- 此时 依旧没有变化
继续跟进跳转
- 发现太长了 那么这里我们只需要断到其 返回值
- 此时此刻 它发生了变化。变成了 NSMallocBlock
- 这也就很清晰的看到了block是什么时候从栈block变为堆的。
我们分析了block是如何确定最终类型的,那还是不了解block是如何捕获外界变量的,为什么__block修饰后 数据会同步呢? 下面我继续分析 底层
先看图
- 首先经过这两种类型的__block我们发现 不同的地方就是修饰指针类型的对象在byref包装结构体中会多出两个函数。
- 共同地方是经过__block修饰后在block_impl中的desc结构体会多出两个函数。
看到这里我们也许就更加明白了,还记的blockLayout结构体中desc吗?它的desc有可选的拓展结构体,是根据 blockLayout里的flags&上 枚举来确定是否拥有,在这里用__block修饰之后,它多出的这两个函数正好和descriptor_2一一对应。 - 他们底层调用的同属 _Block_object_assign 和 _Block_object_dispose函数
源码搜索 _Block_object_assign
void _Block_object_assign(void *destArg, const void *object, const int flags) {
const void **dest = (const void **)destArg;
switch (os_assumes(flags & BLOCK_ALL_COPY_DISPOSE_FLAGS)) {
case BLOCK_FIELD_IS_OBJECT:
/*******
id object = ...;
[^{ object; } copy];
********/
// objc 指针地址 weakSelf (self)
// arc
_Block_retain_object(object);
// 持有
*dest = object;
break;
case BLOCK_FIELD_IS_BLOCK:
/*******
void (^object)(void) = ...;
[^{ object; } copy];
********/
// block 被一个 block 捕获
*dest = _Block_copy(object);
break;
case BLOCK_FIELD_IS_BYREF | BLOCK_FIELD_IS_WEAK:
case BLOCK_FIELD_IS_BYREF:
/*******
// copy the onstack __block container to the heap
// Note this __weak is old GC-weak/MRC-unretained.
// ARC-style __weak is handled by the copy helper directly.
__block ... x;
__weak __block ... x;
[^{ x; } copy];
********/
*dest = _Block_byref_copy(object);
break;
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT:
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK:
/*******
// copy the actual field held in the __block container
// Note this is MRC unretained __block only.
// ARC retained __block is handled by the copy helper directly.
__block id object;
__block void (^object)(void);
[^{ object; } copy];
********/
*dest = object;
break;
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT | BLOCK_FIELD_IS_WEAK:
case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK | BLOCK_FIELD_IS_WEAK:
/*******
// copy the actual field held in the __block container
// Note this __weak is old GC-weak/MRC-unretained.
// ARC-style __weak is handled by the copy helper directly.
__weak __block id object;
__weak __block void (^object)(void);
[^{ object; } copy];
********/
*dest = object;
break;
default:
break;
}
}
- 如果是普通对象,交给系统arc处理,并拷贝对象指针,引用计数+1 ,外界变量不能释放。
- 如果是block类型的变量,又会回到_Block_copy操作,将block从栈 拷贝到堆区。
- 如果是__block修饰的变量,调用_Block_byref_copy函数,进行内存拷贝及处理。
查看 枚举 值
// Runtime support functions used by compiler when generating copy/dispose helpers
// Values for _Block_object_assign() and _Block_object_dispose() parameters
enum {
// see function implementation for a more complete description of these fields and combinations
//普通对象,即没有其他的引用类型
BLOCK_FIELD_IS_OBJECT = 3, // id, NSObject, __attribute__((NSObject)), block, ...
//block类型作为变量
BLOCK_FIELD_IS_BLOCK = 7, // a block variable
//经过__block修饰的变量
BLOCK_FIELD_IS_BYREF = 8, // the on stack structure holding the __block variable
//weak 弱引用变量
BLOCK_FIELD_IS_WEAK = 16, // declared __weak, only used in byref copy helpers
//返回的调用对象 - 处理block_byref内部对象内存会加的一个额外标记,配合flags一起使用
BLOCK_BYREF_CALLER = 128, // called from __block (byref) copy/dispose support routines.
};
搜索 _Block_byref_copy
static struct Block_byref *_Block_byref_copy(const void *arg) {
//强转为Block_byref结构体类型,保存一份
struct Block_byref *src = (struct Block_byref *)arg;
if ((src->forwarding->flags & BLOCK_REFCOUNT_MASK) == 0) {
// src points to stack 申请内存
struct Block_byref *copy = (struct Block_byref *)malloc(src->size);
copy->isa = NULL;
// byref value 4 is logical refcount of 2: one for caller, one for stack
copy->flags = src->flags | BLOCK_BYREF_NEEDS_FREE | 4;
//block内部持有的Block_byref 和 外界的Block_byref 所持有的对象是同一个,这也是为什么__block修饰的变量具有修改能力
//copy 和 scr 的地址指针达到了完美的同一份拷贝,目前只有持有能力
copy->forwarding = copy; // patch heap copy to point to itself
src->forwarding = copy; // patch stack to point to heap copy
copy->size = src->size;
//如果有copy能力
if (src->flags & BLOCK_BYREF_HAS_COPY_DISPOSE) {
// Trust copy helper to copy everything of interest
// If more than one field shows up in a byref block this is wrong XXX
//Block_byref_2是结构体,__block修饰的可能是对象,对象通过byref_keep保存,在合适的时机进行调用
struct Block_byref_2 *src2 = (struct Block_byref_2 *)(src+1);
struct Block_byref_2 *copy2 = (struct Block_byref_2 *)(copy+1);
copy2->byref_keep = src2->byref_keep;
copy2->byref_destroy = src2->byref_destroy;
if (src->flags & BLOCK_BYREF_LAYOUT_EXTENDED) {
struct Block_byref_3 *src3 = (struct Block_byref_3 *)(src2+1);
struct Block_byref_3 *copy3 = (struct Block_byref_3*)(copy2+1);
copy3->layout = src3->layout;
}
//等价于 __Block_byref_id_object_copy
(*src2->byref_keep)(copy, src);
}
else {
// Bitwise copy.
// This copy includes Block_byref_3, if any.
memmove(copy+1, src+1, src->size - sizeof(*src));
}
}
// already copied to heap
else if ((src->forwarding->flags & BLOCK_BYREF_NEEDS_FREE) == BLOCK_BYREF_NEEDS_FREE) {
latching_incr_int(&src->forwarding->flags);
}
return src->forwarding;
}
- 可以看到被__block包装的变量,真实的类型为Block_byref结构体。
- 将栈上的Block_byref 结构体拷贝到堆上,根据大小申请内存空间--> 设置isa为 Null ->设置flags信息
-> 设置堆上Block_byref结构体的forwarding指针指向 为 自己->更改栈上Block_byref结构体的forwarding 指针指向为堆上的Block_byref ->设置堆byref的size大小 为 栈上的byref的size大小。 - 判断如果有copy dispose,(这里我们在上面说过,__block修饰的指针类型,比基本数据类型在包装的结构体中会多出来两个函数,此时和这里是一一对应的),通过类似上面获取desc2 和desc3的方式,这里是偏移一个Block_byref 大小 拿到 src2也就是包含copy和dispose成员变量的Block_byref_2结构体,来获取 copy和dispose 函数并将其拷贝到堆中。 判断如果有 layout成员变量,与获取src2一样的效果,这里是偏移一个Block_byref_2的大小来获取src3 并将layout变量拷贝到堆上,也就是堆上Block_byref_3 的变量layout 指向栈中layout。通过调用 byref_keep来实现响应,它就对应外部的__Block_byref_id_object_copy
我们看一下 Block_byref 结构体
struct Block_byref {
void *isa;
struct Block_byref *forwarding;
volatile int32_t flags; // contains ref count
uint32_t size;
};
struct Block_byref_2 {
// requires BLOCK_BYREF_HAS_COPY_DISPOSE
BlockByrefKeepFunction byref_keep; // 结构体 __block 对象
BlockByrefDestroyFunction byref_destroy;
};
struct Block_byref_3 {
// requires BLOCK_BYREF_LAYOUT_EXTENDED
const char *layout;
};
在看一下 byref中的flags的枚举
// Values for Block_byref->flags to describe __block variables
enum {
// Byref refcount must use the same bits as Block_layout's refcount.
// BLOCK_DEALLOCATING = (0x0001), // runtime
// BLOCK_REFCOUNT_MASK = (0xfffe), // runtime
BLOCK_BYREF_LAYOUT_MASK = (0xf << 28), // compiler
BLOCK_BYREF_LAYOUT_EXTENDED = ( 1 << 28), // compiler
BLOCK_BYREF_LAYOUT_NON_OBJECT = ( 2 << 28), // compiler
BLOCK_BYREF_LAYOUT_STRONG = ( 3 << 28), // compiler
BLOCK_BYREF_LAYOUT_WEAK = ( 4 << 28), // compiler
BLOCK_BYREF_LAYOUT_UNRETAINED = ( 5 << 28), // compiler
BLOCK_BYREF_IS_GC = ( 1 << 27), // runtime
BLOCK_BYREF_HAS_COPY_DISPOSE = ( 1 << 25), // compiler
BLOCK_BYREF_NEEDS_FREE = ( 1 << 24), // runtime
};
- 此时可以看出 和Block_copy中的处理方式非常的相似
在_Block_byref_copy中我们看到src2->byref_keep,其实就是调用外部的__Block_byref_id_object_copy_131,为什么?
这里我们 看 Block_byref_2 中两个函数 ,clang编译器中的两个函数
struct Block_byref_2 {
// requires BLOCK_BYREF_HAS_COPY_DISPOSE
BlockByrefKeepFunction byref_keep; // 结构体 __block 对象
BlockByrefDestroyFunction byref_destroy;
};
- __Block_byref_id_object_copy_131入参里面,有一个内存平移40,
原因
- 因为 内存偏移 40才能取到 NSstring*__strong str
而131 = 128 +3,其中128表示BLOCK_BYREF_CALLER --> 代表__block变量有copy/dispose的内存管理辅助函数
我们这里示例的对象类型为NSString,就表示上述枚举中这个 BLOCK_FIELD_IS_OBJECT
,也就是继承NSObjcet类型的 id类型的 为3,然后和copy函数拼接起来就是 __Block_byref_id_object_copy_131
所以在_Block_byref_copy 中以下标红出就相当于 __Block_byref_id_object_copy_131的调用
而这里的调用又会触发 _Block_object_assign
总结
详细总结:
Block真正的底层是Block_layout 对象,clang编译器 会根据捕获类型,来动态的改变,及生成对应的数据结构。如用__block修饰后的对象,clang编译器会将其封装为一个byref的结构体对象,此结构体对象在底层真正的类型为 Block_byref 结构体。
在运行时 会调用Block_copy 函数 通过 block_layout对象中的flags标记 判断当前block的类型及状态。如果是需要释放的 那么 只操作引用计数并返回,如果是全局block那么直接返回,如果是栈区的block, 开辟内存空间 ,设置属性为堆区的标识及一些设置。其中最具代表性的属性为 desc ,在默认情况下block的描述desc只有一个,当被__block修饰之后 ,clang编译器会在desc结构体中多出两个函数copy/dispose 底层会根据 block的flags 标识 来判断是否拥有 desc2 或者 desc3 的block的拓展信息,如判断拥有 copy/dispose 函数,那么会执行copy函数此时会调用Block_object_assign函数 此函数中同样的会判断当前捕获的是什么类型,进行不同的处理, 此时是__block修饰的变量也就byref结构体 将会掉起 _Block_byref_copy 函数,此函数正是对byref结构体 从栈中copy到堆中的操作, 类似block的copy。首先开辟内存,设置 属性为堆区的标识及一些设置,这里重要的操作为,将堆区的forwarding指针 指向 堆区的Block_byref自己.将栈区的forwarding指针指向更改为堆区的Block_byref结构体。并设置 栈区的大小。同样根据栈区的byref标识flags判断是否支持 copy/和dispose函数,如果支持,通过指针平移获取栈区堆区的 Block_byref2 拓展结构体, 从栈区的这两个函数指针赋值 堆区的 Block_byref2 中。再此判断中还判断了是否支持layout拓展,如支持 同样通过指针平移获取栈区堆区的 Block_byref3拓展结构体,从栈区的这个函数指针赋值 堆区的 Block_byref3 中.
如支持copy/dispose 函数 那么将再次发起 Block_object_assign函数调用,此时进行的是通过Block_byref结构体偏移获取被修饰的指针变量进行 指针copy 也就是引用计数+1
非太详细:
也就是 __block修饰的基本数据类型会进行 二次copy 一个是block的copy 一个是byref结构体的copy 都是从 栈中 copy到堆中。
如果修饰的是指针类型,那么会进行三次 copy,前两次和上面一样,最后一次 会对修饰的原始指针,进行 指针copy引用计数+1.