通过下面几个例子,探讨 block
是如何实现的:
例子1: 1 2 3 4 5 6 7 8 #include <stdio.h> int main() { void (^blk)(void) = ^{ printf("Hello, World!\n"); }; return 0; }
为了研究编译器是如何实现 block
的,我们需要使用 clang
。clang
提供一个命令,可以将 Objetive-C
的源码改写成 c
语言的,借此可以研究 block
具体的源码实现方式:
1 clang -rewrite-objc block.c
转化之后,生成 block.app
:
1 2 3 4 5 6 struct __block_impl { void *isa; int Flags; int Reserved; void *FuncPtr; };
从结构体的命名可以看出这是 block
的实现,block
在 clang
编译器编译之后,生成了一个 __block_impl
结构体,isa
指针表明了 block
可以是一个对象,而 FuncPtr
指针保存了 block
函数的调用地址。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { printf("Hello, World!\n"); } static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; int main() { void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
下面我们就具体看一下是如何实现的,__main_block_impl_0
就是该 block
的实现,从中我们可以看出:
__main_block_impl_0
中包含了两个成员变量和一个构造函数,成员变量分别是 __block_impl
结构体和描述信息。
__block_impl
结构体,isa
指针证明 block
是一个对象。FuncPtr
保存了 block
的调用地址。
__main_block_desc_0
结构体,其中 Block_size
存储 block
大小。
从上面代码,可以看出执行 block
就是调用一个以 block
自身作为参数的函数,这个函数对应着 block
的执行体 。
例子2: block
如何捕获局部变量
1 2 3 4 5 6 7 8 9 int main() { int i = 1024; void (^blk)(void) = ^{ printf("%d",i); }; blk(); return 0; }
通过 clang
编译之后:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; int i; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _i, int flags=0) : i(_i) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { int i = __cself->i; // bound by copy printf("%d",i); } static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; int main() { int i = 1024; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, i)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
从中可以看出这次的 block
结构体 __main_block_impl_0
多了个成员变量 i
,用来存储使用到的局部变量 i
,此时可以看到 __cself
参数的作用,类似 C++
中的 this
和 Objective-C
的 self
当在 block
中引用的变量 i
的时候,实际是在声明 block
时,被 copy
到 __main_block_impl_0
结构体中的那个成员变量 i
,并且把 __cself
指针指向成员变量 i
。
如果尝试修改局部变量,编译会报错:
错误原因告诉我们变量不可赋值,也提醒我们要使用__block类型标识符。
因为局部变量 i
是在 main
函数内部声明的,说明 i
的内存存在于 main
函数的栈空间内部,但是 block
内部的代码在 __main_block_func_0
函数内部。__main_block_func_0
函数内部无法访问 i
变量的内存空间,两个函数的栈空间不一样,__main_block_func_0
内部拿到的 i
是 block
结构体内部的 i
,main
函数中的局部变量 i
和函数 __main_block_func_0
不在同一个作用域中,调用过程中只是进行了值传递。因此无法在 __main_block_func_0
函数内部去修改 main
函数内部的变量。
当然,在上面代码中,我们可以通过指针来实现局部变量的修改。不过这是由于在调用 __main_block_func_0
时,main
函数栈还没展开完成,变量 i
还在栈中。但是在很多情况下,block
是作为参数传递以供后续回调执行的。通常在这些情况下,block
被执行时,定义时所在的函数栈已经被展开,局部变量已经不在栈中了已经被销毁了,再用指针访问就会报常见的坏内存访问 。
例子3: 静态局部变量是如何在 __block
执行体中被修改的。
1 2 3 4 5 6 7 8 9 int main(int argc, char * argv[]) { static int i = 10; void (^blk)(void) = ^{ i = 30; printf("%d", i); }; blk(); return 0; }
通过 clang
编译之后:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; int *i; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_i, int flags=0) : i(_i) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { int *i = __cself->i; // bound by copy (*i) = 30; printf("%d", (*i)); } static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; int main(int argc, char * argv[]) { static int i = 10; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &i)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
从中可以看出这次的 block
结构体 __main_block_impl_0
成员变量 i
存储的是变量的地址,上面中间代码片段与前一个片段的差别主要在于 main
函数里传递的是 i
的地址(&i
),以及 __main_block_impl_0
结构体中成员 i
变成指针类型(int *
)。 然后在执行 block
时,通过指针修改值。
block 访问局部变量,会自动捕获到 block 内部,局部变量是通过值传递的形式,用 static 修饰的局部变量是通过指针传递的形式 局部变量离开作用域,存在随时被销毁的风险,所以 block
会通过值传递的形式,自动捕获到 block
内部。 因为静态局部变量存在于数据段中,不存在栈展开后非法访存的风险。
当然,全局变量、静态全局变量都可以在 block
里面被修改,直接访问,不会捕获到 block
内部。
例子4: __block
类型变量是如何支持修改。int
类型变量加上__block
指示符,使得变量 i
可以在 block
函数体中被修改:
1 2 3 4 5 6 7 8 9 10 int main() { __block int i = 1024; void (^blk)(void) = ^{ i = 1023; printf("%d",i); }; blk(); return 0; }
通过 clang
编译之后:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 struct __Block_byref_i_0 { void *__isa; __Block_byref_i_0 *__forwarding; int __flags; int __size; int i; }; struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __Block_byref_i_0 *i; // by ref __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_i_0 *_i, int flags=0) : i(_i->__forwarding) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { __Block_byref_i_0 *i = __cself->i; // bound by ref (i->__forwarding->i) = 1023; printf("%d",(i->__forwarding->i)); } static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->i, (void*)src->i, 8/*BLOCK_FIELD_IS_BYREF*/);} static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->i, 8/*BLOCK_FIELD_IS_BYREF*/);} static struct __main_block_desc_0 { size_t reserved; size_t Block_size; void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*); void (*dispose)(struct __main_block_impl_0*); } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0}; int main() { __attribute__((__blocks__(byref))) __Block_byref_i_0 i = {(void*)0,(__Block_byref_i_0 *)&i, 0, sizeof(__Block_byref_i_0), 1024}; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_i_0 *)&i, 570425344)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
用 __block
修饰变量,编译器会将 __block
修饰的变量包装成一个对象。 首先被 __block
修饰的 i
变量声明变为名为 i
的 __Block_byref_i_0
结构体,也就是说加上 __block
修饰的话捕获到的 block
内的变量为 __Block_byref_i_0
类型的结构体。
1 2 3 4 5 6 7 struct __Block_byref_i_0 { void *__isa; __Block_byref_i_0 *__forwarding; int __flags; int __size; int i; };
__isa
:__Block_byref_i_0
中也有 isa
指针也就是说 __Block_byref_i_0
本质也一个对象。
__forwarding
:__forwarding
是 __Block_byref_i_0
结构体类型的,并且 __forwarding
存储的值为 (__Block_byref_i_0 *)&i
,即结构体自己的内存地址。
i
:用来存储使用到的局部变量 i
。
__main_block_impl_0
对应的结构体:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __Block_byref_i_0 *i; // by ref __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_i_0 *_i, int flags=0) : i(_i->__forwarding) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { __Block_byref_i_0 *i = __cself->i; // bound by ref (i->__forwarding->i) = 1023; printf("%d",(i->__forwarding->i)); }
__main_block_impl_0
的成员变量 i
变成了 __Block_byref_i_0*
指针类型。
__Block_byref_i_0
指针类型变量 i
,通过其成员变量 __forwarding
指针来操作另一个成员变量。
之后调用 block
,首先取出 __main_block_impl_0
中的 i
,通过 __Block_byref_i_0
结构体拿到 __forwarding
指针,上面提到过 __forwarding
中保存的就是 __Block_byref_i_0
结构体本身,在通过 __forwarding
拿到结构体中的 i
变量并修改其值。
到此为止,__block
为什么能修改变量的值已经很清晰了。__block
将变量包装成对象,然后在把变量封装在结构体里面,block
内部存储的变量为结构体指针,也就可以通过指针找到内存地址进而修改变量的值。