App启动与dylb加载
我们知道 dyld 的加载过程,即在 App 启动启动执行 main 函数之前,dylb 主要作了环境变量配置、共享缓存、主程序的初始化、插入动态库、链接主程序、链接动态库、弱符号绑定、执行初始化方法、寻找主程序入口等一系列处理,具体请参考我之前的博客:iOS之深入解析App启动dyld加载流程的底层原理;在 main 函数执行过程中,当 dyld 加载到开始链接主程序的时候 , 递归调用 recursiveInitialization 函数。recursiveInitialization 函数第一次执行 , 进行 libsystem 的初始化 。 其执行过程为:recursiveInitialization -> doInitialization -> doModInitFunctions -> libSystemInitialized 。libsystem 的初始化 , 它会调用起 libdispatch_init , libdispatch 的 init 会调用 _os_object_init , 这个函数里面调用了 _objc_init。_objc_init 中注册并保存了 map_images , load_images , unmap_image 函数地址,从而进入了我们类的加载过程。
_objc_init 源码解析
一、 _objc_init 底层方法
objc4-781 官方源码_objc_init 方法如下:
void _objc_init(void) {
static bool initialized
= false
;
if (initialized
) return;
initialized
= true
;
environ_init();
tls_init();
static_init();
runtime_init();
exception_init();
cache_init();
_imp_implementationWithBlock_init();
_dyld_objc_notify_register(&map_images
, load_images
, unmap_image
);
#if __OBJC2__
didCallDyldNotifyRegister
= true
;
#endif
}
源码解读:
environ_init() :读取影响运行时的环境变量,如果需要,还可以打开环境变量帮助 export OBJC_HRLP = 1;tls_init():关于线程 key 的绑定,例如线程数据的析构函数;static_init():运行C++静态构造函数,在 dyld 调用静态析构函数之前,libc 会调用_objc_init();runtime_init():runtime 运行时环境初始化,主要是 unattachedCategories、allocatedClasses 等分类初始化;exception_init():初始化 libobjc 的异常处理系统;cache_init():缓存条件初始化;_imp_implementationWithBlock_init():启动回调机制,通常这不会处理什么,因为所有的初始化都是惰性的,但是对于某些进程会迫不及待地加载 trampolines dylib;_dyld_objc_notify_register:dyld的注册仅供 objc 运行时使用,注册处理程序以便在映射、取消映射和初始化 objc 镜像文件时使用,dyld 将使用包含 objc_image_info 的镜像文件数组,回调 mapped 函数;
二、environ_init:环境变量初始化
environ_init 方法的源码如下,其中的关键代码是 for 循环:
void environ_init(void) {
if (PrintHelp
|| PrintOptions
) {
for (size_t i
= 0; i
< sizeof(Settings
)/sizeof(Settings
[0]); i
++) {
const option_t
*opt
= &Settings
[i
];
if (PrintHelp
) _objc_inform("%s: %s", opt
->env
, opt
->help
);
if (PrintOptions
&& *opt
->var
) _objc_inform("%s is set", opt
->env
);
}
}
}
将 for 循环独立出来,去除所有条件,放入工程之中,打印环境变量:
objc
[38640]: OBJC_DISABLE_TAG_OBFUSCATION is set
objc
[38640]: OBJC_DISABLE_NONPOINTER_ISA
: disable non
-pointer isa fields
objc
[38640]: OBJC_DISABLE_NONPOINTER_ISA is set
objc
[38640]: OBJC_DISABLE_INITIALIZE_FORK_SAFETY
: disable safety checks
for +initialize after fork
objc
[38640]: OBJC_DISABLE_INITIALIZE_FORK_SAFETY is set
在 main 函数中,打上如下断点:
在不设置环境变量 OBJC_DISABLE_NONPOINTER_ISA 的时候,LLDB 打印 person 的 isa 信息:
lldb
) x
/4gx person
0x1010b5680: 0x001d800100008265 0x0000000000000000
0x1010b5690: 0x0000000000000000 0x0000000000000000
(lldb
) p
/t
0x001d800100008265
(long) $
1 = 0b0000000000011101100000000000000100000000000000001000001001100101
在设置环境变量 OBJC_DISABLE_NONPOINTER_ISA 为 YES 之后(环境变量的配置在 target – Edit Scheme – Run --Arguments – Environment Variables 中配置),之后再次打印 person 的 isa 信息:
(lldb
) x
/4gx person
0x100a09f20: 0x0000000100008260 0x0000000000000000
0x100a09f30: 0x0000000000000000 0x0000000000000000
(lldb
) p
/t
0x0000000100008260
(long) $
1 = 0b0000000000000000000000000000000100000000000000001000001001100000
由上不难看出: isa 地址的二进制 $1 的末位由 1 变成了 0,通过 isa 底层结构分析,可知 isa 的最后一位就是 nonpointer 位,表示是否对 isa 指针开启指针优化(0:纯 isa 指针;1:不止是类对象地址)。isa 中包含了类信息、对象的引用计数等。关于 isa 的结构分析,请参考我之前的博客:iOS之深入解析对象isa的底层原理;配置打印load 方法的环境变量OBJC_PRINT_LOAD_METHODS,设置为YES;然后在 YDWPerson 类中重写 +load 函数:
运行程序,然后再次打印,控制台日志如下:
...
objc
[39088]: LOAD
: class
'NSApplication' scheduled
for +load
objc
[39088]: LOAD
: class
'NSBinder' scheduled
for +load
objc
[39088]: LOAD
: class
'NSColorSpaceColor' scheduled
for +load
objc
[39088]: LOAD
: class
'NSNextStepFrame' scheduled
for +load
objc
[39088]: LOAD
: category
'NSColor(NSUIKitSupport)' scheduled
for +load
objc
[39088]: LOAD
: +[NSApplication load
]
objc
[39088]: LOAD
: +[NSBinder load
]
...
objc
[39088]: LOAD
: +[YDWPerson load
]
···
从上可以看出:OBJC_PRINT_LOAD_METHODS 可以监控所有的 +load 方法,从而处理启动优化;
三、tls_init:线程 key 的绑定
主要是本地线程池的初始化以及析构,源码如下:
void tls_init(void) {
#if SUPPORT_DIRECT_THREAD_KEYS
pthread_key_init_np(TLS_DIRECT_KEY
, &_objc_pthread_destroyspecific
);
#else
_objc_pthread_key
= tls_create(&_objc_pthread_destroyspecific
);
#endif
}
四、static_init:运行系统级别的C++静态构造函数
主要是运行系统级别的C++静态构造函数,在dyld调用我们的静态构造函数之前,libc调用_objc_init方法,即系统级别的C++构造函数,先于自定义的 C++ 构造函数运行:
static void static_init() {
size_t count
;
auto inits
= getLibobjcInitializers(&_mh_dylib_header
, &count
);
for (size_t i
= 0; i
< count
; i
++) {
inits
[i
]();
}
}
五、runtime_init:运行时环境初始化
主要是运行时的初始化,主要分为两部分:分类初始化、类的表初始化:
void runtime_init(void) {
objc
::unattachedCategories
.init(32);
objc
::allocatedClasses
.init();
}
六、exception_init:初始化 libobjc 的异常处理系统
主要是初始化libobjc的异常处理系统,注册异常处理的回调,从而监控异常的处理,源码如下:
void exception_init(void) {
old_terminate
= std
::set_terminate(&_objc_terminate
);
}
当有crash(crash是指系统发生的不允许的一些指令,然后系统给的一些信号)发生时,会来到_objc_terminate方法,走到uncaught_handler扔出异常:
static void (*old_terminate
)(void) = nil
;
static void _objc_terminate(void)
{
if (PrintExceptions
) {
_objc_inform("EXCEPTIONS: terminating");
}
if (! __cxa_current_exception_type()) {
(*old_terminate
)();
}
else {
@try
{
__cxa_rethrow();
} @catch
(id e
) {
(*uncaught_handler
)((id
)e
);
(*old_terminate
)();
} @catch
(...) {
(*old_terminate
)();
}
}
}
搜索uncaught_handler,在app层会传入一个函数用于处理异常,以便于调用函数,然后回到原有的app层中,如下所示,其中fn即为传入的函数,即 uncaught_handler 等于 fn:
objc_uncaught_exception_handler
objc_setUncaughtExceptionHandler(objc_uncaught_exception_handler fn
)
{
objc_uncaught_exception_handler result
= uncaught_handler
;
uncaught_handler
= fn
;
return result
;
}
crash 的主要原因是收到了未处理的信号,主要来源于三个地方:
kernel 内核其他进行App本身 因此,相对应的 crash 也分为三种:
Mach异常:是指最底层的内核级异常。用户态的开发者可以直接通过Mach API设置thread,task,host的异常端口,来捕获Mach异常;Unix信号:又称BSD 信号,如果开发者没有捕获Mach异常,则会被host层的方法ux_exception()将异常转换为对应的UNIX信号,并通过方法threadsignal()将信号投递到出错线程。可以通过方法signal(x, SignalHandler)来捕获single。NSException 应用级异常:它是未被捕获的Objective-C异常,导致程序向自身发送了SIGABRT信号而崩溃,对于未捕获的Objective-C异常,是可以通过try catch来捕获的,或者通过NSSetUncaughtExceptionHandler()机制来捕获。 针对应用级异常,可以通过注册异常捕获的函数,即NSSetUncaughtExceptionHandler机制,实现线程保活,收集上传崩溃日志;
七、cache_init:缓存条件初始化
void cache_init() {
#if HAVE_TASK_RESTARTABLE_RANGES
mach_msg_type_number_t count
= 0;
kern_return_t kr
;
while (objc_restartableRanges
[count
].location
) {
count
++;
}
kr
= task_restartable_ranges_register(mach_task_self(),
objc_restartableRanges
, count
);
if (kr
== KERN_SUCCESS
) return;
_objc_fatal("task_restartable_ranges_register failed (result 0x%x: %s)",
kr
, mach_error_string(kr
));
#endif
}
八、_imp_implementationWithBlock_init:启动回调机制
该方法主要是启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载libobjc-trampolines.dylib,其源码如下:
void
_imp_implementationWithBlock_init(void)
{
#if TARGET_OS_OSX
if (__progname
&&
(strcmp(__progname
, "QtWebEngineProcess") == 0 ||
strcmp(__progname
, "Steam Helper") == 0)) {
Trampolines
.Initialize();
}
#endif
}
九、_dyld_objc_notify_register:dyld 注册
① _dyld_objc_notify_register方法
_dyld_objc_notify_register 方法的声明如下:
void _dyld_objc_notify_register(_dyld_objc_notify_mapped mapped
,
_dyld_objc_notify_init init
,
_dyld_objc_notify_unmapped unmapped
);
_dyld_objc_notify_register 的具体实现,请请参考我之前的博客:iOS之深入解析App启动dyld加载流程的底层原理。
② 从上面分析,可以得出:
仅供objc运行时使用;注册处理程序,以便在映射、取消映射和初始化objc图像时调用;dyld将会通过一个包含objc-image-info的镜像文件的数组回调mapped函数。
③ 方法中的三个参数分别表示的含义如下:
map_images:dyld将image(镜像文件)加载进内存时,会触发该函数;load_image:dyld初始化image会触发该函数;unmap_image:dyld将image移除时,会触发该函数。
dyld与ObjC的关联
一、关联源码分析
其方法的源码实现与调用如下,即dyld与Objc的关联可以通过源码体现:
void _dyld_objc_notify_register(_dyld_objc_notify_mapped mapped
,
_dyld_objc_notify_init init
,
_dyld_objc_notify_unmapped unmapped
)
{
dyld
::registerObjCNotifiers(mapped
, init
, unmapped
);
}
_dyld_objc_notify_register(&map_images
, load_images
, unmap_image
);
源码分析:
mapped 等价于 map_images;init 等价于 load_images;unmapped 等价于 unmap_image; 我们知道load_images是在notifySingle方法中,通过sNotifyObjCInit调用的,如下所示:
然后通过查找sNotifyObjCInit,最终找到了_dyld_objc_notify_register --> registerObjCNotifiers,在该方法中将_dyld_objc_notify_register传入的参数赋值给了3个回调方法: 有以下关系:
sNotifyObjCMapped == mapped == map_imagessNotifyObjCInit == init == load_imagessNotifyObjCUnmapped == unmapped == unmap_image
二、map_images调用时机
dyld中全局搜索 sNotifyObjcMapped :registerObjCNotifiers – notifyBatchPartial – sNotifyObjCMapped:
全局搜索notifyBatchPartial,在registerObjCNotifiers方法中调用:
因此:map_images是先于load_images调用,即先map_images ,再load_images;
三、dyld与ObjC的关联示例图