Mach-O是macOS、iOS、iPadOS存储程序和库的文件格式,对应的系统通过应用二进制接口(ABI--MachO内容的格式)来运行该格式的文件。保存了在编译过程和链接过程中产生的机器代码和数据。为静态链接和动态链接提供了单一的文件格式。
当我们点击Xcode Run的时候,系统会加载IPA包内的可执行文件,调用fork函数,创建一个进程,然后调用execve程序加载器,将文件加载到内存,分析MachO中的mach_header,以确认它是有效格式的MachO文件。
那么MachO到底是什么格式呢?如何查看MachO文件里面的内容,我们可以通过一个可视化的工具MachOView来查看,也可以通过objdump命令来查看objdump --macho --private-headers MachO文件路径,通过控制台输出或MachOView可以看到,它里面有Header、Load command还有一些Sections等,可以看出它其实就是有很多的配置项的二进制文件。
编译与链接:当我们写的代码进行编译的时候会生成一个个.o文件,也就是MachO文件,这个过程就是将代码放到对应的配置中,将各种类型的符号进行归类存放。而链接的本质就是把多个目标(.o)文件组合成一个可执行文件。把多个目标文件合并到一起,在合并的时候可以对其内部符号对外暴露的属性进行修改。
什么是符号?符号存放在哪里?符号的概念比较广,可以说我们编写的代码中的函数,变量等一切皆为符号,他们在MachO中保存在一个叫Symbol Table的东西内,除了Symbol Table(符号表)还有一个Indirect Symbol Table被称为间接符号表,它是符号表的一个子集,里面保存了引用的其他库的符号,如我们使用使用NSLog()函数,但是NSLog()的实现是在Foundation中,它就是一个外部符号,存放在间接符号表。
符号有哪些种类?我们可以亲自实操一下,生成一个MachO文件然后通过终端去查看或MachOView查看,假如我们使用MachOView会比较麻烦,所以我们先来了解一下如何实现xcode编译后自动实现在终端输出我们想要查看的MachO信息,首先了解一个命令tty,通过man tty命令查看return user's terminal name可以知道这个命令输出的是当前终端的名称。既然知道了终端的名称,那也就意味着我们可以通过重定向将结束输出到终端。
同样在xcode run script中我们也可以这么玩,我们写一个xcode_tty.sh脚本放到工作根目录,来让这个过程自动化,Run Script中执行
sh $SRCROOT/xcode_tty.sh "${BUILT_PRODUCTS_DIR}/*" "/dev/ttys000"
#xcode_tty.sh脚本内容
#!/bin/sh
EchoError() {
if [[ -n "$2" ]]; then
echo "$@" 1>&2>$2
else
echo "$@" 1>&2
fi
}
if [[ ! -e "$2" ]]; then
EchoError "===ERROR: Not Config tty to output."
exit -1
fi
#查看__TEXT
objdump --macho -d $1 1>$2
#查看mach-header
#objdump --macho --private-headers $1 1>$2
#查看符号类型
#`objdump --macho -syms $1 1>$2`
#查看导出符号表
#objdump --macho --exports-trie $1 1>$2
#查看间接符号表
#objdump --macho --indirect-symbols $1 1>$2
使用查看符号类型的命令输出结果中小写l代表本地符号,小写的g代表是全局符号,在main.m文件中定义几个变量运行 -syms命令,可以看出我们定义的变量是全局变量,而加了static之后就变成了本地变量,并且可以看出全局符号中未初始化的符号存放在__common段,已初始化的存放在__data段:
int cpy_inta = 10;
int cpy_intaa;
static int cpy_intb = 10;
static int cpy_inbb;
d *UND* _cpy_inta
0000000000000000 l d *UND* _cpy_inta
0000000000000000 l d *UND* _cpy_intaa
0000000100008018 g O __DATA,__data _cpy_inta
0000000100008040 g O __DATA,__common _cpy_intaa
使用objdump --macho --exports-trie $1 1>$2
命令可以查看所有的导出符号,也就说,符号还也可以分导入符号和导出符号,其实导出符号也就是对应着全局符号,也就是说我们的全局符号是可以被别人使用的,但是全局符号并不一定全是导出符号,因为我们的链接器可以控制它是否可以导出。间接符号表保存着当前可执行文件使用的其他的库的符号,全局符号可以变成导出符号给别人使用,因此这个间接符号表是不能被删除,也就意味着所有的全局符号不能被删除,我们的OC方法默认都是全局符号,因此我们没有使用的OC类要进行删除,不然还会占用空间。其实链接器也提供了一个参数可以控制符号不被导出OTHER_LGFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker ${符号}
。追求极致的人可以通过链接器的此特性将使用的全局符号不需要被外部使用的全部设置为不导出,从而减小应用包的体积。-unexported_symbol_list
可以指定一个文件进行批量处理。OTHER_LGFLAGS=$(inherited) -Xlinker -map -Xlinker 文件路径
可以输出当前可执行文件使用的符号情况。
还有一个符号类型叫Weak Symbol,Weak defintion Symbol表示弱定义符号,如果链接器找到了另外一个非弱定义的符号,那么此弱定义符号将会被忽略,也就是说它就是个备胎。Weak Reference Symbol表示弱引用,如果链接器找不到该符号的定义,那么会将它置为0,使用if(弱引用) 相当于if(0)。
//弱定义示例
void weakDefineFunction(void) __attribute__((weak));
//弱引用示例
void weakImportFunction(void) __attribute__((weak_import));
- 弱定义并不会影响它的全局属性和导出(如果将弱定义隐藏,它将变成一个本地符号),它的好处就是在别人导入它之后可以进行重写实现。如果多个文件中都写了弱定义的实现方法,那么将会按照顺序查找到第一个非弱定义的即停止。
- 弱引用可以不实现,那么它在编译时并不会报错。但是在链接时会产生报错undefined symbol,可以通过链接器参数-U来告诉链接器它没有定义,需要运行时动态查找,示例
OTHER_LGFLAGS=$(inherited) -Xlinker -U -Xlinker _weakImportFunction
。另外链接器还有一个-undefined
的参数,它默认指定未定义时error,还有warning,dynamic_lookup,假如我们将找不到的符号全部声明成dynamic_lookup
那么程序将再也不会报错了,全部变成了动态查找,当然在正常开发中千万不要这么乱搞。在运行时如果找不到定义它就是0。
Swift符号与OC不太一样,swift是一种静态语言,它的符号类型根据关键字public/private来区分,使用public则是全局符号,使用private可以变成本地符号,因此swift中的关键字一定要合理的使用。
另外还有一种re-export符号,它是将引用的外部符号重新导出。
了解了符号之后,我们才能更好的去理解Strip剥离符号。xcode提供的Strip Style有三种分别是All Symbol、Non-Global Symbol、Debugging Symbol,究竟该如何使用?
- 对于动态库,因为是要导出给别人使用,所以它的所有的全局符号都不能被脱掉,使用
Non-Global Symbol
。 - 对于静态库,它是.o文件的合集,它的符号全部都放在重定位符号表中,在链接时需要使用,因此它不能被脱掉,只有调试符号才能被脱掉,使用
Debugging Symbol
。 - 对于App,它根本不需要导出给别人使用,因此不管是本地符号、全局符号还有弱定义符号都可以干掉,所以在app上架是通常使用
All Symbol
,另外即使是All Symbol也不会脱掉间接符号表中的符号。
app使用静态库的符号最终会合并放到app内,也就意味着静态库的符号会变成了app内的本地、全局、导出等符号,因此最终也会被干掉,总的符号会变少。而动态库则只能增加符号,总的符号会变多。符号多寡也就影响包的体积。
Debugging Symbol:静态库的调试符号是存放在MachO文件的一个__DWARF的Segment中,DWARF全称Debugging With Attributed RecordFormats。符号剥离的过程为:MachO文件解析成模型Object,然后通过遍历LoadCommands,找到Segname==__DWARF的LoadCommand,移除里面的section,再从符号表中移除Symbol,最后将修改后的模型Object重新写入MachO,因此说我们的MachO文件是一个可读写的文件。Strip就是修改MachO文件。而动态库它是没有__DWARF的段,它是遍历符号表,将n_type包含N_STAB(0xe0)的全部删除,N_STAB(0xe0)代表调试符号。
All Symbol:遍历符号,只要不是间接符号表中的符号,全部删除
Non-Global Symbols:遍历符号表,判断n_type!= N_EXT都可以删除,N_EXT代表外部符号
Dead code Strip是链接器的一个参数,它是用来剥离死代码,将没有用到的函数和数据干掉,Xcode中默认是YES。