前言 :
之前接触过Bugly,在Bugly文档中心 这里接触了一些iOS符号表的内容,符号(Symbol)是日常开发中经常接触的一个概念,虽然日常开发中直接应用的场景比较少,但符号编译期和运行时都扮演了重要的角色。今天就来好好学习下符号 Symbol,并为后面学习动态库静态库学习做准备。
参考:帅驼驼
目录 :
- 符号 Symbol的定义
- 符号表的种类
- 符号的实际探究
- 符号的扩展
- 5 .符号的剥离Strip命令
一、 符号 Symbol的定义
《深入理解计算机系统》一书中有一段Linux编译系统采用的方法:
在编译时,编译器向汇编器输出每个
全局符号
,或者是强(strong)或者是弱(weak),而汇编器把这个信息隐含地编码在可重定位目标文件的符号表
里。函数和已初始化的全局变量是强符号,未初始化的全局变量是弱符号。
- 符号 Symbol
符号是一个
数据结构
,包含了名称(String)和类型等元数据,符号对应一个函数或者数据的地址
。符号直接影响api的体积
- 符号表Symbol Table
什么是符号表?
符号表是内存地址与函数名、文件名、行号的映射表。符号表元素如下所示:
<起始地址
> <结束地址
> <函数
> [<文件名:行号
>]
Symbol Table
:符号表存储了当前文件的符号信息,静态链接器(ld)和动态链接器(dyld)在链接的过程中都会读取符号表,另外调试器也会用符号表来把符号映射到源文件, 就是⽤来保存符号。
String Table
:就是⽤来保存符号的名称。
Indirect Symbol Table
:间接符号表
。保存使⽤的外部符号。更准确⼀点就是使⽤的外部动态库的符号。是Symbol Table
的⼦集。
符号表中存储符号的数据结构如下:
struct nlist_64 {
union {
uint32_t n_strx; /* index into the string table */
} n_un;
uint8_t n_type; /* type flag, see below */
uint8_t n_sect; /* p number or NO_SECT */
uint16_t n_desc; /* see <mach-o/stab.h> */
uint64_t n_value; /* value of this symbol (or stab offset) */
};
符号表 在Mach-O中的位置
通过两个Load Commands
,描述Symbol Table
的大小和位置,以及其他元数据
LC_SYMTAB
:用来描述该文件的符号表。不论是静态链接器还是动态链接器在链接此文件时,都要使用该Load Command。调试器也可以使用该Load Command找到调试信息LC_DYSYMTAB
:描述动态链接器使用其他的Symbol Table
信息,
定义
LC_SYMTAB
加载命令具体属性。在/usr/include/mach-o/loader.h
中定义:
struct symtab_command {
// 共有属性。指明当前描述的加载命令,当前被设置为LC_SYMTAB
uint32_t cmd ;
// 共有属性。指明加载命令的大小,当前被设置为sizeof(symtab_command)
uint32_t cmdsize;
// 表示从文件开始到symbol table所在位置的偏移量。symbol table用[nlist]来表示
uint32_t symoff;
// 符号表内符号的数量
uint32_t nsyms;
// 表示从文件开始到string table所在位置的偏移量。
uint32_t stroff;
// 表示string table大小(以byteカ单位)
uint32_t strsize;
};
二、符号表的种类
2.1 分类
按照模块区分:
- 全局符号(Global Symbol) : 整个项目可见
- 本地符号(Local Symbol) : 当前类可见
按照位置划分:
- 外部符号 : 符号不在当前文件,需要ld或者dyld在链接的时候解决
- 非外部符号 : 即当前文件内的符号
按照功能分:
Type | 说明 |
---|---|
f | File |
F | Function |
O | Data |
d | Debug |
ABS | Absolute |
COM | Common |
UND | 未定义 |
按照符号种类划分:
Type | 说明 |
---|---|
U |
undefined (未定义) |
A |
absolute (绝对符号) |
T①
|
text section symbol (__TEXT.__text ) |
D①
|
data section symbol (__DATA.__data ) |
B①
|
bss section symbol (__DATA.__bss ) |
C |
common symbol (只能出现在MH_OBJECT 类型的Mach-O ⽂件中) |
- | debugger symbol table |
S①
|
除了上⾯所述的,存放在其他section 的内容,例如未初始化的全局变量存放在(__DATA,__common )中 |
I |
indirect symbol (符号信息相同,代表同⼀符号) |
u | 动态共享库中的⼩写u 表示⼀个未定义引⽤对同⼀库中另⼀个模块中私有外部符号 |
注:标记①
的Type
,⼩写代表本地符号(local symbol
)
nm命令里的小写字母对应着本地符号,大写字母表示全局符号;U表示undefined,即未定义的外部符号
三、符号的实际探究
3.1 可见性
有个很常见的case,就是你有1000个函数,但只有10个函数是公开的,希望最后生成的动态库里不包含其他990个函数的符号,这时候就可以用clang的attribute来实现:
//符号可被外部链接__attribute__((visibility("default")))//符号不会被放到Dynamic Symbol Table里,意味着不可以再被其他编译单元链接__attribute__((visibility("hidden")))
clang来提供了一个全局的开关,用来设置符号的默认可见性:
如果动态库的Target把这个开关打开,会发现动态库仍然能编译通过,但是App会报一堆链接错误,因为符号变成了hidden。
但这是一种常见的编译方式:让符号默认是Hidden的,即-fvisibility=hidden
,然后手动为每个接口加上__attribute__((visibility("default")))
。
//头文件#define LH_EXPORT __attribute__((visibility("default")))LH_EXPORT void method_1(void);//实现文件LH_EXPORT void method_1(){ NSLog(@"1");}
全局符号
和本地符号
,它们本质上的区别就是可见性
一个符号的可见性有两种:
default
:默认值,定义的符号类型是全局即为全局,是本地即为本地hidden
:将全局符号隐藏,变为本地符号
故此隐藏全局符号的方式有两种:
- 使用static关键字修饰
- 使用attribute((visibility("hidden")))
举例 :
案例1:
打开项目,里面包含两个
Project
来到
LGOneFramework
,打开LGOneObject.m
文件,实现global_object
函数在
LGOneObject.h
文件中,并没有暴露global_object
函数来到
LGApp
(另一个Project
),打开ViewController.m
文件,定义global_object
函数,但并不实现。在viewDidLoad
方法中调用global_object
函数运行项目,
LGOneFramework
中实现的global_object
函数被正常调用
案例2:
如果将
LGOneFramework
中的global_object
函数,使用static
关键字修饰在
LGApp
中,global_object
函数的调用代码不变此时
global_object
函数变成本地符号,仅对当前文件可见。所以在LGApp
中调用该函数,编译报错,并提示未定义符号
案例3:
在
LGOneFramework
中,实现global_object
函数,不使用static
关键字修饰在
LGApp
的ViewController.m
中,也实现global_object
函数运行项目,调用的是
LGApp
中的global_object
函数
案例3
中,为什么不会发生冲突?
在LGApp
和LGOneFramework
两个Project
中,都定义了global_object
函数,对于global_object
函数来说,它们其实存储在两个Mach-O
中。由于编译器有⼆级命名空间的概念,所以两个global_object
函数的符号其实是不一样的
two_levelnamespace & flat_namespace
:
⼆级命名空间与⼀级命名空间。链接器默认采⽤⼆级命名空间,也就是除了会记录符号名称,还会记录符号属于哪个Mach-O
的,⽐如会记录下来_NSLog
来⾃Foundation
3.2 作用域
导入符号
和导出符号
- 动态库因为不知道外面是如何使用的,所以最好的方式是所有头文件暴露出的符号全部导出来。从包大小的角度考虑,肯定是用到哪些符号,保留哪些符号对应的代码,ld提供了这样一个方案,通过
exported_symbol
来只保留特定的符号
export symbol
:导出符号意味着,告诉别的模块,我有⼀个这样的符号,你可以将其导⼊(Import
)。以
NSLog
为例:NSLog(@"%d", static_init_value);
NSLog
存储在Foundation
库中
- 对于
Foundation
库来说,NSLog
属于供外部使用的导出符号- 对于当前程序来说,
NSLog
属于从Foundation
库中导入的符号
导出符号
就是全局符号
项目中定义的全局变量生成为全局符号,默认就会被导出,这些符号可以被外界查看并使用
使用
objdump --macho --exports-trie ${MACH_PATH}
命令查看导出符号Exports trie: 0x100000000 __mh_execute_header 0x100003F50 _main 0x100008010 _global_init_value 0x100008020 _global_uninit_value
- 只有上述四个导出符号,对应符号表中的四个全局符号
动态库在运行时才会加载,在编译链接阶段只提供符号即可。
Mach-O
中使用的动态库符号保存在间接符号表里使用
objdump --macho --indirect-symbols ${MACH_PATH}
命令查看间接符号表Indirect symbols for (__TEXT,__stubs) 1 entries address index name 0x0000000100003f90 8 _NSLog Indirect symbols for (__DATA_CONST,__got) 1 entries address index name 0x0000000100004000 10 dyld_stub_binder Indirect symbols for (__DATA,__la_symbol_ptr) 1 entries address index name 0x0000000100008000 8 _NSLog
- 符号在
Mach-O
中占有一定体积,剥离符号时,间接符号表是不能被删除的Mach-O
所使用的动态库的全局符号都不能被删除- 动态库剥离符号,只能剥离非全局符号的所有符号
查看
OC
中的符号打开
LGOneObject.m
文件,写入以下代码:
#import "LGOneObject.h"
@interface LGOneObject : NSObject
- (void)testOneObject;
@end
@implementation LGOneObject
- (void)testOneObject {
NSLog(@"testOneObject");
}
@end
使用
objdump --macho --exports-trie ${MACH_PATH}
命令查看导出符号Exports trie: 0x100000000 __mh_execute_header 0x100003F20 _main 0x1000080B8 _OBJC_METACLASS_$_LGOneObject 0x1000080E0 _OBJC_CLASS_$_LGOneObject 0x100008110 _global_init_value 0x100008120 _global_uninit_value
OC
默认都是全局符号
,同时也是导出符号
。它们可以被外界查看并使用,会增加Mach-O
的体积
开发
OC
动态库时,想要减小Mach-O
的体积,就要将外部无需使用的符号剥离。此时可以借助链接器,将不想暴露的符号
声明为不导出符号
打开
xcconfig
文件,添加OTHER_LDFLAGS
配置项OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject
- 将
_OBJC_CLASS_$_LGOneObject
声明为不导出符号- 将
_OBJC_METACLASS_$_LGOneObject
声明为不导出符号编译项目,此时
OC
的两个导出符号已经被隐藏Exports trie: 0x100000000 __mh_execute_header 0x100003F20 _main 0x100008110 _global_init_value 0x100008120 _global_uninit_value
- 隐藏
OC
不想暴露的符号,需要借助链接器,将符号声明为不导出符号- 由于
OC
是运行时语言,不能直接使用visibility("hidden")
- 不导出符号,将全局符号变为本地符号,这些符号可以被剥离,从而减小
Mach-O
的体积- 隐藏不需要暴露的符号,从而避免被外界查看并使用,解决安全隐患
链接器提供的另一种方式:指定一个文件,将文件内的符号全部声明为不导出符号
创建
symbol.txt
文件,放到工程目录中,里面定义不想暴露的符号_OBJC_CLASS_$_LGOneObject _OBJC_METACLASS_$_LGOneObject _global_init_value _global_uninit_value
打开
xcconfig
文件,添加OTHER_LDFLAGS
配置项OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbols_list >$(PROJECT_DIR)/symbol.txt
编译项目,此时
symbol.txt
文件中定义的四个符号已经被隐藏Exports trie: 0x100000000 __mh_execute_header 0x100003F20 _main
3.3 Weak Symbol
弱定义符号
Weak Defintion Symbol
:表示此符号为弱定义符号。如果静态链接器或动态链接器为此符号找到另⼀个(⾮弱)定义,则弱定义将被忽略。只能将合并部分中的符号标记为弱定义打开
WeakSymbol.m
文件,写入以下代码:#import "WeakSymbol.h" #import <Foundation/Foundation.h> void weak_function(void) { NSLog(@"weak_function"); }
- 此时
weak_function
是一个全局符号,同样也是导出符号打开
WeakSymbol.h
文件,写入以下代码:void weak_function(void) __attribute__((weak));
- 使用
__attribute__((weak))
将weak_function
声明为弱定义符号使用
objdump --macho --exports-trie ${MACH_PATH}
命令查看导出符号Exports trie: 0x100000000 __mh_execute_header 0x100003EF0 _weak_function [weak_def] 0x100003F30 _main 0x100008010 _global_init_value 0x100008020 _global_uninit_value
weak_function
还是导出符号,这也证明它依然是全局符号,其后增加了[weak_def]
的标记
弱定义符号的作用
在
WeakSymbol.m
和main.m
中,都实现一个weak_function
函数void weak_function(void) { NSLog(@"weak_function"); }
同一个
Project
中,出现两个相同的全局符号,此时编译报错,提示出现重复符号将其中一个
weak_function
函数声明为弱定义符号,此时编译成功void weak_function(void) __attribute__((weak));
- 弱定义符号的作用:可以解决同名符号的冲突;链接器按照符号上下顺序,找到一处符号的实现后,其他地方的同名符号将被忽略
如果同时使用
weak
和visibility("hidden")
,符号会变成一个弱定义的本地符号打开
WeakSymbol.m
文件,写入以下代码:void weak_hidden_function(void) { NSLog(@"weak_hidden_function"); }
打开
WeakSymbol.h
文件,将weak_hidden_function
函数同时使用weak
和visibility("hidden")
修饰void weak_hidden_function(void) __attribute__((weak, visibility("hidden")));
使用
objdump --macho --syms ${MACH_PATH}
命令查看符号表SYMBOL TABLE: 0000000100003f10 lw F __TEXT,__text _weak_hidden_function 0000000100008008 l O __DATA,__data __dyld_private 0000000100008014 l O __DATA,__data _static_init_value 0000000100008018 l O __DATA,__bss _static_uninit_value 0000000100008028 l O __DATA,__common _default_x 0000000100000000 g F __TEXT,__text __mh_execute_header 0000000100008010 g O __DATA,__data _global_init_value 0000000100008020 g O __DATA,__common _global_uninit_value 0000000100003f30 g F __TEXT,__text _main 0000000100003ef0 gw F __TEXT,__text _weak_function 0000000000000000 *UND* _NSLog 0000000000000000 *UND* ___CFConstantStringClassReference 0000000000000000 *UND* dyld_stub_binder
- 此时
_weak_hidden_function
被标记为lw
,变为弱定义本地符号
弱引用符号
Weak Reference Symbol
:表示此未定义符号是弱引⽤。如果动态链接器找不到该符号的定义,则将其设置为0
。链接器会将此符号设置弱链接标志打开
WeakImportSymbol.h
文件,写入以下代码:void weak_import_function(void) __attribute__((weak_import));
- 使用
__attribute__((weak_import))
将weak_import_function
声明为若引用符号- 此时项目中没有
weak_import_function
函数的实现打开
main.m
文件,写入以下代码:#import <Foundation/Foundation.h> #import "WeakImportSymbol.h" int main(int argc, char *argv[]) { if (weak_import_function) { weak_import_function(); } return 0; }
由于
weak_import_function
函数没有实现,但在main.m
中被使用,此时编译报错,提示未定义符号
- 当导入
.h
头文件并使用符号时,类似于API
的使用,只要找到符号的声明即可。即使函数没有被实现,也可以生成目标文件。但链接生成可执行文件时,需要知道符号的具体位置,如果函数没有被实现,会出现错误提示:未定义符号
解决弱引用符号的使用问题,可以通过链接器,将符号声明为动态链接
使用
man ld
命令查看链接器参数:
-U
:指明该符号未定义,需要运行时动态查找打开
xcconfig
文件,添加OTHER_LDFLAGS
配置项OTHER_LDFLAGS=$(inherited) -Xlinker -U -Xlinker _weak_import_function
- 此时项目可以正常编译成功
- 通过
-U
参数,告诉链接器此符号是动态链接的,所以在链接阶段,即使它是未定义符号,忽略,不用管它。因为在运行时,动态链接器会自动找到它运行项目,虽然
weak_import_function
函数没有被实现,但运行并不会报错
- 因为
main
函数中调用weak_import_function
函数之前有if (weak_import_function)
的判断- 当动态链接器找不到该符号的定义,则将其设置为
0
。所以weak_import_function
函数并不会被调用
弱引用符号的作用
- 将一个符号声明为弱引用符号,可以避免编译链接时报错。在调用之前增加条件判断,运行时也不会报错
- 使用动态库的时候,可以将整个动态库声明为弱引用,此时动态库即使没有被导入,也不会出现未找到动态库的错误
Common Symbol
在定义时,未初始化的全局符号
例如:
main.m
文件中,未初始化的global_uninit_value
全局变量,它就属于Common Symbol
int global_uninit_value;
打开
main.m
文件,定义两个同名的全局变量,一个初始化,另一个不进行初始化,这种操作并不会报错int global_init_value = 10; int global_init_value;
Common Symbol
的作用- 在编译和链接的过程中,如果找到定义的符号,会自动将未定义符号删掉
- 在链接过程中,链接器默认会把未定义符号变成强制定义的符号
链接器设置:
-d
:强制定义Common Symbol
-commons
:指定对待Common Symbol
如何响应
重新导出符号
以
NSLog
为例:
- 对于当前程序来说,
NSLog
属于存储在间接符号表中的未定义符号
NSLog
可以在当前程序使用,如果想让使用此程序的其他程序也能使用,就要将此符号重新导出。重新导出之后的符号会放在导出符号表中,此时才能被外界查看并使用使用
man ld
命令查看链接器参数:
-alias
:只能给间接符号表中的符号创建别名,别名符号具有全局可见性打开
xcconfig
文件,添加OTHER_LDFLAGS
配置项OTHER_LDFLAGS=$(inherited) -Xlinker -alias -Xlinker _NSLog -Xlinker Cat_NSLog
- 给
_NSLog
符号创建Cat_NSLog
别名使用
nm -m ${MACH_PATH} | grep "Cat_NSLog"
命令查看符号表,指定"Cat_NSLog"
关键字(indirect) external Cat_NSLog (for _NSLog)
- 此时
Cat_NSLog
是一个间接外部符号,是_NSLog
符号的别名使用
objdump --macho --exports-trie ${MACH_PATH}
命令查看导出符号Exports trie: 0x100000000 __mh_execute_header 0x100003F20 _main 0x100008018 _global_init_value 0x100008028 _global_uninit_value [re-export] Cat_NSLog (_NSLog from Foundation)
Cat_NSLog
为导出符号,并且标记为[re-export]
,代表重新导出符号
重新导出符号的作用
- 将一个间接符号表中的符号声明为重新导出符号,可以让使用此程序的其他程序也能使用
- 当程序链接
A动态库
,而A动态库
又链接B动态库
时,B动态库
对于程序来说是不可见的。此时可以使用重新导出的方式,让B动态库
对程序可见
四、符号的扩展
查看项目使用的三方库和符号等信息
通过链接器,可以查看当前项目中使用的三方库和符号等信息
使用
man ld
命令查看链接器参数:
-map
:将所有符号详细信息导出到指定文件打开
xcconfig
文件,添加OTHER_LDFLAGS
配置项OTHER_LDFLAGS=$(inherited) -Xlinker -map -Xlinker $(PROJECT_DIR)/export.txt
编译项目,此时项目目录下多出
export.txt
文件
打开
export.txt
文件
# Path: /Users/zang/Library/Developer/Xcode/DerivedData/MachOAndSymbol-bdzlylfoorwnhggerxdmwocpeyad/Build/Products/Debug/MachOAndSymbol
# Arch: x86_64
# Object files:
[ 0] linker synthesized
[ 1] /Users/zang/Library/Developer/Xcode/DerivedData/MachOAndSymbol-bdzlylfoorwnhggerxdmwocpeyad/Build/Intermediates.noindex/MachOAndSymbol.build/Debug/MachOAndSymbol.build/Objects-normal/x86_64/LGOneObject.o
[ 2] /Users/zang/Library/Developer/Xcode/DerivedData/MachOAndSymbol-bdzlylfoorwnhggerxdmwocpeyad/Build/Intermediates.noindex/MachOAndSymbol.build/Debug/MachOAndSymbol.build/Objects-normal/x86_64/main.o
[ 3] /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX11.1.sdk/System/Library/Frameworks//Foundation.framework/Foundation.tbd
# Sections:
# Address Size Segment Section
0x100003EF0 0x0000006F __TEXT __text
0x100003F60 0x00000006 __TEXT __stubs
0x100003F68 0x0000001A __TEXT __stub_helper
0x100003F82 0x00000011 __TEXT __cstring
0x100003F93 0x0000000C __TEXT __objc_classname
0x100003F9F 0x0000000E __TEXT __objc_methname
0x100003FAD 0x00000008 __TEXT __objc_methtype
0x100003FB8 0x00000048 __TEXT __unwind_info
0x100004000 0x00000008 __DATA_CONST __got
0x100004008 0x00000040 __DATA_CONST __cfstring
0x100004048 0x00000008 __DATA_CONST __objc_classlist
0x100004050 0x00000008 __DATA_CONST __objc_imageinfo
0x100008000 0x00000008 __DATA __la_symbol_ptr
0x100008008 0x000000B0 __DATA __objc_const
0x1000080B8 0x00000050 __DATA __objc_data
0x100008108 0x00000010 __DATA __data
0x100008118 0x00000004 __DATA __bss
0x100008120 0x00000010 __DATA __common
# Symbols:
# Address Size File Name
0x100003EF0 0x00000027 [ 1] -[LGOneObject testOneObject]
0x100003F20 0x0000003F [ 2] _main
0x100003F60 0x00000006 [ 3] _NSLog
0x100003F68 0x00000010 [ 0] helper helper
0x100003F78 0x0000000A [ 3] _NSLog
0x100003F82 0x0000000E [ 1] literal string: testOneObject
0x100003F90 0x00000003 [ 2] literal string: %d
0x100003F93 0x0000000C [ 1] literal string: LGOneObject
0x100003F9F 0x0000000E [ 1] literal string: testOneObject
0x100003FAD 0x00000008 [ 1] literal string: v16@0:8
0x100003FB8 0x00000048 [ 0] compact unwind info
0x100004000 0x00000008 [ 0] non-lazy-pointer-to-local: dyld_stub_binder
0x100004008 0x00000020 [ 1] CFString
0x100004028 0x00000020 [ 2] CFString
0x100004048 0x00000008 [ 1] objc-cat-list
0x100004050 0x00000008 [ 0] objc image info
0x100008000 0x00000008 [ 3] _NSLog
0x100008008 0x00000048 [ 1] __OBJC_METACLASS_RO_$_LGOneObject
0x100008050 0x00000020 [ 1] __OBJC_$_INSTANCE_METHODS_LGOneObject
0x100008070 0x00000048 [ 1] __OBJC_CLASS_RO_$_LGOneObject
0x1000080B8 0x00000028 [ 1] _OBJC_METACLASS_$_LGOneObject
0x1000080E0 0x00000028 [ 1] _OBJC_CLASS_$_LGOneObject
0x100008108 0x00000008 [ 0] __dyld_private
0x100008110 0x00000004 [ 2] _global_init_value
0x100008114 0x00000004 [ 2] _static_init_value
0x100008118 0x00000004 [ 2] _static_uninit_value
0x100008120 0x00000008 [ 2] _global_uninit_value
0x100008128 0x00000008 [ 2] _default_x
- 文件内包含了编译链接时生成的目标文件,项目中使用的三方库,还包含项目中的
Sections
和Symbols
等信息
Section的名称与作用
名称 | 作用 |
---|---|
TEXT.text | 可执行的机器码 |
TEXT.cstring | 去重后的C 字符串 |
TEXT.const | 初始化过的常量 |
TEXT.stubs | 符号桩。lazybinding 的表对 应项指针指向的地址的代码 |
TEXT.stub_ helper | 辅助函数。当在lazybinding 的表中没有找到对应项的指针表示的真正的符号地址的时候,指向这 |
TEXT.unwind_info | 存储处理异常情况信息 |
TEXT.eh_frame | 调试辅助信息 |
DATA.data | 初始化过的可变的数据 |
DATA.nI_symbol_ptr | 非lazy-binding 的指针表,每个表中的指针指向一个在装载过程中,被动态链接器搜索完成的符号 |
DATA.Ia_symbol_ptr |
lazy-binding 的指针表,每个表中的指针一开始指向stub_helper
|
DATA.const | 没有初始化过的常量 |
DATA.mod_init_func | 初始化函数,在main 之前调用 |
DATA.mod_term_func | 终止函数,在main 返回之后调用 |
DATA.bss | 没有初始化的静态变量 |
DATA.common | 没有初始化过的符号声明(for example, int I; ) |
Swift符号表
打开
SwiftSymbol.swift
文件,写入以下代码:public class LGSwiftClassSymbol { func testSwiftSymbol() { } }
使用
objdump --macho --syms ${MACH_PATH} | grep "Swift"
命令查看符号表,指定Swift
关键字
0000000100003f8a lw O __TEXT,__swift5_typeref _symbolic _____ 14MachOAndSymbol012LGSwiftClassC0C
0000000100003f90 l O __TEXT,__swift5_fieldmd _$s14MachOAndSymbol012LGSwiftClassC0CMF
0000000100008020 l O __DATA,__objc_const __METACLASS_DATA__TtC14MachOAndSymbol18LGSwiftClassSymbol
0000000100008068 l O __DATA,__objc_const __DATA__TtC14MachOAndSymbol18LGSwiftClassSymbol
00000001000080e8 l O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC0CMf
0000000100003d90 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0C09testSwiftC0yyF
0000000100003f78 g O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC0C09testSwiftC0yyFTq
0000000100003e10 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0CACycfC
0000000100003f80 g O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC0CACycfCTq
0000000100003e40 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0CACycfc
0000000100003e60 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0CMa
00000001000080c0 g O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC0CMm
0000000100003f44 g O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC0CMn
00000001000080f8 g O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC0CN
0000000100003dd0 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0CfD
0000000100003db0 g F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC0Cfd
0000000000000000 *UND* _OBJC_CLASS_$__TtCs12_SwiftObject
0000000000000000 *UND* _OBJC_METACLASS_$__TtCs12_SwiftObject
- 查找出所有包含
Swift
关键字的符号,其中有很多标记为g
的全局符号
打开
SwiftSymbol.swift
文件,修改LGSwiftClassSymbol
类的访问控制,改为private
修饰private class LGSwiftClassSymbol { func testSwiftSymbol() { } }
使用
objdump --macho --syms ${MACH_PATH} | grep "Swift"
命令查看符号表,指定Swift
关键字
0000000100003d10 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLC09testSwiftC0yyF
0000000100003d30 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCfd
0000000100003d50 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCfD
0000000100003d90 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMa
0000000100003db0 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCADycfC
0000000100003de0 l F __TEXT,__text _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCADycfc
0000000100003f1c lw O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMXX
0000000100003f44 l O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMn
0000000100003f78 l O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLC09testSwiftC0yyFTq
0000000100003f80 l O __TEXT,__const _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCADycfCTq
0000000100003f8a lw O __TEXT,__swift5_typeref _symbolic _____ 14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLC
0000000100003f90 l O __TEXT,__swift5_fieldmd _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMF
0000000100008020 l O __DATA,__objc_const __METACLASS_DATA__TtC14MachOAndSymbolP33_66093EBE10D00815F1A5CBD65FFF466118LGSwiftClassSymbol
0000000100008068 l O __DATA,__objc_const __DATA__TtC14MachOAndSymbolP33_66093EBE10D00815F1A5CBD65FFF466118LGSwiftClassSymbol
00000001000080c0 l O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMm
00000001000080e8 l O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCMf
00000001000080f8 l O __DATA,__data _$s14MachOAndSymbol012LGSwiftClassC033_66093EBE10D00815F1A5CBD65FFF4661LLCN
0000000000000000 *UND* _OBJC_CLASS_$__TtCs12_SwiftObject
0000000000000000 *UND* _OBJC_METACLASS_$__TtCs12_SwiftObject
- 之前那些标记为
g
的全局符号,全部变为本地符号
$(SRCROOT)
和$(PROJECT_DIR)
的区别
$(SRCROOT)
代表的是项目根目录下$(PROJECT_DIR)
代表的是整个项目往项目添加文件时,例如
.a
文件,要先Show in Finder
,复制到工程目录中,然后再拖到xcode
项目中而有时
.a
不在工程目录中。例如在工程的父目录,可以写成:$(SRCROOT)/../Spark/libSDK
。其中/../
就是指向父目录
五、 符号的剥离Strip命令
- 符号表中有些符号是必须的,但是很多符号都是去掉的 , strip经常用来去除目标文件中的一些符号表、调试符号表信息,以减小程序的大小;
-
strip命令
:移除或修改符号表中的符号。App 进行脱符号,可以将本地符号,全局符号全部脱去(All symbols),只留下间接符号表中的符号。
5.1 如何脱去调试符号
5.2 如何脱去All Symbols
- 静态库进行脱符号,放置在重定位符号表中的符号不能脱去,能脱去的只要调试符号(Debugging Symbols)
调试符号:由汇编器生成.o文件时,会生成一个DWARF格式的调试信息,它会被放到__DWARF段,在链接是,会将__DWARF段放到符号表中,链接后所有的符号都放在符号表中
- 动态库进行脱符号,只要不是全局符号都可以被干掉(Non-Global Symbols)
如何脱去Non-Global Symbols
链接一个静态库,静态库中的符号会合并到APP中,但不会存入间接符号表,然后进行APP脱符号时,可以体积缩小
链接一个动态库,动态库中的符号表会放到APP的间接符号表,然后进行APP脱符号时,间接符号表不能被脱去
5.3 Build Setting的Strip Style选择
- Debugging Symbols
- All Symbols
- Non-Global Symbols
5.4 Strip执行的时机
编译完成执行脚本后 ,签名之前,所以这是后剥离符号 已经不起作用了
5.5 Strip剥离符号
- -x : non_global
- 无参数: 代表全部符号
- -S : 剥离调试符号
app瘦身:
- 在编译的时生产目标文件时优化 -O1,-Oz;
- dead code strip 在链接的时死代码剥离 ;
- strip 生产Macho文件后剥离符号 ;
给链接器传参 -S (去除调试符号)