zoukankan      html  css  js  c++  java
  • iOS安装包瘦身的那些事儿

    在我们提交安装包到App Store的时候,如果安装包过大,有可能会收到类似如下内容的一封邮件:

    收到这封邮件的时候,意味着安装包在App Store上下载的时候,有的设备下载的安装包大小会超过100M。对于超过100M的安装包,只能在WIFI环境下下载,不能直接通过4G网络进行下载

    在这里,我们提交App Store的安装包大小为67.6MB,在App Store上显示的下载大小和实际下载下来的大小,我们通过下表做一个对比:

    iPhone型号
    系统
    AppStore 显示大小
    下载到设备大小
    iPhone6 10.2.1 91.5MB 88.9MB
    iPhone6 10.1.1 91.5MB 88.9MB
    iPhone6 9.3.5 91.5MB 84.8MB
    iPhone 5 9.2 91.5MB 84.8MB
    iPhone6 plus 10.0.2 95.7MB 93.2MB
    iPhone7 plus 10.3.0 95.7MB 93.2MB
    iPhone5C 9.2 83.9MB 76MB
    iPhone5S 7.1.1 147MB 144MB
    iPhone5C 7.1.2 147MB 未知
    iPhone5C 越狱 8.1.1 83.9MB 144MB

    从上表可以看到:

    • 在 iOS 9 系统以上的手机上,App Store 上的大小都是做了 App Thinning 操作的。
    • 在 iOS 9 以上系统的基础上,plus 手机在 AppStore size 上比其他手机大了 4.2MB,猜测是因为 @3x 图的原因。
    • iOS 9 和 iOS 10 虽然在  AppStore 显示的包大小一致,但是最终下载到手机上,大小有区别。
    • iOS 9 以下的手机,是直接下载整个安装包的。

    App Thinning】:对于iOS应用来说,应用瘦身仅支持最新版本的iTunes,以及运行iOS 9.0或者更高系统的设备,否则的话,App Store将会为用户分发统一的安装包。iOS 9 在发布时隐含一个 Bug , App Thinning ( App 瘦身)无法正确运作。随着 iOS 9.0.2 的发布,此 Bug 已被修复, App 瘦身终于可以运作如常。从 App Store 下载 App 时请谨记这点。App Thinning 会自动检测用户的设备类型(即型号名称)并且只下载当前设备所适用的内容。换句话说,如果使用的是 iPad Mini 1(1x分辨率且非 retina 显示屏)那么只会下载 1x分辨率所使用的文件。更强大和更高分辨率的 ipad(如iPad Mini 3或 4)所使用的资源将不会被下载。因为用户仅需下载自己当前使用的特定设备所需的内容,这不仅加快了下载速度,还节约了设备的存储空间。

    在邮件内容中,苹果建议删除一些无用的执行代码或资源文件。下面我们分别从这两方面来分析安装包瘦身的一些方法和工具。

    1.资源文件

    资源文件包括图片、声音、配置文件、文本文件(例如rtf文件)、xib(在安装包中后缀名为nib)、storyboard等。对于声音、配置文件、文本文件这三类资源文件,一般在安装包中数量不多,可自行在工程中根据实际情况,进行删除或保留。声音文件过大的话,可以考虑用如下命令做压缩:

    //tritone.caf为声音文件
    afconvert -f AIFC -d ima4 tritone.caf

    xib和storyboard文件实际上是一个xml文件,如果某个页面没有使用,可直接删除。这里主要说一下对图片资源的处理方式。

    对图片资源类文件,一般采取的方法是这几种:

    • 删除无用的资源文件;
    • 对资源文件进行压缩;
    • 变更图片文件的导入方式;
    • 处理1x图片。

    1.1删除无用的资源文件

    首先,使用python脚本搜索工程中没有使用的图片资源,脚本代码示例如下:

    #!/bin/sh
    PROJ=`find . -name '*.xib' -o -name '*.[mh]'`
    
    for png in `find . -name '*.png'`
    do
        name=`basename $png`
        if ! grep -qhs "$name" "$PROJ"; then
            echo "$png is not referenced"
        fi
    done

    但上面的脚本具有如下缺点:不够智能,不够通用,速度太慢,结果不正确。

    在这里推荐使用工具LSUnusedResources。它在脚本的基础上,做了两个改进:

    • 提高匹配速度。LSUnusedResources不是对每个资源文件名都做一次全文搜索匹配,因为加入项目的资源太多,这里会导致性能快速下降。它只是针对源码、Xib、Storyboard 和 plist 等文件,先全文搜索其中可能是引用了资源的字符串,然后用资源名和字符串做匹配。
    • 优化匹配结果。比如说脚本会把大量实际上有使用的资源,当做未使用的资源输出(例如拼接的图片名称),而LSUnusedResources不会。

    接下来,打开工具LSUnusedResources,点击“Browse...”按钮,选择工程所在目录,点击"Search"按钮,即可开始搜索,如下图所示:

    搜索结果出来之后,选中某行,点击“Delete”按钮即可直接删除资源。

    1.2对资源文件进行压缩

     压缩工具有很多,这里介绍两个好用的:

    • 无损压缩工具ImageOptiom(推荐)。这是一款非常好的图片压缩工具,可以进行无损压缩,能够对 png 和 jpeg 图片文件进行优化,它能找到最佳的压缩参数(在设置中可以设置压缩比例,80% 及以上是无损压缩,推荐使用),并通过消除不必要的信息(如文件的 EXIF 标签和颜色配置文件等),优化后达到减小文件大小的效果。
    • 有损压缩工具TinyPNG。它使用聪明的有损压缩技术,能有效减少PNG文件的大小。通过选择性地降低图像中颜色的数量,需要更少的字节来存储数据。

    【建议】:对于较大尺寸的图片,可以和设计沟通,在不失真和影响效果的前提下,使用TinyPNG进行压缩;较小尺寸的图片,建议使用ImageOptiom

    1.3变更图片文件的导入方式

    我们都知道,图片资源的导入方式有如下几种:

    1. Assets.xcassets。

      • 只支持png格式的图片;
      • 图片只支持[UIImage imageNamed]的方式实例化,但是不能从Bundle中加载;
      • 在编译时,Images.xcassets中的所有文件会被打包为Assets.car的文件。

    2. CreateGroup

      • 黄色文件夹图标;Xcode中分文件夹,Bundle中都在同一个文件夹下,因此,不能出现文件重名的情况;
      • 可以直接使用[NSBundle mainBundle]作为资源路径,效率高;
      • 可以使用[UIImage imageNamed:]加载图像。  

    3. CreateFolderRefences

      • 蓝色文件夹;Xcode中分文件夹,Bundle中同样分文件夹,因此,可以出现文件重名的情况;
      • 需要在[NSBundle mainBundle]的基础上拼接实际的路径,效率较差;
      • 不能使用[UIImage imageNamed:]加载图像。

      【说明】:蓝色文件夹只是将文件单纯的创建了引用,这些文件不会被编译,所以在使用的时候需要加入其路径。

    4. PDFs矢量图(Xcode6+)

    5. Bundle(包)

    对于上面这几种不同的导入方式,会对打出的包的大小有影响么?

    经过测试得知:CreateGroup、CreateFolderRefences两种方式打出来的包,图片都会直接放在.app文件中,所以打包前后,图片的大小不会改变。而加入到Assets.xcassets中的方法则不同,打包后,在.app中会生成Assets.car文件来存储Assets.xcassets中的图片,并且文件大小也大大降低。

    测试

    打包前Assets.xcassets文件夹

     打包后的Assets.car文件夹
     第一次

    32.7MB

    16.3MB

    第二次  33.5MB  26.1MB

    从表格数据可以看到,使用Assets.xcassets来管理图片也可以达到ipa瘦身的效果

    值得留意的是,在将图片资源移到Assets.xcassets管理的时候,一般情况下会自动生成与图片名称相同的,比如loading@2x.png和loading@3x.png会自动放置到一个同名的loading文件夹中。然而有一些不规则命名的图片,会出现一些奇怪的问题:

    • 图片名称为ios-f2-8-004的图片,放到Images.xcassets中,会自动生成调用的图片名是ios-f2-8-4,最后一位的004,被替换成4,然而在类文件中引用的是[UIImage imageNamed:@"ios-f2-8-004.png"],这样会找不到图片;
    • 图片名称为ios-f6-的图片,放到Images.xcassets中,会自动生成调用的图片名是ios-f6,这样也会找不到图片。

    因此在移动的时候,一定要细致对比。

    1.4处理1x图片

     我们知道,iPhone设备目前主要有四种尺寸:3.5英寸、4英寸、4.7英寸、5.5英寸,对于这几个尺寸的设备,我们来看一下具体的设备型号和屏幕相关信息:

    机型 屏幕宽高(point) 渲染像素(pixel) 物理像素(pixel) 屏幕对角线长度(英寸) 屏幕模式
    iPhone 2G, 3G, 3GS 320 * 480 320 * 480 320 * 480 3.5(163PPI) 1x
    iPhone 4, 4s 320 * 480 640 * 960 640 * 960 3.5 (326PPI) 2x
    iPhone 5, 5s 320 * 568 640 * 1136 640 * 1136 4 (326PPI) 2x
    iPhone 6, 6s, 7 375 * 667 750 * 1334 750 * 1334 4.7 (326PPI) 2x
    iPhone 6 Plus, 6s Plus, 7 Plus 414 * 736 1242 * 2208 1080 * 1920 5.5 (401PPI)

    3x

    iPhone X 375 * 812 1125 * 2436 1125 * 2436  

    3x

    对于上表中的几个概念,这里做一下说明:

    • Points: 是iOS开发中引入的抽象单位,称作点。开发过程中所有基于坐标系的绘制都是以 point 作为单位,在iPhone 2G,3G,3GS的年代,point 和屏幕上的像素是完全一一对应的,即 320 * 480 (points), 也是 320 * 480 (pixels);
    • Rendered Pixels: 渲染像素, 以 point 为单位的绘制最终都会渲染成 pixels,这个过程被称为光栅化。基于 point 的坐标系乘以比例因子可以得到基于像素的坐标系,高比例因子会使更多的细节展示,目前的比例因子会是 1x,2x,3x
    • Physical Pixels: 物理像素,就是设备屏幕实际的像素。
    • Physical Device: 设备屏幕的物理长度,使用英寸作为单位。比如iPhone 4屏幕是3.5英寸,iPhone 5 是4英寸,iphone 6是4.7英寸,这里的数字是指手机屏幕对角线的物理长度。实际上会是Physical Pixels的像素值(而不是Rendered Pixels的像素值)会渲染到该屏幕上, 屏幕会有 PPI(pixels-per-inch) 的特性,PPI 的值告诉你每英寸会有多少像素渲染。
    • 屏幕模式: 描述的是屏幕中一个点有多少个 Rendered Pixels 渲染,对于2倍屏(又称 Retina 显示屏),会有 2 * 2 = 4 个像素的面积渲染,对于3倍屏(又称 Retina HD 显示屏),会有 3 * 3 = 9 个像素的面积渲染。

    在实际的开发中,所有控件的坐标以及控件大小都是以点为单位的,假如屏幕上需要展示一张 20 * 20 (单位:point)大小的图片,那么设计师应该怎么给图呢?这里就会用到屏幕模式的概念,如果屏幕是 2x,那么就需要提供 40 * 40 (单位: pixel)大小的图片,如果屏幕是 3x,那么就提供 60 * 60 大小的图片,且图片的命名需要遵守以下规范:

    • Standard: <ImageName><device_modifier>.<filename_extension>
    • High resolution: <ImageName>@2x<device_modifier>.<filename_extension>
    • High HD resolution: <ImageName>@3x<device_modifier>.<filename_extension>

    其中:

    • ImageName: 图片名字,根据场景命名
    • device_modifier: 可选,可以是 ~ipad 或者 ~iphone, 当需要为 iPad 和 iPhone 分别指定一套图时需要加上此字段
    • filename_extension: 图片后缀名,iOS中使用 png 图片

    2x屏幕的设备会自动加载 xxx@2x.png 命名的图片资源,3x屏幕的设备会自动加载 xxx@3x.png 的图片。从友盟统计数据可以看到,现在基本没有 1x屏幕的设备了,所以可以不用提供这个分辨率的图片。 

    至于开发中,技术人员和设计人员关于设计和切图的工作流程和规范,可以参看知乎上的这篇文章介绍。

    2.Mach-O 可执行文件 

    我们用 Xcode 构建一个程序的过程中,会把源文件 (.m 和 .h) 文件转换为一个可执行文件。这个可执行文件中包含的字节码会被 CPU (iOS 设备中的 ARM 处理器或 Mac 上的 Intel 处理器) 执行。对于这个可执行文件,我们可以用工具MachOView来查看。

    2.1MachOView

    Mach-O为Mach Object文件格式的缩写,是mac上可执行文件的格式,类似于windows上的PE格式 (Portable Executable )或 linux上的elf格式 (Executable and Linking Format)。Mach-O文件分为这几类:

    • Executable:应用的主要二进制;
    • Dylib Library:动态链接库;
    • Static Library:静态链接库;
    • Bundle:不能被链接的Dylib,只能在运行时使用dlopen( )加载,可当做macOS的插件;
    • Relocatable Object File :可重定向文件类型。

    对于这几种类型的Mach-O文件,我们可以使用MachOView进行查看。MachOView是一个开源的工具,源码在GitHub上:https://github.com/gdbinit/MachOView,感兴趣的可以研究一下。

    下面我们用MachOView来打开一个静态链接库文件看看,了解Mach-O文件的结构:

    首先,我们来看一下“Fat Header”里面的内容:它是对各种架构文件的组装,可以看到每种类型的CPU架构信息,从上图可以看到支持的架构,图中显示的支持ARM_V7 、i386 、 X86_64、ARM_64。

    接下来我们点开一个Static Library看看:

    从上图可以看到,Static Library有很多.o文件,每个.o文件都对应一个类编译后的文件,展开查看“Mach Header”信息,可以看到每个类的CPU架构信息、Load Commands数量 、Load Commands Size 、File Type等信息。

    当然,我们也可以在Xcode中,开启编译选项Write Link Map File,编译之后来查看可执行文件的全貌。

    2.2LinkMap

    LinkMap文件是Xcode产生可执行文件的同时生成的链接信息,用来描述可执行文件的构造成分,包括代码段(__TEXT)和数据段(__DATA)的分布情况。

    在Xcode中,选择XCode -> Target -> Build Settings -> 搜map -> 把Write Link Map File选项设为YES,并指定好linkMap的存储位置,如下图所示:

    编译后,到编译目录里找到该txt文件,文件名和路径就是上述的Path to Link Map File。这个LinkMap里展示了整个可执行文件的全貌,列出了编译后的每一个.o目标文件的信息(包括静态链接库.a里的),以及每一个目标文件的代码段,数据段存储详情。下面来简单分析一下这个文件的结构。

    2.2.1目标文件列表

    打开LinkMap文件,首先看到的就是编译后的每一个.o目标文件的信息,如下图所示:

    前面中括号里的是这个文件的编号,后面会用到。包括工程中用到的库和Framework,都会在这里列出来。

    2.2.2段表

    接着是一个段表,描述各个段在最后编译成的可执行文件中的偏移位置及大小,包括了代码段(__TEXT,保存程序代码段编译后的机器码)和数据段(__DATA,保存变量值)

    首列是数据在文件的偏移位置,第二列是这一段占用大小,第三列是段类型,代码段和数据段,第四列是段名称。

    每一行的数据都紧跟在上一行后面,如第二行__stubs的地址0x1000099AC就是第一行__text的地址0x1000051B4加上大小0x000047F8,整个可执行文件大致数据分布就是这样。

    这里可以清楚看到各种类型的数据在最终可执行文件里占的比例,例如__text表示编译后的程序执行语句,__data表示已初始化的全局变量和局部静态变量,__bss表示未初始化的全局变量和局部静态变量,__cstring表示代码里的字符串常量,等等。

    2.2.3符号表(Symbols)

    Symbols 是对 Sections 进行了再划分,这里会描述所有的 methods、ivar 和字符串,以及它们对应的地址、大小、文件编号信息。

    同样首列是数据在文件的偏移地址,第二列是占用大小,第三列是所属文件序号,对应2.2.1中的文件编号,最后是名字。

    例如第70行代表了文件序号为3(反查上面就是GofObject.o)的gofName方法占用了48byte大小。

    计算某个.o文件在最终安装包中占用的大小,主要是解析目标文件和符号表两个部分,从目标文件读取出每个.o文件名和对应的序号,然后对Symbols中序号相同的文件的Size字段相加,即可得到每个.o文件在最终包的大小。

    2.3编译过程

    在上面两节中,我们初步接触了可执行文件的内容,本节我们来分析一下编译过程,以便更深入的熟悉可执行文件。 

    2.3.1编译器

    Xcode 的默认编译器Clang,Clang 的功能是首先对 Objective-C 代码做分析检查,然后将其转换为低级的类汇编代码:LLVM Intermediate Representation(LLVM 中间表达码)。接着 LLVM 会执行相关指令将 LLVM IR 编译成目标平台上的本地字节码,这个过程的完成方式可以是即时编译 (Just-in-time),或在编译的时候完成。

    LLVM是一个模块化和可重用的编译器和工具链技术的集合,Clang 是 LLVM 的子项目,是 C、C++ 和 Objective-C 编译器,目的是提供惊人的快速编译,比 GCC 快3倍,其中的 clang static analyzer 主要是进行语法分析、语义分析和生成中间代码,当然这个过程会对代码进行检查,出错的和需要警告的会标注出来。LLVM 核心库提供一个优化器,对流行的 CPU 做代码生成支持。lld 是 Clang / LLVM 的内置链接器,clang 必须调用链接器来产生可执行文件。

    LLVM 的优点主要得益于它的三层式架构。 第一层支持多种语言作为输入(例如 C, ObjectiveC, C++ 和 Haskell),第二层是一个共享式的优化器(对 LLVM IR 做优化处理),第三层是许多不同的目标平台(例如 Intel, ARM 和 PowerPC)。在这三层式的架构中,如果想要添加一门语言到 LLVM 中,那么可以把重要精力集中到第一层上,如果想要增加另外一个目标平台,那么没必要过多的考虑输入语言。 

    目前LLVM包含的主要子项目包括:

    • LLVM Core:包含一个现在的源代码/目标设备无关的优化器,一集一个针对很多主流(甚至于一些非主流)的CPU的汇编代码生成支持。
    • Clang:一个C/C++/Objective-C编译器,致力于提供令人惊讶的快速编译,极其有用的错误和警告信息,提供一个可用于构建很棒的源代码级别的工具.
    • dragonegg:gcc插件,可将GCC的优化和代码生成器替换为LLVM的相应工具。
    • LLDB:基于LLVM提供的库和Clang构建的优秀的本地调试器。
    • libc++、libc++ ABI: 符合标准的,高性能的C++标准库实现,以及对C++11的完整支持。
    • compiler-rt:针对__fixunsdfdi和其他目标机器上没有一个核心IR(intermediate representation)对应的短原生指令序列时,提供高度调优过的底层代码生成支持。
    • OpenMP: Clang中对多平台并行编程的runtime支持。
    • vmkit:基于LLVM的Java和.NET虚拟机实
    • polly: 支持高级别的循环和数据本地化优化支持的LLVM框架。
    • libclc: OpenCL标准库的实现
    • klee: 基于LLVM编译基础设施的符号化虚拟机
    • SAFECode:内存安全的C/C++编译器
    • lld: clang/llvm内置的链接器

    【说明】:从功能的角度来说,微观的LLVM可以认为是一个编译器的后端,而Clang是一个编译器的前端。关于Clang和LLVM的关系,可以看一下这篇文章

    从一个简单的例子开始:

    #include <stdio.h>
    
    #define YEAR 2017
    int main(int argc, const char * argv[]) {
        printf("Hello, %d!
    ", YEAR);
        return 0;
    }

    在编译一个源文件时,编译器的处理过程分为几个阶段。要想查看编译 main.m 源文件需要几个不同的阶段,我们可以让通过 clang 命令观察:

    clang -ccc-print-phases main.m

    结果如下:

    0: input, "main.m", objective-c
    1: preprocessor, {0}, objective-c-cpp-output
    2: compiler, {1}, ir
    3: backend, {2}, assembler
    4: assembler, {3}, object
    5: linker, {4}, image
    6: bind-arch, "x86_64", {5}, image

    从结果可以看到,从源文件到可执行文件,经过了这么几个过程:预处理、编译、汇编、链接,最终生成可执行文件。

    当程序执行时,操作系统将可执行文件拷贝到内存中。那么我们的程序最终是怎么执行的呢?程序的执行是在进程中进行的,程序转化为进程大致分为这么几个步骤:

    • 1.内核将程序读入内存,为程序镜像分配内存空间。程序镜像的内存布局分为如下部分(可通过size指令查看代码段、数据段、BSS段的大小以及这3个段大小之和的十进制和十六进制表示):
      • 代码段:即机器码,只读,可共享(多个进程共享代码段);
      • 数据段:储存已被初始化了的静态数据;
      • BSS段(未初始化的数据段):储存未始化的静态数据;
      • 堆:储存动态分配的内存;
      • 栈:储存函数调用的上下文,动态数据。
    • 2.内核为该进程分配进程标志符(PID)。
    • 3.内核为该进程保存PID及相应的进程状态信息。

    经过上面几个步骤,操作系统向内核数据结构中添加了适当的信息,并为运行程序代码分配了必要的资源之后,程序就变成了进程。下面我们来分析编译的几个阶段。

    2.3.2预处理

    执行指令,我们看一下预处理阶段都做了哪些事情:

    clang -fmodules -E main.m | open -f

    【说明】:目前预处理中引入了模块 - modules功能,这使预处理变得更加的高级。

     通过上面的指令,我们看一下输出的结果:

    # 1 "main.m"
    # 1 "<built-in>" 1
    # 1 "<built-in>" 3
    # 342 "<built-in>" 3
    # 1 "<command line>" 1
    # 1 "<built-in>" 2
    # 1 "main.m" 2
    
    
    @import Darwin.C.stdio; /* clang -E: implicit import for "/usr/include/stdio.h" */
    
    int main() {
        printf("Hello, %d!
    ", 2017);
    
        return 0;
    }

    从结果可以看到,预处理阶段,会进行宏的替换,头文件的导入,以及类似#if的处理。

    在Xcode中,可以通过这样的方式查看任意文件的预处理结果:Product -> Perform Action -> Preprocess。如下图所示:

    在预处理完成之后,会进行词法分析,这里会把代码切成一个个 Token,比如大小括号,等于号还有字符串等。我们可以通过指令看一下词法分析:

    clang -fmodules -fsyntax-only -Xclang -dump-tokens main.m

    输出结果如下:

    annot_module_include '#include <stdio.h>
    
    #define YEAR 2017
    int main() {
        printf("Hello, %d!
    ", YEAR);
    //    NSLog(@"hello, %@", @"world");
        return 0;
    }
    '        Loc=<main.m:9:1>
    int 'int'     [StartOfLine]    Loc=<main.m:12:1>
    identifier 'main'     [LeadingSpace]    Loc=<main.m:12:5>
    l_paren '('        Loc=<main.m:12:9>
    r_paren ')'        Loc=<main.m:12:10>
    l_brace '{'     [LeadingSpace]    Loc=<main.m:12:12>
    identifier 'printf'     [StartOfLine] [LeadingSpace]    Loc=<main.m:13:5>
    l_paren '('        Loc=<main.m:13:11>
    string_literal '"Hello, %d!
    "'        Loc=<main.m:13:12>
    comma ','        Loc=<main.m:13:26>
    numeric_constant '2017'     [LeadingSpace]    Loc=<main.m:13:28 <Spelling=main.m:11:14>>
    r_paren ')'        Loc=<main.m:13:32>
    semi ';'        Loc=<main.m:13:33>
    return 'return'     [StartOfLine] [LeadingSpace]    Loc=<main.m:15:5>
    numeric_constant '0'     [LeadingSpace]    Loc=<main.m:15:12>
    semi ';'        Loc=<main.m:15:13>
    r_brace '}'     [StartOfLine]    Loc=<main.m:16:1>
    eof ''        Loc=<main.m:16:2>

    然后进行语法分析,验证语法是否正确,然后将所有节点组成抽象语法树 AST:

    clang -fmodules -fsyntax-only -Xclang -ast-dump main.m

    结果如下:

    TranslationUnitDecl 0x7fbdb7020cd0 <<invalid sloc>> <invalid sloc>
    |-TypedefDecl 0x7fbdb7021218 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128'
    | `-BuiltinType 0x7fbdb7020f40 '__int128'
    |-TypedefDecl 0x7fbdb7021278 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128'
    | `-BuiltinType 0x7fbdb7020f60 'unsigned __int128'
    |-TypedefDecl 0x7fbdb7021308 <<invalid sloc>> <invalid sloc> implicit SEL 'SEL *'
    | `-PointerType 0x7fbdb70212d0 'SEL *'
    |   `-BuiltinType 0x7fbdb7021180 'SEL'
    |-TypedefDecl 0x7fbdb70213e8 <<invalid sloc>> <invalid sloc> implicit id 'id'
    | `-ObjCObjectPointerType 0x7fbdb7021390 'id'
    |   `-ObjCObjectType 0x7fbdb7021360 'id'
    |-TypedefDecl 0x7fbdb70214c8 <<invalid sloc>> <invalid sloc> implicit Class 'Class'
    | `-ObjCObjectPointerType 0x7fbdb7021470 'Class'
    |   `-ObjCObjectType 0x7fbdb7021440 'Class'
    |-ObjCInterfaceDecl 0x7fbdb7021518 <<invalid sloc>> <invalid sloc> implicit Protocol
    |-TypedefDecl 0x7fbdb7021878 <<invalid sloc>> <invalid sloc> implicit __NSConstantString 'struct __NSConstantString_tag'
    | `-RecordType 0x7fbdb7021680 'struct __NSConstantString_tag'
    |   `-Record 0x7fbdb70215e0 '__NSConstantString_tag'
    |-TypedefDecl 0x7fbdb7021908 <<invalid sloc>> <invalid sloc> implicit __builtin_ms_va_list 'char *'
    | `-PointerType 0x7fbdb70218d0 'char *'
    |   `-BuiltinType 0x7fbdb7020d60 'char'
    |-TypedefDecl 0x7fbdb78049e8 <<invalid sloc>> <invalid sloc> implicit __builtin_va_list 'struct __va_list_tag [1]'
    | `-ConstantArrayType 0x7fbdb7804990 'struct __va_list_tag [1]' 1
    |   `-RecordType 0x7fbdb7804800 'struct __va_list_tag'
    |     `-Record 0x7fbdb7021958 '__va_list_tag'
    |-ImportDecl 0x7fbdb7805230 <main.m:9:1> col:1 implicit Darwin.C.stdio
    |-FunctionDecl 0x7fbdb78052b8 <line:12:1, line:16:1> line:12:5 main 'int ()'
    | `-CompoundStmt 0x7fbdb8861140 <col:12, line:16:1>
    |   |-CallExpr 0x7fbdb88610a0 <line:13:5, col:32> 'int'
    |   | |-ImplicitCastExpr 0x7fbdb8861088 <col:5> 'int (*)(const char *, ...)' <FunctionToPointerDecay>
    |   | | `-DeclRefExpr 0x7fbdb7805798 <col:5> 'int (const char *, ...)' Function 0x7fbdb78053c0 'printf' 'int (const char *, ...)'
    |   | |-ImplicitCastExpr 0x7fbdb88610f0 <col:12> 'const char *' <BitCast>
    |   | | `-ImplicitCastExpr 0x7fbdb88610d8 <col:12> 'char *' <ArrayToPointerDecay>
    |   | |   `-StringLiteral 0x7fbdb8861000 <col:12> 'char [12]' lvalue "Hello, %d!
    "
    |   | `-IntegerLiteral 0x7fbdb8861038 <line:11:14> 'int' 2017
    |   `-ReturnStmt 0x7fbdb8861128 <line:15:5, col:12>
    |     `-IntegerLiteral 0x7fbdb8861108 <col:12> 'int' 0
    `-<undeserialized declarations>

    2.3.3编译

    我们可以用下面的命令让 clang 输出汇编代码:

    clang -S -o - main.m | open -f

    结果如下:

        //.section 指令指定接下来会执行哪一个段
        .section    __TEXT,__text,regular,pure_instructions
        .macosx_version_min 10, 12
        //.globl 指令说明 _main 是一个外部符号。这就是我们的 main() 函数。这个函数对于二进制文件外部来说是可见的,因为系统要调用它来运行可执行文件。
        .globl    _main
        //.align 指令指出了后面代码的对齐方式。在我们的代码中,后面的代码会按照 16(2^4) 字节对齐,如果需要的话,用 0x90 补齐。
        .p2align    4, 0x90
    //main 函数的头部:
    //_main 函数真正开始的地址。这个符号会被 export。二进制文件会有这个位置的一个引用。    
    _main:                                  ## @main
        //.cfi_startproc 指令通常用于函数的开始处。CFI 是调用帧信息 (Call Frame Information) 的缩写。这个调用 帧 以松散的方式对应着一个函数。当开发者使用 debugger 和 step in 或 step out 时,实际上是 stepping in/out 一个调用帧。在 C 代码中,函数有自己的调用帧,当然,别的一些东西也会有类似的调用帧。.cfi_startproc 指令给了函数一个 .eh_frame 入口,这个入口包含了一些调用栈的信息(抛出异常时也是用其来展开调用帧堆栈的)。这个指令也会发送一些和具体平台相关的指令给 CFI。它与后面的 .cfi_endproc 相匹配,以此标记出 main() 函数结束的地方。
        .cfi_startproc
    ## BB#0:
        //ABI ( 应用二进制接口 application binary interface) 指定了函数调用是如何在汇编代码层面上工作的。在函数调用期间,ABI 会让 rbp 寄存器 (基础指针寄存器 base pointer register) 被保护起来。当函数调用返回时,确保 rbp 寄存器的值跟之前一样,这是属于 main 函数的职责。pushq %rbp 将 rbp 的值 push 到栈中,以便我们以后将其 pop 出来。
        pushq    %rbp
    Ltmp0:
        //和.cfi_offset %rbp, -16一起,会输出一些关于生成调用堆栈展开和调试的信息。我们改变了堆栈和基础指针,而这两个指令可以告诉编译器它们都在哪儿,或者更确切的,它们可以确保之后调试器要使用这些信息时,能找到对应的东西。
        .cfi_def_cfa_offset 16
    Ltmp1:
        .cfi_offset %rbp, -16
        //把局部变量放置到栈上
        movq    %rsp, %rbp
    Ltmp2:
        .cfi_def_cfa_register %rbp
        //将栈指针移动 16 个字节,也就是函数会调用的位置
        subq    $16, %rsp
        //leaq 会将 L_.str 的指针加载到 rdi 寄存器中。
        leaq    L_.str(%rip), %rdi
        movl    $2017, %esi             ## imm = 0x7E1
        movl    $0, -4(%rbp)
        //把使用来存储参数的寄存器数量存储在寄存器 al 中
        movb    $0, %al
        //调用 printf() 函数
        callq    _printf
        //下面的代码将 ecx 寄存器设置为 0,并把 eax 寄存器的值保存至栈中,然后将 ect 中的 0 拷贝至 eax 中。ABI 规定 eax 将用来保存一个函数的返回值
        xorl    %esi, %esi
        movl    %eax, -8(%rbp)          ## 4-byte Spill
        movl    %esi, %eax
        //把堆栈指针 rsp 上移 32 字节
        addq    $16, %rsp
        //把之前存储至 rbp 中的值从栈中弹出来
        popq    %rbp
        //返回调用者, ret 会读取出栈的返回地址
        retq
        .cfi_endproc
    
        //.section 指令指出下面将要进入的段
        .section    __TEXT,__cstring,cstring_literals
    //L_.str 标记运行在实际的代码中获取到字符串的一个指针
    L_.str:                                 ## @.str
        //.asciz 指令告诉编译器输出一个以 ‘’ (null) 结尾的字符串。
        .asciz    "Hello, %d!
    "
    
        .section    __DATA,__objc_imageinfo,regular,no_dead_strip
    L_OBJC_IMAGE_INFO:
        .long    0
        .long    64
    
    //.subsections_via_symbols 指令是静态链接编辑器使用的
    .subsections_via_symbols

    关于汇编指令的资料,可以在 苹果的 OS X Assembler Reference 中进行查看和学习。

    在Xcode中,可以通过这样的方式查看任意文件的汇编输出结果:Product -> Perform Action -> Assemble。如下图所示:

    2.3.4汇编器

     汇编器将可读的汇编代码转换为机器代码。它会创建一个目标对象文件,一般简称为 对象文件。这些文件以 .o 结尾。如果用 Xcode 构建应用程序,可以在工程的 derived data 目录中,Objects-normal 文件夹下找到这些文件。

    我们也可以通过如下指令来生成:

    clang -fmodules -c main.m -o main.o

    2.3.5链接器

    链接器解决了目标文件和库之间的链接。 如上面的汇编代码:

    callq    _printf

    printf() 是 libc 库中的一个函数。无论怎样,最后的可执行文件需要能需要知道 printf() 在内存中的具体位置:例如,_printf 的地址符号是什么。链接器会读取所有的目标文件 (此处只有一个) 和库 (此处是 libc),并解决所有未知符号 (此处是 _printf) 的问题。然后将它们编码进最后的可执行文件中 (可以在 libc 中找到符号 _printf),接着链接器会输出可以运行的执行文件。

    这里我们讲一个复杂点的可执行文件。

    //main.m
    #import "GofClass.h"
    
    int main() {
        GofClass *gofClass = [[GofClass alloc] init];
        [gofClass doSomethingWithName:@"写代码"];
        return 0;
    }
    
    //GofClass.h
    #import <Foundation/Foundation.h>
    
    @interface GofClass : NSObject
    
    /**
     做某项事情
    
     @param workName 事情名称
     */
    - (void)doSomethingWithName:(NSString *)workName;
    
    @end
    
    //GofClass.m
    #import "GofClass.h"
    
    @implementation GofClass
    
    - (void)doSomethingWithName:(NSString *)workName {
        NSLog(@"开始%@", workName);
    }
    
    @end

    通过如下指令来分别生成各个类的目标文件,并最终生成可执行文件:

    clang -fmodules -c main.m -o main.o
    clang -fmodules -c GofClass.m -o GofClass.o
    //生成可执行文件
    clang main.o GofClass.o -o GofMachOFile

    可执行文件和目标文件都有一个符号表,这个符号表规定了它们的符号。如果我们用 nm(1) 工具观察一下 main.o 目标文件,可以看到如下内容:

    //指令
    xcrun nm -nm main.o
    
    //结果
                     (undefined) external _OBJC_CLASS_$_GofClass
                     (undefined) external ___CFConstantStringClassReference
                     (undefined) external _objc_msgSend
    0000000000000000 (__TEXT,__text) external _main
    00000000000000b0 (__TEXT,__ustring) non-external l_.str

    external _OBJC_CLASS_$_GofClass是GofClass Objective-C 类的符号。该符号是 undefined, external 。External 的意思是指对于这个目标文件该类并不是私有的,相反,non-external 的符号则表示对于目标文件是私有的。我们的 helloworld.o 目标文件引用了类 Foo,不过这并没有实现它。因此符号表中将其标示为 undefined。

    同样的我们也看一下GofClass.o:

    //指令
    xcrun nm -nm GofClass.o
    
    //结果
                     (undefined) external _NSLog
                     (undefined) external _OBJC_CLASS_$_NSObject
                     (undefined) external _OBJC_METACLASS_$_NSObject
                     (undefined) external ___CFConstantStringClassReference
                     (undefined) external __objc_empty_cache
    0000000000000000 (__TEXT,__text) non-external -[GofClass doSomethingWithName:]
    0000000000000030 (__TEXT,__ustring) non-external l_.str
    0000000000000070 (__DATA,__objc_const) non-external l_OBJC_METACLASS_RO_$_GofClass
    00000000000000b8 (__DATA,__objc_const) non-external l_OBJC_$_INSTANCE_METHODS_GofClass
    00000000000000d8 (__DATA,__objc_const) non-external l_OBJC_CLASS_RO_$_GofClass
    0000000000000120 (__DATA,__objc_data) external _OBJC_METACLASS_$_GofClass
    0000000000000148 (__DATA,__objc_data) external _OBJC_CLASS_$_GofClass

    接下来我们看一下可执行文件:

    //指令
    xcrun nm -nm GofMachOFile
    
    //结果
                     (undefined) external _NSLog (from Foundation)
                     (undefined) external _OBJC_CLASS_$_NSObject (from CoreFoundation)
                     (undefined) external _OBJC_METACLASS_$_NSObject (from CoreFoundation)
                     (undefined) external ___CFConstantStringClassReference (from CoreFoundation)
                     (undefined) external __objc_empty_cache (from libobjc)
                     (undefined) external _objc_msgSend (from libobjc)
                     (undefined) external dyld_stub_binder (from libSystem)
    0000000100000000 (__TEXT,__text) [referenced dynamically] external __mh_execute_header
    0000000100000ea0 (__TEXT,__text) external _main
    0000000100000f10 (__TEXT,__text) non-external -[GofClass doSomethingWithName:]
    0000000100001140 (__DATA,__objc_data) external _OBJC_METACLASS_$_GofClass
    0000000100001168 (__DATA,__objc_data) external _OBJC_CLASS_$_GofClass

    可以看到所有的 Foundation 和 Objective-C 运行时符号依旧是 undefined,不过现在的符号表中已经多了如何解析它们的信息,例如在哪个动态库中可以找到对应的符号。

    在运行时,动态链接器 dyld也可以解析这些 undefined 符号,并指向它们在 Foundation 中的实现等。

    当构建一个程序时,将会链接各种各样的库。它们又会依赖其他一些 framework 和 动态库。需要加载的动态库会非常多。而对于相互依赖的符号就更多了。可能将会有上千个符号需要解析处理,这将花费很长的时间:一般是好几秒钟。

    为了缩短这个处理过程所花费时间,在 OS X 和 iOS 上的动态链接器使用了共享缓存,共享缓存存于 /var/db/dyld/。对于每一种架构,操作系统都有一个单独的文件,文件中包含了绝大多数的动态库,这些库都已经链接为一个文件,并且已经处理好了它们之间的符号关系。当加载一个 Mach-O 文件 (一个可执行文件或者一个库) 时,动态链接器首先会检查 共享缓存 看看是否存在其中,如果存在,那么就直接从共享缓存中拿出来使用。每一个进程都把这个共享缓存映射到了自己的地址空间中。这个方法大大优化了 OS X 和 iOS 上程序的启动时间。

    2.4可执行文件的瘦身

    上面介绍了可执行文件的结构以及整个编译过程,介绍这些内容是为了对可执行文件以及它的来历有一个了解,下面我们分析一下对可执行文件的瘦身都有哪些方法。

    我们知道,可执行文件是由我们编写的代码产生的。通过脚本分析前面说的LinkMap文件,我们可以更加清晰的知道具体的某个类在可执行文件中的大小。

    #!usr/bin/python
    ## -*- coding: UTF-8 -*-
    #
    #使用简介:python linkmap.py XXX-LinkMap-normal-xxxarch.txt 或者 python linkmap.py XXX-LinkMap-normal-xxxarch.txt | open -f
    #使用参数-g会统计每个模块.o的统计大小
    #
    __author__ = "zmjios"
    __date__ = "2017-05-05"
    
    import os
    import re
    import shutil
    import sys
    
    class SymbolModel:
        file = ""
        size = 0
    
    def verify_linkmapfile(args):
        if len(sys.argv) < 2:
            print("请输入linkMap文件")
            return False
    
        path = args[1]
    
        if not os.path.isfile(path):
            print("请输入文件")
            return False
    
        file = open(path)
        content    = file.read()
        file.close()
    
        #查找是否存在# Object files:
        if content.find("# Object files:") == -1:
            print("输入linkmap文件非法")
            return False
        #查找是否存在# Sections:
        if content.find("# Sections:") == -1:
            print("输入linkmap文件非法")
            return False
        #查找是否存在# Symbols:
        if content.find("# Symbols:") == -1:
            print("输入linkmap文件非法")
            return False
    
        return True 
    
    def symbolMapFromContent():
        symbolMap = {}
        reachFiles = False
        reachSections = False
        reachSymblos = False
        file = open(sys.argv[1])
        for line in file.readlines():
            if line.startswith("#"):
                if line.startswith("# Object files:"):
                    reachFiles = True
                if line.startswith("# Sections:"):
                    reachSections = True
                if line.startswith("# Symbols:"):
                    reachSymblos = True
            else:
                if reachFiles == True and reachSections == False and reachSymblos == False:
                    #查找 files 列表,找到所有.o文件
                    location = line.find("]")
                    if location != -1:
                        key = line[:location+1]
                        if  symbolMap.get(key) is not None:
                            continue
                        symbol = SymbolModel()
                        symbol.file = line[location + 1:]
                        symbolMap[key] = symbol
                elif reachFiles == True and reachSections == True and reachSymblos == True:
                    #'	'分割成三部分,分别对应的是Address,Size和 File  Name
                    symbolsArray = line.split('	')
                    if len(symbolsArray) == 3:
                        fileKeyAndName = symbolsArray[2]
                        #16进制转10进制
                        size = int(symbolsArray[1],16)
                        location = fileKeyAndName.find(']')
                        if location != -1:
                            key = fileKeyAndName[:location + 1]
                            symbol = symbolMap.get(key)
                            if symbol is not None:
                                symbol.size = symbol.size + size
        file.close()
    
        return symbolMap
    
    def sortSymbol(symbolList):
         return sorted(symbolList, key=lambda s: s.size,reverse = True)
    
    def buildResultWithSymbols(symbols):
        results = ["文件大小	文件名称
    "]
        totalSize = 0
        for symbol in symbols:
            results.append(calSymbol(symbol))
            totalSize += symbol.size
        results.append("总大小: %.2fM" % (totalSize/1024.0/1024.0))
        return results
    
    def buildCombinationResultWithSymbols(symbols):
        #统计不同模块大小
        results = ["库大小	库名称
    "]
        totalSize = 0
        combinationMap = {}
    
        for symbol in symbols:
            names = symbol.file.split('/')
            name = names[len(names) - 1].strip('
    ')
            location = name.find("(")
            if name.endswith(")") and location != -1:
                component = name[:location]
                combinationSymbol = combinationMap.get(component)
                if combinationSymbol is None:
                    combinationSymbol = SymbolModel()
                    combinationMap[component] = combinationSymbol
    
                combinationSymbol.file = component
                combinationSymbol.size = combinationSymbol.size + symbol.size
            else:
                #symbol可能来自app本身的目标文件或者系统的动态库
                combinationMap[symbol.file] = symbol
        sortedSymbols = sortSymbol(combinationMap.values())
    
        for symbol in sortedSymbols:
            results.append(calSymbol(symbol))
            totalSize += symbol.size
        results.append("总大小: %.2fM" % (totalSize/1024.0/1024.0))
    
        return results
    
    def calSymbol(symbol):
        size = ""
        if symbol.size / 1024.0 / 1024.0 > 1:
            size = "%.2fM" % (symbol.size / 1024.0 / 1024.0)
        else:
            size = "%.2fK" % (symbol.size / 1024.0)
        names = symbol.file.split('/')
        if len(names) > 0:
            size = "%s	%s" % (size,names[len(names) - 1])
        return size
    
    def analyzeLinkMap():
        if verify_linkmapfile(sys.argv) == True:
            print("**********正在开始解析*********")
            symbolDic = symbolMapFromContent()
            symbolList = sortSymbol(symbolDic.values())
            if len(sys.argv) >= 3 and sys.argv[2] == "-g":
                results = buildCombinationResultWithSymbols(symbolList)
            else:
                results = buildResultWithSymbols(symbolList)
            for result in results:
                print(result)
            print("***********解析结束***********")
    
    
    if __name__ == "__main__":
        analyzeLinkMap()

    执行脚本之后,输出结果示例如下:

    从结果看到,不仅是我们编写的类的大小可以统计出来,第三方的也可以。在实际工程中,我们可以对一些可执行文件中过大的第三方库,思考其存在的必要性,对于不需要存在或者有替换方案的,可以考虑替换或删除

    2.4.1清理无用代码--AppCode

    AppCode是一种智能的Objective-C集成开发环境,由专业的开发收费IDE的公司Jetbrains开发,具有这些特点:

    • 最好的代码助手:IDE深入的了解代码结构,编辑器能提供准确的代码实现选择。通过代码生成节省了不必要的输入,减少了日常任务。 
    • 可靠的代码重构:安全、准确和可靠的代码重构允许我们随时修改和提升代码质量。
    • 快速项目导航:通过类继承可以从方法导航到它的声明或使用处,或者直接从一个文件链接到另一个文件。支持即时跳转到项目中的任何文件、类、标号处,或者查看标号的实际使用者,并不仅仅是文本匹配那么简单。
    • 代码质量追踪:支持对Objective-C、C、C++、JavaScript、CSS、HTML、XML和Xpath等进行动态代码分析。AppCode能让您避免潜在的错误,提示您哪些代码可以改善。此外,它还集成了Clang Static Analyzer。
    • 强大的代码调试器:使用便携调试器中灵活的断点、窗口、框架视图和求值表达式调整您的应用或单元测试。
    • 无缝集成:AppCode完美地集成大部分流行的版本控制系统,如Git, Mercurial、Perforce等,还集成了Kiwi测试框架、Dash和成分文档工具以及很多问题追踪器,提供与Xcode100%的互操作性。

    在这里,我们可以用它的inspect code来扫描无用代码,包括无用的类、函数、宏定义、value、属性等,而safe delete功能使得删除一些由于runtime被调用到的代码时更加安全智能。扫描结果示例:

     

    【说明】:如果工程很大,这个扫描的时间可能会比较长。我们现在的工程中,大概有2700个类,扫描时间在一个半小时。

    2.4.2清理无用类

    实际上,在2.4.1的扫描结果中,包含无用类,但2.4.1的扫描时间会比较长,另外扫描出来的内容也较多。如果只是需要清理无用类的话,可以用如下脚本:

    #!/usr/bin/env python
    # 使用方法:python py文件 Xcode工程文件目录
    
    # -*- coding:UTF-8 -*-
    import sys
    import os
    import re
    
    if len(sys.argv) == 1:
        print '请在.py文件后面输入工程路径' 
        sys.exit()
    
    projectPath = sys.argv[1]
    print '工程路径为%s' % projectPath
    
    resourcefile = []
    totalClass = set([])
    unusedFile = []
    pbxprojFile = []
    
    def Getallfile(rootDir): 
        for lists in os.listdir(rootDir): 
            path = os.path.join(rootDir, lists) 
            if os.path.isdir(path): 
                Getallfile(path) 
            else:
                ex = os.path.splitext(path)[1]  
                if ex == '.m' or ex == '.mm' or ex == '.h':
                    resourcefile.append(path)
                elif ex == '.pbxproj':
                    pbxprojFile.append(path)
    
    Getallfile(projectPath)
    
    print '工程中所使用的类列表为:'
    for ff in resourcefile:
        print ff
    
    for e in pbxprojFile:
        f = open(e, 'r')
        content = f.read()
        array = re.findall(r's+([w,+]+.[h,m]{1,2})s+',content)
        see = set(array)
        totalClass = totalClass|see
        f.close()
    
    print '工程中所引用的.h与.m及.mm文件'
    for x in totalClass:
        print x
    print '--------------------------'
    
    for x in resourcefile:
        ex = os.path.splitext(x)[1]
        if ex == '.h': #.h头文件可以不用检查
            continue
        fileName = os.path.split(x)[1]
        print fileName
        if fileName not in totalClass:
            unusedFile.append(x)
    
    for x in unusedFile:
        resourcefile.remove(x)
    
    print '未引用到工程的文件列表为:'
    
    writeFile = []
    for unImport in unusedFile:
        ss = '未引用到工程的文件:%s
    ' % unImport
        writeFile.append(ss)
        print unImport
    
    unusedFile = []
    
    allClassDic = {}
    
    for x in resourcefile:
        f = open(x,'r')
        content = f.read()
        array = re.findall(r'@interfaces+([w,+]+)s+:',content)
        for xx in array:
            allClassDic[xx] = x
        f.close()
    
    print '所有类及其路径:'
    for x in allClassDic.keys():
        print x,':',allClassDic[x]
    
    def checkClass(path,className):
        f = open(path,'r')
        content = f.read()
        if os.path.splitext(path)[1] == '.h':
            match = re.search(r':s+(%s)s+' % className,content)
        else:
            match = re.search(r'(%s)s+w+' % className,content)
        f.close()
        if match:
            return True
    
    ivanyuan = 0
    totalIvanyuan = len(allClassDic.keys())
    
    for key in allClassDic.keys():
        path = allClassDic[key]
        
        index = resourcefile.index(path)
        count = len(resourcefile)
        
        used = False
        
        offset = 1
        ivanyuan += 1
        print '完成',ivanyuan,'共:',totalIvanyuan,'path:%s'%path
        
        
        while index+offset < count or index-offset > 0:
            if index+offset < count:
                subPath = resourcefile[index+offset]
                if checkClass(subPath,key):
                    used = True
                    break
            if index - offset > 0:
                subPath = resourcefile[index-offset]
                if checkClass(subPath,key):
                    used = True
                    break
            offset += 1
    
        if not used:
            str = '未使用的类:%s 文件路径:%s
    ' %(key,path)
            unusedFile.append(str)
            writeFile.append(str)
    
    for p in unusedFile:
        print '未使用的类:%s' % p
    
    filePath = os.path.split(projectPath)[0]
    writePath = '%s/未使用的类.txt' % filePath
    f = open(writePath,'w+')
    f.writelines(writeFile)
    f.close()

    同样的工程,这个脚本执行速度大概是三分钟,结果如下:

    2.4.3清理无用方法

    以往C++在链接时,没有被用到的类和方法是不会编进可执行文件里。但Objctive-C不同,由于它的动态性,它可以通过类名和方法名获取这个类和方法进行调用,所以编译器会把项目里所有OC源文件编进可执行文件里,哪怕该类和方法没有被使用到。

    结合LinkMap文件的__TEXT.__text,通过正则表达式([+|-][.+s(.+)]),我们可以提取当前可执行文件里所有objc类方法和实例方法(SelectorsAll)。再使用otool命令otool -v -s __DATA __objc_selrefs逆向__DATA.__objc_selrefs段,提取可执行文件里引用到的方法名(UsedSelectorsAll),我们可以大致分析出SelectorsAll里哪些方法是没有被引用的(SelectorsAll-UsedSelectorsAll)。

     2.4.4编译选项优化

    • Build Settings->Optimization Level:release版应该选择Fastest, Smalllest,这个选项会开启那些不增加代码大小的全部优化,并让可执行文件尽可能小。
    • Build Settings->Strip Debug Symbols During Copy: release版应该设置为YES,可以去除不必要的调试符号。
    • Build Settings->Symbols Hidden by Default:release版应该设置为YES,会把所有符号都定义成”private extern”。

    2.4.5其他项

    • 类/方法命名长度 :从LinkMap可以发现每个类和方法名都在__cstring段里都存了相应的字符串值,所以类和方法名的长短也是对可执行文件大小是有影响的,原因还是Objective-C的动态特性,因为需要通过类/方法名反射找到这个类/方法进行调用,Objective-C对象模型会把类名,方法名列表都保存下来。实际上这部分占用的长度比较小,中型项目也就几百K,可以忽略。
    • ARC->MRC:ARC代码会在某些情况多出一些retain和release的指令,例如调用一个方法,它返回的对象会被retain,退出作用域后会被release,MRC就不需要,汇编指令变多,机器码变多,可执行文件就变大了。ARC对可执行文件大小的影响几乎都是在代码段,通过实验,结论是ARC大概会使代码段增加10%的size,考虑代码段占可执行文件大约有80%,估计对整个可执行文件的影响会是8%。但考虑到它的可实施性,可以忽略。

    3.参考资料

  • 相关阅读:
    运动员排成绩————————对多个数组进行排序
    关于指针 用字符数组,字符指针变量输入字符串 动态为字符型指针变量分配内存
    axel 原来求中点我想复杂了 两个结果一样
    Bezier曲线绘制 B样条绘制
    最大的回文子串
    字符数组
    按位与、或、异或等运算方法
    uniapp mixin 使用
    vue mixin执行覆盖
    windows10 安装NASM
  • 原文地址:https://www.cnblogs.com/LeeGof/p/6803146.html
Copyright © 2011-2022 走看看