zoukankan      html  css  js  c++  java
  • OC 底层探索 09、objc_msgSend 流程 1-缓存查找

    本文对 Runtime 进行简单介绍 和对 objc_msgSend 的发消息流程中的缓存查找进行探索。

    更新(流程图概览):缓存查找流程图

    我们知道类结构中包含了很多信息:isa superclass cache bits,cache 中缓存了我们调用的方法,具体流程见OC底层探索07. 但是方法具体时间什么时候缓存的,需要继续探究。

    源码 objc_cache.mm 文件,Method cache locking 中,我们可以看到在写入之前还有一个读的过程

    --> objc_msgSend* / cache_getImp

    看到 objc_msgSend  就不免想到 runtime,我们先简单介绍下 runtime 是什么。

    一、Runtime 简介

    Runtime 是一个为我们OC语言开发中提供动态特性的一个

    官方文档: Objective-C Runtime 

        /Objective-C Runtime Programming Guide

    The Objective-C language defers as many decisions as it can from compile time and link time to runtime. Whenever possible, it does things dynamically. This means that the language requires not just a compiler, but also a runtime system to execute the compiled code. The runtime system acts as a kind of operating system for the Objective-C language; it’s what makes the language work.

    OC 语言将尽可能多的决策从编译时链接时延迟到运行时。只要有可能,它就动态地做事情。这意味着该语言不仅需要一个编译器,还需要一个运行时系统来执行编译后的代码。运行时系统作为Objective-C语言的一种操作系统;它使语言起作用。

    提取信息点:一个提供动态特性的库,实现运行时作用。

    1、Runtime 结构和调用方式:

    complier: 编译 --> runtime 底层所调用的并非我们写的代码,它进过了 complier 进行编译、优化。 --> LLVM

    tip:编译时、链接时,一句话简介 {

    编译时

      1、对我们的代码进行语法词法等分析,并给出waringerror等提示。类似一个扫描过程,将代码扫一遍;

      2、将编写的高级语言(C C++ OC等)编译成机器识别的机器语言(汇编、机器语言01等),编译得到相应的二进制目标文件

    编译时并没有进行加载分配内存等操作。

    链接时

      将编译得到的二进制文件和库函数等进行连接。  

    运行时

      代码已被装载到内存中,已运行起来了。

    } 

    2、探索

    通过clang 将 main.m 文件编译成 mian.cpp. mian函数编译结果如下:

     

    id objc_msgSend(id self, SEL _cmd, ...) :

      消息接受者 self;消息体 SEL. 通过查找 objc_msgSend() 源码,我们可以发现它是使用汇编实现的,这里暂时先不探究,继续当前操作。

    sel_registerName("helloObj1"):

      注册一个方法。例: 上层的操作 @selector()NSSelectorFromString() 都是 SEL 类型.

    直接使用 API - objc_msgSend() 进行方法调用

    对代码进行修改:

    报错如下:

    修改工程配置:Building Setting --> Preprocessing --> 将 objc_msgSend call 严格检查改为 NO.

     

    运行结果如下,通过 objc_msgSend() 正常调用了方法 'helloObj3':

     

    OC 方法调用 --> objc_msgSend() --> sel (方法编号) --> imp (函数指针地址) --> 函数.

    sel 如何找到 imp 呢? 

    二、objc_msgSend 流程探索 - cache

    从上面的操作,可知方法调用的本质是 发送消息,下面进行 发送消息流程的探究。

    全局查找 objc_msgSend(),是通过汇编实现的

    使用汇编的原因:

      1、快速,方法的查找操作是很频繁的,汇编是相对底层的语言更易被机器识别,节省中间的一些编译过程。

      2、语言的动态特性,C/C++ 来编写实现的话更偏向于静态,虽然也可实现会更麻烦且慢。

    下面我们通过源码 注释 和 网络 对消息查找流程进行探索。

    objc_msgSend 流程

    消息接收者 和 sel:

    消息接受者 --> 对象 --> isa --> 方法(类/元类) --> cache_t --> methodliss(bits中) 

    主要流程源码 CacheLookup:(汇编指令解读)

     1 .macro CacheLookup
     2     //
     3     // Restart protocol:
     4     //
     5     //   As soon as we're past the LLookupStart$1 label we may have loaded
     6     //   an invalid cache pointer or mask.
     7     //
     8     //   When task_restartable_ranges_synchronize() is called,
     9     //   (or when a signal hits us) before we're past LLookupEnd$1,
    10     //   then our PC will be reset to LLookupRecover$1 which forcefully
    11     //   jumps to the cache-miss codepath which have the following
    12     //   requirements:
    13     //
    14     //   GETIMP:
    15     //     The cache-miss is just returning NULL (setting x0 to 0)
    16     //
    17     //   NORMAL and LOOKUP:
    18     //   - x0 contains the receiver
    19     //   - x1 contains the selector
    20     //   - x16 contains the isa
    21     //   - other registers are set as per calling conventions
    22     //
    23 LLookupStart$1:
    24 
    25     // p1 = SEL, p16 = isa
    26     ldr    p11, [x16, #CACHE]       // p11 = mask|buckets
    27  
    28 #if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    29     // 真机 64 位
    30     and    p10, p11, #0x0000ffffffffffff    // p10 = buckets
    31     // p11, LSR #48: p11 >> 48 = mask --> p1 & mask 赋给 p12
    32     and    p12, p1, p11, LSR #48    // x12 = _cmd & mask
    33 #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    34     and    p10, p11, #~0xf          // p10 = buckets
    35     and    p11, p11, #0xf           // p11 = maskShift
    36     mov    p12, #0xffff
    37     lsr    p11, p12, p11            // p11 = mask = 0xffff >> p11
    38     and    p12, p1, p11             // x12 = _cmd & mask
    39 #else
    40 #error Unsupported cache mask storage for ARM64.
    41 #endif
    42 
    43     // x12 << 4 --> buckets 内存平移 得到查询的 bucket - p12
    44     add    p12, p10, p12, LSL #(1+PTRSHIFT)
    45                                // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT)) // PTRSHIFT=3
    46 
    47     ldp    p17, p9, [x12]        // {imp, sel} = *bucket
    48 1:    cmp    p9, p1               // if (bucket->sel != _cmd)
    49     b.ne    2f                  // scan more cmp不相等,跳到2
    50     CacheHit $0                  // call or return imp - cmp相等,找到了
    51     
    52 2:    // not hit: p12 = not-hit bucket
    53     CheckMiss $0              // miss if bucket->sel == 0
    54     cmp    p12, p10            // wrap if bucket == buckets 判断当前的bucket是不是第一个
    55     b.eq    3f                // 是第一个bucket 跳3
    56     ldp    p17, p9, [x12, #-BUCKET_SIZE]!    // {imp, sel} = *--bucket
    57     b    1b                    // loop 跳到下面的1
    58 
    59 3:    // wrap: p12 = first bucket, w11 = mask
    60 #if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    61     // 真机 64 位
    62     add    p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
    63                                  // p12 = buckets + (mask << 1+PTRSHIFT)
    64                                  // 将bucket手动置为buckets的最后一个
    65 
    66 #elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    67     add    p12, p12, p11, LSL #(1+PTRSHIFT)
    68                                  // p12 = buckets + (mask << 1+PTRSHIFT)
    69 #else
    70 #error Unsupported cache mask storage for ARM64.
    71 #endif
    72 
    73     // Clone scanning loop to miss instead of hang when cache is corrupt.
    74     // The slow path may detect any corruption and halt later.
    75 
    76     ldp    p17, p9, [x12]    // {imp, sel} = *bucket
    77 1:    cmp    p9, p1          // if (bucket->sel != _cmd) 判断sel和cmd是否相同
    78     b.ne    2f               // scan more 不同d跳到2
    79     CacheHit $0              // call or return imp
    80     
    81 2:    // not hit: p12 = not-hit bucket
    82     CheckMiss $0             // miss if bucket->sel == 0
    83     cmp    p12, p10          // wrap if bucket == buckets
    84     b.eq    3f             // 上一步cmp相同:bucket还是buckets的第一个,直接跳到 3 -> JumpMiss
    85     ldp    p17, p9, [x12, #-BUCKET_SIZE]!    // {imp, sel} = *--bucket
    86                            // 从后向前 --bucket 回到1 继续判断
    87     b    1b                // loop
    88 
    89 LLookupEnd$1:
    90 LLookupRecover$1:
    91 3:    // double wrap
    92     JumpMiss $0            // cache 中没找到方法
    93 
    94 .endmacro
  • 相关阅读:
    顺序容器的操作
    C++顺序容器
    Java8实战系列一
    Java枚举的小知识点
    Java集合框架入门介绍(一)
    测试代码格式
    Eclipse通过jdbc连接sqlserver2008数据库的两种方式
    排序算法之插入排序
    排序算法之冒泡排序
    容器扩容之分摊时间复杂度分析
  • 原文地址:https://www.cnblogs.com/zhangzhang-y/p/13704597.html
Copyright © 2011-2022 走看看