zoukankan html css js c++ java

第33篇-方法调用指令之invokeinterface

invokevirtual字节码指令的模板定义如下：

def(Bytecodes::_invokeinterface     , ubcp|disp|clvm|____, vtos, vtos, invokeinterface     , f1_byte      );

可以看到指令的生成函数为TemplateTable::invokeinterface()，在这个函数中首先会调用TemplateTable::prepare_invoke()函数，TemplateTable::prepare_invoke()函数生成的汇编代码如下：

第1部分：

0x00007fffe1022610: mov    %r13,-0x38(%rbp)
0x00007fffe1022614: movzwl 0x1(%r13),%edx
0x00007fffe1022619: mov    -0x28(%rbp),%rcx
0x00007fffe102261d: shl    $0x2,%edx
// 获取ConstantPoolCacheEntry[_indices,_f1,_f2,_flags]中的_indices
0x00007fffe1022620: mov    0x10(%rcx,%rdx,8),%ebx


// 获取ConstantPoolCacheEntry中indices[b2,b1,constant pool index]中的b1
// 如果已经连接，那这个b1应该等于185,也就是invokeinterface指令的操作码
0x00007fffe1022624: shr    $0x10,%ebx
0x00007fffe1022627: and    $0xff,%ebx
0x00007fffe102262d: cmp    $0xb9,%ebx
// 如果invokeinterface已经连接就跳转到----resolved----
0x00007fffe1022633: je     0x00007fffe10226d2

汇编代码的判断逻辑与invokevirutal一致，这里不在过多解释。

第2部分：

由于方法还没有解析，所以需要设置ConstantPoolCacheEntry中的信息，这样再一次调用时就不需要重新找调用相关的信息了。生成的汇编如下：

// 执行如下汇编代码时，表示invokeinterface指令还没有连接，也就是ConstantPoolCacheEntry中
// 还没有保存调用相关的信息
  
// 通过调用call_VM()函数生成如下汇编，通过这些汇编
// 调用InterpreterRuntime::resolve_invoke()函数
// 将bytecode存储到%ebx中
0x00007fffe1022639: mov    $0xb9,%ebx           
// 通过MacroAssembler::call_VM()来调用InterpreterRuntime::resolve_invoke()
0x00007fffe102263e: callq  0x00007fffe1022648   
0x00007fffe1022643: jmpq   0x00007fffe10226c6
0x00007fffe1022648: mov    %rbx,%rsi
0x00007fffe102264b: lea    0x8(%rsp),%rax
0x00007fffe1022650: mov    %r13,-0x38(%rbp)
0x00007fffe1022654: mov    %r15,%rdi
0x00007fffe1022657: mov    %rbp,0x200(%r15)
0x00007fffe102265e: mov    %rax,0x1f0(%r15)
0x00007fffe1022665: test   $0xf,%esp
0x00007fffe102266b: je     0x00007fffe1022683
0x00007fffe1022671: sub    $0x8,%rsp
0x00007fffe1022675: callq  0x00007ffff66ae13a
0x00007fffe102267a: add    $0x8,%rsp
0x00007fffe102267e: jmpq   0x00007fffe1022688
0x00007fffe1022683: callq  0x00007ffff66ae13a
0x00007fffe1022688: movabs $0x0,%r10
0x00007fffe1022692: mov    %r10,0x1f0(%r15)
0x00007fffe1022699: movabs $0x0,%r10
0x00007fffe10226a3: mov    %r10,0x200(%r15)
0x00007fffe10226aa: cmpq   $0x0,0x8(%r15)
0x00007fffe10226b2: je     0x00007fffe10226bd
0x00007fffe10226b8: jmpq   0x00007fffe1000420
0x00007fffe10226bd: mov    -0x38(%rbp),%r13
0x00007fffe10226c1: mov    -0x30(%rbp),%r14
0x00007fffe10226c5: retq   

// 结束MacroAssembler::call_VM()函数
// 将invokeinterface x中的x加载到%edx中
0x00007fffe10226c6: movzwl 0x1(%r13),%edx
// 将ConstantPoolCache的首地址存储到%rcx中
0x00007fffe10226cb: mov    -0x28(%rbp),%rcx
// %edx中存储的是ConstantPoolCacheEntry项的索引，转换为字节偏移，因为
// 一个ConstantPoolCacheEntry项占用4个字
0x00007fffe10226cf: shl    $0x2,%edx

与invokevirtual的实现类似，这里仍然在方法没有解释时调用InterpreterRuntime::resolve_invoke()函数进行方法解析，后面我们也详细介绍一下InterpreterRuntime::resolve_invoke()函数的实现。

在调用完resolve_invoke()函数后，会将调用相信的信息存储到CallInfo实例info中。所以在调用的InterpreterRuntime::resolve_invoke()函数的最后会有如下的实现：

switch (info.call_kind()) {
  case CallInfo::direct_call: // 直接调用
    cache_entry(thread)->set_direct_call(
          bytecode,
          info.resolved_method());
    break;
  case CallInfo::vtable_call: // vtable分派
    cache_entry(thread)->set_vtable_call(
          bytecode,
          info.resolved_method(),
          info.vtable_index());
    break;
  case CallInfo::itable_call: // itable分派
    cache_entry(thread)->set_itable_call(
          bytecode,
          info.resolved_method(),
          info.itable_index());
    break;
  default:  ShouldNotReachHere();
}

之前已经介绍过vtable分派，现在看一下itable分派。

当为itable分派时，会调用set_itable_call()函数设置ConstantPoolCacheEntry中的相关信息，这个函数的实现如下：

void ConstantPoolCacheEntry::set_itable_call(
 Bytecodes::Code   invoke_code,
 methodHandle      method,
 int               index
) {

  InstanceKlass* interf = method->method_holder();
  // interf一定是接口，method一定是非final方法
  set_f1(interf); // 对于itable，则_f1为InstanceKlass
  set_f2(index);
  set_method_flags(as_TosState(method->result_type()),
                   0,  // no option bits
                   method()->size_of_parameters());
  set_bytecode_1(Bytecodes::_invokeinterface);
}

ConstantPoolCacheEntry中存储的信息为：

bytecode存储到了_f2字段上，这样当这个字段有值时表示已经对此方法完成了解析；
_f1字段存储声明方法的接口类，也就是_f1是指向表示接口的Klass实例的指针；
_f2表示_f1接口类对应的方法表中的索引，如果是final方法，则存储指向Method实例的指针。

解析完成后ConstantPoolCacheEntry中的各个项如下图所示。

第3部分：

如果invokeinterface字节码指令已经解析，则直接跳转到resolved执行，否则调用resolve_invoke进行解析，解析完成后也会接着执行resolved处的逻辑，如下：

// **** resolved ****
// resolved的定义点，到这里说明invokeinterface字节码已经连接


// 执行完如上汇编后寄存器的值如下：
// %edx：ConstantPoolCacheEntry index
// %rcx：ConstantPoolCache

// 获取到ConstantPoolCacheEntry::_f1
// 在计算时，因为ConstantPoolCacheEntry在ConstantPoolCache
// 之后保存，所以ConstantPoolCache为0x10，而
// _f1还要偏移0x8，这样总偏移就是0x18
0x00007fffe10226d2: mov    0x18(%rcx,%rdx,8),%rax  
// 获取ConstantPoolCacheEntry::_f2属性
0x00007fffe10226d7: mov    0x20(%rcx,%rdx,8),%rbx
// 获取ConstantPoolCacheEntry::_flags属性
0x00007fffe10226dc: mov    0x28(%rcx,%rdx,8),%edx


// 执行如上汇编后寄存器的值如下：
// %rax：ConstantPoolCacheEntry::_f1
// %rbx：ConstantPoolCacheEntry::_f2
// %edx：ConstantPoolCacheEntry::_flags

// 将flags移动到ecx中
0x00007fffe10226e0: mov    %edx,%ecx
// 从ConstantPoolCacheEntry::_flags中获取参数大小
0x00007fffe10226e2: and    $0xff,%ecx  
// 让%rcx指向recv           
0x00007fffe10226e8: mov    -0x8(%rsp,%rcx,8),%rcx 
// 暂时用%r13d保存ConstantPoolCacheEntry::_flags属性
0x00007fffe10226ed: mov    %edx,%r13d  
// 从_flags的高4位保存的TosState中获取方法返回类型           
0x00007fffe10226f0: shr    $0x1c,%edx
// 将TemplateInterpreter::invoke_return_entry地址存储到%r10
0x00007fffe10226f3: movabs $0x7ffff73b63e0,%r10
// %rdx保存的是方法返回类型，计算返回地址
// 因为TemplateInterpreter::invoke_return_entry是数组，
// 所以要找到对应return type的入口地址
0x00007fffe10226fd: mov    (%r10,%rdx,8),%rdx
// 获取结果处理函数TemplateInterpreter::invoke_return_entry的地址并压入栈中
0x00007fffe1022701: push   %rdx                   

// 恢复ConstantPoolCacheEntry::_flags中%edx
0x00007fffe1022702: mov    %r13d,%edx   
// 还原bcp          
0x00007fffe1022705: mov    -0x38(%rbp),%r13

在TemplateTable::invokeinterface()函数中首先会调用prepare_invoke()函数，上面的汇编就是由这个函数生成的。调用完后各个寄存器的值如下：

rax: interface klass (from f1)
rbx: itable index (from f2)
rcx: receiver
rdx: flags

然后接着执行TemplateTable::invokeinterface()函数生成的汇编片段，如下：

第4部分：

// 将ConstantPoolCacheEntry::_flags的值存储到%r14d中
0x00007fffe1022709: mov    %edx,%r14d
// 检测一下_flags中是否含有is_forced_virtual_shift标识，如果有，
// 表示调用的是Object类中的方法，需要通过vtable进行动态分派
0x00007fffe102270c: and    $0x800000,%r14d
0x00007fffe1022713: je     0x00007fffe1022812  // 跳转到----notMethod----

// ConstantPoolCacheEntry::_flags存储到%eax
0x00007fffe1022719: mov    %edx,%eax
// 测试调用的方法是否为final
0x00007fffe102271b: and    $0x100000,%eax
0x00007fffe1022721: je     0x00007fffe1022755 // 如果为非final方法，则跳转到----notFinal----


// 下面汇编代码是对final方法的处理

// 对于final方法来说，rbx中存储的是Method*，也就是ConstantPoolCacheEntry::_f2指向Method*
// 跳转到Method::from_interpreted处执行即可
0x00007fffe1022727: cmp    (%rcx),%rax
// ... 省略统计相关的代码
// 设置调用者栈顶并存储
0x00007fffe102274e: mov    %r13,-0x10(%rbp)
// 跳转到Method::_from_interpreted_entry
0x00007fffe1022752: jmpq   *0x58(%rbx)   // 调用final方法


// **** notFinal ****

// 调用load_klass()函数生成如下2句汇编
// 查看recv这个oop对应的Klass，存储到%eax中
0x00007fffe1022755: mov    0x8(%rcx),%eax  
// 调用decode_klass_not_null()函数生成的汇编   
0x00007fffe1022758: shl    $0x3,%rax  

      
// 省略统计相关的代码

// 调用lookup_virtual_method()函数生成如下这一句汇编
0x00007fffe10227fe: mov    0x1b8(%rax,%rbx,8),%rbx

// 设置调用者栈顶并存储
0x00007fffe1022806: lea    0x8(%rsp),%r13
0x00007fffe102280b: mov    %r13,-0x10(%rbp)

// 跳转到Method::_from_interpreted_entry
0x00007fffe102280f: jmpq *0x58(%rbx)

如上汇编包含了对final和非final方法的分派逻辑。对于final方法来说，由于ConstantPoolCacheEntry::_f2中存储的就是指向被调用的Method实例，所以非常简单；对于非final方法来说，需要通过itable实现动态分派。分派的关键一个汇编语句如下：

mov    0x1b8(%rax,%rbx,8),%rbx

如上是vtable的动态分派逻辑，这个分派逻辑比较简单，之前也介绍过，这里不再介绍。

如果跳转到notMethod后，那就需要通过itable进行方法的动态分派了，我们看一下这部分的实现逻辑：

第5部分：

// **** notMethod ****

// 让%r14指向本地变量表
0x00007fffe1022812: mov    -0x30(%rbp),%r14  
// %rcx中存储的是receiver，%edx中保存的是Klass
0x00007fffe1022816: mov    0x8(%rcx),%edx  
// LogKlassAlignmentInBytes=0x03，进行对齐处理
0x00007fffe1022819: shl    $0x3,%rdx

// 如下代码是调用如下函数生成的：
__ lookup_interface_method(rdx, // inputs: rec. class
rax, // inputs: interface
rbx, // inputs: itable index
rbx, // outputs: method
r13, // outputs: scan temp. reg
no_such_interface);

 
// 获取vtable的起始地址　　
// %rdx中存储的是recv.Klass，获取Klass中vtable_length属性的值
0x00007fffe10228c1: mov    0x118(%rdx),%r13d  

// %rdx：recv.Klass，%r13为vtable_length，最后r13指向第一个itableOffsetEntry
// 加一个常量0x1b8是因为vtable之前是InstanceKlass
// 其中base=%rdx=recv_klass,index=%r13=scan_temp,scala=8=times_vte_scale,disp=0x1b8=vtable_base
0x00007fffe10228c8: lea    0x1b8(%rdx,%r13,8),%r13 
// 其中base=%rdx=recv_klass,index=%rbx=itable_index,scala=8=Address::times_ptr,disp=itentry_off
0x00007fffe10228d0: lea    (%rdx,%rbx,8),%rdx   

// 获取itableOffsetEntry::_interface并与%rax比较，%rax中存储的是要查找的接口
0x00007fffe10228d4: mov    0x0(%r13),%rbx
0x00007fffe10228d8: cmp    %rbx,%rax
// 如果相等，则直接跳转到---- found_method ----
0x00007fffe10228db: je     0x00007fffe10228f3

// **** search ****

// 检测%rbx中的值是否为NULL，如果为NULL，那就说明receiver没有实现要查询的接口
0x00007fffe10228dd: test   %rbx,%rbx
// 跳转到---- L_no_such_interface ----
0x00007fffe10228e0: je     0x00007fffe1022a8c

0x00007fffe10228e6: add    $0x10,%r13

0x00007fffe10228ea: mov    0x0(%r13),%rbx
0x00007fffe10228ee: cmp    %rbx,%rax
// 如果还是没有在itableOffsetEntry中找到接口类，
// 则跳转到search继续进行查找
0x00007fffe10228f1: jne    0x00007fffe10228dd // 跳转到---- search ----

// **** found_method ****

// 已经找到匹配接口的itableOffsetEntry，获取
// itableOffsetEntry的offset属性并存储到%r13d中
0x00007fffe10228f3: mov    0x8(%r13),%r13d
// 通过recv_klass进行偏移后找到此接口下声明的一系列方法的开始位置
0x00007fffe10228f7: mov    (%rdx,%r13,1),%rbx

我们需要重点关注itable的分派逻辑，首先生成了如下汇编：

mov    0x118(%rdx),%r13d

%rdx中存储的是recv.Klass，获取Klass中vtable_length属性的值，有了这个值，我们就可以计算出vtable的大小，从而计算出itable的开始地址。

接着执行了如下汇编：

lea    0x1b8(%rdx,%r13,8),%r13

其中的0x1b8表示的是recv.Klass首地址到vtable的距离，这样最终的%r13指向的是itable的首地址。如下图所示。

后面我们就可以开始循环从itableOffsetEntry中查找匹配的接口了，如果找到则跳转到found_method，在found_method中，要找到对应的itableOffsetEntry的offset，这个offset指明了接口中定义的方法的存储位置相对于Klass的偏移量，也就是找到接口对应的第一个itableMethodEntry，因为%rbx中已经存储了itable的索引，所以根据这个索引直接定位对应的itableMethodEntry即可，我们现在看如下的2个汇编语句：

lea    (%rdx,%rbx,8),%rdx 
...
mov    (%rdx,%r13,1),%rbx

当执行到如上的第2个汇编时，%r13存储的是相对于Klass实例的偏移，而%rdx在执行第1个汇编时存储的是Klass首地址，然后根据itable索引加上了相对于第1个itableMethodEntry的偏移，这样就找到了对应的itableMethodEntry。　　

第6部分：

在执行如下汇编时，各个寄存器的值如下：

rbx: Method* to call
rcx: receiver

生成的汇编代码如下：

0x00007fffe10228fb: test   %rbx,%rbx
// 如果本来应该存储Method*的%rbx是空，则表示没有找到
// 这个方法，跳转到---- no_such_method ----
0x00007fffe10228fe: je     0x00007fffe1022987 

// 保存调用者的栈顶指针
0x00007fffe1022904: lea    0x8(%rsp),%r13  
0x00007fffe1022909: mov    %r13,-0x10(%rbp)
// 跳转到Method::from_interpreted指向的例程并执行
0x00007fffe102290d: jmpq   *0x58(%rbx)  


// 省略should_not_reach_here()函数生成的汇编


// **** no_such_method ****
// 当没有找到方法时，会跳转到这里执行

// 弹出调用prepare_invoke()函数压入的返回地址
0x00007fffe1022987: pop    %rbx
// 恢复让%r13指向bcp
0x00007fffe1022988: mov    -0x38(%rbp),%r13
// 恢复让%r14指向本地变量表
0x00007fffe102298c: mov    -0x30(%rbp),%r14


// ... 省略通过call_VM()函数生成的汇编来调用InterpreterRuntime::throw_abstractMethodError()函数
// ... 省略调用should_not_reach_here()函数生成的汇编代码

// **** no_such_interface ****

// 当没有找到匹配的接口时执行的汇编代码
0x00007fffe1022a8c: pop    %rbx
0x00007fffe1022a8d: mov    -0x38(%rbp),%r13
0x00007fffe1022a91: mov    -0x30(%rbp),%r14

// ... 省略通过call_VM()函数生成的汇编代码来调用InterpreterRuntime::throw_IncompatibleClassChangeError()函数
// ... 省略调用should_not_reach_here()函数生成的汇编代码

对于一些异常的处理这里就不过多介绍了，有兴趣的可以看一下相关汇编代码的实现。