虚拟机的方法调用和字节码执行

一、运行时栈帧结构

栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构，它是虚拟机运行时数据区中的虚拟机栈的栈元素。栈帧存储了方法的局部变量表、操作数栈、动态链接和方法返回地址等信息。每一个方法从调用开始至执行完成的过程，都对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。

每一个栈帧都包括了局部变量表、操作数栈、动态链接、方法返回地址和一些额外的附加信息。在编译程序代码的时候，栈帧中需要 多大的局部变量表，多深的操作数栈 都已经完全确定了，并且写入到了方法表的 Code 属性中，因此一个栈帧需要分配多少内存，不会受到程序运行期变量数据的影响，而仅仅取决于具体的虚拟机实现。

一个线程中的方法调用链可能很长（如一个方法内调用了许多其他方法），很多方法都同时处于执行状态。对于执行引擎来说，在活动线程中，只有位于栈顶的栈帧才是有效的，称为 当前栈帧 ，与这个栈帧相关联的方法称为当前方法。执行引擎运行的所有字节码指令都只针对当前栈帧进行操作，在概念模型上，典型的栈帧结构如下所示。

栈帧的概念结构.png

接下来详细说明一下栈帧中的局部变量、操作数栈、动态链接、方法返回地址等各个部分的作用和数据结构。

局部变量表

局部变量表是一组变量值存储空间，用于存放 方法参数 和 方法内部定义的局部变量。在 Java 程序编译为 Class 文件时，就在方法的 Code 属性的 max_locals 数据项中确定了该方法所需要分配的局部变量表的最大容量。
局部变量表是以 变量槽（Variable Slot，下称Slot）为最小单位，每个 Slot 都应该能存放一个boolean、short、byte、char、int、float、reference 和 returnAddress 类型的数据，这 8 种数据类型，都可以使用 32 位或更小的物理内存来存放。
一个 Slot 可以存放一个 32 位以内的数据类型，Java 中占用 32 位以内的数据类型有 boolean、short、 byte、char、int、float、reference 和 returnAddress 8 种类型。前面 6 种不需要解释，而第 7 种 reference 类型表示一个对象实例的引用，虚拟机规范并对其特别说明，但虚拟机实现至少都应当能通过这个引用做到这两点：第一是从引用中直接或间接地查找到对象在 Java 堆中数据存放的起始地址索引；第二是此引用中直接或间接地查找到对象所属数据类型在方法区中的存储的类型信息，否则无法实现 Java 语言规范中定义的语法约束。第 8 种已经很少见了，它是为字节码指令 jsr、jsr_w 和 ret 服务的，指向了一条字节码指令的地址。
对于 64 位的数据类型，虚拟机会以高位对齐的方式为其分配两个连续的 Slot 空间，Java 语言中明确的 64 位数据类型只有 long 和double 两种。由于局部变量表建立在线程的堆栈上，是线程私有的数据，无论读写两个连续的 Slot 是否为原子操作，都不会引起数据安全问题。
在方法执行时，虚拟机是使用局部变量表完成参数值到参数变量列表的传递过程的，如果执行的是实例方法（即非静态方法），那局部变量表的第 0 个索引的 Slot 默认是用于传递方法所属对象实例的引用，在方法中可以通过关键字 “this” 来访问到这个隐含的参数。其余参数则按照参数表顺序排列，占用从 1 开始的局部变量 Slot，参数表分配完毕后，再根据方法体内部定义的变量顺序和作用域分配其余的 Slot。

操作数栈

操作数栈也常称为操作栈，它是一个先进后出的栈。
同局部变量表一样，操作数栈的最大深度也在编译的时候写入到 Code 属性的 max_stacks 数据项中。栈的最小深度为0，最大深度直到报栈溢出异常。
32 位数据类型所占的栈容量为 1，64 位数据类型所占的栈容量为 2。即 32 位的数据类型（boolean、short、 byte、char、int、float、reference 和 returnAddress）在栈中占 1 个空间，64 位数据类型（long、double）在栈中占 2 个空间。
当一个方法刚刚开始执行的时候，这个方法的操作数栈是空的，在方法的执行过程中，会有各种字节码指令往操作数栈中写入和提取内容，也就是进栈和出栈操作。
操作数栈中元素的数据类型必须与字节码指令的序列严格匹配，在编译程序代码的时候，编译期要严格保证这一点，在类校验阶段的数据流分析中还要再次验证这一点。

动态连接

每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有这个引用是为支持方法调用过程中的动态连接。Class 文件的常量池存在大量的符号引用，字节码中的方法调用指令就以常量池中指向方法的符号引用作为参数。
符号引用转换为直接引用可以分为 静态解析 和 动态连接。
静态解析：存在 Class 文件的常量池中的符号引用，这些符号引用一部分会在类加载或者第一次使用的时候就转化为直接引用，这种转化称为静态解析。如静态方法和私有方法，前者与类型直接关联，后者在外部不可被访问，这两种方法各自的特定决定了他们都不可能通过继承或别的方法重写其他版本，因此它们都适合在类加载阶段进行解析。
动态连接：另外一部分符号引用将在每一次运行期间转换为直接引用，这部分成功为动态连接。

方法返回地址
当一个方法开始执行后，只有两种方式可以退出这个方法。

正常完成出口：这种方式是执行引擎遇到任意一个方法返回的字节码指令，这时候可能会有返回值传递给上层的方法调用者，是否有返回值和返回值的类型将根据遇到何种方法返回指令来决定。
异常完成出口：这种退出方式是，在方法执行过程中遇到了异常，并且这个异常没有在方法体内得到处理，无论是 Java 虚拟机内部产生的异常，还是代码中使用 athrow 字节码指令产生的异常，只要在本方法的异常表中没有搜索到匹配的异常处理器，就会导致方法按退出。

二、方法调用

方法调用并不等同于方法执行，方法调用阶段唯一的任务就是确定被调用方法的版本（即调用哪一个方法），暂时还不涉及到方法内部的具体运行过程。在程序运行时，进行方法调用是最普遍、最频繁的操作，但是 Class 文件的编译过程中不包含传统编译中的连接步骤，一切方法调用在 Class 文件里面存储的都只是符号引用，而不是方法在实际运行时内存布局中的入口地址（直接引用）。这个特性给 Java 带来了更强大的动态扩展能力，但也使得 Java 方法调用过程变得相对复杂起来，需要在类加载期间，甚至到运行期间才能确定目标方法的直接引用。

解析调用

所有方法调用的目标方法在 Class 文件里面都是常量池中的符号引用，在类加载的解析阶段，会将其中一部分符号引用转化为直接引用，这种解析能成立的前提是：方法在程序真正运行之前就能有一个 可确定的版本，并且这个方法的调用版本 在运行期是不可改变的。换句话说，调用目标在程序代码写好、编译期进行编译时就必须确定下来。这类方法的调用称为解析（Resolution）。
符合“解析”的方法：在Java语言中符号“编译期可知，运行期不可变”这个要求的方法，主要包括 静态方法 和 私有方法 两大类，前者与类型直接关联，后者在外部不可被访问，这两种方法各自的特定决定了他们都不可能通过继承或别的方法重写其他版本，因此它们都适合在类加载阶段进行解析。

分派调用
众所周知，Java 是一门面向对象的程序语言，因为 Java 具备面向对象的 3 个基本特征：继承、封装和多态。分派调用过程将会揭示多态性特征的一些最基本的体现，如“重载”和“重写” 在Java虚拟机之中是如何实现的。分派调用可以分为 “静态分派” 和 “动态分派”。

静态分派：所有依赖静态类型（方法的参数类型）来定位方法执行版本的分派动作称为静态分派。静态分派的典型应用是方法的重载。静态分派发生在编译阶段，因此确定静态分派的动作实际上不是由虚拟机来执行的。
动态分派：
在运行期根据实际类型确定方法执行版本的分派过程称为动态动态。动态分派的典型应用是方法的重写。动态分派是通过字节码 invokevirtual 指令进行多态查找的过程的，而 invokevirtual 字节码指令的作用是调用实例方法（这里指的是可被重写的实例方法），invokevirtual 指令的运行时解析过程大致分为以下几个步骤：
1）、找到操作数栈顶的第一个元素所指向的对象的实际类型，记作 C。
2）、如果在类型 C 中找到与常量中的描述符和简单名称都相符的方法，则进行访问权限校验，如果通过则返回这个方法的直接引用，查找结束；如果不通过，则返回 java.lang.IllegalAccessError 异常。
3）、否则，按照继承关系从下往上依次对 C 的各个父类进行第 2 步的搜索和验证过程。
4）、如果始终没有找到合适的方法，则抛出 Java.lang.AbstractMethodError 异常。

三、方法的执行

上面我们了解了虚拟机是如何调用方法的，这里我们来探讨一下虚拟机是如何执行方法中的字节码指令的。许多 Java 虚拟机的执行引擎在执行 Java 代码的时候都有解析执行（通过解析器执行）和编译执行（通过即时编译器产生本地代码执行）两种选择（即许多主流的商用虚拟机都同时包含解析器与编译器），这里主要说明一下解析执行。

1、基于栈的指令集和基于寄存器的指令集
Java 编译器输出的指令流，基本上是一种 基于栈的指令集架构，指令流中的指令大部分都是零地址指令，它们依赖操作数栈进行工作，与之相对的另一套常用的指令集架构是 基于寄存器的指令集，最典型的就是 x86 的二地址指令集，换句话说，就是现在我们主流 PC 机中直接支持的指令集架构，这些指令依赖寄存器进行工作。那么栈的指令集与基于寄存器的指令集这两者之间有什么不同呢？
举个例子，分别使用两种指令集计算 “1 + 1” 的结果，基于栈的指令集回事这样的：

iconst_1
iconst_1
iadd
istore_0

两条 iconst_1 指令连续把两个常量 1 压入操作数栈中，iadd 指令把栈顶的两个值出栈、相加，然后把结果放回栈顶，最后 istore_0 把栈顶的值放到局部变量表的第 0 个 Slot（变量槽）中。
如果基于寄存器，那程序可能会是这个样子：

mov eax, 1
add eax, 1

mov 指令把 EAX 寄存器的值设为 1，然后 add 指令再把这个值加 1，最后结果再保存到 EAX 寄存器中。
基于栈的指令集和基于寄存器的指令集比较：

基于栈的指令集的主要优点是可移植，而寄存器由硬件直接提供，程序直接依赖这些硬件寄存器则不可避免的要收到硬件的约束。
基于栈的指令集还有一些优点，如代码更加紧凑、编译器实现更加简单等。
栈结构指令集的主要缺点是执行速度相对来说会稍慢一点，因为实现相同的功能，需要的指令数量一般会比寄存器指令集多，因出栈、入栈操作本身就产生了相当多的指令数量。

2、基于栈的解析器执行过程
这里通过一个例子来说明一下，代码如下所示。

这里主要说明执行 calc() 方法的字节码指令，我们使用 javap -verbose MethodExecutor 命令查看它的 Class 文件的字节码指令如下所示。

javap 提示这段代码需要深度为 2 的操作数栈和 4 个 Slot 的局部变量表，由于这是一个实例方法，所以局部变量表的第 0 个位置为 “this”，下面通过图解的方式描述 calc() 方法的字节码指令执行过程，以及描述执行过程中的代码、操作数栈、布局变量表的变化情况。

执行偏移地址为 0 的指令的情况

执行偏移地址为 2 的指令的情况

执行偏移地址为 11 的指令的情况

执行偏移地址为 12 的指令的情况

执行偏移地址为 13 的指令的情况

执行偏移地址为 14 的指令的情况

执行偏移地址为 16 的指令的情况

我们从这段程序的执行中可以看出栈结构指令集的一般运行过程，整个运算过程的中间变量都以操作数栈的出栈、入栈为信息交换途径。

最后编辑于：2017.12.27 17:53:20

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342

虚拟机的方法调用和字节码执行

虚拟机的方法调用和字节码执行

目录

一、运行时栈帧结构

二、方法调用

三、方法的执行

推荐阅读更多精彩内容