JVM虚拟机之字节码指令集解析
概述
执行模型
do{
自动计算PC寄存器的值加1
根据PC寄存器的指示位置,从字节码流中取出操作码;
if(字节码存在操作数)从字节码流中取出操作数;
执行操作码所定义的操作;
}while(字节码长度>0); 字节码与数据类型
iload 指令用于从局部变量表中加载 int 型的数据到操作数栈中,而 fload 指令加载的则是 float 类型的数据。| 数据类型 | 特殊助记字符 |
|---|---|
| int | i |
| long | l |
| short | s |
| byte | b |
| char | c |
| float | f |
| double | d |
arraylength 指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。goto 则是与数据类型无关的。指令分析
-
加载与存储指令
-
算术指令
-
类型转换指令
-
对象的创建与访问指令
-
方法调用与返回指令
-
操作数栈管理指令
-
比较控制指令
-
异常处理指令
-
同步控制指令
-
一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值可能是对象的引用)被压入操作数栈。
-
一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等等操作。

| 实际数据类型 | 计算类型 | 分类 |
|---|---|---|
| boolean | int | 1 |
| byte | int | 1 |
| char | int | 1 |
| short | int | 1 |
| int | int | 1 |
| floa | float | 1 |
| reference | reference | 1 |
| returnAddress | returnAddress | 1 |
| long | long | 2 |
| double | double | 2 |
- Category 1:包括 boolean、byte、char、short、int、float 等 6 种基本类型。它们所需的字节长度都不超过 4 个字节。
- Category 2:包括 long、double 等 2 种基本类型。它们所需的字节长度都超过 4 个字节。
加载与存储指令
- [局部变量压栈指令] 将一个局部变量加载到操作数栈:
xload、xload_<n> (其中 x 为i、1、f、d、 a,n 为0到3) - [常量入栈指令] 将一个常量加载到操作数栈:
bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d> (其中 i 、l、f、d 的范围在不同的指令是不一样的,下节会详细解释) - [出栈装入局部变量表指令] 将一个数值从操作数栈存储到局部变量表:
xstore、xstore_n(其中 x 为 i、1、f、d、a,n 为 0 到 3);xastore(其中 x 为 i、l、f、d、a、b、c、s) - 扩充局部变量表的访问索引的指令:wide。
iload_0、1load_1、iload_2 和 iload_3 这几个指令)。这几组指令都是某个带有一个操作数的通用指令(例如 iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中。除此之外,它们的语义与原生的通用指令完全一致(例如 iload_0 的语义与操作数为 0 时的 iload 指令语义完全一致 )。在尖括号之间的字母指定了指令隐含操作数的数据类型,<n> 代表非负的整数,<i> 代表是 int 类型数据,<l> 代表 long 类型,<f> 代表 float 类型,<d> 代表 double 类型。复习:再谈操作数栈与局部变量表

iadd 为例。假设在执行该指令前,栈顶的两个元素分别为 int 值 1 和 int 值 2,那么iadd 指令将弹出这两个 int,并将求得的和 int 值 3 压入栈中。
iadd 指令只消耗栈顶的两个元素,因此,对于离栈顶距离为 2 的元素,即图中的问号,iadd 指令并不关心它是否存在,更加不会对其进行修改。
public void foo(long l, float f) {
{
int i = e;
}
{
String s = "Hello, World";
}
} 

局部变量压栈指令
-
xload_<n>( x 为 i、l、f、d、a,n为0到3)
-
xload(x 为 i、l、f、d、a)
iload_1、fload_0、aload_0 等指令。其中 aload_0 表示将局部变量表中的索引为 0 的一个对象引用压栈。xload 通过指定参数的形式,把局部变量压入操作数栈,当使用这个命令时,表示局部变量的数量可能超过了 4 个,比如指令iload、fload 等.public void load(int num, Object obj, long count, boolean flag, short[] arr) {
System.out.println(num);
System.out.println(obj);
System.out.println(count);
System.out.println(flag);
System.out.println(arr);
} 
常量入栈指令
- iconst_<i>(i 从 -1到5):
iconst_m1将 -1 压入操作数栈,iconst_x( x 为到5)将 x 压入栈 - lconst_<l>(l 从 0到1):
lconst_0、lconst_1分别将长整数 0 和 1 压入栈 - fconst_<f> (f 从 0到2):
fconst_0、fconst_1、fconst_2分别将浮点数0、1、2 压入栈 - dconst_<d> (d 从0到1):
dconst_0和dconst_1分别将 double 型 0 和 1 压入栈 - aconst_null:
aconst_null将 null 了压入操作数栈
bipush 和 sipush。它们的区别在于接收数据类型的不同,bipush 接收 8 位整数作为参数, sipush 接收 16 位整数,它们都将参数压入栈。ldc 指令,它可以接收一个8位的参数。该参数指向常量池中的 int、 float 或者String 的索引,将指定的内容压入堆栈。ldc_w,它接收两个8位参数,能支持的索引范围大于 ldc。如果要压入的元素是 long 或者 double 类型的,则使用ldc2_w指令,使用方式都是类似的。| 类型 | 常数指令 | 范围 |
|---|---|---|
| int(boolean,byte,char,short) | iconst | [-1, 5] |
| bipush | [-128, 127] | |
| sipush | [-32768, 32767] | |
| ldc、ldc_w、ldc2_w | any int value | |
| long | lconst | 0, 1 |
| ldc、ldc_w、ldc2_w | any long value | |
| float | fconst | 0, 1, 2 |
| ldc、ldc_w、ldc2_w | any float value | |
| double | dconst | 0, 1 |
| ldc、ldc_w、ldc2_w | any double value | |
| reference | aconst | null |
| ldc、ldc_w、ldc2_w | String literal, Class literal |


出栈入局部变量表指令
store 的形式存在,比如- xstore( x 为 i、l、f、d、a),指令 xstore 由于没有隐含参数信息,故需要提供一个 byte 类型的参数类指定目标局部变量表的位置。
- xstore_n ( x 为 i、l、f、d、a,n 为 0 至 3),例如:指令
istore_n将从操作数栈中弹出一个整数,并把它贿值给局部变量索引为 n 的位置
istore_1指令表示将弹出的元素放置在局部变量表第 1 个位置。类似的还有 istore_0、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第 0、2、3 个位置。
- 首先该方法被调用的时候,形式参数 k 和 d 都是有确定的值,由于该方法不是静态方法,所以局部变量表中的第一个位置(槽位)存储 this,而第二个位置存储 k 具体的值
- 然后第三个和第四个位置储存 d 具体的值,由于 d 是 double 类型,所以需要占据两个槽位
- 数据已经准备好了,那就来看字节码,首先
iload_1是将局部变量表中下标为 1 的 k 值取出来压入操作数栈中,然后iconst_2是将常量池中的整型值 2 压入操作数栈,iadd让操作数栈弹出的 k 值和整型值 2 执行相加操作,之后将相加的结果值 m 压入操作数栈中。(图中在执行弹栈和压栈操作之后,为了展示方便并没有删除操作数栈中的 k 值和 2,真正的操作是弹栈之后 k 值和 2 就会从操作数栈中弹出,之后操作数栈中就没有 k 值和 2 了,栈顶就是 m 值了) - 然后
istore_4是将操作数栈中的 m 值弹出栈,然后放在局部变量表中下标为 4 的位置 idc2_w #13<12>代表将 long 型值 12 压入操作数栈,istore5是将值 12 弹栈之后放入局部变量表中下标为 5 的位置,由于 12 是 long 型,所以占据两个位置(槽位),ldc #15\<atguigu\>代表将字符串 “atguigu” 压入操作数栈,astore 7代表将字符串 “atguigu” 弹栈之后放入局部变量表中下标为 7 的位置idc #16<10.0>代表将 float 类型数据 10.0 压入操作数栈,fstore 8代表将 10.0 弹出栈,然后放入局部变量表中下标为 8 的位置idc2_w #17<10.0>代表将 10.0 压入操作数栈,dstore2代表将 10.0 弹出栈,之后将 10.0 放入下标为 2 和 3 的操作(double 类型数据占据两个槽位)
算术指令
-
向最接近数舍入模式:JVM 要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的;
-
向零舍入模式:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果;

所有的算术指令
| 算数指令 | 备注 | int(boolean,byte,char,short) | long | float | double |
|---|---|---|---|---|---|
| 加法指令 | iadd | ladd | fadd | dadd | |
| 减法指令 | isub | lsub | fsub | dsub | |
| 乘法指令 | imul | lmul | fmul | dmul | |
| 除法指令 | idiv | ldiv | fdiv | ddiv | |
| 求余指令 | remainder | irem | lrem | frem | drem |
| 取反指令 | negation | ineg | lneg | fneg | dneg |
| 自增指令 | iinc | ||||
| 位运算指令 | 按位或指令 | ior | lor | ||
| 按位与指令 | iand | land | |||
| 按位异或指令 | ixor | lxor | |||
| 比较指令 | lcmp | fcmpg / fcmpl | dcmpg / dcmpl |
public static int bar(int i) {
return ((i + 1) - 2) * 3 / 4;
} 
public void add() {
byte i = 15;
int j = 8;
int k = i + j;
} 


public static void main(String[] args) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a + b);
} 

比较指令说明
dcmpg、dcmpl、fcmpg、fcmpl、lcmp,与前面讲解的指令类似,首字符 d 表示 double 类型,f 表示 float,l 表示 long。其中 double 类型 和 float 类型的指令都有两套,这是因为浮点型的数据需要处理 NaN 值的情况。long 类型的无需处理 NaN 值所以只需要一套指令就行。fcmpg和 fcmpl 两个指令,指令 fcmpg 和fcmpl 都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为 v2,栈顶顺位第2位的元素为 v1,若 v1 = v2,则压入 0;若v1 > v2 则压入1;若 v1 < v2 则压入-1。- 如果遇到 NaN 值,
fcmpg会压入 1 - 如果遇到 NaN 值,
fcmpl会压入 -1
dcmpg 和 dcmpl 指令的处理结果和上面的类似。类型转换指令
宽化类型转换
- int 类型转换成 long、float 或者 double 类型。对应的指令为:
i21、i2f、i2d - long 类型转换成 float、double 类型。对应的指令为:
l2f、l2d - float 类型转换成 double 类型。对应的指令为:
f2d
i2l ,可以看到在内部,byte 在这里已经等同于 int 类型处理,类似的还有 short 类型,这种处理方式有两个特点:- 一方面可以减少实际的数据类型,如果为 char、 short 和 byte 都准备一套指令,那么指令的数量就会大増,而虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过 256 个,为了节省指令资源,将 char、short 和 byte 当做 int 处理也在情理之中。
- 另一方面,由于 byte、char 、 short、int 类型在局部变量表中都使用一个 Slot,无论是 byte 、char 或者 short 存入局部变量表都会占用一个 Slot 和 int 类型是一样的,从这个角度说,也没有必要特意区分这几种数据类型。
窄化类型转换
-
int 类型转换成 byte、 short 或者 char 类型。对应的指令有:
i2b、i2c、i2s -
long 类型转换成 int 类型。对应的指令有:
l2i -
float 类型转换成 int 或者 long 类型。对应的指令有:
f2i、f2l -
double 类型转换成 int、long 或者 float 类型。对应的指令有:
d2i、d2l、d2f
-
如果浮点值是 NaN ,那转换结果就是 int 或 long 类型的 0。
-
如果浮点值不是无穷大的话,浮点值使用 IEEE754 的向零含入模式取整,获得整数值 v。如果 v 在目标类型 T(int 或 long)的表示范围之内,那转换结果就是 v。否则,将根据 v 的符号,转换为 T 所能表示的最大或者最小整数。
-
如果转换结果的绝对值太小而无法使用 float 来表示,将返回 float 类型的正负零 。
-
如果转换结果的绝对值太大而无法使用 float 来表示,将返回 float 类型的正负无穷大。
-
对于 double 类型的 NaN 值将按规定转换为 float 类型的 NaN 值。
对象的创建与访问指令
创建指令
| 指令操作码 | 含义 |
|---|---|
| new | 创建类实例 |
| newarray | 创建基本类型数组 |
| anewarray | 创建引用类型数组 |
| multilanewarra | 创建多维数组 |
new,它接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入操作数栈。 public void testNew() {
Object o = new Object();
} 0 new #2 <java/lang/Object>
3 dup
4 invokespecial #1 <java/lang/Object.<init> : ()V>
7 astore_1
8 return -
通过
new指令通过符号引用指向的类的全限定名称,在堆空间中开辟一块内存空间,返回该内存空间的起始地址并压入操作数栈中。 -
dup指令是复制当前栈顶的数据并压入操作数栈。然后执行 Object 类的 <init>() 方法(会把dup指令复制的应用地址弹出栈)。接着将执行new指令产生的应用地址弹出,存储到局部变量表索引为 1 的 Slot 。最后方法返回,整个方法对应的栈帧弹出。
newarray、anewarray、multianewarray 。newarray用于创建一个新的基本类型数组(即 boolean、byte、char、short、int、long、float 或 double 数组)。该指令需要一个整数参数,来指定要创建的数组的长度。在执行newarray指令时,JVM 会从操作数栈中弹出长度值,并将其作为参数传递给该指令。newarray还有一个操作数 atype 是一个代表着要生成什么基本类型的数组,下面是对应的表格:
| 数组类型 | atype |
|---|---|
| T_BOOLEAN | 4 |
| T_CHAR | 5 |
| T_FLOAT | 6 |
| T_DOUBLE | 7 |
| T_BYTE | 8 |
| T_SHORT | 9 |
| T_INT | 10 |
| T_LONG | 11 |
-
anewarray用于创建一个包含引用类型元素的新数组。它需要两个参数:第一个参数是类描述符,表示要创建的数组中元素的类型;第二个参数是数组大小,即要创建的数组中元素的数量。在执行anewarray指令时,JVM 会从操作数栈中弹出长度值,并将其作为参数传递给该指令。 -
multianewarray用于创建多维数组对象。它需要两个操作数,第一个操作数是对常量池中的一个 符号引用,用于表示所需创建的多维数组的元素类型;第二个操作数则是一个无符号的整数,表示需要创建的多维数组的维度数。
public void testNewArray() {
// 测试创建基本数据类型的数组
int[] intArr = new int[10];
// 测试创建引用类型的数组
String[] strArr = new String[20];
// 创建多维数组
String[][] strArr2 = new String[30][];
double[][] doubleArr = new double[40][15];
long[][] longArr = new long[50][];
} 0 bipush 10
2 newarray 10 (int)
4 astore_1
5 bipush 20
7 anewarray #15 <java/lang/String>
10 astore_2
11 bipush 30
13 anewarray #17 <[Ljava/lang/String;>
16 astore_3
17 bipush 40
19 bipush 15
21 multianewarray #19 <[[D> dim 2
25 astore 4
27 bipush 50
29 anewarray #21 <[J>
32 astore 5
34 return - index 2 的字节码:
newarray 10表达的意思就是这将创建一个 int 类型的数组,数组的长度为 10(bipush 10压入操作数栈的)。 - index 7 的字节码:
anewarray #15表达的意思是这将创建一个 String 类型的数组,数组的长度为 20(bipush 20压入操作数栈的)。 - index 13 的字节码:
anewarray #17表达的意思是这将创建一个 String 类型的二维数组,数组的长度为 30(bipush 30压入操作数栈的)。由于第二维的长度没有传入,所以这边使用的还是anewarray指令。 - index 21 的字节码:
multianewarray #19 <[[D> dim 2表达的意思是这将创建一个 double 类型的二维数组,2 指的是数组的维度。 - index 29 的字节码:
anewarray #21表达的意思是这将创建一个 long 类型的二维数组,数组的长度为 50(bipush 50压入操作数栈的)。由于第二维的长度没有传入,所以这边使用的还是anewarray指令,而且虽然这边创建的是基本数据类型的二维数组,但是由于存储的其实是 long 数组的引用地址,所以使用到的指令还是anewarray
字段访问指令
| 指令操作码 | 含义 |
|---|---|
| getstatic、putstatic | 访问类字段(static字段,或者称为类变量)的指令 |
| getfield、 putfield | 访问类实例字段(非static字段,或者称为实例变量)的指令 |
getstatic 指令为例,它含有一个操作数,为指向常量池的 Fieldref 索引,它的作用就是获取 Fieldref 指定的对象或者值,并将其压入操作数栈。public void sayHello() {
System.out.println("hel1o");
} 0 getstatic #8 <java/lang/System.out>
3 ldc #9 <hello>
5 invokevirtual #10 <java/io/PrintStream.println>
8 return 
public class FieldTest {
class FieldInner {
static int field1;
String field2;
}
public void testGet() {
FieldInner fieldInner = new FieldInner();
String field2 = fieldInner.field2;
int field1 = FieldInner.field1;
}
public void testSet() {
FieldInner fieldInner = new FieldInner();
fieldInner.field2 = "Suwian";
FieldInner.field1 = 26;
System.out.println(fieldInner);
}
} 0 new #7 <com/fgi/test/FieldTest$FieldInner>
3 dup
4 aload_0
5 invokespecial #9 <com/fgi/test/FieldTest$FieldInner.<init> : (Lcom/fgi/test/FieldTest;)V>
8 astore_1
9 aload_1
10 getfield #12 <com/fgi/test/FieldTest$FieldInner.field2 : Ljava/lang/String;>
13 astore_2
14 getstatic #16 <com/fgi/test/FieldTest$FieldInner.field1 : I>
17 istore_3
18 return - index 为 9 的字节码指令先将前面
new生成的对象引用从局部变量表加载到操作数栈,然后getfield #12会将对象引用弹出栈,获取到对应的字段内容后将结果压入操作数栈 - index 为 14 的字节码
getstatic #16由于获取的是类变量,所以不需要将对象引用压入操作数栈,而是直接通过类获取。
0 new #7 <com/fgi/test/FieldTest$FieldInner>
3 dup
4 aload_0
5 invokespecial #9 <com/fgi/test/FieldTest$FieldInner.<init> : (Lcom/fgi/test/FieldTest;)V>
8 astore_1
9 aload_1
10 ldc #20 <Suwian>
12 putfield #12 <com/fgi/test/FieldTest$FieldInner.field2 : Ljava/lang/String;>
15 bipush 26
17 putstatic #16 <com/fgi/test/FieldTest$FieldInner.field1 : I>
20 getstatic #22 <java/lang/System.out : Ljava/io/PrintStream;>
23 aload_1
24 invokevirtual #28 <java/io/PrintStream.println : (Ljava/lang/Object;)V>
27 return - index 为 12 的字节码
putfield #12将上一条指令压入操作数栈的字符串 “Suwian”和从局部变量表加载过来的对象引用弹出操作数栈,并且存储到对象符号引用所指向的字段里面。 - index 为 17 的字节码
putstatic #16将上一条指令压入操作数栈的 26 弹出操作数栈,并且存储到类符号引用所指向的字段里面。由于是类变量,所以不需要对象。
数组操作指令
-
把一个数组元素加载到操作数栈的指令:
baload、caload、saload、iaload、laload、faload、daload、aaload -
将一个操作数栈的值存储到数组元素中的指令:
bastore、castore、sastore、iastore、lastore、fastore、dastore、aastor
| 数组指令 | byte(boolean) | char | short | int | long | float | double | reference |
|---|---|---|---|---|---|---|---|---|
| xaload | baload | caload | saload | iaload | laload | faload | daload | aaload |
| xastore | bastore | castore | sastore | iastore | lastore | fastore | dastore | aastore |
arraylength,该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈。在Java语言里,当检查到发生数组越界时会抛出 java.lang.ArrayIndexOutOfBoundsException异常,避免了直接造成非法内存访问。
准确的说,越界检查不是封装在数组元素访问的类中,而是封装在数组访问的xaload、xastore字节 码指令中。
xaload 表示将数组的元素压栈,比如 saload、caload分别表示压入 short 数组和 char 数组。指令 xaload 在执行时,要求操作数中栈顶元素为数组索引 i,栈顶顺位第2个元素为数组引用 a,该指令会弹出栈顶这两个元素,并将 a[i] 重新压入栈。xastore 则专门针对数组操作,以 iastore 为例,它用于给一个 int 数组的给定索引赋值。在 iastore 执行前,操作数栈顶需要为此准备3个元素:值、索引、数组引用,iastore 会弹出这 3 个值,并将值赋给数组中指定索引的位置。public class ArrayTest {
/**
* 测试 xaload 指令
*/
public void testLoad() {
int[] ints = new int[3];
System.out.println(ints[2]);
}
/**
* 测试 xastore 指令
*/
public void testStore() {
int[] ints = new int[3];
ints[1] = 100;
System.out.println(ints[2]);
}
} 0 iconst_3
1 newarray 10 (int)
3 astore_1
4 getstatic #7 <java/lang/System.out : Ljava/io/PrintStream;>
7 aload_1
8 iconst_2
9 iaload
10 invokevirtual #13 <java/io/PrintStream.println : (I)V>
13 return - index 为 9 的字节码
iaload指令的执行将数组的引用地址和索引弹出操作数栈,获取到存储在里面实际的值再压入操作数栈中。
0 iconst_3
1 newarray 10 (int)
3 astore_1
4 aload_1
5 iconst_1
6 bipush 100
8 iastore
9 getstatic #7 <java/lang/System.out : Ljava/io/PrintStream;>
12 aload_1
13 iconst_2
14 iaload
15 invokevirtual #13 <java/io/PrintStream.println : (I)V>
18 return
- index 为 8 的字节码
iastore指令的执行将数组的引用地址和索引以及要存储的值弹出操作数栈,将数据存储在对应的位置。
类型检查指令
instanceof、checkcast。- 指令
instanceof用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈。 - 指令
checkcast用于检查类型强制转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈,并在运行时进行明确的类型转换。否则它会抛出ClassCastException 异常。
| 类型检查指令 | 含义 |
|---|---|
| instanceof | 判断给定对象是否是某一个类的实例 |
| checkcast | 检查类型强制转换是否可以进行 |
public class ClassCastTest {
public void testClassCast(Object obj) {
boolean b = obj instanceof String;
String str = (String) obj;
}
} 0 aload_1
1 instanceof #7 <java/lang/String>
4 istore_2
5 aload_1
6 checkcast #7 <java/lang/String>
9 astore_3
10 return - index 为 1 的字节码
instanceof #7会将当前栈顶的元素弹出,并且判断对象是否为某个类的实例:- 如果对象引用为 null,则将0(表示 false)推入栈顶。
- 否则,该指令会检查该对象引用所指向的对象是否是指定类的实例。如果是,就将1(表示 true)推入栈顶;否则将0(表示 false)推入栈顶。
- index 为 6 的字节码
checkcast #7接收一个引用类型值,并将其转换为一个指定的引用类型。如果这个值不是指定类型的一个实例,那么将抛出一个 ClassCastException 异常。
方法调用与返回指令
方法调用指令
-
invokevirtual指令用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态。这也是 Java 语言中最常见的方法分派方式。 -
invokeinterface指令用于调用接口方法,它会在运行时搜索由特定对象所实现的这个接口方法,并找出适合的方法进行调用。使用invokeinterface指令时,方法调用采用动态绑定,因为具体的实现是在运行时才能确定的。 -
invokespecial指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法。这些方法都是静态类型绑定的,不会在调用时进行动态派发。 -
invokestatic指令用于调用命名类中的类方法(static方法)。方法调用总是采用静态绑定,因为静态方法的调用目标在编译时就已经确定了。 -
invokedynamic指令用于调用动态绑定的方法,这个是 JDK1.7 后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的,而前面4条调用指令的分派逻辑都固化在java虚拟机内部。invokedynamic指令在运行时处理 Java 字节码中未知的方法,并将其绑定到具体实现。它提供了一种通用的方法调用机制,可以动态地选择一个方法实现。使用invokedynamic指令时,方法调用采用动态绑定。
| 字节码指令 | 含义 |
|---|---|
| invokevirtual | 调用对象的实例方法 |
| invokeinterface | 调用接口方法 |
| invokespecial | 调用一些需要特殊处理的实例方法,包括实例初始化方法(构造器)、私有方法和父类方法 |
| invokestatic | 调用命名类中的类方法(static方法) |
| invokedynamic | 处理 Java 字节码中未知的方法,并将其绑定到具体实现 |
invokeinterface
invokeinterface 用于调用接口方法。该指令类似于 invokevirtual 指令,但是它的操作数中包含了一个接口的符号引用,在运行时,实际调用的方法是在运行时确定的,并且要求接收者对象必须实现了这个接口。invokeinterface 操作数格式如下:invokeinterface <method-ref>, <count> <method-ref> 是一个对接口方法的符号引用,包括了接口的名字、方法名和描述符;count 指定了待调用方法的参数数量(包括对象引用)。在执行该指令前,需要将接口对象的引用压入栈顶,invokeinterface 指令会从操作数栈中弹出 count 个操作数,其中最顶部的一个操作数为对象引用,其余的操作数为接口方法的参数。然后,JVM会在对象引用所指向的对象上查找一个能够响应接口中指定的方法的对象,并进行方法调用。如果找到了多个对象,则选择其中某一个对象进行方法调用,具体选择哪个对象由 Java 虚拟机实现决定。invokeinterface 指令的解析和分派过程比普通方法调用要耗费更多的时间。public class InvokeTest {
// 调用接口方法
public void testInvokeInterface() {
TestInterface t = new User();
int length = t.length();
}
}
/**
* 接口实现
*/
class User implements TestInterface {
@Override
public int length() {
return 0;
}
@Override
public long weigth() {
return TestInterface.super.weigth();
}
}
/**
* 接口
*/
interface TestInterface {
int length();
default long weigth() {
return 100L;
}
static String name() {
return "Jean";
}
} 0 new #7 <com/fgi/test/User>
3 dup
4 invokespecial #9 <com/fgi/test/User.<init> : ()V>
7 astore_1
8 aload_1
9 invokeinterface #10 <com/fgi/test/TestInterface.length : ()I> count 1
14 istore_2
15 return - index 为 9 的字节码,由于该方法没有入参,所以 count = 1,代表的就是执行方法的实际对象的引用。
invokespecial
invokespecial 指令用于调用对象的私有方法、构造函数或超类中的方法,因为这些方法都无法被覆盖或继承。与其他方法调用指令不同,invokespecial 指令没有多态性,即它总是调用当前对象类型中的方法。invokespecial 指令时,它会首先检查该方法是否为对象的构造函数或虚拟机中的 Object 类型中的方法,如果是,则直接调用该方法。否则,JVM 会在该对象的类型中查找该方法并调用之。需要注意的是,在使用 invokespecial 调用构造函数时,必须保证该构造函数是该对象类型中的构造函数,而不能是任何子类中的构造函数。这是因为 Java 对象的创建过程中,必须先调用父类的构造函数,然后再调用子类的构造函数。invokespecial <method-ref> <method-ref> 是一个指向方法的符号引用,它包括了该方法所属的类名、方法名以及描述符。例如:invokespecial java/lang/Object/<init>()V invokestatic
invokestatic 用于调用静态方法。它会将方法名和类名作为参数,并从当前类的常量池中找到对应的方法符号引用。然后将这个符号引用解析为实际的方法在运行时调用。invokestatic 指令:public class Example {
public static void main(String[] args) {
int result = add(3, 4);
System.out.println(result);
}
public static int add(int a, int b) {
return a + b;
}
} add 方法来计算两个整数的和。因为 add 方法是静态的,所以可以直接通过类名来调用,而不需要先创建对象。在 main 方法中,使用 invokestatic 指令来调用 add 方法,将参数值传递给该方法并获得返回值。invokestatic 指令:Compiled from "Example.java"
public class Example {
public Example();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: iconst_3
1: iconst_4
2: invokestatic #2 // Method add:(II)I
5: istore_1
6: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
9: iload_1
10: invokevirtual #4 // Method java/io/PrintStream.println:(I)V
13: return
public static int add(int, int);
Code:
0: iload_0
1: iload_1
2: iadd
3: ireturn
} main 方法中,第 2 行使用 invokestatic 指令来调用静态方法 add。该指令的操作数为 #2,表示 add 方法的符号引用在常量池中的索引为 2。因为 add 方法是静态的,所以不需要将任何对象引用传递给该方法。invokevirtual
invokevirtual 用于调用对象方法。它的操作数是一个常量池索引,该索引指向一个 CONSTANT_Methodref_info 常量,该常量包含了被调用方法的类和方法签名信息。invokevirtual 指令调用对象方法:public class MyClass {
public void myMethod() {
System.out.println("Hello, World!");
}
}
public class Main {
public static void main(String[] args) {
MyClass obj = new MyClass();
obj.myMethod(); // 调用 myMethod 方法
}
} obj.myMethod() 语句调用 myMethod() 方法。aload_1 ; 将对象引用加载到操作数栈
invokespecial #X ; 调用 myMethod 方法 aload_1 指令将 obj 对象引用加载到操作数栈,invokespecial 指令则使用常量池索引 #X 调用 myMethod() 方法。在运行时,Java 虚拟机将从常量池中获取 #X 索引处的方法信息,并执行相应的方法调用操作。invokedynamic
invokedynamic 是 Java 虚拟机在Java 7 新添加的一条指令,用于在运行时动态地绑定方法。在以前版本的 JVM 中,由于 Java 语言中的方法调用和静态类型检查是在编译时完成的,因此在运行时动态地绑定方法比较困难。而invokedynamic指令可以通过先定义一个返回正确的方法句柄的引导方法,再将该方法句柄与实际调用的目标方法进行关联来实现这一点。invokedynamic指令:public class LambdaExample {
public static void main(String[] args) {
Runnable r = () -> { System.out.println("Hello, World!"); };
r.run();
}
} Runnable对象,并使用 Lambda 表达式将其实现为输出”Hello, World!”。当我们调用run()方法时,JVM 会动态地绑定 Lambda 表达式,并执行其中的代码。javac LambdaExample.java javap -c LambdaExample.class public class LambdaExample {
public LambdaExample();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: invokedynamic #2, 0 // InvokeDynamic #0:run:()Ljava/lang/Runnable;
5: astore_1
6: aload_1
7: invokeinterface #3, 1 // InterfaceMethod java/lang/Runnable.run:()V
12: return
private static void lambda$main$0();
Code:
0: getstatic #4 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #5 // String Hello, World!
5: invokevirtual #6 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
} invokedynamic指令被用于调用 Lambda 表达式。具体来说,invokedynamic #2, 0表示要调用一个动态方法,并且该方法的名称和类型将在运行时确定。这个指令会导致 JVM 查找和绑定与 Lambda 表达式关联的动态方法,并执行其中的代码。run,并且其返回类型为Runnable接口。当解释器执行这条指令时,它将根据 Lambda 表达式的实现动态地创建一个Runnable对象,并将其作为结果返回。接下来,我们将这个对象存储在本地变量r中,并通过invokeinterface指令调用run()方法,从而触发了动态方法的执行。invokedynamic指令无法通过 Java 代码生成,得借助第三方生成,Lambda表达式必须通过内部类实现。因此,上述代码在Java 8之前的版本中无法编译。方法返回指令
| 方法返回指令 | void | int | long | float | double | reference |
|---|---|---|---|---|---|---|
| xreturn | return | ireturn | lreturn | freutrn | dreturn | areturn |
-
ireturn(当返回值是 boolean、byte、char、short 和 int 类型时使用)。 -
return指令供声明为 void 的方法、实例初始化方法以及类和接口的类初始化方法使用。
xreturn 指令(除 return 指令外),将当前函数操作数栈的顶层元素弹出,并将这个元素压入调用者函数的操作数栈中(因为调用者非常关心函数的返回值),所有在当前函数操作数栈中的其他元素都会被丢弃。最后,会丢弃当前方法的整个帧,恢复调用者的帧,并将控制权转交给调用者。monitorexit 指令,退出临界区。public int methodReturn() {
int i = 500;
int j = 200;
int k = 50;
return (i + j) / k;
} 
操作数栈管理指令
-
将一个或两个元素从栈顶弹出,并且直接废弃:
pop、pop2 -
复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:
dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2 -
将栈最顶端的两个Slot数值位置交换:
swap。Java 虚拟机没有提供交换两个 64 位数据类型(long、double)数值的指令。 -
指令
nop,是一个非常特殊的指令,它的字节码为0x00。和汇编语言中的 nop 一样,它表示什么都不做。这条指令一般可用于调试、占位等。
dup,dup2。dup 的系数代表要复制的 Slot 个数。dup指令用于复制 1 个 Slot 的数据。例如 1 个 int 或 1 个 reference 类型数据。dup2指令用于复制 2 个 Slot 的数据。例如 1个 long 或者 1 个 double,或者 2 个 int,或者 1 个 int + 1 个 float 类型数据。
dup_x1,dup2_x1,dup_x2,dup2_x2。对于带 _x 的复制插入指令,只要将指令的 dup 和 x 的系数相加,结果即为需要插入的位置。dup_x1插入位置:1 + 1 = 2,即复制当前栈顶 1 个 Slot 的元素,并且插入到当前栈顶的 2 个 Slot 下面。dup_x2插入位置:1 + 2 = 3,即复制当前栈顶 1 个 Slot 的元素,并且插入到当前栈顶的 3 个 Slot 下面。dup2_x1插入位置:2 + 1 = 3,即复制当前栈顶 2 个 Slot 的元素,并且插入到当前栈顶的 3 个 Slot 下面。
-
pop:将栈顶的 1 个 Slot 数值出栈。例如 1 个 int 类型数值。 -
pop2:将栈顶的 2 个 Slot 数值出栈。例如 1 个 double 类型数值,或者 2 个 int 类型数值。
控制转移指令
条件跳转指令
ifeq,iflt,ifle,ifne,ifgt,ifge,ifnull,ifnonnull。这些指令都接收两个字节的操作数,用于计算跳转的位置( 16 位符号整数作为当前位置的 offset )。| < | <= | == | != | >= | > | null | not null |
|---|---|---|---|---|---|---|---|
| iflt | ifle | ifeq | ifne | ifge | ifgt | ifnull | ifnonnull |
ifeq:如果栈顶值等于0,则跳转到指定位置。ifne:如果栈顶值不等于0,则跳转到指定位置。iflt:如果栈顶值小于0,则跳转到指定位置。ifle:如果栈顶值小于或等于0,则跳转到指定位置。ifgt:如果栈顶值大于0,则跳转到指定位置。ifge:如果栈顶值大于或等于0,则跳转到指定位置。ifnonnull:如果栈顶值不为null,则跳转到指定位置。ifnull:如果栈顶值为null,则跳转到指定位置。
-
对于 boolean、byte、char、short 类型的条件分支比较操作,都是使用 int 类型的比较指令完成。
-
对于 long、float、double 类型的条件分支比较操作,则会先执行相应类型的比较运算指令(
lcmp、fcmpl、fcmpg、dcmpl、dcmpg),运算指令会返回一个整型值到操作数栈中,随后再执行 int 类型的条件分支比较操作来完成整个分支跳转。
int a = 10;
if (a < 5) {
System.out.println("a is less than 5");
} else {
System.out.println("a is greater than or equal to 5");
} 0: bipush 10
2: istore_1
3: iload_1
4: iconst_5
5: if_icmplt 16
8: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
11: ldc #3 // String a is greater than or equal to 5
13: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
16: return if_icmplt 就是使用了iflt指令的等效指令。if_icmplt指令的前两个参数是要比较的两个整数值,它们先从操作数栈中弹出,然后执行和iflt指令相同的比较操作。如果第一个参数小于第二个参数,则跳转到第三个参数指定的目标位置,否则继续执行下一条指令。比较条件跳转指令
多条件分支跳转指令
无条件跳转指令
异常处理指令
抛出异常指令
异常处理与异常表
同步控制指令
方法级的同步
方法内指令指令序列的同步
作者: Suwian 发表日期:2023 年 3 月 13 日