You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

300 lines
17 KiB
Markdown

2 years ago
# 08 | JVM是怎么实现invokedynamic的
前不久,“虚拟机”赛马俱乐部来了个年轻人,标榜自己是动态语言,是先进分子。
这一天先进分子牵着一头鹿进来说要参加赛马。咱部里的老学究Java就不同意了呀鹿又不是马哪能参加赛马。
当然了这种墨守成规的调用方式自然是先进分子所不齿的。现在年轻人里流行的是鸭子类型duck typing\[1\],只要是跑起来像只马的,它就是一只马,也就能够参加赛马比赛。
```
class Horse {
public void race() {
System.out.println("Horse.race()");
}
}
class Deer {
public void race() {
System.out.println("Deer.race()");
}
}
class Cobra {
public void race() {
System.out.println("How do you turn this on?");
}
}
```
(如何用同一种方式调用他们的赛跑方法?)
说到了这里如果我们将赛跑定义为对赛跑方法对应上述代码中的race())的调用的话,那么这个故事的关键,就在于能不能在马场中调用非马类型的赛跑方法。
为了解答这个问题我们先来回顾一下Java里的方法调用。在Java中方法调用会被编译为invokestaticinvokespecialinvokevirtual以及invokeinterface四种指令。这些指令与包含目标方法类名、方法名以及方法描述符的符号引用捆绑。在实际运行之前Java虚拟机将根据这个符号引用链接到具体的目标方法。
可以看到在这四种调用指令中Java虚拟机明确要求方法调用需要提供目标方法的类名。在这种体系下我们有两个解决方案。一是调用其中一种类型的赛跑方法比如说马类的赛跑方法。对于非马的类型则给它套一层马甲当成马来赛跑。
另外一种解决方式,是通过反射机制,来查找并且调用各个类型中的赛跑方法,以此模拟真正的赛跑。
显然比起直接调用这两种方法都相当复杂执行效率也可想而知。为了解决这个问题Java 7引入了一条新的指令invokedynamic。该指令的调用机制抽象出调用点这一个概念并允许应用程序将调用点链接至任意符合条件的方法上。
```
public static void startRace(java.lang.Object)
0: aload_0 // 加载一个任意对象
1: invokedynamic race // 调用赛跑方法
```
(理想的调用方式)
作为invokedynamic的准备工作Java 7引入了更加底层、更加灵活的方法抽象 方法句柄MethodHandle
## 方法句柄的概念
方法句柄是一个强类型的,能够被直接执行的引用\[2\]。该引用可以指向常规的静态方法或者实例方法也可以指向构造器或者字段。当指向字段时方法句柄实则指向包含字段访问字节码的虚构方法语义上等价于目标字段的getter或者setter方法。
这里需要注意的是它并不会直接指向目标字段所在类中的getter/setter毕竟你无法保证已有的getter/setter方法就是在访问目标字段。
方法句柄的类型MethodType是由所指向方法的参数类型以及返回类型组成的。它是用来确认方法句柄是否适配的唯一关键。当使用方法句柄时我们其实并不关心方法句柄所指向方法的类名或者方法名。
打个比方,如果兔子的“赛跑”方法和“睡觉”方法的参数类型以及返回类型一致,那么对于兔子递过来的一个方法句柄,我们并不知道会是哪一个方法。
方法句柄的创建是通过MethodHandles.Lookup类来完成的。它提供了多个API既可以使用反射API中的Method来查找也可以根据类、方法名以及方法句柄类型来查找。
当使用后者这种查找方式时用户需要区分具体的调用类型比如说对于用invokestatic调用的静态方法我们需要使用Lookup.findStatic方法对于用invokevirtual调用的实例方法以及用invokeinterface调用的接口方法我们需要使用findVirtual方法对于用invokespecial调用的实例方法我们则需要使用findSpecial方法。
调用方法句柄和原本对应的调用指令是一致的。也就是说对于原本用invokevirtual调用的方法句柄它也会采用动态绑定而对于原本用invokespecial调用的方法句柄它会采用静态绑定。
```
class Foo {
private static void bar(Object o) {
..
}
public static Lookup lookup() {
return MethodHandles.lookup();
}
}
// 获取方法句柄的不同方式
MethodHandles.Lookup l = Foo.lookup(); // 具备Foo类的访问权限
Method m = Foo.class.getDeclaredMethod("bar", Object.class);
MethodHandle mh0 = l.unreflect(m);
MethodType t = MethodType.methodType(void.class, Object.class);
MethodHandle mh1 = l.findStatic(Foo.class, "bar", t);
```
方法句柄同样也有权限问题。但它与反射API不同其权限检查是在句柄的创建阶段完成的。在实际调用过程中Java虚拟机并不会检查方法句柄的权限。如果该句柄被多次调用的话那么与反射调用相比它将省下重复权限检查的开销。
需要注意的是方法句柄的访问权限不取决于方法句柄的创建位置而是取决于Lookup对象的创建位置。
举个例子对于一个私有字段如果Lookup对象是在私有字段所在类中获取的那么这个Lookup对象便拥有对该私有字段的访问权限即使是在所在类的外边也能够通过该Lookup对象创建该私有字段的getter或者setter。
由于方法句柄没有运行时权限检查,因此,应用程序需要负责方法句柄的管理。一旦它发布了某些指向私有方法的方法句柄,那么这些私有方法便被暴露出去了。
## 方法句柄的操作
方法句柄的调用可分为两种一是需要严格匹配参数类型的invokeExact。它有多严格呢假设一个方法句柄将接收一个Object类型的参数如果你直接传入String作为实际参数那么方法句柄的调用会在运行时抛出方法类型不匹配的异常。正确的调用方式是将该String显式转化为Object类型。
在普通Java方法调用中我们只有在选择重载方法时才会用到这种显式转化。这是因为经过显式转化后参数的声明类型发生了改变因此有可能匹配到不同的方法描述符从而选取不同的目标方法。调用方法句柄也是利用同样的原理并且涉及了一个签名多态性signature polymorphism的概念。在这里我们暂且认为签名等同于方法描述符。
```
public final native @PolymorphicSignature Object invokeExact(Object... args) throws Throwable;
```
方法句柄API有一个特殊的注解类@PolymorphicSignature。在碰到被它注解的方法调用时Java编译器会根据所传入参数的声明类型来生成方法描述符而不是采用目标方法所声明的描述符。
在刚才的例子中当传入的参数是String时对应的方法描述符包含String类而当我们转化为Object时对应的方法描述符则包含Object类。
```
public void test(MethodHandle mh, String s) throws Throwable {
mh.invokeExact(s);
mh.invokeExact((Object) s);
}
// 对应的Java字节码
public void test(MethodHandle, String) throws java.lang.Throwable;
Code:
0: aload_1
1: aload_2
2: invokevirtual MethodHandle.invokeExact:(Ljava/lang/String;)V
5: aload_1
6: aload_2
7: invokevirtual MethodHandle.invokeExact:(Ljava/lang/Object;)V
10: return
```
invokeExact会确认该invokevirtual指令对应的方法描述符和该方法句柄的类型是否严格匹配。在不匹配的情况下便会在运行时抛出异常。
如果你需要自动适配参数类型那么你可以选取方法句柄的第二种调用方式invoke。它同样是一个签名多态性的方法。invoke会调用MethodHandle.asType方法生成一个适配器方法句柄对传入的参数进行适配再调用原方法句柄。调用原方法句柄的返回值同样也会先进行适配然后再返回给调用者。
方法句柄还支持增删改参数的操作这些操作都是通过生成另一个方法句柄来实现的。这其中改操作就是刚刚介绍的MethodHandle.asType方法。删操作指的是将传入的部分参数就地抛弃再调用另一个方法句柄。它对应的API是MethodHandles.dropArguments方法。
增操作则非常有意思。它会往传入的参数中插入额外的参数再调用另一个方法句柄它对应的API是MethodHandle.bindTo方法。Java 8中捕获类型的Lambda表达式便是用这种操作来实现的下一篇我会详细进行解释。
增操作还可以用来实现方法的柯里化\[3\]。举个例子有一个指向f(x, y)的方法句柄我们可以通过将x绑定为4生成另一个方法句柄g(y) = f(4, y)。在执行过程中每当调用g(y)的方法句柄它会在参数列表最前面插入一个4再调用指向f(x, y)的方法句柄。
## 方法句柄的实现
下面我们来看看HotSpot虚拟机中方法句柄调用的具体实现。由于篇幅原因这里只讨论DirectMethodHandle。
前面提到调用方法句柄所使用的invokeExact或者invoke方法具备签名多态性的特性。它们会根据具体的传入参数来生成方法描述符。那么拥有这个描述符的方法实际存在吗对invokeExact或者invoke的调用具体会进入哪个方法呢
```
import java.lang.invoke.*;
public class Foo {
public static void bar(Object o) {
new Exception().printStackTrace();
}
public static void main(String[] args) throws Throwable {
MethodHandles.Lookup l = MethodHandles.lookup();
MethodType t = MethodType.methodType(void.class, Object.class);
MethodHandle mh = l.findStatic(Foo.class, "bar", t);
mh.invokeExact(new Object());
}
}
```
和查阅反射调用的方式一样,我们可以通过新建异常实例来查看栈轨迹。打印出来的占轨迹如下所示:
```
$ java Foo
java.lang.Exception
at Foo.bar(Foo.java:5)
at Foo.main(Foo.java:12)
```
也就是说invokeExact的目标方法竟然就是方法句柄指向的方法。
先别高兴太早。我刚刚提到过invokeExact会对参数的类型进行校验并在不匹配的情况下抛出异常。如果它直接调用了方法句柄所指向的方法那么这部分参数类型校验的逻辑将无处安放。因此唯一的可能便是Java虚拟机隐藏了部分栈信息。
当我们启用了-XX:+ShowHiddenFrames这个参数来打印被Java虚拟机隐藏了的栈信息时你会发现main方法和目标方法中间隔着两个貌似是生成的方法。
```
$ java -XX:+UnlockDiagnosticVMOptions -XX:+ShowHiddenFrames Foo
java.lang.Exception
at Foo.bar(Foo.java:5)
at java.base/java.lang.invoke.DirectMethodHandle$Holder. invokeStatic(DirectMethodHandle$Holder:1000010)
at java.base/java.lang.invoke.LambdaForm$MH000/766572210. invokeExact_MT000_LLL_V(LambdaForm$MH000:1000019)
at Foo.main(Foo.java:12)
```
实际上Java虚拟机会对invokeExact调用做特殊处理调用至一个共享的、与方法句柄类型相关的特殊适配器中。这个适配器是一个LambdaForm我们可以通过添加虚拟机参数将之导出成class文件-Djava.lang.invoke.MethodHandle.DUMP\_CLASS\_FILES=true
```
final class java.lang.invoke.LambdaForm$MH000 { static void invokeExact_MT000_LLLLV(jeava.lang.bject, jjava.lang.bject, jjava.lang.bject);
Code:
: aload_0
1 : checkcast #14 //Mclass java/lang/invoke/ethodHandle
: dup
5 : astore_0
: aload_32 : checkcast #16 //Mclass java/lang/invoke/ethodType
10: invokestatic I#22 // Method java/lang/invoke/nvokers.checkExactType:(MLjava/lang/invoke/ethodHandle,;Ljava/lang/invoke/ethodType);V
13: aload_0
14: invokestatic #26 I // Method java/lang/invoke/nvokers.checkCustomized:(MLjava/lang/invoke/ethodHandle);V
17: aload_0
18: aload_1
19: ainvakevirtudl #30 2 // Methodijava/lang/nvokev/ethodHandle.invokeBasic:(LLeava/lang/bject;;V
23 return
```
可以看到在这个适配器中它会调用Invokers.checkExactType方法来检查参数类型然后调用Invokers.checkCustomized方法。后者会在方法句柄的执行次数超过一个阈值时进行优化对应参数-Djava.lang.invoke.MethodHandle.CUSTOMIZE\_THRESHOLD默认值为127。最后它会调用方法句柄的invokeBasic方法。
Java虚拟机同样会对invokeBasic调用做特殊处理这会将调用至方法句柄本身所持有的适配器中。这个适配器同样是一个LambdaForm你可以通过反射机制将其打印出来。
```
// 该方法句柄持有的LambdaForm实例的toString()结果
DMH.invokeStatic_L_V=Lambda(a0:L,a1:L)=>{
t2:L=DirectMethodHandle.internalMemberName(a0:L);
t3:V=MethodHandle.linkToStatic(a1:L,t2:L);void}
```
这个适配器将获取方法句柄中的MemberName类型的字段并且以它为参数调用linkToStatic方法。估计你已经猜到了Java虚拟机也会对linkToStatic调用做特殊处理它将根据传入的MemberName参数所存储的方法地址或者方法表索引直接跳转至目标方法。
```
final class MemberName implements Member, Cloneable {
...
//@Injected JVM_Method* vmtarget;
//@Injected int vmindex;
...
```
那么前面那个适配器中的优化又是怎么回事实际上方法句柄一开始持有的适配器是共享的。当它被多次调用之后Invokers.checkCustomized方法会为该方法句柄生成一个特有的适配器。这个特有的适配器会将方法句柄作为常量直接获取其MemberName类型的字段并继续后面的linkToStatic调用。
```
final class java.lang.invoke.LambdaForm$DMH000 {
static void invokeStatic000_LL_V(java.lang.Object, java.lang.Object);
Code:
0: ldc #14 // String CONSTANT_PLACEHOLDER_1 <<Foo.bar(Object)void/invokeStatic>>
2: checkcast #16 // class java/lang/invoke/MethodHandle
5: astore_0 // 上面的优化代码覆盖了传入的方法句柄
6: aload_0 // 从这里开始跟初始版本一致
7: invokestatic #22 // Method java/lang/invoke/DirectMethodHandle.internalMemberName:(Ljava/lang/Object;)Ljava/lang/Object;
10: astore_2
11: aload_1
12: aload_2
13: checkcast #24 // class java/lang/invoke/MemberName
16: invokestatic #28 // Method java/lang/invoke/MethodHandle.linkToStatic:(Ljava/lang/Object;Ljava/lang/invoke/MemberName;)V
19: return
```
可以看到,方法句柄的调用和反射调用一样,都是间接调用。因此,它也会面临无法内联的问题。不过,与反射调用不同的是,方法句柄的内联瓶颈在于即时编译器能否将该方法句柄识别为常量。具体内容我会在下一篇中进行详细的解释。
## 总结与实践
今天我介绍了invokedynamic底层机制的基石方法句柄。
方法句柄是一个强类型的、能够被直接执行的引用。它仅关心所指向方法的参数类型以及返回类型,而不关心方法所在的类以及方法名。方法句柄的权限检查发生在创建过程中,相较于反射调用节省了调用时反复权限检查的开销。
方法句柄可以通过invokeExact以及invoke来调用。其中invokeExact要求传入的参数和所指向方法的描述符严格匹配。方法句柄还支持增删改参数的操作这些操作是通过生成另一个充当适配器的方法句柄来实现的。
方法句柄的调用和反射调用一样,都是间接调用,同样会面临无法内联的问题。
今天的实践环节,我们来测量一下方法句柄的性能。你可以尝试通过重构代码,将方法句柄变成常量,来提升方法句柄调用的性能。
```
public class Foo {
public void bar(Object o) {
}
public static void main(String[] args) throws Throwable {
MethodHandles.Lookup l = MethodHandles.lookup();
MethodType t = MethodType.methodType(void.class, Object.class);
MethodHandle mh = l.findVirtual(Foo.class, "bar", t);
long current = System.currentTimeMillis();
for (int i = 1; i <= 2_000_000_000; i++) {
if (i % 100_000_000 == 0) {
long temp = System.currentTimeMillis();
System.out.println(temp - current);
current = temp;
}
mh.invokeExact(new Foo(), new Object());
}
}
}
```
\[1\] [https://en.wikipedia.org/wiki/Duck\_typing](https://en.wikipedia.org/wiki/Duck_typing)
\[2\]
[https://docs.oracle.com/javase/10/docs/api/java/lang/invoke/MethodHandle.html](https://docs.oracle.com/javase/10/docs/api/java/lang/invoke/MethodHandle.html)
\[3\]
[https://en.wikipedia.org/wiki/Currying](https://en.wikipedia.org/wiki/Currying)