本文介绍执行引擎。
1. 概述
执行引擎是Java虚拟机核心的组成部分之一。
“虚拟机”是一个相对于“物理机”的概念,这两种机器都有代码执行能力,其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的。而虚拟机的执行引擎则是由软件自行实现的,因此虚拟机可以不受物理条件制约地定制指令集与执行引擎的结构体系,能够执行那些不被硬件直接支持的指令集格式。
JVM的主要任务是负责装载字节码到其内部并执行,但字节码并不能够直接运行在操作系统之上,因为字节码指令并非等价于本地机器指令,它内部包含的仅仅只是一些能够被JVM所识别的字节码指令、符号表,以及其他辅助信息。
那么如果想要让一个Java程序运行起来,执行引擎(Execution Engine)的任务就是将字节码指令解释/编译为对应平台上的本地机器指令才可以。简单来说,JVM中的执行引擎充当了将高级语言翻译为机器语言的译者。
- 执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于PC寄存器。
- 每当执行完一项指令操作后,PC寄存器就会更新下一条需要被执行的指令地址。
- 当然方法在执行的过程中,执行引擎有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息,以及通过对象头中的元数据指针定位到目标对象的类型信息。
从外观上来看,所有的Java虚拟机的执行引擎的输入、输出都是一致的:输入的是字节码二进制流,处理过程是字节码编译/解析执行的等效过程,输出的是执行结果。
执行引擎在JVM处于下层,和运行时数据区以及本地方法库交互。如下图所示,执行引擎分为解析器、编译器和垃圾回收三部分。
2. 代码编译和执行过程
大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前,都需要经过以下步骤。
- 黄色流程,即为前端编译(如javac),生成字节码文件
- 绿色流程,就是解释执行步骤(如Python),翻译一条指令,就执行一条
- 蓝色流程,就是编译执行步骤(如C),将全部指令翻译完,再统一执行
- Java目前支持这两种,半编译半解释。
JVM中包含了蓝色和绿色两种流程:
什么是解释器,什么是JIT编译器?
解释器:当Java虚拟机启动时,会根据预定义的规范,对字节码采用逐行解释的方式执行,即将每条字节码的内容翻译为对应平台的本地机器指令。翻译一行,执行一行。(但是翻译后的指令不会保存起来)
JIT(Just In Time Compiler)编译器:就是将所有的字节码一起翻译完之后,再统一执行。(显然,这里会保存翻译后的指令)
3. 机器码、指令、汇编语言、高级语言
- 机器码就是计算机能够直接识别的编码,即01二进制码,也被称为机器指令码。
- 指令就是在机器码的基础上,将特定的机器码简化成对应的指令,如mov、inc、add等等,方便记忆,计算机可识别。
- 指令集则是则是指令的集合,不同硬件平台上的指令和指令集都是不一样的。
- 汇编语言则是在指令的基础上进一步翻译简化而来,对程序员更加友好。
- 高级语言对指令的进一步封装简化,人类易读。高级语言翻译成机器指令有两种方式,即编译和解释。
4. 解释器
解释器真正意义上所承担的角色就是一个运行时“翻译者”,将字节码文件中的内容“翻译”为对应平台的本地机器指令执行。
当一条字节码指令被解释执行完成后,接着再根据PC寄存器中记录的下一条需要需要被执行的字节码指令执行解释操作。
由于解释器在设计和实现上非常简单,因此除了Java语言外,Python、Perl、Ruby等语言也都是基于解释器执行的,基于解释器执行已经沦落为低效的代名词。
5. JIT编译器
为了解决解释器效率低下的问题,JVM平台支持一种叫做即使编译的技术。即时编译的目的是避免函数被解释执行,而是将整个函数体编译为机器码(会缓存下来),每次函数执行时,只执行编译后的机器码即可,这种方式可以使执行效率大幅度提升。
6. Hotspot VM
Hotspot VM是目前市面上高性能虚拟机的代表作之一。它采用解释器与即时编译器并存的架构。在Java虚拟机运行时,解释器和即时编译器能够相互协作,各自取长补短,尽力去选择最合适的方式来权衡编译本地代码和直接解释执行代码的时间。
那么既然JIT编译器的执行效率较高,为什么还保留解释器呢?
因为JIT提升性能是在第一次编译后,后续再次执行本代码时,可以直接从缓存的机器指令中直接执行,无需再次翻译成及其指令。
如果只执行一次,显然JIT是无法提升性能的。而解释器则是翻译一句就执行一句,响应速度较快,即程序启动时,解释器可以马上发挥作用,省去编译的时间,立即执行。
当Java虚拟机启动时,解释器可以首先发挥作用,而不必等待即时编译器全部编译完成后再执行,这样可以省去许多不必要的编译时间。随着时间的推移,编译器发挥作用,根据热点代码探测功能,把有价值的字节码编译成本地代码缓存下来,获得更高的执行效率。
6.1 热点代码
是否需要启动JIT编译器将字节码直接编译为对应平台的本地机器指令,则需要根据代码被调用执行的频率而定。关于那些需要被编译为本地代码的字节码,被称之为“热点代码”,JIT编译器在运行时会针对那些频繁被调用的“热点代码”做出深度优化,将其直接编译为对应平台的本地机器指令,以此提升Java程序的执行性能。这里的频率,根据方法调用计数器或者回边计数器来计算,client模式下是1500,server模式下是10000。
一个被多次调用的方法,或者是一个方法体内部循环次数较多的循环体都可被称为“热点代码”。因此都可以通过JIT编译器编译为本地机器指令。由于这种编译方式发生在方法的执行过程中,因此也被称之为栈上替换,简称OSR(On Stack Replacement)编译。
6.2 JIT编译器C1、C2
Hotspot中的JIT编译器有两个C1和C2,C1指的是Client Compiler,C2指的是Server Compiler。64位操作系统,JVM默认使用的是C2编译器。
- C1优化的比较简单,耗时短。
- 方法内联
- 去虚拟化
- 冗余消除
- C2优化的比较深层,比较激进,效率更高。
- 标量替换
- 栈上分配
- 同步消除
在JDK10以后,Hotspot又加入了一个全新的即时编译器:Graal编译器。
6.3 AOT编译器
JIT编译器是在程序运行过程中进行优化,将热点代码翻译成机器指令保存起来。而AOT编译器则是在程序运行之前,就翻译成机器指令.so文件
保存起来。
但是这样,翻译后的机器指令,显然不能跨平台了。打破了Java一次编译到处运行。
7. 备注
参考B站《尚硅谷》。