JVM - 运行时内存区域

Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。

那在整个程序执行过程中,JVM中怎么存取数据和相关信息呢?

事实上在JVM中是用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是我们常说的JVM内存。

一、运行时数据区域包括哪些

根据《Java虚拟机规范》的规定,运行时数据区通常包括这几个部分:

  • **程序计数器(Program Counter Register)**:线程私有的,记录当前线程的行号指示器,为线程的切换提供保障;

  • **Java虚拟机栈(Java Vitual Machine Stack)*:线程私有的,主要存放局部变量表*,操作数栈,动态链接和方法出口等;

  • 本地方法栈(Native Method Stack)

  • 方法区(Method Area):线程共享的,主要存储类信息、常量池、静态变量、JIT编译后的代码等数据。方法区理论上来说是堆的逻辑组成部分;运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用;

  • 堆(Heap):所有线程共享的,主要用来存储对象。其中,堆可分为:年轻代和老年代两块区域。使用NewRatio参数来设定比例。对于年轻代,一个Eden区和两个Suvivor区,使用参数SuvivorRatio来设定大小;

二、各个部分存储的信息和负责的职能

1、程序计数器

这个内存区域是Java虚拟机规范中唯一一个没有规定任何OOM(OutOfMemoryError)情况的区域,这是这个区域最大的特点之一,这是因为程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,因此,对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。

这个区域主要是负责记录正在执行的虚拟机字节码指令地址,即当前线程执行的字节码的行号指示器(注意:JVM不是直接执行Java代码,而是执行.class文件,所以只要其他编程语言能翻译成.class文件一样能放入JVM中执行)。 JVM会给每个线程一个独立的程序计数器,计数器之间互不影响 ,且通过线程轮流切换并且分配处理器执行时间来实现JVM的多线程。不过当线程执行的是Native方法的时候这个计数器中的值为undefined。

2、Java虚拟机栈

和程序计数器一样的是Java虚拟机栈是线程私有,生命周期和线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的时候都会创建栈帧,用来存储局部变量表,操作数栈,动态链接,方法出口等信息,每个方法从调用到执行完成的过程,就对应一个栈帧在虚拟机中入栈到出栈的过程,其中64位长度的long和double类型的数据会占用2个局部变量空间,其余的数据类型只占用1个。 这里需要理解一下的就是为什么要用栈这个结构呢,比如A方法中调用了B方法,虚拟机中是先让A方法的栈帧进入虚拟机栈执行,当执行到调用B方法的语句就让B栈帧进入,执行完之后B栈帧就出栈,A栈就继续执行。这里注意的是如果递归的方法递归的太深很容易抛出下面两种异常,所以递归虽然写起来方便,但是性能会有所下降,并且容易抛出异常。

Java虚拟机规范中,对这个区域规定了两种异常状况

i. 线程请求栈的深度大于虚拟机所允许栈的深度,将抛出Stack Overflow Error

ii. 如果虚拟机栈可以动态扩展且扩展时无法申请到足够的内存,会抛出OutOfMemoryError

3、本地方法栈

与虚拟机栈作用相似,不过是虚拟机栈为虚拟机执行Java方法提供,而本地方法为虚拟机使用到的Native方法服务,Native方法多是用C++写的。抛出的异常和虚拟机栈相同。

4、Java堆

Java堆是与前面的区域不同的是:这个区域是 被所有线程共享 的一块内存区域,用来存放对象实例,并为对象实例分配好内存。Java虚拟机规范中这样描述:所有对象实例以及数组都要在堆上分配。Java堆也是垃圾收集器管理的主要区域,也叫”GC堆“。由于现在的垃圾回收算法多是分代收集,所以Java堆里面又可分为:新生代和老年代。 并且根据Java虚拟机规范的规定:Java堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。有实例没有被分配,且堆无法再扩展的时候会抛出OutOfMemoryError异常,虚拟机调优其实也主要关注的是这个区域。

5、方法区

与Java堆一样,线程共享,用来存储被虚拟机加载的类信息、常量、静态变量。这个区域Java虚拟机规范对其特别宽松,既可以像Java堆那样不需要连续内存,又可以选择固定大小和可扩展。还可以选择不实现垃圾收集,这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。当无法满足内存分配需求时,将抛出OutOfMemoryError异常。

永久代和元空间

方法区是Java虚拟机规范中的定义,是一种规范,而永久代是HotSpot对方法区的一种实现,一个是标准一个是实现,即使用永久代来实现方法区

  • 存储位置不同,永久代物理上是堆的一部分,和新生代,老年代地址是连续的,而元空间属于本地内存;
  • 存储内容不同,元空间(一块区域)存储类的元信息静态变量和常量池等并入堆中。相当于永久代的数据被分到了堆和元空间中。

对于Java8, HotSpots取消了永久代, 取代永久代的就是元空间。虚拟机Hotspot已经将这部分存储空间从使用JVM内存换成使用本地内存,即这部分不再叫永久代,而是元空间。这个元空间实际上是JVM动态规定内存大小。

这个替换有什么优势呢?因为字符串常量池是存在永久代中,很容易出现性能问题,并且类和方法信息大小难确定,给永久代的的大小指定带来困难,而且GC会对永久代特殊处理,这就增加了GC的复杂性。从JDK1.7开始,字符串常量池就划分进了堆中,也使得元空间在内存划分的算法上更趋于合理。

Class文件常量池

Class 文件常量池指的是编译生成的 class 字节码文件,其结构中有一项是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放

这里的字面量是指字符串字面量和声明为 final 的(基本数据类型)常量值

  • 字符串字面量:除了类中所有双引号括起来的字符串(包括方法体内的),还包括所有用到的类名、方法的名字和这些类与方法的字符串描述、字段(成员变量)的名称和描述符;
  • 声明为final的常量值:指的是类的成员变量,不包含本地变量,本地变量是属于方法的。这些都在常量池的 UTF-8 表中(逻辑上的划分);

运行时常量池

运行时常量池是方法区的一部分,是一块内存区域。Class 文件常量池将在类加载后进入方法区的运行时常量池中存放。一个类加载到 JVM 中后对应一个运行时常量池,运行时常量池相对于 Class 文件常量池来说具备动态性,Class 文件常量只是一个静态存储结构,里面的引用都是符号引用。而运行时常量池可以在运行期间将符号引用解析为直接引用。可以说运行时常量池就是用来索引和查找字段和方法名称和描述符的。给定任意一个方法或字段的索引,通过这个索引最终可得到该方法或字段所属的类型信息和名称及描述符信息,这涉及到方法的调用和字段获取。

字符串常量池

字符串常量池是全局的,JVM 中独此一份,因此也称为全局字符串常量池。

运行时常量池中的字符串字面量若是成员的,则在类的加载初始化阶段就使用到了字符串常量池;若是本地的,则在使用到的时候(执行此代码时)才会使用到字符串常量池。其实,“使用常量池”对应的字节码是一个 ldc 指令,在给 String 类型的引用赋值的时候会先执行这个指令,看常量池中是否存在这个字符串对象的引用,若有就直接返回这个引用,若没有,就在堆里创建这个字符串对象并在字符串常量池中记录下这个引用(jdk1.7)。

常量不一定只有编译期才能产生,运行期间也可以将新的常量放入池中。例如String的Intern()方法,同样抛出OutOfMemoryError异常。

缓冲池

JVM 中除了字符串常量池,8种基本数据类型中除了两种浮点类型剩余的6种基本数据类型的包装类,都使用了缓冲池技术,但是 Byte、Short、Integer、Long、Character 这5种整型的包装类也只是在对应值在 [-128,127] 时才会使用缓冲池,超出此范围仍然会去创建新的对象。其中:

  • 在 jdk1.6(含)之前也是方法区的一部分,并且其中存放的是字符串的实例;
  • 在 jdk1.7(含)之后是在堆内存之中,存储的是字符串对象的引用,字符串实例是在堆中;
  • jdk1.8 已移除永久代,字符串常量池是在本地内存当中,存储的也只是引用。

三、直接内存

这个区域并不是属于运行时数据区域,但是这个区域也会被频繁使用,并且抛出OOM异常。这个区域主要是由于在JDK1.4中新加入了NIO(New Input/Output)类,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存,通过一个储存在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。

这样能避免在Java堆和Native堆中来回复制数据,从而在一些场景中显著提高性能。直接内存分配不会受到Java堆大小的限制,会受到本机总内存大小及处理器寻址空间的限制。会抛出OutOfMemoryError异常

四、总结

只有程序计数器不会报出任何相关OOM异常,而Java虚拟机栈有可能会报出OOM或Stack Overflow异常。Java虚拟机栈主要是存储方法的一些信息,能让方法顺利的执行,而Java堆存储的是对象的信息。虚拟机的垃圾回收算法主要在这一块,并且平常调优的区域也是在这一块。

参考

https://www.cnblogs.com/xiaotian15/p/6971353.html

https://www.tuicool.com/articles/Av6RZnU

参考

(完)


JVM - 运行时内存区域
https://blackist.org/2019-07-07-java-jvm-jmm/
作者
董猿外
发布于
2019年7月7日
许可协议