@boothsun
2021-12-22T18:38:40.000000Z
字数 3965
阅读 1309
JVM
转载原文地址:JVM的内存区域划分
转载原文地址:java虚拟机内存区域的划分以及作用详解
转载原文地址:深入理解JVM之JVM内存区域与内存分配
学过C语言的朋友都知道C编译器在划分内存区域的时候经常将管理的区域划分为数据段和代码段,数据段包括堆、栈以及静态数据区。那么在Java语言当中,内存又是如何划分的呢?
由于Java程序是交由JVM执行的,所以我们在谈Java内存区域划分的时候事实上是指JVM内存区域划分。在讨论JVM内存区域划分之前,先来看一下Java程序具体执行的过程:
如上图所示,首先Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。在整个程序执行过程中,JVM会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是我们常说的JVM内存。因此,在Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。
在知道了JVM内存是什么东西之后,下面我们就来讨论一下这段空间具体是如何划分区域的,是不是也像C语言中一样也存在栈和堆呢?
根据《Java虚拟机规范》的规定,运行时数据区通常包括这几个部分:程序计数器(Program Counter Register)、Java栈(VM Stack)、本地方法栈(Native Method Stack)、方法区(Method Area)、堆(Heap)。
如上图所示,JVM中的运行时数据区应该包括这些部分。在JVM规范中虽然规定了程序在执行期间运行时数据区应该包括这几部分,但是至于具体如何实现并没有做出规定,不同的虚拟机厂商可以有不同的实现方式。
下面我们来了解一下运行时数据区的每部分具体用来存储程序执行过程中的哪些数据。
程序计数器 = 当前线程执行的指令地址
在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间片的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说一个一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储。
在JVM规范中规定,如果线程执行的是非native方法,则程序计数器中保存的是当前需要执行的指令的地址;如果线程执行的是native方法,则程序计数器中的值是undefined(原因是:程序计数器记的是字节码的指令地址,而对于本地方法,是操作系统层面的方法,JVM无法记录执行过程)。
由于程序计数器中存储的数据所占空间的大小不会随程序的执行而发生改变,因此,对于程序计数器是不会发生内存溢出现象(OutOfMemory)的。
总结:
1. 程序计数器就是保存当前线程执行的指令地址。作用是:线程切换后的恢复,异常处理 循环跳转等。
2. 线程私有区域,生命周期与线程相同。
3. 所占空间小且固定,故不会出现 OOM。
Java虚拟机栈与C语言的数据结构中的栈类似。事实上,Java栈是Java方法执行过程的内存模型。为什么这么说呢?下面就来解释一下其中的原因。
Java栈中存放的是一个个的栈帧,每个栈帧对应一个被调用的方法,栈帧中存储包括局部变量表(Local Variables)、操作栈(Operand Stack)、指向当前方法所属的类的运行时常量池(运行时常量池的概念在方法区部分会谈到)的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些额外的附加信息。当线程执行一个方法时,就会随之创建一个对应的栈帧,并将建立的栈帧压栈。当方法执行完毕之后,便会将栈帧出栈。因此可知,线程当前执行的方法所对应的栈帧必定位于Java栈的顶部。讲到这里,大家就应该会明白为什么 在 使用 递归方法的时候容易导致栈内存溢出以及为什么栈区的空间不用程序员去管理了(当然在Java中,程序员基本不用关系到内存分配和释放的事情,因为Java有自己的垃圾回收机制),这部分空间的分配和释放都是由系统自动实施的。对于所有的程序设计语言来说,栈这部分空间对程序员来说是不透明的。下图表示了一个Java栈的模型:
局部变量表,故名思议,就是用来存储方法中的局部变量(包括方法体内定义的变量以及方法入参、出参)。对于基本数据类型的变量,则直接存储它的值,对于引用类型的变量,则存的是指向对象的引用。局部变量表的大小在编译阶段就可以确定,因此在程序执行期间局部变量表的大小是不会改变的。
操作栈,想必学过数据结构中的栈的朋友想必对表达式求值问题不会陌生,栈最典型的一个应用就是用来对表达式求值。想想一个线程执行方法的过程中,实际上就是不断执行语句的过程,而归根到底就是进行计算的过程。因此可以这么说,程序中的所有计算过程都是在借助于操作栈来完成的。
指向运行时常量池的引用,因为在方法执行的过程中有可能需要用到类中的常量,所以必须要有一个引用指向运行时常量。
方法返回地址,当一个方法执行完毕之后,要返回之前调用它的地方,因此在栈帧中必须保存一个方法返回地址。
由于每个线程正在执行的方法可能不同,因此每个线程都会有一个自己的Java栈,互不干扰。
在Java虚拟机规范中,对这个区域规定了两种异常情况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机栈可以动态扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。
其实用面向对象的思想来解释,就是有个“栈帧”实体,里面包含描述栈帧(方法)的属性有:操作栈、局部变量表、方法返回地址等。
public class StackFrameEntity {
// 局部变量表(包含输入输出参数)
private Object[] paramterers ;
// 操作数
private Object operatorNum ;
// 方法返回地址
private Object retunAddress ;
// ......
}
本地方法栈与Java虚拟机栈的作用和原理非常相似。区别只不过是Java栈是为执行Java方法服务的,而本地方法栈则是为执行本地方法(Native Method)服务的。在JVM规范中,并没有对本地方法栈的具体实现方法以及数据结构作强制规定,虚拟机可以自由实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。
Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例和数组,几乎所有的对象实例都在这里分配内存。 在Heap中分配一定的内存来保存对象实例,实际上也只是保存对象的属性值,属性的类型和对象本身的类型标记等,并不保存对象的方法(以栈帧的形式保存在Stack中),在Heap中分配一定的内存保存对象实例。而对象实例在Heap中分配好以后,需要在Stack中保存一个4字节的Heap内存地址,用来定位该对象实例在Heap中的位置,便于找到该对象实例。
由于现在收集器基本都是采用的分代收集算法,所以Java堆还可以细分为:新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。不过,无论如何划分,都与存放内容无关,无论哪个区域,存放的都仍然是对象实例,进一步划分的目的是为了更好地回收内存,或者更快地分配内存。
如果在堆中没有内存空间完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。
方法区域(Method Area)是各个线程共享的运行时内存区域,方法区与传统语言中的编译代码储存区(Storage Area Of Compiled Code)或者操作系统进程的正文段(Text Segment) 的作用非常类似,它用于存储已被虚拟机加载的类结构信息,例如Class文件中的常量池、字段和方法数据、构造函数和普通方法的字节码内容,还包括一些在类、实例、接口初始化时用到的特殊方法。
这个区域除了和Java堆一样不需要连续的内存和可以选择固定大小或者可扩展之外,还可以选择不实现垃圾收集。但是这部分区域的回收确实是有必要的,这个区域的内存回收目标主要是针对于常量池的回收和对类型的卸载。
如果方法区的内存空间不能满足内存分配请求,那Java虚拟机将抛出异常:OutOfMemoryError异常。
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段方法、接口等描述性信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类被加载后存放到方法区的运行时常量池中。也就是说,Class文件中有一个常量池信息,用于存放此Class文件涉及到的各种字面量和符号引用,当Class文件被加载到方法区时,会将该Class里的常量池保存的内容加载到方法的运行时常量池中。
运行时常量与Class文件中的常量池的区别:
参见 深入理解JVM之JVM内存区域与内存分配 中马士兵老师讲解那段 基本上大致流程就都ok了。