深入了解Java虚拟机栈以及内存模型

1、结合字节码指令理解java虚拟机栈和栈帧

栈帧：每个栈帧对应一个被调用的方法，可以理解为一个方法的运行空间。

每个栈帧中包括局部变量表(local variables)、操作数栈(operand stack)、指向运行时常量池的引用(a reference to the run-time constant pool)、方法返回地址(return address)和附加信息。

局部变量表：方法中定义的局部变量以及方法的参数存放在这张表中，局部变量表中的变量不可直接使用，如需要使用的话，必须通过相关指令将其加载至操作数栈中作为操作数使用。

操作数栈：以压栈和出栈的方式存储操作数的。

动态链接：每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有这个引用是为了支持方法调用过程中的动态连接(dynamic linking)。

方法返回地址：当一个方法开始执行后，只有两种方式可以退出，一种是遇到方法返回的字节码指令；一种是遇见异常，并且这个异常没有在方法体内得到处理。

2、深入分析

2.1 栈指向堆

如果在栈帧中有一个变量，类型为引用类型，比如 object obj=new object()，这时候就是典型的栈中元素指向堆中的对象。

2.2 方法区指向堆

方法区中会存放静态变量，常量等数据。如果是下面这种情况，就是典型的方法区中元素指向堆中的对象。

2.3 堆指向方法区

方法区中会包含类的信息，堆中会有对象，那怎么知道对象是哪个类创建的呢?

思考：一个对象怎么知道它是由哪个类创建出来的？怎么记录?这就需要了解一个java对象的具体信息咯。

2.4 java对象内存布局

一个java对象在内存中包括3个部分：对象头、实例数据和对齐填充。

3、内存模型

3.1 图解

一块是非堆区，一块是堆区。
堆区分为两大块，一个是old区，一个是young区。 young区分为两大块，一个是survivor区(s0+s1)，一块是eden区。 eden:s0:s1=8:1:1 s0和s1一样大，也可以叫from和to。

根据之前对于heap的介绍可以知道，一般对象和数组的创建会在堆中分配内存空间，关键是堆中有这么多区域，那一个对象的创建到底在哪个区域呢?

3.2 对象创建所在区域

一般情况下，新创建的对象都会被分配到eden区，一些特殊的大的对象会直接分配到old区。
比如有对象a，b，c等创建在eden区，但是eden区的内存空间肯定有限，比如有100m，假如已经使用了 100m 或者达到一个设定的临界值，这时候就需要对eden内存空间进行清理，即垃圾收集(garbage collect)，这样的gc我们称之为minor gc，minor gc指的是young区的gc。

经过gc之后，有些对象就会被清理掉，有些对象可能还存活着，对于存活着的对象需要将其复制到survivor 区，然后再清空eden区中的这些对象。

3.3 survivor区详解

由图解可以看出，survivor区分为两块s0和s1，也可以叫做from和to。在同一个时间点上，s0和s1只能有一个区有数据，另外一个是空的。

接着上面的gc来说，比如一开始只有eden区和from中有对象，to中是空的。此时进行一次gc操作，from区中对象的年龄就会+1，我们知道eden区中所有存活的对象会被复制到to区，
from区中还能存活的对象会有两个去处。

若对象年龄达到之前设置好的年龄阈值，此时对象会被移动到old区，􏰀􏰁eden􏰂􏰃from􏰂没有达到阈值的对象会被复制到to区。此时eden区和from区已经被清空(被gc的对象肯定没了，没有被gc的对象都有了各自的去处)。
这时候from和to交换角色，之前的from变成了to，之前的to变成了from。也就是说无论如何都要保证名为to的survivor区域是空的。
minor gc会一直重复这样的过程，直到to区被填满，然后会将所有对象复制到老年代中。

3.4 old区详解

从上面的分析可以看出，一般old区都是年龄比较大的对象，或者相对超过了某个阈值的对象。

在old区也会有gc的操作，old区的gc我们称作为major gc。

3.5 对象的一辈子理解

我是一个普通的java对象，我出生在eden区，在eden区我还看到和我长的很像的小兄弟，我们在eden区中玩了挺长时间。有一天eden区中的人实在是太多了,我就被迫去了survivor区的“from”区，自从去了survivor区,我就开始漂了，有时候在 survivor的“from”区，有时候在survivor的“to”区,居无定所。直到我18岁的时候，爸爸说我成人了，该去社会上闯闯了。于是我就去了年老代那边,年老代里，人很多，并且年龄都挺大的，我在这里也认识了很多人。在年老代里，我生活了20年(每次 gc加一岁)，然后被回收。

3.6 常见问题

如何理解minor/major/full gc

minor gc：新生代

major gc：老年代

full gc：新生代+老年代

为什么需要survivor区?只有eden不行吗?

如果没有survivor，eden区每进行一次minor gc，存活的对象就会被送到老年代。这样一来，老年代很快被填满，触发major gc(因为major gc一般伴随着minor gc，也可以看做触发了full gc)。老年代的内存空间远大于新生代，进行一次full gc消耗的时间比minor gc长得多。执行时间长有什么坏处？频发的full gc消耗的时间很长，会影响大型程序的执行和响应速度。

可能你会说，那就对老年代的空间进行增加或者较少咯。假如增加老年代空间，更多存活对象才能填满老年代。虽然降低full gc频率，但是随着老年代空间加大，一旦发生full gc，执行所需要的时间更长。

假如减少老年代空间，虽然full gc所需时间减少，但是老年代很快被存活对象填满，full gc频率增加。

所以survivor的存在意义，就是减少被送到老年代的对象，进而减少full gc的发生，survivor的预筛选保证，只有经历16 次minor gc还能在新生代中存活的对象，才会被送到老年代。

为什么需要两个survivor区?

最大的好处就是解决了碎片化。也就是说为什么一个survivor区不行?第一部分中，我们知道了必须设置survivor区。假设，现在只有一个survivor区,我们来模拟一下流程：

刚刚新建的对象在eden中，一旦eden满了，触发一次minor gc，eden中的存活对象就会被移动到survivor区。这样继续循环下去，下一次eden满了的时候,问题来了，此时进行minor gc，eden和survivor各有一些存活对象，如果此时把eden区的，存活对象硬放到survivor区，很明显这两部分对象所占有的内存是不连续的，也就导致了内存碎片化。
永远有一个survivor space是空的，另一个非空的survivor space无碎片。

新生代中eden:s1:s2为什么是8:1:1?

新生代中的可用内存：复制算法用来担保的内存为9:1

可用内存中eden:s1区为8:1

即新生代中eden:s1:s2 = 8:1:1

4、验证

4.1 堆内存溢出

程序：

记得设置参数比如-xmx20m -xms20m

运行结果：

4.2 方法区内存溢出

比如向方法区中添加class的信息

4.2.1 asm依赖和class代码

4.2.2 代码

设置metaspace的大小，比如-xx:metaspacesize=50m -xx:maxmetaspacesize=50m

运行结果：

4.3 虚拟机栈

4.3.1 代码演示stackoverflow

运行结果：

4.3.2 理解和说明

stack space用来做方法的递归调用时压入stack frame(栈帧)。所以当递归调用太深的时候，就有可能耗尽stack space，爆出stackoverflow的错误。

-xss128k：设置每个线程的堆栈大小。jdk 5以后每个线程堆栈大小为1m，以前每个线程堆栈大小为256k。根据应用的线程所需内存大小进行调整。在相同物理内存下，减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的，不能无限生成，经验值在3000~5000左右。

线程栈的大小是个双刃剑，如果设置过小，可能会出现栈溢出，特别是在该线程内有递归、大的循环时出现溢出的可能性更大，如果该值设置过大，就有影响到创建栈的数量，如果是多线程的应用，就会出现内存溢出的错误。

到此这篇关于深入了解java虚拟机栈以及内存模型的文章就介绍到这了,更多相关java虚拟机栈和内存模型内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com！

黄山市民网：https://www.huangshanshimin.com/