吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3039|回复: 24
收起左侧

[其他原创] 深入理解JVM虚拟机 - jvm的对象分配策略

  [复制链接]
zxdsb666. 发表于 2021-6-6 14:15

《深入理解JVM虚拟机》解读

深入理解JVM虚拟机 - jvm的对象分配策略

概述:

  1. 书中对象优先在eden区分配实验与实际结果不符?关于实际运行结果的对比和解读
  2. JVM大对象的分配细节概述,补充动态年龄判断当中书中遗漏的存活率参数。
  3. 了解空间分配担保的机制,为什么会出现该机制。以及JDK版本变化的改动细节
  4. 总结个人经验与教训

前言

​ JVM的对象分配策略是面试的中经常会碰到的点,也是学习和了解虚拟机必须迈过的一个坎。本文并不是单纯的总结书中的内容,在个人针对书中的案例进行实验的时候,发现结果居然和书中的结果不匹配,所以抽了不少时间专门研究了一下这一块,下面根据个人的学习和总结来描述一下个人对于JVM对象分配策略的解读。

注意:本部分内容不建议手机上观看,建议PC端观看,另外强烈建议有条件的同学去翻一翻《深入理解JVM虚拟机》第三版,看一下关于对象优先在eden区域分配相关的部分内容,对于理解下文所说的差异更有帮助。

问题:对象优先在eden区分配实验与实际结果不符?

​ 下面这段代码,只要随便百度一下eden区域分配的相关博客内容,基本可以翻到一大堆的类似内容,这段代码的出处就是《深入理解JVM虚拟机》。下面我们来看看这一部分代码实际运行情况和书中的出入对比结果。

​ 按照书中的描述,正确结果应该是Minor gc之后对象在eden区域分配最后的4M对象,而a1和a2以及a3因为survivor区域无法容纳则进入了老年代占用了6M的老年代内存,然而实际的结果却大相径庭。

​ 先说下结论:要符合书中的情况,需要使用serial 垃圾收集器 + jdk1.7 的版本,才会出现书中对应的效果。其他情况下会发现各种莫名其妙的情况。

问题代码:

public class MinorGcTest {
    private static final int _1MB = 1024 * 1024;

    public static void main(String[] args) {
        testAllocation();
    }

    public static void testAllocation() {
        byte[] allocation1, allocation2, allocation3, allocation4, allocation5;
        allocation1 = new byte[_1MB * 2];
        allocation2 = new byte[_1MB * 2];
        allocation3 = new byte[_1MB * 2];
        allocation4 = new byte[_1MB * 4];

    }/*jdk 1.8.0-221 运行结果:
        下面为  parallel 收集器 的运行结果:
    -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
    eden区域存活6M对象,而老年代分配最后的4M对象
                                                        (可用空间eden 8194+1个survivor区大小1024)
    [GC (Allocation Failure) [PSYoungGen: 7925K->1006K(9216K)] 7925K->5394K(19456K), 0.0045482 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]
    Heap
     PSYoungGen      total 9216K, used 7637K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
      eden space 8192K, 80% used [0x00000000ff600000,0x00000000ffc79b40,0x00000000ffe00000)
      from space 1024K, 98% used [0x00000000ffe00000,0x00000000ffefbbb0,0x00000000fff00000)
      to   space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
     ParOldGen       total 10240K, used 4387K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      object space 10240K, 42% used [0x00000000fec00000,0x00000000ff048d18,0x00000000ff600000)
     Metaspace       used 3302K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 355K, capacity 388K, committed 512K, reserved 1048576K

    jdk 1.8.0-221 运行结果:
    下面为 serrial 收集器的运行结果
    -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGcDetail -XX:SurvivorRatio=8 -XX:+UseSerialGC
    eden区域存活6M对象,而老年代分配最后的4M对象
    [GC (Allocation Failure) [DefNew: 7925K->1023K(9216K), 0.0063912 secs] 7925K->5300K(19456K), 0.0064606 secs] [Times: user=0.00 sys=0.02, real=0.01 secs]
    Heap
     def new generation   total 9216K, used 7654K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      eden space 8192K,  80% used [0x00000000fec00000, 0x00000000ff279b70, 0x00000000ff400000)
      from space 1024K,  99% used [0x00000000ff500000, 0x00000000ff5ffff8, 0x00000000ff600000)
      to   space 1024K,   0% used [0x00000000ff400000, 0x00000000ff400000, 0x00000000ff500000)
     tenured generation   total 10240K, used 4276K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
       the space 10240K,  41% used [0x00000000ff600000, 0x00000000ffa2d020, 0x00000000ffa2d200, 0x0000000100000000)
     Metaspace       used 3271K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 355K, capacity 388K, committed 512K, reserved 1048576K
    */

    /*JDK 1.7.0_51 运行结果:
    -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
    下面为  parallel 收集器收集方案:
    eden区域存活6M对象,而老年代分配最后的4M对象
    Heap
     PSYoungGen      total 9216K, used 7669K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
      eden space 8192K, 93% used [0x00000000ff600000,0x00000000ffd7d448,0x00000000ffe00000)
      from space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
      to   space 1024K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
     ParOldGen       total 10240K, used 4096K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      object space 10240K, 40% used [0x00000000fec00000,0x00000000ff000010,0x00000000ff600000)
     PSPermGen       total 21504K, used 3019K [0x00000000f9a00000, 0x00000000faf00000, 0x00000000fec00000)
      object space 21504K, 14% used [0x00000000f9a00000,0x00000000f9cf2c78,0x00000000faf00000)

    JDK 1.7.0_51 运行结果:
    下面为 serrial 收集器的运行结果
    eden区域存活4M最后分配的对象,而老年代存活先前6M的对象
    -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGcDetail -XX:SurvivorRatio=8 -XX:+UseSerialGC
    [GC[DefNew: 7505K->533K(9216K), 0.0066009 secs] 7505K->6677K(19456K), 0.0066489 secs] [Times: user=0.03 sys=0.02, real=0.01 secs]
    Heap
     def new generation   total 9216K, used 5123K [0x00000000f9a00000, 0x00000000fa400000, 0x00000000fa400000)
      eden space 8192K,  56% used [0x00000000f9a00000, 0x00000000f9e7b6a0, 0x00000000fa200000)
      from space 1024K,  52% used [0x00000000fa300000, 0x00000000fa385660, 0x00000000fa400000)
      to   space 1024K,   0% used [0x00000000fa200000, 0x00000000fa200000, 0x00000000fa300000)
     tenured generation   total 10240K, used 6144K [0x00000000fa400000, 0x00000000fae00000, 0x00000000fae00000)
       the space 10240K,  60% used [0x00000000fa400000, 0x00000000faa00030, 0x00000000faa00200, 0x00000000fae00000)
     compacting perm gen  total 21248K, used 2923K [0x00000000fae00000, 0x00000000fc2c0000, 0x0000000100000000)
       the space 21248K,  13% used [0x00000000fae00000, 0x00000000fb0dada0, 0x00000000fb0dae00, 0x00000000fc2c0000)
    No shared spaces configured.
    */

}

​ 个人起初刚看的时候感觉书在骗我,于是网上搜集各种资料发现大多似乎都是“抄书”(深入理解JVM虚拟机说的是什么结论就是什么),即使说的方向正确的也没根据jdk版本进行比对过。所以这里个人直接通过两个jdk版本对应两个不同收集器对比得出了如上的结果。

​   其实周大神并没有骗我们,因为在书本的最开头作者就说了自己的环境是基于JDK7的,同时在介绍本部分内容说了也是使用了 serial 收集器,但是 JDK默认运行情况下不再使用Serial收集器而是Parallel收集器。所以导致运行结果和书里面看到的完全不同。另外JVM本身也是需要占用一定的内存的,在垃圾收集里面会 “多出”很多不知道哪里来的内存,这一点会在下面的内容介绍。

​   不过这一部分重读一遍之后发现确实不是特别的严谨,容易导致误解也是很正常的事情。

下面是JDK1.7和1.8比对【parallel收集器】收集器的结果截图

  • 从打印结果来看jdk7的版本当中没有触发GC,但是在jdk8版本触发了gc。
  • 在jdk1.8当中一个survivor塞满了数据,而jdk7将所有的对象内容分配到了 eden区域。
  • jdk1.8使用了元空间(废弃永久代),而jdk7 虽然存在永久代,但是可以看到常量池其实已经移到了堆当中,所以他的总大小为堆空间的大小

JDK1.7和1.8比对【parallel收集器】

下面是JDK1.7和1.8比对【Serial收集器】收集器的结果截图

  • jdk8 在老年代分配了4M的空间,而jdk7分配了6M的空间。
  • jdk7当中使用了survivor区域的一半大小空间存储,而eden区的数据为5M左右。jdk8直接为使用了7M的eden区域+1M的survivor区域,剩下对象直接分配到老年代
  • jdk1.8使用了元空间(废弃永久代),而jdk7 虽然存在永久代,但是可以看到常量池其实已经移到了堆当中,所以他的总大小为堆空间的大小

JDK1.7和1.8比对【Serial收集器】

总结:

  • JDK7 当中 PS收集器没有GC,4M的对象直接分配在了老年代。如果将对象大小改为3M或2M,将触发GC。
  • Serial收集器下,给4M的对象分配内存时触发了一次GC。GC产生的结果:先前分配的6M的对象进入了老年代,后面分配的4M的对象分配在了新生代。
  • Serial收集器下增加 -XX:PretenureSizeThreshold=3145728可产生PS收集器相同的结果。

<font color='red'>从上面的内容可以看到,对于jdk1.7和1.8不同的收集器效果居然完全不同。</font>究竟是什么原因导致的呢?

​ 这个问题其实很好解答:我们先对比一下在不执行任何代码的情况下两个版本对应同一个垃圾收集器使用的空间大小:从个人电脑的运行结果结果来看,serial 收集器 在 jdk7 中只会消耗1M左右的内容,而到了jdk8却需要消耗接近4M的内存大小。所以结论也很明显了,JVM为了保证程序运行自己需要生成一定的对象,导致对于测试结果进行“污染”,我们在进行试验的时候需要考虑到这部分内容。

这和所有的测试工具的思想类似:测试工具本身运行需要占用一定的内存:

Heap
 def new generation   total 9216K, used 3993K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  eden space 8192K,  48% used [0x00000000fec00000, 0x00000000fefe6540, 0x00000000ff400000)
  from space 1024K,   0% used [0x00000000ff400000, 0x00000000ff400000, 0x00000000ff500000)
  to   space 1024K,   0% used [0x00000000ff500000, 0x00000000ff500000, 0x00000000ff600000)
 tenured generation   total 10240K, used 0K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
   the space 10240K,   0% used [0x00000000ff600000, 0x00000000ff600000, 0x00000000ff600200, 0x0000000100000000)
 Metaspace       used 3258K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 354K, capacity 388K, committed 512K, reserved 1048576K
--------------------------
Heap
 def new generation   total 9216K, used 1525K [0x00000000f9a00000, 0x00000000fa400000, 0x00000000fa400000)
  eden space 8192K,  18% used [0x00000000f9a00000, 0x00000000f9b7d418, 0x00000000fa200000)
  from space 1024K,   0% used [0x00000000fa200000, 0x00000000fa200000, 0x00000000fa300000)
  to   space 1024K,   0% used [0x00000000fa300000, 0x00000000fa300000, 0x00000000fa400000)
 tenured generation   total 10240K, used 0K [0x00000000fa400000, 0x00000000fae00000, 0x00000000fae00000)
   the space 10240K,   0% used [0x00000000fa400000, 0x00000000fa400000, 0x00000000fa400200, 0x00000000fae00000)
 compacting perm gen  total 21248K, used 2871K [0x00000000fae00000, 0x00000000fc2c0000, 0x0000000100000000)
   the space 21248K,  13% used [0x00000000fae00000, 0x00000000fb0cdff0, 0x00000000fb0ce000, 0x00000000fc2c0000)
No shared spaces configured.

关于JVM自身对象对于大对象分配的一些影响

​   既然我们不跑任何程序都会产生一些对象,那么这些对象就肯定会影响到程序的验证结果,不妨验证一下注释掉后面一个2M空间对象以及一个4M对象分配,仅仅分配两个2M的byte数组会产生什么结果,如下面的结果显示会发现在eden区占了8M的空间。很明显jvm本身使用了部分数据(4M),直接分配到了eden的区域当中,而4M字节数组内存对象同样分配到eden内。

Heap
PSYoungGen      total 9216K, used 8089K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
eden space 8192K, 98% used [0x00000000ff600000,0x00000000ffde6560,0x00000000ffe00000)
from space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
to   space 1024K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
ParOldGen       total 10240K, used 0K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
object space 10240K, 0% used [0x00000000fec00000,0x00000000fec00000,0x00000000ff600000)
Metaspace       used 3261K, capacity 4496K, committed 4864K, reserved 1056768K
class space    used 355K, capacity 388K, committed 512K, reserved 1048576K

​   那么如果分配6M的空间呢?这里可以看到 allocation1(还是使用开头的代码)和allocation2分配了4M空间,而JVM本身要占用将近4M的空间,此时eden区域已经使用了8M总空间,Eden区域已经满了,所以当allocation3进来的时候,发现eden区域分配不下,所以触发了minor gc,清理之后,发现allocation1和allocation2还是处于存活的状态,JVM依然使用了4M的空间,eden区域还是满的,survivor区域又无法装下a1或者a2,所以这时候 a1和a2直接晋升老年代,a3进入到新生代分配。

​   有读者可能会好奇, survivor1 区域将近1M的对象存放的又是什么呢?可以看到GC日志当中:8089K->1016K minor gc进行垃圾收集之后留下了1M左右的存活对象,这部分对象自然要复制到from区域(survivor),同时分代年龄+1。

[GC (Allocation Failure) [PSYoungGen: (*)=> 8089K->1016K(9216K) <=(*)] 8089K->5428K(19456K), 0.0038596 secs] [Times: user=0.19 sys=0.02, real=0.00 secs] 
Heap
PSYoungGen      total 9216K, used 3119K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
eden space 8192K, 25% used [0x00000000ff600000,0x00000000ff80dbf8,0x00000000ffe00000)
from space 1024K, 99% used [0x00000000ffe00000,0x00000000ffefe010,0x00000000fff00000)
to   space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
ParOldGen       total 10240K, used 4412K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
object space 10240K, 43% used [0x00000000fec00000,0x00000000ff04f298,0x00000000ff600000)
Metaspace       used 3348K, capacity 4496K, committed 4864K, reserved 1056768K
class space    used 361K, capacity 388K, committed 512K, reserved 1048576K

​   如果看了上面描述的内容依然觉得云里雾里,可以开启jvm选项:<font color='red'>-XX:+PrintHeapAtGC</font> 。这个选项的作用是打印堆空间的变动细节,帮助你看到垃圾收集前后的堆空间变化的细节,对于垃圾收集的调试以及理解非常有帮助。

最终参数结果:-verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+PrintHeapAtGC

下面是个人的打印结果:

{Heap before GC invocations=1 (full 0):
 PSYoungGen      total 9216K, used 7925K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
  eden space 8192K, 96% used [0x00000000ff600000,0x00000000ffdbd490,0x00000000ffe00000)
  from space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
  to   space 1024K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
 ParOldGen       total 10240K, used 0K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  object space 10240K, 0% used [0x00000000fec00000,0x00000000fec00000,0x00000000ff600000)
 Metaspace       used 3252K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 353K, capacity 388K, committed 512K, reserved 1048576K
[GC (Allocation Failure) [PSYoungGen: 7925K->1006K(9216K)] 7925K->5413K(19456K), 0.0040614 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap after GC invocations=1 (full 0):
 PSYoungGen      total 9216K, used 1006K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
  eden space 8192K, 0% used [0x00000000ff600000,0x00000000ff600000,0x00000000ffe00000)
  from space 1024K, 98% used [0x00000000ffe00000,0x00000000ffefbbb0,0x00000000fff00000)
  to   space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
 ParOldGen       total 10240K, used 4406K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  object space 10240K, 43% used [0x00000000fec00000,0x00000000ff04daf8,0x00000000ff600000)
 Metaspace       used 3252K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 353K, capacity 388K, committed 512K, reserved 1048576K
}
Heap
 PSYoungGen      total 9216K, used 3220K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
  eden space 8192K, 27% used [0x00000000ff600000,0x00000000ff829810,0x00000000ffe00000)
  from space 1024K, 98% used [0x00000000ffe00000,0x00000000ffefbbb0,0x00000000fff00000)
  to   space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
 ParOldGen       total 10240K, used 4406K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  object space 10240K, 43% used [0x00000000fec00000,0x00000000ff04daf8,0x00000000ff600000)
 Metaspace       used 3261K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 355K, capacity 388K, committed 512K, reserved 1048576K

大对象分配策略:

对象直接进入老年代

​ 前文介绍了,对于不同的收集器,在不同的JDK版本的收集情况也存在差异,所以为了避免下面的内容造成误解,个人将按照jdk8版本 + 手动选择使用serial收集器进行结果的验证。

​ 那么什么是大对象呢?大对象通常指的是占用大量连续内存空间的对象,比如byte数组和大字符串,更糟糕的是生成大量“朝生夕灭”的大对象会直接导致垃圾收集器的频繁启动。

​ Java中避免大对象的原因是即使eden区域本来还有非常多的内存空间,根据分代{过}{滤}理论对象优先在eden分配的原则,由于大对象超过eden区域容量无法在此区域进行分配,就只能够被迫让垃圾收集提前执行,将存活对象搬移到survivor区域,但是最为严重的情况是垃圾收集完成之后所有的新生代对象全部存活,导致依然无法分配到eden区,这种时候大对象明显只能丢到老年代进行存放(serial和paralle收集器结果并不一致),所以大对象意味着高额的内存复制开销

​ hotspot提供了:-XX: PretenureSizeThreshold 参数,大于该值设置的对象直接会在老年代分配。目的是防止eden 和 survivor 区域进行反复的复制。

注意:-XX: PretenureSizeThreshold参数只有在serialParNew 收集器中有效。如果要使用其他新生代的收集器,其他可以考虑的方案是 ParNew  + CMS 收集器。

* jdk7和 Jdk8 默认使用的垃圾收集器Parallel

下面的代码将会验证上面的说法是否正确,实例代码如下:

public class Object2Old {

    /**
     * JVM 参数:
     * -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:PretenureSizeThreshold=3145728
     * -XX:PretenureSizeThreshold=3145728 (相当于3M)
     * @Param args
     */
    public static void main(String[] args) {
        byte[] allocation1;
        allocation1 = new byte[1024 * 1024 * 3];
        // allocation1 = new byte[1024 * 1024 * 3];
    }
}

代码结果如下:

​ 由于 没有使用-XX:+UseSerialGC参数,默认使用的是Parallel收集器,所以-XX:PretenureSizeThreshold=3145728这个参数很明显是没有生效的。

Heap
 PSYoungGen      total 9216K, used 8089K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
  eden space 8192K, 98% used [0x00000000ff600000,0x00000000ffde6550,0x00000000ffe00000)
  from space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
  to   space 1024K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
 ParOldGen       total 10240K, used 0K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  object space 10240K, 0% used [0x00000000fec00000,0x00000000fec00000,0x00000000ff600000)
 Metaspace       used 3258K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 354K, capacity 388K, committed 512K, reserved 1048576K

​ 现在我们开启 -XX:+UseSerialGC 再走一遍。运行结果如下,如果也在预料之内,4M的大对象直接分配到老年代进行存储:

Heap
 def new generation   total 9216K, used 3993K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
  eden space 8192K,  48% used [0x00000000fec00000, 0x00000000fefe6540, 0x00000000ff400000)
  from space 1024K,   0% used [0x00000000ff400000, 0x00000000ff400000, 0x00000000ff500000)
  to   space 1024K,   0% used [0x00000000ff500000, 0x00000000ff500000, 0x00000000ff600000)
 tenured generation   total 10240K, used 4096K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
   the space 10240K,  40% used [0x00000000ff600000, 0x00000000ffa00010, 0x00000000ffa00200, 0x0000000100000000)
 Metaspace       used 3258K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 354K, capacity 388K, committed 512K, reserved 1048576K

长期存活对象进入老年代

​ Hotspot多数垃圾收集器都存在分代的概念,在jdk8以前还存在永久代的概念,永久代属于方法区的范畴,这里不做过多介绍,并且jdk8之后永久代也已经从jvm中移除,所以我们重点关注新生代和老年代,新生代又由 eden区 + 2个Survivor区组成,默认情况下是 8:1:1 的比例分配,而老年代则是除开新生代的所有空间,占有着一块较大的内存,通常情况下新生代需要保证一个survivor区域为空作为备份切换。

​ JVM对象存活的流程如下:对象优先在eden区域分配,当遇到垃圾收集的时候,使用根节点枚举查找对象是否存活,如果当前对象可以被survivor容纳,则将存活的对象从eden区域拷贝到survivor区,同时将其对象的年龄设置为1,在survivor中的对象每熬过一次垃圾收集,对应对象的年龄就+1,当对象年龄到达了15,就会直接晋升到老年代。                                               

​ 如果要改变这个设置,可以通过:-XX: MaxTenuringThreshold进行配置,默认为15, 注意区间范围:15<m<1 。   

​ 这里的示例代码通过分配一个4M的对象和一个1M对象,如果设置为15,对象年龄为15的情况下按照默认的规则进行分配(为什么老年代会出现4M的对象,这个在动态对象年龄判断进行说明)。而如果设置为1,会发现触发了Minor GC,这里回收之后剩下1M存活对象进入S1区域,而先分配的4M数组对象则因为年龄满足为1的条件被进入S1区域,又因为S1存放不下的原因直接进入了老年代,所以后分配的1M对象在EDEN区域,而之前分配的4M对象在老年代,S1存放垃圾回收之后的对象。

public class ObjectAge {
    /**
     * JVM 参数:
     * -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=1(/15)
     * -XX: MaxTenuringThreshold=15
     * -XX: MaxTenuringThreshold=1
     * @param args
     */
    public static void main(String[] args) {
        byte[] allocation1 = new byte[1024 * 1024 * 4];
        byte[] allocation2 = new byte[1024 * 1024 * 1];

    }/*
    长期存活对象进入老年代:
    注意:JVM默认需要使用4M的内存
    ---------------------------------|  15 岁年龄情况 |------------------------------------------
    Heap
     PSYoungGen      total 9216K, used 5327K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
      eden space 8192K, 65% used [0x00000000ff600000,0x00000000ffb33fb0,0x00000000ffe00000)
      from space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
      to   space 1024K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x00000000fff00000)
     ParOldGen       total 10240K, used 4096K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      object space 10240K, 40% used [0x00000000fec00000,0x00000000ff000010,0x00000000ff600000)
     Metaspace       used 3433K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 369K, capacity 388K, committed 512K, reserved 1048576K

    ---------------------------------| 1 岁年龄情况 |------------------------------------------
    [GC (Allocation Failure) [PSYoungGen: 8192K->1008K(9216K)] 8192K->5606K(19456K), 0.0023319 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
    Heap
     PSYoungGen      total 9216K, used 2170K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
      eden space 8192K, 14% used [0x00000000ff600000,0x00000000ff722a70,0x00000000ffe00000)
      from space 1024K, 98% used [0x00000000ffe00000,0x00000000ffefc020,0x00000000fff00000)
      to   space 1024K, 0% used [0x00000000fff00000,0x00000000fff00000,0x0000000100000000)
     ParOldGen       total 10240K, used 4598K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      object space 10240K, 44% used [0x00000000fec00000,0x00000000ff07dae0,0x00000000ff600000)
     Metaspace       used 3328K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 361K, capacity 388K, committed 512K, reserved 1048576K
    */
}

对象动态年龄判断

​ 接着上一节留下的一个问题:为什么老年代会出现4M的对象?

​ HotSpot虚拟机并不是总是根据-XX: MaxTenuringThreshold参数作为对象进入老年代的指标。这里存在一个更加重要的规则:<font color='red'>如果在Survivor空间当中相同年龄的所有对象大小总和大于survivor空间的一半,年龄大于等于该年龄的对象就可以直接进入老年代。</font>

​ 这个要如何进行理解呢?还是直接上实际案例。

public class DynamicAge {

    private static final int _1MB = 1024 * 1024;

    /**
     * JVM 参数:
     * -verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8 -XX:+UseSerialGC
     * -XX: MaxTenuringThreshold=15
     * -XX: MaxTenuringThreshold=1
     *
     * @param args
     */
    public static void main(String[] args) {
        // allocation1 + allocation2 的大小大于 survivor空间的1/2
        System.out.println(_1MB / 4);
        byte[] allocation1 = new byte[_1MB / 4];
        byte[] allocation2 = new byte[_1MB / 4];
        byte[] allocation3 = new byte[_1MB * 4];
//        byte[] allocation4 = new byte[_1MB * 4];
//        allocation4 = null;
//        allocation4 = new byte[_1MB * 4];

    }/*运行结果:
    JVM程序默认使用:4303K 的内存
    代码来源于深入理解JVM虚拟机,注意要使用serial收集器,个人测试版本为JDK8
    [GC (Allocation Failure) [DefNew: 4651K->1023K(9216K), 0.0021389 secs] 4651K->1867K(19456K), 0.0021767 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
    Heap
     def new generation   total 9216K, used 5174K [0x00000000fec00000, 0x00000000ff600000, 0x00000000ff600000)
      eden space 8192K,  50% used [0x00000000fec00000, 0x00000000ff00dbf8, 0x00000000ff400000)
      from space 1024K,  99% used [0x00000000ff500000, 0x00000000ff5ffff8, 0x00000000ff600000)
      to   space 1024K,   0% used [0x00000000ff400000, 0x00000000ff400000, 0x00000000ff500000)
     tenured generation   total 10240K, used 843K [0x00000000ff600000, 0x0000000100000000, 0x0000000100000000)
       the space 10240K,   8% used [0x00000000ff600000, 0x00000000ff6d2cd8, 0x00000000ff6d2e00, 0x0000000100000000)
     Metaspace       used 3435K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 369K, capacity 388K, committed 512K, reserved 1048576K
    */
}

​ 如注释说明所示,代码是从书本里面搬来的,不过个人运行的时候注释掉了后面的部分,因为jvm本身会占用一定的内存空间,从运行结果来看a1和a2两个对象在经过了判断之后,发现占用的内存大于survivor区域的一半大小,所以根据前面介绍的动态对象年龄的判断直接进入老年代,注意这里并不是512K,还包括了JVM本身存在的小对象。

​ 这里其实有个漏洞,就行如果不同年龄的对象均等分配要如何处理?比如对象年龄为2的为30%,对象年龄为3的占30%,对象年龄为4的占30%。针对这种情况下jvm提供了参数:-XX:TargetSurvivorRatio参数,设定survivor区的目标使用率。默认50代表survivor区对象目标使用率为50%为限制。这个参数的意思是假设survivor对象中按照年龄排序如果某一年龄对象累加的总和大于目标存活率,则大于改年龄的所有对象会直接进行老年代,意味着如果年龄为4,5的对象总和大于survivor区域的50%,则会直接进入老年代,这种情况也被成为提前进入老年代

由于JVM本身对象占用一定内存的影响,上述-XX:TargetSurvivorRatio参数这种情况个人目前没有找到具体的代码可以确切的模拟......

另外,需要知道survivor空间的变化,可以使用参数:-XX:+PrintTenuringDistribution

空间分配担保

​ 在进行Minor Gc之前,JVM会首先检查老年代的最大可用连续空间是否大于新生代所有对象总空间。如果此条件成立,则会查看一个叫做:-XX:HandlePromotionFailure参数设置是否允许分配担保失败。

​ 如果允许分配担保失败:会检查最大连续内存是否大于历次晋升到老年代的内存对象平均大小,尝试Minor GC

​ 如果不允许分配担保失败:或者不满足上述的所有条件进行FULL GC

​ 对于上面的内容,在书中介绍中被称之为:冒险。为什么说是冒险呢,因为新生代使用的是复制的算法,直接提到会使用eden+2个survivor区域进行存活对象的复制,S2通常是必须保证为空作为轮换备份使用。最极端的情况下如果Minor gc之后所有对象都存活,需要使用老年代进行担保,保证对象能够正常分配运行。但是如果连老年代都没有足够的连续内存容纳对象,那么此时必然需要stop the world进行一次full gc进行深度的垃圾清理。老年代如何知道自己的空间不足呢?老年代显然并不知道新生代会过来多少存活对象,所以只能根据 之前每一次新生代晋升到老年代对象的平均大小 作为经验值进行判断,决定是否进行full gc。

空间分配担保

注意:<font color='red'>-XX:HandlePromotionFailure 在 JDK6update24之前此参数设置有效</font>

在此版本之后,只要老年代的连续空间大于新生代总大小或者历次晋升的平均大小,就会进行minorgc。(也就是说少了前面的判断步骤)

​ 由于现在基本都是JDK1.8开发,所以个人没有像书中一样测试该选项在jdk6update24之前的效果,所以我们忽略这个参数看下hotspot源码内部是如何判断的:

bool TenuredGeneration::promotion_attempt_is_safe(size_t 
max_promotion_in_bytes) const { 
    // 老年代最大可用的连续空间 
    size_t available = max_contiguous_available(); 
    // 每次晋升到老年代的平均大小 
    size_t av_promo  = (size_t)gc_stats()->avg_promoted()->padded_average(); 
    // 老年代可用空间是否大于平均晋升大小,或者老年代可用空间是否大于当此GC时新生代所有对象容量 
    bool   res = (available >= av_promo) || (available >= 
max_promotion_in_bytes); 
    return res; 
} 

这段代码在哪可以看到呢?

如何下载jdk源码、hotspot源码

文件位置:hotspot-0c94c41dcd70\src\share\vm\memory\TenuredGeneration.cpp

bool TenuredGeneration::promotion_attempt_is_safe(size_t max_promotion_in_bytes) const {
  size_t available = max_contiguous_available();
  size_t av_promo  = (size_t)gc_stats()->avg_promoted()->padded_average();
  bool   res = (available >= av_promo) || (available >= max_promotion_in_bytes);
  if (PrintGC && Verbose) {
    gclog_or_tty->print_cr(
      "Tenured: promo attempt is%s safe: available("SIZE_FORMAT") %s av_promo("SIZE_FORMAT"),"
      "max_promo("SIZE_FORMAT")",
      res? "":" not", available, res? ">=":"<",
      av_promo, max_promotion_in_bytes);
  }
  return res;
}

总结:

​ jvm对象分配这一块基本内容在《深入理解JVM虚拟机》中有非常详细的解释,但是从实际的实验来看,我们不能完全当做八股文来背诵,比如动态年龄判断当中有存活率的参数作为衡量对象晋升老年代的评价指标。同样在不同JDK版本中的不同垃圾收集器对于回收的细节也可以看到明显和书里面的介绍不同,更为“痛苦”的是JVM自身需要维持程序运行的对象也干涉到了垃圾收集的结果,我们需要十分小心的判断并且排除“副作用”之后才能得到书中正确的结果。

​ 从本次的实验对于个人而言也不小的收获,就是对于所以的资料都要进行质疑和实际验证,不然很容易导致误人子弟,个人最近查找这部分资料的时候发现很多就是照着书“抄上去”,既没有说明版本也没有说明是使用的哪一种垃圾收集器,令人摸不着头脑。

​ 最后,感谢您的耐心阅读,如果觉得有用不妨点赞支持一下?

其他:

JVM的分代年龄为什么是15?

答案内容来自:https://segmentfault.com/a/1190000020512977

​ 接下来我们来回答JVM的分代年龄为什么是15?而不是16,20之类的呢?

​ 真的不是为什么不能是其它数(除了15),着实是臣妾做不到啊!

​ 事情是这样的,HotSpot虚拟机的对象头其中一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据的长度在32位和64位的虚拟机(未开启压缩指针)中分别为32bit和64bit,官方称它为“Mark word”。

​ 例如,在32位的HotSpot虚拟机中,如果对象处于未被锁定的状态下,那么Mark Word的32bit空间中25bit用于存储对象哈希码,4bit用于存储对象分代年龄,2bit用于存储锁标志位,1bit固定为0 。

​ 明白是什么原因了吗?对象的分代年龄占4位,也就是0000,最大值为1111也就是最大为15,而不可能为16,20之类的了。

参考资料:

【面试必备】小伙伴栽在了JVM的内存分配策略。。。
https://segmentfault.com/a/1190000020512977

JVM(九)内存分配策略:

https://blog.csdn.net/liupeifeng3514/article/details/79183734
深入JVM八:JVM内存分配机制
https://blog.csdn.net/pang5356/article/details/108492493?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-1&spm=1001.2101.3001.4242

免费评分

参与人数 5吾爱币 +14 热心值 +3 收起 理由
yumenawei + 1 热心回复!
Titanic + 1 干货,顶一个。
卖萌的小包子 + 1 + 1 用心讨论,共获提升!
苏紫方璇 + 10 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
unlited0 + 1 + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

nealkeent 发表于 2021-7-23 17:07
fengss 发表于 2021-7-23 16:53
楼主 你好 请问对堆日志从哪里看,或者有好用的工具推荐吗?

我记得启动参数加上-XX:+PrintGCDetails 就可以打印这种日志,你试试
 楼主| zxdsb666. 发表于 2021-6-7 11:39
逸帅 发表于 2021-6-7 10:29
但是按照对象优先进入eden区来说,x1和x2应该是在老年代,3,4在新生代吧?

public static void testAllocation() {
        byte[] allocation1, allocation2, allocation3, allocation4, allocation5;
        allocation1 = new byte[_1MB * 4];
        allocation2 = new byte[_1MB * 5];

    }
如果还是觉得懵,用这段代码去做验证, 看下4M对象是在新生代还是老年代。当然我这边的JVM占用了4M左右,很容易试出来。
从结果来看serial 收集器的分配策略和 parallel 收集器的分配策略是不一样的
卖萌的小包子 发表于 2021-6-6 16:28
Titanic 发表于 2021-6-6 16:32
干货,顶一个。
daijiancheng 发表于 2021-6-6 16:35
太深奥了看不懂
wildfire_810 发表于 2021-6-6 16:55
新帖呢。非常棒的细节。可以经常查询
ouyang19960227 发表于 2021-6-6 18:51
不错,谢谢分享
8204118 发表于 2021-6-6 19:43
哈希码(HashCode)是什么东西
 楼主| zxdsb666. 发表于 2021-6-6 19:48
8204118 发表于 2021-6-6 19:43
哈希码(HashCode)是什么东西

可以理解为JAVA为了确定对象唯标识而生成的一个标记码
 楼主| zxdsb666. 发表于 2021-6-6 19:49

建议看书,我的所有内容都是源自于书的理解和自我思考反馈
逸帅 发表于 2021-6-6 20:48
假如新生代10M,依次创建4个对象,每个对象占用3M的空间,对象x1,x2,x3,x4分别在哪?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 13:38

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表