JVM 探秘 3:内存溢出

本贴最后更新于 2185 天前,其中的信息可能已经物是人非

在 Java 虚拟机内存区域中,除了程序计数器外,其他几个内存区域都可能会发生 OutOfMemoryError,这次通过一些代码来验证虚拟机各个内存区域存储的内容。

在实际工作中遇到内存溢出异常时,需要做到能根据异常信息快速判断是哪个内存区域的溢出,知道什么样的代码会导致这些区域内存溢出,并且知道出现内存溢出后如何处理。

Java 堆溢出

Java 堆用于存储对象实例,只要不断的扩展对象,并且保证 GC Roots 到对象有可达路径来避免垃圾回收,那么对象数量到达堆的最大容量后就会发生内存溢出异常。

模拟堆内存溢出

以下代码会把堆大小限制在 20M 且不可扩展(将最小参数 -Xms 和最大参数 -Xmx 设为相同就会避免自动扩展),通过参数 -XX:+HeapDumpOnOutOfMemoryError 可以让虚拟机在发生内存溢出时 Dump 出内存快照用来分析。

/**
 * Java堆内存溢出异常
 * VM args: -Xms20M -Xmx20M -XX:+HeapDumpOnOutOfMemoryError
 * -Xms和-Xmx设为相同值避免堆内存自动扩展,
 * -XX:+HeapDumpOnOutOfMemoryError可以让虚拟机在发生OOM时Dump出内存快照
 * Run With JDK 1.8
 * */
public class HeapOOM {

    static class OOMObject{
    }

    public static void main(String[] args){
        List<OOMObject> list = new ArrayList<>();
        while(true){
            list.add(new OOMObject());
        }
    }
}

运行结果:

java.lang.OutOfMemoryError: Java heap space
Dumping heap to java_pid1344.hprof ...
Heap dump file created [29068691 bytes in 0.108 secs]
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
	at java.util.Arrays.copyOf(Arrays.java:3210)
	at java.util.Arrays.copyOf(Arrays.java:3181)
	at java.util.ArrayList.grow(ArrayList.java:261)
	at java.util.ArrayList.ensureExplicitCapacity(ArrayList.java:235)
	at java.util.ArrayList.ensureCapacityInternal(ArrayList.java:227)
	at java.util.ArrayList.add(ArrayList.java:458)
	at test.oom.HeapOOM.main(HeapOOM.java:21)

可以从异常信息中看到,OOM 异常发生在“main”线程,发生的内存区域是“Java heap space”。

通过 IntelliJ IDEA 运行的话,可以点击 Edit Configurations 配置 VM 参数,生成的堆 Dump 快照文件为 hprof 后缀,存放在 Working directory 配置对应的目录下,如下图:

image

堆内存溢出分析

要分析 Java 堆的内存溢出,首先通过快照分析工具(如 Java VisualVM)对 Dump 出来的的快照进行分析,确认内存中的对象是否是必要的。如果是不必要的而没有垃圾回收掉,则发生的是内存泄漏(Memory Leak);如果都是必要的,则是内存溢出(Memory Overflow)。

如果是内存泄漏,通过工具进一步查看对象实例到 GC Roots 的引用链,找到泄露对象是通过什么路径与 GC Roots 相关联导致垃圾收集器无法回收它们。根据泄露对象的类型信息和到 GC Roots 的引用链,就可以定位到泄露代码的位置。

如果是内存溢出,也就是说这些对象还都必须存活,那么就检查堆内存的大小参数(-Xms 与-Xmx)与物理内存比较还是否可以调大,再从代码上检查是否存在某些对象生命周期过长、持有状态时间过长的情况,尝试减少程序运行期的内存消耗。

打开 JDK 自带的分析工具 Java VisualVM(bin 目录下的 jvisualvm.exe),点击 文件->装入 选择堆快照 java_pid1344.hprof 文件,打开后显示的是概述信息,这里会显示快照的一些基本信息、环境属性以及线程信息。

然后点击 ,打开后如下图:

image

从上图可以看到,数量最多的且占用内存最大的对象是 OOMObject 类型的实例,OOMObject 类型共有实例 810,326 个,大小总共 12,965,216 个字节(byte),而这些对象都是在 while 循环中 new 出来加入到 List 中的,都是应该存活的对象,也就是说发生的 OOM 是内存溢出而不是内存泄漏。

然后在 OOMObject 的记录上右键点击 在实例试图中显示,则会打开实例视图,见下图:

image

可以看到其中一个 OOMObject 对象的引用链,它被一个 Object[] 数组中的元素引用,我们都知道 ArrayList 是基于数组实现的,而这个 Object[] 数组对象就是一个 GC Root,它的内存地址是 578296

虚拟机栈和本地方法栈溢出

在内存区域那篇文章讲到过,HotSpot 虚拟机把本地方法栈和虚拟机栈合二为一了,栈容量由 -Xss 参数设置。关于虚拟机栈和本地方法栈,虚拟机规范规定了两种异常:

  • 如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出 StackOverflowError 异常。
  • 如果虚拟机在扩展栈时无法申请到足够的内存空间,则抛出 OutOfMemoryError 异常。

这里把异常分为了两种,看似严谨实际上有相互重叠的地方,当栈空间无法继续分配时,到底是内存太小,还是已使用的栈空间太大,本质上只是对同一个问题的不同描述而已。

有两种方法会抛出 StackOverflowError 异常,一种是通过 -Xss 参数减小栈内存容量;一种是定义大量局部变量,从而增大此方法帧中的局部变量表的长度。以下代码是第一种:

/**
 * Java栈内存溢出异常
 * 通过减小栈内存容量抛出StackOverflowError
 * VM args: -Xss128K
 * Run With JDK 1.8
 * */
public class StackOOM {

    private int stackLength = 1;
    
    public void stackLeak() {
        stackLength++;
        stackLeak();
    }
    public static void main(String[] args) throws Throwable {
        StackOOM oom = new StackOOM();
        try {
            oom.stackLeak();
        }catch(Throwable e){
            System.out.println("stack length: " + oom.stackLength);
            throw e;
        }
    }
}

运行结果:

stack length: 998
Exception in thread "main" java.lang.StackOverflowError
	at com.cellei.outofmemory.StackOOM.stackLeak(StackOOM.java:15)
	at com.cellei.outofmemory.StackOOM.stackLeak(StackOOM.java:16)
	at com.cellei.outofmemory.StackOOM.stackLeak(StackOOM.java:16)
	...
	at com.cellei.outofmemory.StackOOM.main(StackOOM.java:22)

实验结果表明,不论是减小栈容量大小还是增加栈帧大小,当内存无法分配时虚拟机抛出的都是 StackOverflowError 异常。

如果不限于单线程,不断的建立线程的情况下倒是会抛出 OutOfMemoryError 异常,但跟栈空间是否足够大没有直接关系,而且栈是线程私有的内存区域。这种情况下,每个线程的栈分配的内存越大,就越容易产生内存溢出异常。

虚拟机提供了参数来控制堆内存和方法区的最大容量,物理内存减去堆内存最大值,再减去方法区的最大值,程序计数器消耗内存很小忽略不计,剩下的就被虚拟机栈和本地方法栈瓜分了。所以每个线程分配到的栈容量越大,则可以建立的线程数量越少,建立线程时就越容易把剩下的内存耗尽。如果建立过多导致了内存溢出,在不能减少线程数的情况下,就只能通过减少最大堆和减少栈容量来换取更多的线程。

方法区和运行时常量池溢出

JDK1.6 及之前,运行时常量池是方法区的一部分,且方法区还使用永久代实现,那时候可以在限制永久代大小的情况下,循环调用 String.intern() 方法造成运行时常量池溢出而导致方法区溢出。使用参数 -XX:PermSize-XX:MaxPermSize 来限制永久代也就是方法区的大小。String.intern() 方法是一个 Native 方法,作用是:如果字符串常量池中已经包含一个等于此 String 对象的字符串,则返回代表常量池中这个字符串的 String 对象;否则,将此 String 对象包含的字符串添加到常量池中。

JDK1.7 的时候常量池挪到了堆内存中,到了 JDK1.8 就干脆取消了永久代,取而代之的是元空间(MetaSpace),且元空间是位于本地内存而不是虚拟机内存。

以下代码,在 JDK1.6 及之前的版本中会产生内存溢出:

/**
 * 要求运行在 JDK1.6 或以前
 * 导致常量池溢出从而产生永久代溢出
 * VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M
 * Run With JDK 1.6
 */
public class ConstantPoolOverflowTest
{
    public static void main(String[] args)
    {
        List<String> list = new ArrayList<String>();
        int i = 0;
        while (true)
        {
            list.add(String.valueOf(i++).intern());
        }
    }
}

运行结果:

Exception in thread "main" java.lang.OutOfMemoryError: PermGen space
    at java.lang.String.intern(Native Method)
    ...

可见运行结果提示了 PermGen space,表明是那个版本的永久代也就是方法区溢出。

既然 JDK1.7 及之后常量池挪到了 Java 堆中,在那之后的版本如何产生方法区溢出呢?既然方法区用于存放类的相关信息,基本思路就是在运行时产生大量的类去填充方法区,直到溢出。可以使用 JDK 的动态代理,也可以使用第三方库比如 CGLib 实现。

以下代码使用 CGLib 库,在运行时不断的产生类导致方法区溢出。由于 JDK1.8 的方法区改为了使用元空间实现,所以可以使用参数 -XX:MetaspaceSize-XX:MaxMetaspaceSize 限制方法区大小。

/**
 * 限制元空间大小后
 * 使用CGLib运行时产生类,导致元空间也就是方法区溢出
 * VM Args:-XX:MetaspaceSize=8M -XX:MaxMetaspaceSize=28M
 * Run With JDK 1.8
 */
public class MethodAreaOOM {

    static class OOMObject{
    }

    public static void main(String[] args){
        while(true) {
            Enhancer enhancer = new Enhancer();
            enhancer.setSuperclass(OOMObject.class);
            enhancer.setUseCache(false);
            enhancer.setCallback(new MethodInterceptor() {
                public Object intercept(Object o, Method method, Object[] objects, 
                MethodProxy methodProxy) throws Throwable {
                    return methodProxy.invokeSuper(o, objects);
                }
            });
            enhancer.create();
        }
    }
}

运行结果:

Exception in thread "main" java.lang.OutOfMemoryError: Metaspace
	at net.sf.cglib.core.AbstractClassGenerator.generate(AbstractClassGenerator.java:345)
	at net.sf.cglib.proxy.Enhancer.generate(Enhancer.java:492)
	at net.sf.cglib.core.AbstractClassGenerator$ClassLoaderData.get(AbstractClassGenerator.java:114)
	at net.sf.cglib.core.AbstractClassGenerator.create(AbstractClassGenerator.java:291)
	at net.sf.cglib.proxy.Enhancer.createHelper(Enhancer.java:480)
	at net.sf.cglib.proxy.Enhancer.create(Enhancer.java:305)
	at com.cellei.oom.MethodAreaOOM.main(MethodAreaOOM.java:29)

可见异常信息提示 Metaspace,就是说元空间(方法区)内存溢出了。方法区溢出也是一种比较常见的溢出,一个类要被垃圾收集器回收,判定条件是比较苛刻的。在经常动态产生大量 Class 的应用中,要特别注意类的回收情况。

本机内存直接溢出

DirectMemory 容量可以通过参数 -XX:MaxDirectMemorySize 指定,如果不指定,则默认与 Java 堆最大值(-Xmx)一样。通过反射获取 Unsafe 实例进行内存分配,allocateMemory() 方法会真正申请分配内存。

/**
 * 不断的申请内存,导致本机内存溢出
 * VM Args: -Xmx20M -XX:MaxDirectMemorySize=10M
 * Run With JDK 1.8
 * */
public class DirectMemoryOOM {

    private static final int _1M = 1024 * 1024;

    public static void main(String[] args) throws Exception{
        Field unsafeField = Unsafe.class.getDeclaredFields()[0];
        unsafeField.setAccessible(true);
        Unsafe unsafe = (Unsafe) unsafeField.get(null);
        while (true) {
            unsafe.allocateMemory(_1M);
        }
    }
}

运行结果:

Exception in thread "main" java.lang.OutOfMemoryError
	at sun.misc.Unsafe.allocateMemory(Native Method)
	at com.cellei.oom.DirectMemoryOOM.main(DirectMemoryOOM.java:20)

由 DirectMemory 导致的内存溢出,有一个特点就是 Heap Dump 文件中不会看到明显异常,如果 Dump 文件非常小,又直接间接使用了 NIO,则有可能是这方面的原因。

本文代码的 Github Repo 地址:https://github.com/cellei/JVM-Practice

发表于 2018-04-12,最后编辑于 2018-04-15
本文作者: Cellei
本文链接: http://www.cellei.com/blog/2018/04121
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1083 引用 • 3461 回帖 • 287 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...