0%

JVM基础知识一

Java Virtual Machine

JVM 全称 Java Virtual Machine,也就是我们耳熟能详的 Java 虚拟机。它能识别 .class后缀的文件,并且能够解析它的指令,最终调用操作系统上的函数,完成我们想要的操作

翻译

Java 程序不一样,使用 javac 编译成 .class 文件之后,还需要使用 Java 命令去主动执行它,操作系统并不认识这些 .class 文件。所以JVM就是一个翻译

JVM、JRE、JDK的关系

JVM: JVM只是一个翻译,把Class翻译成机器识别的代码,但是需要注意,JVM 不会自己生成代码,需要大家编写代码,同时需要很多依赖类库,这个时候就需要用到JRE。

JRE: JRE是什么,它除了包含JVM之外,提供了很多的类库(就是我们说的jar包,比如读取或者操作文件,连接网络,使用I/O等等之类的)这些东西就是JRE提供的基础类库

JDK: 但对于程序员来说,JRE还不够。我写完要编译代码,还需要调试代码,还需要打包代码、有时候还需要反编译代码。所以我们会使用JDK

avatar

过程如下:Java 文件->编译器>字节码->JVM->机器码

运行时数据区域

avatar

程序计数器

较小的内存空间,当前线程执行的字节码的行号指示器;各线程之间独立存储,互不影响。
程序计数器是一块很小的内存空间,主要用来记录各个线程执行的字节码的地址,例如,分支、循环、跳转、异常、线程恢复等都依赖于计数器。
由于 Java 是多线程语言,当执行的线程数量超过 CPU 核数时,线程之间会根据时间片轮询争夺 CPU 资源。如果一个线程的时间片用完了,或者是其它原因导致这个线程的 CPU 资源被提前抢夺,那么这个退出的线程就需要单独的一个程序计数器,来记录下一条运行的指令
程序计数器也是JVM中唯一不会OOM(OutOfMemory)的内存区域,因为程序计数器只需要记录一个地址int 类型的数据就足够了,只占用了很小的内存

avatar

虚拟机栈

虚拟机栈在JVM运行过程中存储当前线程运行方法所需的数据指令返回地址

avatar

栈帧
  • 局部变量表
  • 操作数栈
  • 动态连接
  • 完成出口

局部变量表:顾名思义就是局部变量的表,用于存放我们的局部变量的。首先它是一个32位的长度,主要存放我们的Java的八大基础数据类型,一般32位就可以存放下,如果是64位的就使用高低位占用两个也可以存放下,如果是局部的一些对象,比如我们的Object对象,我们只需要存放它的一个引用地址即可。
操作数据栈:存放我们方法执行的操作数的,它就是一个栈,先进后出的栈结构,操作数栈,就是用来操作的,操作的的元素可以是任意的java数据类型,所以我们知道一个方法刚刚开始的时候,这个方法的操作数栈就是空的,操作数栈运行方法就是JVM一直运行入栈/出栈的操作
**动态连接:**Java语言特性多态(需要类运行时才能确定具体的方法)。
返回地址: 正常返回(调用程序计数器中的地址作为返回)、异常的话(通过异常处理器表<非栈帧中的>来确定)

avatar

####本地方法栈

本地方法栈跟 Java 虚拟机栈的功能类似,Java 虚拟机栈用于管理 Java 函数的调用,而本地方法栈则用于管理本地方法的调用。但本地方法并不是用 Java 实现的,而是由 C 语言实现的。
本地方法栈是和虚拟机栈非常相似的一个区域,它服务的对象是 native 方法。你甚至可以认为虚拟机栈和本地方法栈是同一个区域。
虚拟机规范无强制规定,各版本虚拟机自由实现 ,HotSpot直接把本地方法栈和虚拟机栈合二为一 。

线程共享的区域

  • 方法区/永久代(很多开发者都习惯将方法区称为“永久代”,其实这两者并不是等价的)
    • 类信息
    • 常量
    • 静态变量
    • 及时编译后的代码
  • Java堆
    • 对象实例(几乎所有,对于基本数据类型来说(byte、short、int、long、float、double、char),有两种情况。当你在方法体内声明了基本数据类型的对象,它就会在栈上直接分配。其他情况,都是在堆上分配。)
    • 数组

直接内存

不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域;如果使用了NIO,这块区域会被频繁使用,在java堆内可以用directByteBuffer对象直接引用并操作
这块内存不受java堆大小限制,但受本机总内存的限制,可以通过-XX:MaxDirectMemorySize来设置(默认与堆内存最大值一样),所以也会出现OOM异常

avatar

深入理解运行时数据区

举个栗子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class TestObject{
public final static String MAN_TYPE="man";//常量
public static String WOMAN_TYOE="woman";//静态变量
public static void main(String [] args){
Student stu=new Student();
stu.setName("Alex");
stu.setAge(20);
stu.setTest(TEST);
for (int o=0 ; i<15 ; i++){
System.gc();
}
}
}
**i为什么是15次 因为JVM中 from 和to区表示对象年龄的头占用4个byte 最大值也就是2进制数 1111,所以最大值是15,也是就在 Hotspot JVM版本中对象年龄最大值是15 ,超过15 进入老年代**

avatar

当我们通过 Java 运行以上代码时,JVM 的整个处理过程如下:

  1. JVM 向操作系统申请内存,JVM 第一步就是通过配置参数或者默认配置参数向操作系统申请内存空间。
  2. .JVM 获得内存空间后,会根据配置参数分配堆、栈以及方法区的内存大小。
  3. 完成上一个步骤后, JVM 首先会执行构造器,编译器会在.java 文件被编译成.class 文件时,收集所有类的初始化代码,包括静态变量赋值语句、静态代码块、静态方法,静态变量和常量放入方法区
  4. 执行方法。启动 main 线程,执行 main 方法,开始执行第一行代码。此时堆内存中会创建一个 Teacher 对象,对象引用 student 就存放在栈中。

深入理解堆和栈

功能

以栈帧的方式存储方法调用的过程,并存储方法调用过程中基本数据类型的变量(int、short、long、byte、float、double、boolean、char等)以及对象的引用变量,其内存分配在栈上,变量出了作用域就会自动释放;
而堆内存用来存储Java中的对象。无论是成员变量,局部变量,还是类变量,它们指向的对象都存储在堆内存中

线程独享还是共享

栈内存归属于单个线程,每个线程都会有一个栈内存,其存储的变量只能在其所属线程中可见,即栈内存可以理解成线程的私有内存。
堆内存中的对象对所有线程可见。堆内存中的对象可以被所有线程访问

空间大小

栈的内存要远远小于堆内存

内存溢出

栈溢出

HotSpot版本中栈的大小是固定的,是不支持拓展的
java.lang.StackOverflowError 一般的方法调用是很难出现的,如果出现了可能会是无限递归
虚拟机栈带给我们的启示:方法的执行因为要打包成栈桢,所以天生要比实现同样功能的循环慢,所以树的遍历算法中:递归和非递归(循环来实现)都有存在的意义。递归代码简洁,非递归代码复杂但是速度较快。
OutOfMemoryError:不断建立线程,JVM申请栈内存,机器没有足够的内存。(一般演示不出,演示出来机器也死了)

堆溢出

内存溢出:申请内存空间,超出最大堆内存空间
如果是内存溢出,则通过 调大 -Xms,-Xmx参数。
如果不是内存泄漏,就是说内存中的对象却是都是必须存活的,那么久应该检查JVM的堆参数设置,与机器的内存对比,看是否还有可以调整的空间,再从代码上检查是否存在某些对象生命周期过长、持有状态时间过长、存储结构设计不合理等情况,尽量减少程序运行时的内存消耗。

方法区溢出

  • 运行时常量池溢出
  • 方法区中保存的Class对象没有被及时回收掉或者Class信息占用的内存超过了我们配置。

虚拟机优化技术

编译优化技术——方法内联

方法内联的优化行为,就是把目标方法的代码原封不动的“复制”到调用的方法中,避免真实的方法调用而已,因为每个方法都是一个栈帧,少调用一个方法,就减少了一个栈帧

栈的优化技术——栈帧之间数据的共享

在一般的模型中,两个不同的栈帧的内存区域是独立的,但是大部分的JVM在实现中会进行一些优化,使得两个栈帧出现一部分重叠。(主要体现在方法中有参数传递的情况),让下面栈帧的操作数栈和上面栈帧的部分局部变量重叠在一起,这样做不但节约了一部分空间,更加重要的是在进行方法调用时就可以直接公用一部分数据,无需进行额外的参数复制传递了。

举个栗子:

1
2
3
4
5
6
7
public void  Test(int a){
int b=a+5; //a属于Test栈帧的局部变量表,同时也是Main栈帧的操作数栈中的10,内存共享了
System.out.printlan(b);
}
public static void main(String [] args){
Test(10); //10 存在于main栈帧的操作数栈
}

avatar