深度剖析JVM虚拟机.doc_第1页
深度剖析JVM虚拟机.doc_第2页
深度剖析JVM虚拟机.doc_第3页
深度剖析JVM虚拟机.doc_第4页
深度剖析JVM虚拟机.doc_第5页
免费预览已结束,剩余34页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

JVM:Java Virtual Machine Java虚拟机JRE:Java Runtime Environment Java运行时环境ABI:Application Binary Interface 应用二进制接口,是一个程序在运行时应用的环境,也是一种可执行文件的格式。操作系统都有自己的进程地址控件,硬件系统也各不相同;java在所有的计算机上都使用相同的ABI; java运行时环境JRE,包括java虚拟机,是java ABI与各种硬件/操作系统ABI之间的桥梁。1)java源代码编译后生成的目标代码是一种字节码(bytecode),与其他语言不同的是:java的字节码是一种中立结构的机器代码(不是任何现有系统上的二进制指令代码),通过JVM可以快速地解释并运行在任何特定的计算机上。2)java程序的执行通过JVM实现;3)一般情况下,JVM是在运行java程序时调用的;4)JVM读取字节码程序,解释或翻译成实际的机器指令后再执行,实行了java的“一次编写,多处运行”的特点;Java虚拟机是什么Java虚拟机之所以称为“虚拟”,就是因为它仅仅是由一个规范来定义的抽象计算机。要运行某个Java程序,首先需要一个符合该规范的具体实现。下面主要讨论这个规范本身。 要理解Java虚拟机,你必须意识到,当你说“Java虚拟机”时,可能指的是如下三种不同的东西: 抽象规范 一个具体的实现 一个运行中的虚拟机实例 Java虚拟机抽象规范仅仅是个概念。该规范的具体实现,可能来自多个提供商,并存在多个平台上。它或者完全用软件实现,或者以硬件和软件相结合的方式来实现。当运行一个Java程序的同时,也就在运行了一个Java虚拟机实例。对JVM规范的抽象说明是一些概念的集合,它们已经在书The Java Virtual Machine Specification(Java虚拟机规范)中被详细地描述了;对JVM的具体实现要么是软件,要么是软件和硬件的组合,它已经被许多生产厂商所实现,并存在于多种平台之上;运行Java程序的任务由JVM的运行期实例单个承担。在本文中我们所讨论的Java虚拟机(JVM)主要针对第三种情况而言。它可以被看成一个想象中的机器,在实际的计算机上通过软件模拟来实现,有自己想象中的硬件,如处理器、堆栈、寄存器等,还有自己相应的指令系统。JVM在它的生存周期中有一个明确的任务,那就是运行Java程序,因此当Java程序启动的时候,就产生JVM的一个实例;当程序运行结束的时候,该实例也跟着消失了。下面我们从JVM的体系结构和它的运行过程这两个方面来对它进行比较深入的研究。 Java虚拟机的生命周期一个运行时的Java虚拟机实例的天职就是:负责运行一个Java程序。当启动一个Java程序时,一个虚拟机实例也就诞生了。当该程序关闭退出,这个虚拟机实例也就随之消亡。每个Java程序都运行在于自己的Java虚拟机实例中。Java虚拟机实例通过调用某个初始类的main()方法来运行一个Java程序。而这个main()方法必须是public,static,返回值为void。main()方法作为该程序初始线程的起点,任何其他的线程都是由这个初始线程启动的。 Java虚拟机内部有两种线程:守护线程和非守护线程。守护线程通常由虚拟机自己使用的,比如执行垃圾收集任务的线程。但是,Java程序也可以把它的创建的任何线程标记为守护线程。而Java程序中的初始线程,就是开始于main()的那个,是非守护线程。只要有非守护线程在运行,那么这个Java程序也在继续运行,只有该程序中所有的非守护线程都终止时,虚拟机实例将自动退出。 Java虚拟机的体系结构Java虚拟机的结构分为:类装载子系统,执行引擎,运行时数据区,本地方法接口。其中运行时数据区又分为:方法区,堆,Java栈,PC寄存器,本地方法栈。 Java虚拟机结构图Java虚拟机由五个部分组成:一组指令集、一组寄存器、一个栈、一个无用单元收集堆(Garbage-collected-heap)、一个方法区域。这五部分是Java虚拟机的逻辑成份,不依赖任何实现技术或组织方式,但它们的功能必须在真实机器上以某种方式实现。类装载子系统(class loader)Java虚拟机中,负责查找并装载类型的那部分称为类装载子系统。 Java虚拟机有两种类装载器:启动类装载器和用户自定义类装载器。启动类装载器是Java虚拟机实现的一部分。用户自定义类装载器是Java程序的一部分。 类装载器的动作: 1. 装载-查找并装载类型的二进制数据 2. 连接-执行验证,准备,以及解析(可选) 验证:确保被导入类型的正确性 准备:为类变量分配内存,并将其初始化为默认值 把类型中的符号引用换为直接引用 3. 初始化-把类变量初始化为正确的初始值 执行引擎处于JVM的核心位置,在Java虚拟机规范中,它的行为是由指令集所决定的。尽管对于每条指令,规范很详细地说明了当JVM执行字节码遇到指令时,它的实现应该做什么,但对于怎么做却言之甚少。Java虚拟机支持大约248个字节码。每个字节码执行一种基本的CPU运算,例如,把一个整数加到寄存器,子程序转移等。Java指令集相当于Java程序的汇编语言。由于指令系统的简单性,使得虚拟机执行的过程十分简单,从而有利于提高执行的效率。指令中操作数的数量和大小是由操作符决定的。如果操作数比一个字节大,那么它存储的顺序是高位字节优先。例如,一个16位的参数存放时占用两个字节,其值为: 第一个字节*256+第二个字节字节码。 指令流一般只是字节对齐的。指令tableswitch和lookup是例外,在这两条指令内部要求强制的4字节边界对齐。Java指令集Java虚拟机支持大约248个字节码。每个字节码执行一种基本的CPU运算,例如,把一个整数加到寄存器,子程序转移等。Java指令集相当于Java程序的汇编语言。 Java指令集中的指令包含一个单字节的操作符,用于指定要执行的操作,还有0个或多个操作数,提供操作所需的参数或数据。许多指令没有操作数,仅由一个单字节的操作符构成。虚拟机的内层循环的执行过程如下: do 取一个操作符字节; 根据操作符的值执行一个动作; while(程序未结束)由于指令系统的简单性,使得虚拟机执行的过程十分简单,从而有利于提高执行的效率。指令中操作数的数量和大小是由操作符决定的。如果操作数比一个字节大,那么它存储的顺序是高位字节优先。例如,一个16位的参数存放时占用两个字节,其值为:第一个字节*256+第二个字节字节码指令流一般只是字节对齐的。指令tableswitch和lookup是例外,在这两条指令内部要求强制的4字节边界对齐。运行时数据区方法区 在Java虚拟机中,被装载类型的信息存储在一个逻辑上被称为方法区的内存中。当虚拟机装载某个类型时,它使用类装载器定位相应的class文件,然后读入这个class文件,然后将它传输到虚拟机中,紧接着虚拟机提取其中的类型信息,并将这些信息存储到方法区。该类型中的类(静态)变量同样也是存储在方法区中。方法区的大小不必固定,可以根据需要动态调整。方法区也可以被垃圾收集,因为虚拟机允许通过用户定义的类装载器来动态扩展Java程序,因此,一些类也会成为“不再引用”的类。 对于每个装载的类型,虚拟机都会在方法区中存储以下类型信息: 这个类型的全限定名。 这个类型的直接超类的全限定名(除非是java.lang.Object,无超类) 这个类型是类类型还是接口类型。 这个类型的访问修饰符(public,abstract .) 任何直接超接口的全限定名的有序列表除了上面列出的基本类型信息外,虚拟机还为每个被装载的类型存储以下信息 该类型的常量池 字段信息 方法信息 除了常量以外所有类(静态)变量 一个到类ClassLoader的引用 一个到Class类的引用方法区与传统语言中的编译后代码或是Unix进程中的正文段类似。它保存方法代码(编译后的java代码)和符号表。在当前的Java实现中,方法代码不包括在无用单元收集堆中,但计划在将来的版本中实现。每个类文件包含了一个Java类或一个Java界面的编译后的代码。可以说类文件是Java语言的执行代码文件。为了保证类文件的平台无关性,Java虚拟机规范中对类文件的格式也作了详细的说明。其具体细节请参考Sun公司的Java虚拟机规范。堆无用单元收集堆Java的堆是一个运行时数据区,类的实例(对象)从中分配空间。Java语言具有无用单元收集能力:它不给程序员显式释放对象的能力。Java不规定具体使用的无用单元收集算法,可以根据系统的需求使用各种各样的算法。无用单元收集堆(Garbage-collected-heap)栈Java虚拟机的栈有三个区域:局部变量区、运行环境区、操作数区。(1)局部变量区每个Java方法使用一个固定大小的局部变量集。它们按照与vars寄存器的字偏移量来寻址。局部变量都是32位的。长整数和双精度浮点数占据了两个局部变量的空间,却按照第一个局部变量的索引来寻址。(例如,一个具有索引n的局部变量,如果是一个双精度浮点数,那么它实际占据了索引n和n+1所代表的存储空间。)虚拟机规范并不要求在局部变量中的64位的值是64位对齐的。虚拟机提供了把局部变量中的值装载到操作数栈的指令,也提供了把操作数栈中的值写入局部变量的指令。(2)运行环境区在运行环境中包含的信息用于动态链接,正常的方法返回以及异常传播。动态链接 运行环境包括对指向当前类和当前方法的解释器符号表的指针,用于支持方法代码的动态链接。方法的class文件代码在引用要调用的方法和要访问的变量时使用符号。动态链接把符号形式的方法调用翻译成实际方法调用,装载必要的类以解释还没有定义的符号,并把变量访问翻译成与这些变量运行时的存储结构相应的偏移地址。动态链接方法和变量使得方法中使用的其它类的变化不会影响到本程序的代码。正常的方法返回如果当前方法正常地结束了,在执行了一条具有正确类型的返回指令时,调用的方法会得到一个返回值。执行环境在正常返回的情况下用于恢复调用者的寄存器,并把调用者的程序计数器增加一个恰当的数值,以跳过已执行过的方法调用指令,然后在调用者的执行环境中继续执行下去。异常和错误传播异常情况在Java中被称作Error(错误)或Exception(异常),是Throwable类的子类,在程序中的原因是:动态链接错,如无法找到所需的class文件。运行时错,如对一个空指针的引用程序使用了throw语句。当异常发生时,Java虚拟机采取如下措施:检查与当前方法相联系的catch子句表。每个catch子句包含其有效指令范围,能够处理的异常类型,以及处理异常的代码块地址。与异常相匹配的catch子句应该符合下面的条件:造成异常的指令在其指令范围之内,发生的异常类型是其能处理的异常类型的子类型。如果找到了匹配的catch子句,那么系统转移到指定的异常处理块处执行;如果没有找到异常处理块,重复寻找匹配的catch子句的过程,直到当前方法的所有嵌套的catch子句都被检查过。由于虚拟机从第一个匹配的catch子句处继续执行,所以catch子句表中的顺序是很重要的。因为Java代码是结构化的,因此总可以把某个方法的所有的异常处理器都按序排列到一个表中,对任意可能的程序计数器的值,都可以用线性的顺序找到合适的异常处理块,以处理在该程序计数器值下发生的异常情况。如果找不到匹配的catch子句,那么当前方法得到一个未截获异常的结果并返回到当前方法的调用者,好像异常刚刚在其调用者中发生一样。如果在调用者中仍然没有找到相应的异常处理块,那么这种错误传播将被继续下去。如果错误被传播到最顶层,那么系统将调用一个缺省的异常处理块。 (3)操作数栈区机器指令只从操作数栈中取操作数,对它们进行操作,并把结果返回到栈中。选择栈结构的原因是:在只有少量寄存器或非通用寄存器的机器(如Intel486)上,也能够高效地模拟虚拟机的行为。操作数栈是32位的。它用于给方法传递参数,并从方法接收结果,也用于支持操作的参数,并保存操作的结果。例如,iadd指令将两个整数相加。相加的两个整数应该是操作数栈顶的两个字。这两个字是由先前的指令压进堆栈的。这两个整数将从堆栈弹出、相加,并把结果压回到操作数栈中。每个原始数据类型都有专门的指令对它们进行必须的操作。每个操作数在栈中需要一个存储位置,除了long和double型,它们需要两个位置。操作数只能被适用于其类型的操作符所操作。例如,压入两个int类型的数,如果把它们当作是一个long类型的数则是非法的。在Sun的虚拟机实现中,这个限制由字节码验证器强制实行。但是,有少数操作(操作符dupe和swap),用于对运行时数据区进行操作时是不考虑类型的。寄存器Java虚拟机的寄存器用于保存机器的运行状态,与微处理器中的某些专用寄存器类似。Java虚拟机的寄存器有四种: pc:Java程序计数器。 optop:指向操作数栈顶端的指针。 frame:指向当前执行方法的执行环境的指针。 vars:指向当前执行方法的局部变量区第一个变量的指针。Java虚拟机是栈式的,它不定义或使用寄存器来传递或接受参数,其目的是为了保证指令集的简洁性和实现时的高效性(特别是对于寄存器数目不多的处理器)。 所有寄存器都是32位的。本地方法接口Java应用程序设计接口Java Application Programming Interface简称Java API,其中文名为Java应用程序设计接口。它是一个软件集合,其中有许多开发时所需要的控件,可以用它来辅助开发。Java API和JVM构成了Java运行的基本环境,这两种软件整合在一起处于计算机之上,通过这两种软件,Java平台把一个Java应用程序从硬件系统分离开,从而很好地保证了程序的独立性。为了更好地适应开发的需要,Java的设计者们提供了3种版本的Java平台:Java 2 Micro Edition (J2ME )、Java 2 Standard Edition(J2SE)和 Java 2 Enterprise Edition (J2EE),每一种版本都提供了丰富的开发工具以适应不同的开发需要。Java虚拟机的运行过程上面对虚拟机的各个部分进行了比较详细的说明,下面通过一个具体的例子来分析它的运行过程。虚拟机通过调用某个指定类的方法main启动,传递给main一个字符串数组参数,使指定的类被装载,同时链接该类所使用的其它的类型,并且初始化它们。例如对于程序:编译后在命令行模式下键入: java HelloApp run virtual machine 将通过调用HelloApp的方法main来启动java虚拟机,传递给main一个包含三个字符串run、virtual、machine的数组。现在我们略述虚拟机在执行HelloApp时可能采取的步骤。 class HelloApp public static void main(String args) System.out.println(Hello World!); for (int i = 0; i args.length; i+ )System.out.println(argsi);开始试图执行类HelloApp的main方法,发现该类并没有被装载,也就是说虚拟机当前不包含该类的二进制代表,于是虚拟机使用ClassLoader试图寻找这样的二进制代表。如果这个进程失败,则抛出一个异常。类被装载后同时在main方法被调用之前,必须对类HelloApp与其它类型进行链接然后初始化。链接包含三个阶段:检验,准备和解析。检验检查被装载的主类的符号和语义,准备则创建类或接口的静态域以及把这些域初始化为标准的默认值,解析负责检查主类对其它类或接口的符号引用,在这一步它是可选的。类的初始化是对类中声明的静态初始化函数和静态域的初始化构造方法的执行。一个类在初始化之前它的父类必须被初始化。整个过程如下:图4:虚拟机的运行过程结束语本文通过对JVM的体系结构的深入研究以及一个Java程序执行时虚拟机的运行过程的详细分析,意在剖析清楚Java虚拟机的机理。我们可以通过helloworld来理解这几个缩写词的具体含义:public class HelloWorld public static void main(String args) System.out.println(helloworld);编译之后, 我们得到了HelloWorld.class(图中的Your programs class files)在HelloWorld里面, 我们调用了 JAVA API中的 java.lang.System这个类的静态成员对象 out, out 的静态方法: public static void println(String string); 然后我们让虚拟机器来执行这个HelloWorld。1. 虚拟机会在classpath中找到HelloWorld.class。2. 虚拟机中的解释器(interpret)会把HelloWorld.class解释成字节码。3. 把解释后的字节码交由execution engin执行。4. execution engin会调用native method(即平台相关的字节码)来在host system的stdout(显示器)的指定部分打印出指定的字符串。5. 这样, 我们就看到helloworld字样了。有了这个流程后, 我们就好理解上面几个术语了:a. JDK: java develop kit (JAVA API包)b. SDK: software develop kit, 以前JDK 叫做java software develop kit, 后来出了1.2版本后, 就改名叫jdk了, 省时省力, 节约成本。c. JRE. java runtime environment 我们的helloworld必须在JRE(JAVA运行环境,JAVA运行环境又叫JAVA平台)里面, 才能跑起来。 所以, 显然地, JREJRE顾名思义只是java class运行时需要的环境,JDK不仅包含了JRE,还提供了开发调试java程序需要的工具 。d. JVM java virtual machine. 简单地讲, 就是把class文件变成字节码, 然后送到excution engin中执行。 而为什么叫虚拟机, 而不叫真实机呢? 因为JVM本身是又不能运算, 又不能让显示器显示helloworld的, 它只能再调用host system的API, 比如在w32里面就会调c+的API, 来让CPU帮他做做算术运算, 来调用c+里面的API来控制显示器显示显示字符串。 而这些API不是JDK里面有的,我们平时又看不见的,所以我们就叫它native api了(亦曰私房XX)。总结 Java平台虚拟机 Java的核心技术JVM(Java Virtual Machine)是Java实现平台无关性的基础 Java虚拟机(JVM)是可运行Java代码的假想计算机。 只要根据JVM规格说明把解释器移植到特定的计算机上,就能保证经过编译的任何Java代码能够在该系统上运行。Java平台虚拟机工作原理 Java编译程序把Java源程序翻译为JVM可执行代码字节码 Java编译器不把变量和方法的引用编译为数值引用,也不确定程序执行过程中的内存布局,而是把这些符号引用信息存储在字节码中,由解释器在运行过程中建立内存布局,然后再通过查表来确定一个方法所在的地址 这样保证了Java的可移植性和安全性。 运行JVM字节码的工作由解释器来完成,这包括三部分: 代码装入:该工作由类装载器(class loader)完成 代码校验:被装入代码经过字节码校验器进行检查,类只检查一次,无需反复校验,效率高 代码执行:通过校验,开始执行代码,有下列方式 解释 执行方式(笔译) 即时 编译方式(口译)在JAVA中,有六个不同的地方可以存储数据:1. 寄存器(register)。这是最快的存储区,因为它位于不同于其他存储区的地方处理器内部。但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配。你不能直接控制 ,也不能在程序中感觉到寄存器存在的任何迹象。2. 堆栈(stack)。位于通用RAM中,但通过它的“堆栈指针”可以从处理器哪里获得支持。堆栈指针若向下移动,则分配新的内存;若向上移动,则释放那些内存。这是一种快速有效的分配存储方法,仅次于寄存器。创建程序时候,JAVA编译器必须知道存储在堆栈内所有数据的确切大小和生命周期,因为它必须生成相应的代码,以便上下移动堆栈指针 。这一约束限制了程序的灵活性,所以虽然某些JAVA数据存储在堆栈中特别是对象引用,但是JAVA对象不存储其中。 3. 堆(heap)。一种通用性的内存池 (也存在于RAM中),用于存放所以的JAVA对象。堆不同于堆栈的好处是:编译器不需要知道要从堆里分配多少存储区域 ,也不必知道存储的数据在堆里存活多长时间。因此,在堆里分配存储有很大的灵活性。当你需要创建一个对象的时候,只需要new写一行简单的代码,当执行这行代码时,会自动在堆里进行存储分配。当然,为这种灵活性必须要付出相应的代码。用堆进行存储分配比用堆栈进行存储存储需要更多的时间 。4. 静态存储(static storage)。这里的“静态”是指“在固定的位置”。静态存储里存放程序运行时一直存在的数据。你可用关键字static来标识一个对象的特定元素是静态的,但JAVA对象本身从来不会存放在静态存储空间里。5. 常量存储(constant storage)。常量值通常直接存放在程序代码内部,这样做是安全的,因为它们永远不会被改变。有时,在嵌入式系统中,常量本身会和其他部分分割离开,所以在这种情况下,可以选择将其放在ROM中6. 非RAM存储。如果数据完全存活于程序之外,那么它可以不受程序的任何控制,在程序没有运行时也可以存在。就速度来说,有如下关系: 寄存器 堆栈 堆 其他上面这段话摘取之Thinking in Java在这里,主要要说下堆与堆栈的关系: 堆:堆是heap,是所谓的动态内存,其中的内存在不需要时可以回收,以分配给新的内存请求,其内存中的数据是无序的,即先分配的和随后分配的内存并没有什么必然的位置关系,释放时也可以没有先后顺序。一般由使用者自由分配,malloc分配的就是堆,需要手动释放。 堆栈:就是STACK。实际上是只有一个出入口的队列,即后进先出(First In Last Out),先分配的内存必定后释放。一般由,由系统自动分配,存放存放函数的参数值,局部变量等,自动清除。还有,堆是全局的,堆栈是每个函数进入的时候分一小块,函数返回的时候就释放了,静态和全局变量,new 得到的变量,都放在堆中,局部变量放在堆栈中,所以函数返回,局部变量就全没了。其实在实际应用中,堆栈多用来存储方法的调用。而对则用于对象的存储。 JAVA中的基本类型,其实需要特殊对待。因为,在JAVA中,通过new创建的对象存储在“堆”中,所以用new 创建一个小的、简单的变量,如基本类型等,往往不是很有效。因此,在JAVA中,对于这些类型,采用了与C、C+相同的方法。也就是说,不用new 来创建,而是创建一个并非是“引用”的“自动”变量。这个变量拥有它的“值”,并置于堆栈中,因此更高效。Java进程的内存布局关于java进程的内存占用,java的命令好参数始终也没有找到一个明确的说法。最近自己写的Java服务器进程总是不稳定,个人在怀疑代码的同事也对java的参数产生的怀疑,于是仔细研究了一下Java的启动参数和内存的关系,得到的结论如下。在32位操作系统下,一般一个操作系统进程最大只能使用2G用户内存。对于Java进程来说,这2G内存由Object Heap,Thread Stack, Code Cache和JVM来共享这也是为啥SUN的官方文档从来没有说过java的mx参数最大可以设置为多大,因为这取决于具体的java程序。java参数中的mx/ms参数针对的是object heap。也就是java中的java对象堆。参数中的ss,针对单个线程的栈大小,如果程序的线程多,那么这个部分占用的内存就大code cache占用的是一个称为perm gen的内存空间,这里存放的是代码,也就是class,包括虚拟机加载的和程序动态生成的跟反射相关的代码数据,这个可以通过PermSize和MaxPerSize参数来指定。至于JVM自己要多少内存,就不好说了。因此SUN官方之说mx参数+一个overhead不能超过2G。如果是线程数很多的程序,一定要注意手工设置合适的ss参数,否则内存必然OutOfMemoryError。在java进程运行时,至于如何查看,估算各个部分的内存占用System.totalMemory这些方法看到的是object heap(包括年轻代和年老代)Thread Stack,需要根据自己的线程数和启动时的ss参数来估算,要考虑到峰值code cache根据permsize参数可以看到实时数据和峰值JVM就是根据系统分配给java进程的实际内存和上述三个数据的差值了,不过jvm随着object heap的增加可能也是会增加的,需要回头验证一把。关于java的OutOfMemoryError,如果是Heap的就是普通的对象太多了,需要增加尺寸或者检查程序是否有对象堆积如果是Perm Gen,可能是加载的类太多,反射太多,PermSize不够了如果是其它问题,可能就是机器的物理内存不够了,交换分区不够了,或者线程用的太多了。Java内存分配相关资料的收集Java 中的堆和栈简单的说:Java把内存划分成两种:一种是栈内存,一种是堆内存。 在函数中定义的一些基本类型的变量和对象的引用变量都在函数的栈内存中分配。 当在一段代码块定义一个变量时,Java就在栈中为这个变量分配内存空间,当超过变量的作用域后,Java会自动释放掉为该变量所分配的内存空间,该内存空间可以立即被另作他用。 堆内存用来存放由new创建的对象和数组。 在堆中分配的内存,由Java虚拟机的自动垃圾回收器来管理。 在堆中产生了一个数组或对象后,还可以在栈中定义一个特殊的变量,让栈中这个变量的取值等于数组或对象在堆内存中的首地址,栈中的这个变量就成了数组或对象的引用变量。 引用变量就相当于是为数组或对象起的一个名称,以后就可以在程序中使用栈中的引用变量来访问堆中的数组或对象。 具体的说:栈与堆都是Java用来在Ram中存放数据的地方。与C+不同,Java自动管理栈和堆,程序员不能直接地设置栈或堆。 Java的堆是一个运行时数据区,类的(对象从中分配空间。这些对象通过new、newarray、anewarray和multianewarray等 指令建立,它们不需要程序代码来显式的释放。堆是由垃圾回收来负责的,堆的优势是可以动态地分配内存大小,生存期也不必事先告诉编译器,因为它是在运行时 动态分配内存的,Java的垃圾收集器会自动收走这些不再使用的数据。但缺点是,由于要在运行时动态分配内存,存取速度较慢。 栈的优势是,存取速度比堆要快,仅次于寄存器,栈数据可以共享。但缺点是,存在栈中的数据大小与生存期必须是确定的,缺乏灵活性。栈中主要存放一些基本 类型的变量(,int, short, long, byte, float, double, boolean, char)和对象句柄。 栈有一个很重要的特殊性,就是存在栈中的数据可以共享。假设我们同时定义: int a = 3; int b = 3; 编译器先处理int a = 3;首先它会在栈中创建一个变量为a的引用,然后查找栈中是否有3这个值,如果没找到,就将3存放进来,然后将a指向3。接着处理int b = 3;在创建完b的引用变量后,因为在栈中已经有3这个值,便将b直接指向3。这样,就出现了a与b同时均指向3的情况。这时,如果再令a=4;那么编译器 会重新搜索栈中是否有4值,如果没有,则将4存放进来,并令a指向4;如果已经有了,则直接将a指向这个地址。因此a值的改变不会影响到b的值。要注意这 种数据的共享与两个对象的引用同时指向一个对象的这种共享是不同的,因为这种情况a的修改并不会影响到b, 它是由编译器完成的,它有利于节省空间。而一个对象引用变量修改了这个对象的内部状态,会影响到另一个对象引用变量。 String是一个特殊的包装类数据。可以用: String str = new String(abc); String str = abc; 两种的形式来创建,第一种是用new()来新建对象的,它会在存放于堆中。每调用一次就会创建一个新的对象。 而第二种是先在栈中创建一个对String类的对象引用变量str,然后查找栈中有没有存放abc,如果没有,则将abc存放进栈,并令str指向”abc”,如果已经有”abc” 则直接令str指向“abc”。 比较类里面的数值是否相等时,用equals()方法;当测试两个包装类的引用是否指向同一个对象时,用=,下面用例子说明上面的理论。 String str1 = abc; String str2 = abc; System.out.println(str1=str2); /true 可以看出str1和str2是指向同一个对象的。 String str1 =new String (abc); String str2 =new String (abc); System.out.println(str1=str2); / false 用new的方式是生成不同的对象。每一次生成一个。 因此用第二种方式创建多个”abc”字符串,在内存中其实只存在一个对象而已. 这种写法有利与节省内存空间. 同时它可以在一定程度上提高程序的运行速度,因为JVM会自动根据栈中数据的实际情况来决定是否有必要创建新对象。而对于String str = new String(abc);的代码,则一概在堆中创建新对象,而不管其字符串值是否相等,是否有必要创建新对象,从而加重了程序的负担。 另一方面, 要注意: 我们在使用诸如String str = abc;的格式定义类时,总是想当然地认为,创建了String类的对象str。担心陷阱!对象可能并没有被创建!而可能只是指向一个先前已经创建的 对象。只有通过new()方法才能保证每次都创建一个新的对象。 由于String类的immutable性质,当String变量需要经常变换其值时,应该考虑使用StringBuffer类,以提高程序效率。java中内存分配策略及堆和栈的比较 2.1 内存分配策略 按照编译原理的观点,程序运行时的内存分配有三种策略,分别是静态的,栈式的,和堆式的. 静态存储分配是指在编译时就能确定每个数据目标在运行时刻的存储空间需求,因而在编译时就可以给他们分配固定的内存空间.这种分配策略要求程序代码中不允 许有可变数据结构(比如可变数组)的存在,也不允许有嵌套或者递归的结构出现,因为它们都会导致编译程序无法计算准确的存储空间需求. 栈式存储分配也可称为动态存储分配,是由一个类似于堆栈的运行栈来实现的.和静态存储分配相反,在栈式存储方案中,程序对数据区的需求在编译时是完全未知 的,只有到运行的时候才能够知道,但是规定在运行中进入一个程序模块时,必须知道该程序模块所需的数据区大小才能够为其分配内存.和我们在数据结构所熟知 的栈一样,栈式存储分配按照先进后出的原则进行分配。 静态存储分配要求在编译时能知道所有变量的存储要求,栈式存储分配要求在过程的入口处必须知道所有的存储要求,而堆式存储分配则专门负责在编译时或运行时 模块入口处都无法确定存储要求的数据结构的内存分配,比如可变长度串和对象实例.堆由大片的可利用块或空闲块组成,堆中的内存可以按照任意顺序分配和释 放. 2.2 堆和栈的比较 上面的定义从编译原理的教材中总结而来,除静态存储分配之外,都显得很呆板和难以理解,下面撇开静态存储分配,集中比较堆和栈: 从堆和栈的功能和作用来通俗的比较,堆主要用来存放对象的,栈主要是用来执行程序的.而这种不同又主要是由于堆和栈的特点决定的: 在编程中,例如C/C+中,所有的方法调用都是通过栈来进行的,所有的局部变量,形式参数都是从栈中分配内存空间的。实际上也不是什么分配,只是从栈顶 向上用就行,就好像工厂中的传送带(conveyor belt)一样,Stack Pointer会自动指引你到放东西的位置,你所要做的只是把东西放下来就行.退出函数的时候,修改栈指针就可以把栈中的内容销毁.这样的模式速度最快, 当然要用来运行程序了.需要注意的是,在分配的时候,比如为一个即将要调用的程序模块分配数据区时,应事先知道这个数据区的大小,也就说是虽然分配是在程 序运行时进行的,但是分配的大小多少是确定的,不变的,而这个大小多少是在编译时确定的,不是在运行时. 堆是应用程序在运行的时候请求操作系统分配给自己内存,由于从操作系统管理的内存分配,所以在分配和销毁时都要占用时间,因此用堆的效率非常低.但是堆的 优点在于,编译器不必知道要从堆里分配多少存储空间,也不必知道存储的数据要在堆里停留多长的时间,因此,用堆保存数据时会得到更大的灵活性。事实上,面 向对象的多态性,堆内存分配是必不可少的,因为多态变量所需的存储空间只有在运行时创建了对象之后才能确定.在C+中,要求创建一个对象时,只需用 new命令编制相关的代码即可。执行这些代码时,会在堆里自动进行数据的保存.当然,为达到这种灵活性,必然会付出一定的代价:在堆里分配存储空间时会花 掉更长的时间!这也正是导致我们刚才所说的效率低的原因,看来列宁同志说的好,人的优点往往也是人的缺点,人的缺点往往也是人的优点(晕). 2.3 JVM中的堆和栈 JVM是基于堆栈的虚拟机.JVM为每个新创建的线程都分配一个堆栈.也就是说,对于一个Java程序来说,它的运行就是通过对堆栈的操作来完成的。堆栈以帧为单位保存线程的状态。JVM对堆栈只进行两种操作:以帧为单位的压栈和出栈操作。 我们知道,某个线程正在执行的方法称为此线程的当前方法.我们可能不知道,当前方法使用的帧称为当前帧。当线程激活一个Java方法,JVM就会在线程的 Java堆栈里新压入一个帧。这个帧自然成为了当前帧.在此方法执行期间,这个帧将用来保存参数,局部变量,中间计算过程和其他数据.这个帧在这里和编译 原理中的活动纪录的概念是差不多的. 从Java的这种分配机制来看,堆栈又可以这样理解:堆栈(Stack)是操作系统在建立某个进程时或者线程(在支持多线程的操作系统中是线程)为这个线程建立的存储区域,该区域具有先进后出的特性。 每一个Java应用都唯一对应一个JVM实例,每一个实例唯一对应一个堆。应用程序在运行中所创建的所有类实例或数组都放在这个堆中,并由应用所有的线程 共享.跟C/C+不同,Java中分配堆内存是自动初始化的。Java中所有对象的存储空间都是在堆中分配的,但是这个对象的引用却是在堆栈中分配,也 就是说在建立一个对象时从两个地方都分配内存,在堆中分配的内存实际建立这个对象,而在堆栈中分配的内存只是一个指向这个堆对象的指针(引用)而已。程序运行时的内存布局一个程序要运行,就要先将可执行程序文件装载到计算机的内存中。装载是操作系统掌控的,一般而言,操作系统将程序装入内存后,将形成一个随时可以运行的进程空间,该进程空间分四个区域,如图所示: 进程空间 代码区 Code area 全局数据区 Data area 堆区 Heap area 栈区 Stack area一个运行的程序在内存中表示为这四个空间区域,其中代码区存放程序的执行代码。所谓执行代码就是索引了一个个函数块代码,它由函数定义块的编译得到。全局数据区存放全局数据、常量、文字量、静态全局量和静态局部量。堆区存放动态内存,供程序随机申请使用。栈区存放函数数据区(即局部数据区),它动态地反映了程序运行中的函数状态,其运动轨迹正好用来观察函数的调用和返回,从而研究其函数机制。栈区:栈是一种数据结构,它的工作原理就像叠盘子一样,最先叠上去的盘子要等随后叠上去的盘子都拿走了才能拿到,而最后叠上去的盘子则可以首先拿到。C+的函数调用过程,需要初始化和善后处理的环节。函数调用的整个过程就是栈空间操作的过程。函数调用时,C+做以下工作:(1) 建立被调函数的栈空间,栈空间的大小由函数定义体中的数据量多少决定;(2) 保护调用函数的运行状态和返回地址;(3) 传递参数;(4) 将控制权转交给被调函数;(5) 函数运行完成后,复制返回值到函数数据块底部;(6) 恢复调用函数的运行状态;(7) 返回调用函数。调用一个函数,可以看做是一个栈中元素的进栈与出栈操作。然而,进栈之后的函数运行,可能导致其他函数被调用。因此,程序运行表现为栈中一系列元素的进栈与出栈。最初,操作系统将main()函数进入栈中,标志着程序运行的开始,等到最后main()函数出栈,程序运行就结束了。stack(堆) 存放 对象实例或数组(就是所有NEW出来的东西)heap (栈)存放局部变量 就是那8种基本类型(int long 之类的,和class)在C+里栈区是会自动释放内存的,栈区,你把他想象成客栈,客栈就肯定有人管理的(具体自己想一下加深印象),所以内存就自动释放的,那记得住栈区,堆区就不用记了。code segment (静态代码区)代码区说明白了是代码区就是把所有的代码都放进去的地方,就是你写的代码放进去的地方,整个方法都是整段代码自然也放这里了data segment(静态数据区) 代码区你明白了,静态数据区你就记得存放跟他不一样的东西,在C+里这里可以存放全局变量,但JAVA就没了全局变量,这里还放静态变量常量好象也放这吧,String s = hello world里的hello world就是放这里,s就是放在栈里,但是String s = new String(hello world);这里的hello world就是放在堆里,因为他是NEW出来的。还有如果String s = hello world String t = hello world这样的话,栈里的s 和 t 都是指向静态区存放hello world的那块内存,而String

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论