全面了解String.doc_第1页
全面了解String.doc_第2页
全面了解String.doc_第3页
全面了解String.doc_第4页
全面了解String.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

全面理解Java中的String数据类型1. 首先String不属于8种基本数据类型,String是一个对象。 因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性。2. new String()和new String(“”)都是申明一个新的空字符串,是空串不是null;3. String str=”kvill”; 和 String str=new String (“kvill”);的区别在这里,我们不谈堆,也不谈栈,只先简单引入常量池这个简单的概念。常量池(constant pool)指的是在编译期被确定,并被保存在已编译的.class文件中的一些数据。它包括了关于类、方法、接口等中的常量,也包括字符串常量。看例1:String s0=”kvill”;String s1=”kvill”;String s2=”kv” + “ill”;System.out.println( s0=s1 );System.out.println( s0=s2 );结果为: truetrue首先,我们要知道Java会确保一个字符串常量只有一个拷贝。 因为例子中的s0和s1中的”kvill”都是字符串常量,它们在编译期就被确定了,所以s0=s1为true;而”kv”和”ill”也都是字符串 常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中” kvill”的一个引用。所以我们得出s0=s1=s2;用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。看例2:String s0=”kvill”;String s1=new String(”kvill”);String s2=”kv” + new String(“ill”);System.out.println( s0=s1 );System.out.println( s0=s2 );System.out.println( s1=s2 );结果为: falsefalsefalse例2中s0还是常量池 中”kvill”的应用,s1因为无法在编译期确定,所以是运行时创建的新对象”kvill”的引用,s2因为有后半部分new String(“ill”)所以也无法在编译期确定,所以也是一个新创建对象”kvill”的应用;明白了这些也就知道为何得出此结果了。4. Sern()再补充介绍一点:存在于.class文件中的常量池,在运行期被JVM装载,并且可以扩充。String的intern()方法就是扩充常量池的一个方 法;当一个String实例str调用intern()方法时,Java查找常量池中是否有相同Unicode的字符串常量,如果有,则返回其的引用,如 果没有,则在常量池中增加一个Unicode等于str的字符串并返回它的引用;看例3就清楚了例3:String s0= “kvill”;String s1=new String(”kvill”);String s2=new String(“kvill”);System.out.println( s0=s1 );System.out.println( “*” );ern();s2=ern(); /把常量池中“kvill”的引用赋给s2System.out.println( s0=s1);System.out.println( s0=ern() );System.out.println( s0=s2 );结果为:false*false /虽然执行了ern(),但它的返回值没有赋给s1true /说明ern()返回的是常量池中”kvill”的引用true最后我再破除一个错误的理解: 有人说,“使用Sern()方法则可以将一个String类的保存到一个全局String表中,如果具有相同值的Unicode字符 串已经在这个表中,那么该方法返回表中已有字符串的地址,如果在表中没有相同值的字符串,则将自己的地址注册到表中“如果我把他说的这个全局的 String表理解为常量池的话,他的最后一句话,“如果在表中没有相同值的字符串,则将自己的地址注册到表中”是错的:看例4:String s1=new String(kvill);String s2=ern();System.out.println( s1=ern() );System.out.println( s1+ +s2 );System.out.println( s2=ern() );结果: falsekvill kvilltrue在这个类中 我们没有声名一个”kvill”常量,所以常量池中一开始是没有”kvill”的,当我们调用ern()后就在常量池中新添加了一个” kvill”常量,原来的不在常量池中的”kvill”仍然存在,也就不是“将自己的地址注册到常量池中”了。s1=ern()为false说明原来的“kvill”仍然存在;s2现在为常量池中“kvill”的地址,所以有s2=ern()为true。5. 关于equals()和=这个对于String简单来说就是比较两字符串的Unicode序列是否相当,如果相等返回true;而=是比较两字符串的地址是否相同,也就是是否是同一个字符串的引用。6. 关于String是不可变的这一说又要说很多,大家只要知道String的实例一旦生成就不会再改变了,比如说:String str=”kv”+”ill”+” “+”ans”;就是有4个字符串常量,首先”kv”和”ill”生成了”kvill”存在内存中, 然后”kvill”又和” “ 生成 ”kvill “存在内存中,最后又和生成了”kvill ans”;并把这个字符串的地址赋给了str,就是因为String的“不可变”产生了很多临时变量,这也就是为什么建议用StringBuffer的原 因了,因为StringBuffer是可改变的String是一个非可变类(immutable)。什么是非可变类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创 建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对 象,甚至可以共享它们的内部信息。(详见 Effective javaitem 13)。String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。6.1 创建String str1 = new String(abc);Stirng str2 = abc;虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个String对 象,然后将该对象的引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象; 如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:e.g. 1String str1 = new String(abc); /jvm 在堆上创建一个String对象 /jvm 在strings pool中找不到值为“abc”的字符串,因此/在堆上创建一个String对象,并将该对象的引用加入至strings pool中/此时堆上有两个String对象Stirng str2 = abc;if(str1 = str2)System.out.println(str1 = str2);elseSystem.out.println(str1 != str2);/打印结果是 str1 != str2,因为它们是堆上两个不同的对象String str3 = abc;/此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”/因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用if(str2 = str3)System.out.println(str2 = str3);elseSystem.out.println(str2 != str3);/打印结果为 str2 = str3e.g. 2String str1 = new String(abc); /jvm 在堆上创建一个String对象 str1 = ern();/程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool/有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至/strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会/被GC收集。/此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”/因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,/此时,堆上的有效对象只有一个。Stirng str2 = abc;if(str1 = str2)System.out.println(str1 = str2);elseSystem.out.println(str1 != str2);/打印结果是 str1 = str2 为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。6.2 串接(Concatenation)java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然 String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状 态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而 来了。为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串 接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。6.3 String的长度我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中 是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 232,也就是4G。不过,我们在编写源代码的时候,如果使用 Sting str = aaaa;的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536 2 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。 如果超出这个数量,在编译的时候编译器会报错。7.cast object to String (suggest to use Object.toString()将对象转为String常用的方法有Object.toString(),(String)Object,String.valueOf(Object)等。下面对这些方法一一进行分析方法1:采用 Object.toString()方法请看下面的例子:Object object = getObject();System.out.println(object.toString();在 这种使用方法中,因为java.lang.Object类里已有public方法.toString(),所以对任何严格意义上的java对象都可以调用 此方法。但在使用时要注意,必须保证object不是null值,否则将抛出NullPointerException异常。采用这种方法时,通常派生类 会覆盖Object里的toString()方法。方法2:采用类型转换(String)object方法这是标准的类型转换, 将object转成String类型的值。使用这种方法时,需要注意的是类型必须能转成String类型。因此最好用instanceof做个类型检查, 以判断是否可以转换。否则容易抛出CalssCastException异常。此外,需特别小心的是因定义为Object 类型的对象在转成String时语法检查并不会报错,这将可能导致潜在的错误存在。这时要格外小心。如:Object obj = new Integer(100);StringstrVal = (String)obj;在运行时将会出错,因为将Integer类型强制转换为String类型,无法通过。但是,Integer obj = new Integer(100);StringstrVal = (String)obj;如是格式代码,将会报语法错误。此外,因null值可以强制转换为任何java类类型,(String)null也是合法的。方法3:采用String.valueOf(Object)String.valueOf (Object)的基础是Object.toString()。但它与Object.toString()又有所不同。在前面方法1的分析中提到,使用后 者时需保证不为null。但采用第三种方法时,将不用担心object是否为null值这一问题。为了便于说明问题,我们来分析一下相关的源代码。Jdk 里String.valueOf(Object)源码如下:public static String valueOf(Object obj) return (obj = null) ? null : obj.toString();从 上面的源码可以很清晰的看出null值不用担心的理由。但是,这也恰恰给了我们隐患。我们应当注意到,当object为null时, String.valueOf(object)的值是字符串”null”,而不是null!在使用过程中切记要注意。试想一下,如果我们用 if(String.valueOf(object)=null)System.out.println(“传入的值是null!”);这样的语句 将可能会发生什么问题。再想一下,向控制台输出时,在视觉上如下语句在执行的结果上有什么不同:System.out.println(String.valueOf(null); / NullPointerExceptionSystem.out.println(null); / println only accept String and char8.private static void func(String s)s += tail;System.out.println(s);String a = abc;func(a);System.out.println(a);result:abctailabc9.判断java String中是否有汉字的方法java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基本上地球上的字符可被全部包括了,实际中,我们希望判断一个字符是不是汉字,或者一个字符串里的字符是否有汉字来满足业务上的需求, String类中有个这样的方法可得到其字符长度length() ,看下面例子, String s1 = 我是中国人; String s2 = imchinese; String s3 = i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论