java中文转换Unicode编码.doc_第1页
java中文转换Unicode编码.doc_第2页
java中文转换Unicode编码.doc_第3页
java中文转换Unicode编码.doc_第4页
java中文转换Unicode编码.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Java中文Unicode中文转换转换背景:把中文转换成Unicode编码再直接输出,程序解析XML,properties,以及JS打印提示信息后再把Unicode编码转回中文就没有问题了。提供两种方法把中文转换成Unicode编码:第一种办法:Eclipse中JS转换法1. web项目中随便新建一个 *.js文件,将文件的编码属性设置为utf8 (右击文件从弹出菜单中选择“properties”在弹出的属性对话框中设置“Text file encoding”选项)2. 打开新建的*.js文件,输入: “要转换的汉字”.3. 按下Ctrl+Shift+F 或右键点击文件内容从弹出菜单中选择“Format Document”选型,效果出来了。总结:必须将汉字放到”中间,否则不转换._第二种办法:JAVA程序实现法public class CharacterSetToolkit /* Creates a new instance of CharacterSetToolkit */ public CharacterSetToolkit() private static final char hexDigit = 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F ; private static char toHex(int nibble) return hexDigit(nibble & 0xF); /* * 将字符串编码成 Unicode 。 * param theString 待转换成Unicode编码的字符串。 * param escapeSpace 是否忽略空格。 * return 返回转换后Unicode编码的字符串。 */ public static String toUnicode(String theString, boolean escapeSpace) int len = theString.length(); int bufLen = len * 2; if (bufLen 0) bufLen = Integer.MAX_VALUE; StringBuffer outBuffer = new StringBuffer(bufLen); for(int x=0; x 61) & (aChar 127) if (aChar = ) outBuffer.append(); outBuffer.append(); continue; outBuffer.append(aChar); continue; switch(aChar) case : if (x = 0 | escapeSpace) outBuffer.append(); outBuffer.append( ); break; case t:outBuffer.append(); outBuffer.append(t); break; case n:outBuffer.append(); outBuffer.append(n); break; case r:outBuffer.append(); outBuffer.append(r); break; case f:outBuffer.append(); outBuffer.append(f); break; case =: / Fall through case : / Fall through case #: / Fall through case !: outBuffer.append(); outBuffer.append(aChar); break; default: if (aChar 0x007e) outBuffer.append(); outBuffer.append(u); outBuffer.append(toHex(aChar 12) & 0xF); outBuffer.append(toHex(aChar 8) & 0xF); outBuffer.append(toHex(aChar 4) & 0xF); outBuffer.append(toHex( aChar & 0xF); else outBuffer.append(aChar); return outBuffer.toString(); /* * 从 Unicode 码转换成编码前的特殊字符串。 * param in Unicode编码的字符数组。 * param off 转换的起始偏移量。 * param len 转换的字符长度。 * param convtBuf 转换的缓存字符数组。 * return 完成转换,返回编码前的特殊字符串。 */ public String fromUnicode(char in, int off, int len, char convtBuf) if (convtBuf.length len) int newLen = len * 2; if (newLen 0) newLen = Integer.MAX_VALUE; convtBuf = new charnewLen; char aChar; char out = convtBuf; int outLen = 0; int end = off + len; while (off end) aChar = inoff+; if (aChar = ) aChar = inoff+; if (aChar = u) / Read the xxxx int value = 0; for (int i = 0; i 4; i+) aChar = inoff+; switch (aChar) case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7: case 8: case 9: value = (value 4) + aChar - 0; break; case a: case b: case c: case d: case e: case f: value = (value 4) + 10 + aChar - a; break; case A: case B: case C: case D: case E: case F: value = (value 4) + 10 + aChar - A; break; default: throw new IllegalArgumentException( Malformed uxxxx encoding.); outoutLen+ = (char) value; else if (aChar = t) aChar = t; else if (aChar = r) aChar = r; else if (aChar = n) aChar = n; else if (aChar = f) aChar = f; outoutLen+ = aChar; else outoutLen+ = (char) aChar; return new String(out, 0, outLen); public st

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论