Java在创建文件时指定编码的实现方法_第1页
Java在创建文件时指定编码的实现方法_第2页
Java在创建文件时指定编码的实现方法_第3页
Java在创建文件时指定编码的实现方法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第Java在创建文件时指定编码的实现方法目录一、问题分析二、字符编码三、问题解决前言:最近,学习了JavaIO流的相关的知识,想通过读写文件的方式练习和巩固所学知识。在使用File类创建文件时,突然想到,我该如何指定文件使用的编码呢?进而想到,应该如何查看一个文件的编码呢?

一、问题分析

先去互联网上查找答案,结果如下:

FileInputStreamfis=newFileInputStream(“xxxx.txt”);

OutputStreamWriterosw=newOutputStreamWriter(fis,“UTF-8”);

上面的代码大概意思是在写入文件时,写入的字符使用UTF-8编码,和我预想的不一样,我想在创建文件的同时指定编码。像下面这样,

Filemyfile=newFile("test.txt”,“UTF-8”);

if(!myfile.exists())myfile.createNewFile();

于是,我去查看JavaAPI8官方文档,File没有提供可以指定字符编码的构造函数。

同时也没提供set或者get等其他访问字符字符编码的方法,说明字符编码不是文件的固有属性。像文件创建时间,文件修改时间,是否可读、可写、可执行,这些都是文件的固有属性,或者说元信息,它们是文件的一部分。

二、字符编码

我们知道,计算机中存储的任何信息都是01串,文字也不例外。

对于字符的处理包括两个过程:编码和解码

编码:把字符映射到01串

解码:把01串映射到字符

不同的字符编码,例如GBK、UTF-8,编码和解码使用的规则不同。

对于同样的文本字符串:中国,使用UTF-8编码保存,一般使用三个字节保存一个汉字,(底层的01字符串的16进制形式)。

使用GBK编码保存,使用两个字节表示一个汉字。

当我们在文本编辑器中写好文字保存时,编辑器会根据你设置的字符编码类型将文本映射成01串。

你设置的字符类型,仅仅是编辑器把文字编码成成10串的转换规则而已,并不是文本的属性。

在编辑器打开文本文件时,显示的不是底层的01串,而是文字,是因为编辑器使用某种文字编码,把01串解码为字符。如果,解码时,使用的字符编码和编码时的一致或者兼容,就可以正确显示文本。如果解码时,使用的字符编码和编码时的不一致或者不兼容,就会乱码。

例如,我有一个文本文件使用的是GBK编码,内容是明月几时有,

我使用VScode(微软的一款非常好用的文本编辑器)打开文件,用术语说,就是解码文件。其默认使用的文字编码是UTF-8,解码相同。但是,因为我的文本底层是GBK编码的01串(两个字节一个字符),使用UTF-8解码01串,由于编码,解码不一致,必然会导致乱码。这时,只要手动选择对应的GBK编码,解码文件就不会乱码了。

乱码也从侧面说明了,字符编码不是文件的固有属性。

扯了这么多,就是为了说明这一点:字符编码就是解码和编码时用的规则,不是文件的固有属性。

我不禁产生疑惑,为什么当初不把字符编码设置为文件属性的一部分呢?

假设可以设置,并且设置为GBK,那么操作系统需要维护改功能。像一个文件是不可写的,那么有程序试图写文件,操作系统会拒绝写入一样,操作系统必须写入的字节必须是满足GBK编码要求,那么每次写入字节,操作系统都需要检查该字节的合法性,这需要非常大的性能开销,甚至是无法实现的,因为有些特殊字节即可以表示GBK,也可以表示UTF-8,是有歧义的。在说,做这一些的意义是什么,为了编辑器可以在打开文件的时候,可以根据编码属性选择正确的编码吗?没有必要,智能的编辑器,可以根据内容的前几个字节,推断出你的01串使用了什么编码。另外,你也可以手动设置解码所用的字符编码。

三、问题解决

在创建文件的时候,无法指定文件的编码。在将文字写入(例如文本编辑器的Ctrl+S保存,本质执行的就是写入操作)文件时,可以选择将文字转换为01串的编码规则。

针对Java程序,代码如下,正是文章最开始提及的代码:

FileInputStream

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论