CMD中CODEPAGE的概念及.ppt_第1页
CMD中CODEPAGE的概念及.ppt_第2页
CMD中CODEPAGE的概念及.ppt_第3页
CMD中CODEPAGE的概念及.ppt_第4页
CMD中CODEPAGE的概念及.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CMD中CODE PAGE的概念及其 设置值: Chcp Displays the number of the active console code page, or changes the consoles active console code page. Used without parameters, chcp displays the number of the active console code page. Syntax chcp nnn Parameters nnn : Specifies the code page. The following table lists each code page supported and its country/region or language: Code page Country/region or language 437 United States 850 Multilingual (Latin I) 852 Slavic (Latin II) 855 Cyrillic (Russian) 857 Turkish 860 Portuguese 861 Icelandic 863 Canadian-French 865 Nordic 866 Russian 869 Modern Greek 什么是code page, 怎么修改 windows cmd中的codepage 如果你的cmd无法正常显示中文, 或者其他字符, 通过chcp 来修改, 参数是nnn代表3个数字. 简体中 文的codepage是: 936 西文是 :1252 Code page 的历史: 1. Codepage的定义和历史 字符内码(charcter code)指的是 用来代表字符的内码.读者在输入 和存储文档时都要使用内码,内码 分为 单字节内码 - Single-Byte character sets (SBCS),可以支持 256个字符编码. 双字节内码 - Double-Byte character sets)(DBCS),可以支持 65000个字符编码.主要用来对大 字符集的东方文字进行编码. codepage 指的是一个经过挑选 的以特定顺序排列的字符内码列 表,对于早期的单字节内码的语种 ,codepage中的内码顺序使得系 统可以按照此列表来根据键盘的 输入值给出一个对应的内码.对于 双字节内码,则给出的是MultiByte 到Unicode的对应表,这样就可以 把以Unicode形式存放的字符转 化为相应的字符内码,或者反之, 在Linux核心中对应的函数就是 utf8_mbtowc和utf8_wctomb. 在1980年前,仍然没有任何国际 标准如ISO-8859或Unicode来定 义如何扩展US-ASCII编码以便非 英语国家的用户使用.很多IT厂商 发明了他们自己的编码,并且使用 了难以记忆的数目来标识: 例如936代表简体中文. 950代表 繁体中文. 1.1 CJK Codepage 同 Extended Unix Coding ( EUC )编码大不一样的是,下面所有的 远东 codepage 都利用了C1控制 码 =80=9F 做为首字节, 使用 ASCII值 =40=7E 做为第二 字节,这样才能包含多达数万个双 字节字符,这表明在这种编码之中 小于3F的ASCII值不一定代表 ASCII字符. CP932 Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节), 所以 JIS X 0201平假名包含一个 字节半宽的字符,其剩馀的60个字 节被用做7076个汉字以及648个 其他全宽字符的首字节.同EUC- JP编码区别的是, Shift-JIS没有 包含JIS X 202中定义的5802个 汉字. CP936 GBK 扩展了 EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字) 到Unicode (GB13000.1-93)中定 义的20902个汉字,中国大陆使用 的是简体中文zh_CN. CP949 UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附 加的韩文音节( 在C1中 ) CP950 是代替EUC-TW (CNS 11643- 1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定 义都在Ken Lunde的 CJK.INF中 或者 Unicode 编码表中找到. 注意: Microsoft采用以上四种 Codepage,因此要访问Microsoft 的文件系统时必需采用上面的 Codepage . 1.2 IBM的远东语言Codepage IBM的Codepage分为SBCS和 DBCS两种: IBM SBCS Codepage 37 (英文) * 290 (日文) * 833 (韩文) * 836 (简体中文) * 891 (韩文) 897 (日文) 903 (简体中文) 904 (繁体中文) IBM DBCS Codepage 300 (日文) * 301 (日文) 834 (韩文) * 835 (繁体中文) * 837 (简体中文) * 926 (韩文) 927 (繁体中文) 928 (简体中文) 将SBCS的Codepage和DBCS的 Codepage混合起来就成为: IBM MBCS Codepage 930 (日文) (Codepage 300 加 290) * 932 (日文) (Codepage 301 加 897) 933 (韩文) (Codepage 834 加 833) * 934 (韩文) (Codepage 926 加 891) 938 (繁体中文) (Codepage 927 加 904) 936 (简体中文) (Codepage 928 加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论