版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现行维吾尔文与西里尔维吾尔文编码字符转换规则2015-03-13实施2015-03-13实施新疆维吾尔自治区质量技术监督局发布I本标准依照GB/T1.1-2009《标准化工作导则第1部分:标准的结构和编写》、GB13000-2010《信息技术通用多八位编码字符集(UCS)》、GB21669-2008《信息技术维吾尔文、哈萨克文、柯尔克孜文编码字符集》的规定编写。本标准由新疆维吾尔自治区民族语言文字工作委员会提出。本标准由新疆维吾尔自治区经济和信息化委员会归口。本标准起草单位:新疆维吾尔自治区标准化研究院、新疆西北星信息技术有限责任公司、中科院新疆理化技术研究所、新疆维吾尔自治区民族语言文字工作委员会。现行维吾尔文与西里尔维吾尔文都是用于表达维吾尔语言的拼音文字,但两种文字表达维吾尔语言字母的方式有许多显著区别,主要包括以下几个方面:——现行维吾尔文是从右向左书写的文字,西里尔维吾尔文是从左向右书写的文字。——现行维吾尔文字母不区分大小写,西里尔维吾尔文字母区分大小写。——维吾尔文有8个元音字母。现行维吾尔文用字符3(该字符的编码为0x0626)与另外8个字符结合构成8个双字符字母来表示这8个维吾尔文元音字母,且根据上下文环境的不同,字符5有时需要出现,有时不需要出现;西里尔维吾尔文用8个字符分别表示这8个维吾尔文元音字母。——缩略语在西里尔维吾尔文中用每个单词首字母的大写形式表示,而在现行维吾尔文中则用每个单词的首字母加空格表示。——现行维吾尔文有32个字母,西里尔维吾尔文有40个字母。为了保证现行维吾尔文与西里尔维吾尔文编码字符转换过程中信息的完整性,应对这两种文字的书写方式进行必要的规范。因此,本标准提出了与编码字符转换有关的两种文字的书写规则,并制定两种文字编码字符的转换规则。1本标准规定了现行维吾尔文与西里尔维吾尔文编码字符转换的术语和定义、书写规则及转换规则本标准适用于现行维吾尔文与西里尔维吾尔文编2规范性引用文件件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB13000信息技术通用多八位编码字符集(UCS)注音及拼读的符号。编码字符codedcharacter字符及其编码表示。单字符字母monoletter2双字符字母dualletter用于表示阿拉伯字母和符号的编码字符,在GB13000中,有5个阿拉伯字本区(编码从0x0600到0x06FF)、补充区(编码从0x0750到0x077F)、扩展区(编码从0x08A0到0x08FF)、变形显现区A(编码从0xFB50到0xFDEE)、变形显现区B(编码从0xFE70到0xFEFF)。用于表示西里尔字母和符号的编码字符,在GB13000中,中有4个西里尔字符基本区(编码从0x0400到0x04FF)、补充区(编码从0x0500到0x052F)、扩展区A(编码从0x2DE0到字符,主要用于音节分隔或区分双字符字母和单字符字母,该字符的编码为0x0027。镜像字符mirroredcharacter用于控制字符的连接行为、双向顺序行为和选择显示格式行为的字符,例如:编码为0x200C的零编码为0x200B的字符,宽度为零,主要用于指示单词的边界。零宽不中断空格zerowidthno-breakspace编码为0xFEFF的字符,宽度为零,主要用于指示字符的前后即不分词也不断行。一对一的编码字符转换conversionofonecodedcharactertoonecodedcharacter3一对多的编码字符转换conversionofonecodedcharactertoseveralcodedcharacter一个编码字符转换为多个编码字符。多个编码字符转换为多个编码字符。多个编码字符转换为一个编码字符。4与编码字符转换相关的现行维吾尔文书写规则4.1缩略语的每个字母之间应有一个空格(见示例1)。5与编码字符转换相关的西里尔维吾尔文书写规则5.1句首字母应大写(见示例2)。5.2双引号内的首字母应大写(见示例3)。5.3专有名词(人名、地名、机构名称)的首字母应大写(见示例4)。5.4缩略语中的字母应大写(见示例5)。6现行维吾尔文编码字符转换为西里尔维吾尔文编码字符的规则6.1总体要求6.1.1扩展区编码字符的转换阿拉伯字符变形显现区A和变形显现区B的编码字符表达的现行维吾尔文,应首先转换为阿拉伯字符基本区编码字符表达的现行维吾尔文,然后再转换为对应的西里尔维吾尔文编码字符。6.1.2现行维吾尔文字母应先转换为西里尔维吾尔文字母的小写形式如无特别说明,现行维吾尔文编码字符应先转换为对应的西里尔维吾尔文编码字符的小写形式,然后再根据西里尔维吾尔文的书写规则进行必要的大小写转换。6.1.3镜像字符的处理4如无特别说明,镜像字符保留不变。信息系统不能依据上下文环境选择镜像字符的正确字形用于显示的,需将一个镜像字符的编码字符转换为与之镜像的另一个编码字符。表1列出了部分镜像字符的镜像关系,完整的镜像字符列表可以参照GB13000。表1部分镜像字符现行维吾尔文)]{}《》(〉西里尔维吾尔文[}{》《)(6.2一对一的编码字符转换6.2.1现行维吾尔文21个辅音字母,其编码字符应直接转换为对应的西里尔维吾尔文字母的编码字符,具体见表2(示例见6至9)。表2一对一的编码字符转换出C747之西里尔维吾尔文BⅡTKXp3Fφ5JS出J9西里尔维吾尔文KKTHⅡMHhB示例7:(头)应转换为6aⅢ示例8:吨(足)应转换为IyT6.2.2现行维吾尔文字母心与两个西里尔维吾尔文字母c和π对应,当出现在词首时,其编码字符需根据专用词汇表确定转换为西里尔维吾尔文字母π或c的编码字符。若专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母心默认转换为西里尔维吾尔文字母c的编码字符;当出现在非词首时,且前面没有现行维吾尔文字母心,则直接转换为西里尔维吾尔文字母c的编码字符,具体见表3(示例见10至12)。表3现行维吾尔文字母心的转换西里尔维吾尔文c示例10:(爱情)应转换为ceǎry示例11:此(马戏)应转换为Iupk示例12:Au(政治)应转换为cHsCOT6.2.3如表4所示,现行维吾尔文字母与两个西里尔维吾尔文字母Ⅲ和Ⅲ对应。因此,现行维吾尔文字母的编码字符需根据专用词汇表确定转换为西里尔维吾尔文字母Ⅲ或m的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母默认转换为西里尔维吾尔文字母Ⅲ的编码字符,具体见表4(示例见13至14)。5表4现行维吾尔文字母的转换西里尔维吾尔文ⅢⅢ6.2.4现行维吾尔文字母世与两个西里尔维吾尔文字母q和Ⅲ对应。因此,现行维吾尔文字母&字符,具体见表5(示例见15至16)。道道西里尔维吾尔文YⅢ元音字母的编码字符,具体见表6(示例见17至20)。19696西里尔维吾尔文aa0y0Y示例17:Ls(书)应转换为KHTa6西里尔维吾尔文字母e的编码字符,具体见表7(见示例21)。西里尔维吾尔文e36的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母5默认转换为西里尔维吾尔文字母n的编码字符,具体见表8(见示例22)。表8现行维吾尔文元音字母在非词首位置的转换5西里尔维吾尔文H示例22:Ls(书)应转换为KHTa66.3多对一的编码字符转换6.3.1现行维吾尔文元音字母是双字符字母,当出现在词首位置时,应忽略词首的字符5,双字符字母中的另一个字符直接转换为对应的西里尔维吾尔文元音字母的编码字符,具体见表9(示例见23至28)。表9现行维吾尔文元音字母在词首位置的转换L3¥西里尔维吾尔文a30yθY示例26:,5(战争)应转换为ypyⅢ示例28:3(葡萄)应转换为Y3YM6.3.2现行维吾尔文元音字母是双字符字母,且与两个西里尔维吾尔文字母e和3对应。当现行维吾尔文字母出现在词首位置时,应忽略词首的字符5,双字符字母中的另一个字符需根据专用词汇表确定转换为西里尔维吾尔文字母e或3的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母默认转换为西里尔维吾尔文字母e的编码字符,具体见表10(示例见29至30)。表10现行维吾尔文元音字母在词首位置的转换西里尔维吾尔文e36.3.3现行维吾尔文元音字母是双字符字母,且与两个西里尔维吾尔文字母n和bI对应。当现行维吾尔文字母出现在词首位置时,应忽略词首的字符5,双字符字母中的另一个字符需根据专用词汇表确定转换为西里尔维吾尔文字母u或bⅡ的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母默认转换为西里尔维吾尔文字母π的编码字符,具体见表11 (见示例31)。表11现行维吾尔文元音字母在词首位置的转换西里尔维吾尔文H76.3.4单词中有表12所示的字母序列,其编码字符分别转换为对应的西里尔维吾尔文字母的编码字符(示例见32至34)。表12现行维吾尔文字符序列的转换u西里尔维吾尔文Ⅱ示例33:5(6月)应转换为MIOH6.4多对多的编码字符转换6.4.1现行维吾尔文5个元音字母是双字符字母,当出现在非词首位置时,根据上下文环境字符5有时需要出现,有时不需要出现。当字符5出现时,则字符5转换为分隔符'的字符编码,双字符字母的另一个字符转换为对应的西里尔维吾尔文元音字母的编码字符(示例见35至40)。表13现行维吾尔文元音字母在非词首位置的转换GJ站y西里尔维吾尔文''yy6.4.2现行维吾尔文元音字母是双字符字母,且与两个西里尔维吾尔文字母e和3对应。当现行维吾尔文字母出现在非词首位置时,根据上下文环境字符5有时需要出现,有时不需要出现。当字符5出现时,字符5的编码字符转换为分隔符¹的编码字符,双字符字母中的另一个字符需根据专用词汇表确定转换为西里尔维吾尔文字母e或3的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母默认转换为西里尔维吾尔文字母e的编码字符(见示例41)。表14现行维吾尔文元音字母在非词首位置的转换西里尔维吾尔文6.4.3现行维吾尔文元音字母5是双字符字母,且与两个西里尔维吾尔文字母u和bI对应。当现行维吾尔文字母出现在非词首位置时,根据上下文环境字符5有时需要出现,有时不需要出现。当字符5出现时,字符5的编码字符转换为分隔符'的编码字符,双字符字母中的另一个字符需根据专用词汇表确转换为西里尔维吾尔文字母n或bI的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时现行维吾尔字母5默认转换为西里尔维吾尔文字母u的编码字符(见示例42)。8表15现行维吾尔文元音字母在非词首位置的转换J西里尔维吾尔文示例42:品(共计)应转换为KoM'nǔ6.4.4表16所示的现行维吾尔文字母序列,当出现在非词首时,其编码字符直接转换为西里尔维吾尔文字符π的编码字符(见示例43)。表16现行维吾尔文字母序列在非词首位置的转换西里尔维吾尔文I现行维吾尔文单词在转换为西里尔维吾尔文单词的过程中,需要根据专用词汇表判断单词中是否需要增加西里尔维吾尔文字母b和b的编码字符,以及判断在单词的什么位置增加西里尔维吾尔文字母b和b的编码字符(示例见44至45)。6.6缩略语的编码字符转换相邻的两个或两个以上现行维吾尔文字母左右及之间都有且仅有1个空格,则忽略字母之间的空格,并将现行维吾尔文字母转换为对应的西里尔维吾尔文字母的大写形式(示例见46至48)。6.7标点符号的编码字符转换现行维吾尔文标点符号的编码字符应转换为对应的西里尔维吾尔文标点符号的编码字符,具体见表17(示例见49至51)。表17现行维吾尔文标点符号的转换现行维吾尔文S!西里尔维吾尔文?6.8非现行维吾尔文编码字符的转换6.8.1现行维吾尔文中西里尔字符的处理现行维吾尔文中的西里尔字符应保留不变,同时在西里尔字符的前后分别增加零宽空格和零宽不中断空格。6.8.2零宽空格和零宽不中断空格的处理忽略现行维吾尔文中的零宽空格和零宽不中断空格,同时零宽空格和零宽不中断空格之间的字符保留不变。6.8.3布局和格式控制字符的处理现行维吾尔文中的布局和格式控制字符保留不变。6.8.4连接符的处理当连接符出现在现行维吾尔文单词中,转换为西里尔维吾尔文时,忽略连接符。6.8.5单个不带字符5的现行维吾尔文元音字母的处理现行维吾尔文的8个元音字母由包括字符5在内的两个字符构成的双字符字母,根据上下文环境,字符5有时需要出现,有时不需要出现。当不带字符5的现行维吾尔文元音字母单独出现的时候,在转换为西里尔维吾尔文时其编码字符保留不变。6.8.6其它非现行维吾尔文编码字符的处理现行维吾尔文中的其它非现行维吾尔文编码字符保留不变。6.9现行维吾尔文与西里尔维吾尔文编码字符对照见附录A。7西里尔维吾尔文编码字符转换为现行维吾尔文编码字符的规则7.1总体要求7.1.1扩展区编码字符的转换如无特别说明,西里尔维吾尔文编码字符转换为对应现行维吾尔文字母名义形式的编码字符就完成了转换工作。信息系统不能依据现行维吾尔文字母名义形式的编码字符,选择正确的变形显现的,需将现行维吾尔文字母名义形式的编码字符依据现行维吾尔文的书写习惯进一步转换为正确的变形显现形式编码字符。7.1.2西里尔维吾尔文字母大小写形式的处理如无特别说明,西里尔维吾尔文编码字符转换为现行维吾尔文编码字符的过程中,对同一个西里尔字母的大写形式和小写形式采用同样的方式处理。7.1.3镜像字符的处理如无特别说明,镜像字符保留不变。信息系统不能依据上下文环境选择镜像字符的正确字形用于显示的,需将一个镜像字符的编码字符转换为与之镜像的另一个编码字符。表18列出了部分镜像字符的镜像关系,完整的镜像字符列表可以参照GB13000。西里尔维吾尔文()[]{《》(〉现行维吾尔文)(][}{》《〈7.2一对一的编码字符转换7.2.1西里尔维吾尔文24个辅音字母,其编码字符应直接转换为对应的现行维吾尔文字母的编码字符,具体见表19(示例见52至55)。表19西里尔维吾尔文辅音字母的转换西里尔维吾尔文6ⅡTKHXp3KcⅢC道之5U西里尔维吾尔文F中KKrHMHhB之uüJSJ飞45§7.2.2西里尔维吾尔文字母Ⅲ的编码字符与现行维吾尔文字母和对应。需根据专用词汇表确定西里尔维吾尔文字母Ⅲ转换为现行维吾尔文字母和的编码字符。若专用的词汇表中没有包含需要转换的词条,转换时西里尔维吾尔字母Ⅲ默认转换为西里尔维吾尔文字母的编码字符,具体见表20(示例见56至57)。表20西里尔维吾尔文字母Ⅲ的转换西里尔维吾尔文ⅢⅢ正示例56:meTka(刷子)应转换为LS7.2.3表21中的6个西里尔维吾尔文元音字母出现在非词首时,转换为对应现行维吾尔文元音字母不带字符5的形式的编码字符(示例见58至61)。表21西里尔维吾尔文元音字母在非词首位置的转换西里尔维吾尔文aa0y0Y19*6Y616示例58:KHTa6(书)应转换为Ls示例61:KeMYp(煤)应转换为7.2.4表22中4个西里尔维吾尔文元音字母出现在非词首时,转换为对应现行维吾尔文元音字母不带字符5的形式的编码字符(示例见62至63)。表22西里尔维吾尔文元音字母在非词首位置的转换西里尔维吾尔文e3HSS示例62:πeKTop(讲师)应转换为,7.3一对多的编码字符转换7.3.1表23中的6个西里尔维吾尔文元音字母出现在词首位置时,转换为对应现行维吾尔文双字符字母的编码字符(示例见64至69)。表23西里尔维吾尔文元音字母在词首位置的转换西里尔维吾尔文aa0yθYL5示例64:aHap(石榴)应转换为,L比7.3.2表24中的4个西里尔维吾尔文元音字母出现在词首位置时,转换为对应现行维吾尔文双字符字母的编码字符(示例见70至72)。表24西里尔维吾尔文元音字母在词首位置的转换西里尔维吾尔文e3M现行维吾尔文示例72:IT(狗)应转换为s7.3.3表25中的2个西里尔维吾尔文字母I和IO,转换为现行维吾尔文时,编码字符直接转换为对应的现行维吾尔文字母序列的编码字符(示例见73至74)。表25西里尔维吾尔文字母9和FO的转换西里尔维吾尔文L一7.3.4西里尔维吾尔文字母Ⅱ,当在词首时,与现行维吾尔文字母心和字母序列对应。因此,需根据专用词汇表确定西里尔维吾尔文字母Ⅱ的编码字符转换为现行维吾尔文字母心或字母序列03的编码字符。如果专用的词汇表中没有包含需要转换的词条,则转换时西里尔维吾尔字母Ⅱ默认转换为现行维吾尔文字母心的编码字符;当在非词首时,直接转换为现行维吾尔文字母序列的编码字符,具体见表26(示例见75至76)。表26西里尔维吾尔文字母4在词首位置的转换西里尔维吾尔文Ⅱ心示例75:CapIH(撒尔金)应转换为西里尔维吾尔文字母b和b的编码字符在转换为现行维吾尔文时忽略(示例见77至78)。7.5分隔符编码字符的转换当分隔符′在西里尔维吾尔文元音字母之前,应转换为字符5的编码字符;分隔符在其它位置,则保留不变(示例见79至80)。7.6缩略语编码字符的转换相邻的多个大写西里尔维吾尔文字母编码字符转换为现行维吾尔文编码字符时,直接转换为对应的现行维吾尔文编码字符,然后在现行维吾尔文字母的编码字符之间加1个空格编码字符(示例见81至83)。7.7标点符号的转换7.7.1西里尔维吾尔文标点符号的编码字符应转换为对应的现行维吾尔文标点符号的编码字符,具体见表27(示例见84至86)。表27西里尔维吾尔文标点符号的转换西里尔维吾尔文?;6:示例84:6yHeMə?(这是什么?)应转换为S示例85:MH,COH(我,你)应转换为4心。7.8非西里尔维吾尔文编码字符的转换7.8.1西里尔维吾尔文中阿拉伯字符的处理西里尔维吾尔文中的阿拉伯字符应保留不变,并在阿拉伯字符的前后分别增加零宽空格和零宽不中断空格。7.8.2零宽空格和零宽不中断空格的处理忽略西里尔维吾尔文中的零宽空格和零宽不中断空格,同时零宽空格和零宽不中断空格之间的字符保留不变。7.8.3布局和格式控制字符的处理西里尔维吾尔文中的布局和格式控制字符保留不变。7.8.4其它非西里尔维吾尔文编码字符的处理西里尔维吾尔文中的其它
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年服务行业团队激励创新实践与情绪引导新趋势
- 2026年保安员文明用语服务规范
- 2026年探究“切割线定理”模型与相似三角形证明的教学整合
- 护理管理中的信息技术与电子病历
- 护理人文关怀培训
- 皮肤科队列研究失访数据的处理要点
- 病理资源标准化与医疗资源高效利用
- 小学图书馆个性化服务满意度与阅读推广效果评价教学研究课题报告
- 合作与共享承诺书6篇范文
- 客户需求及时处理响应承诺书(6篇)
- 动画场景构图课件
- 2025年物业经营管理真题及专家押题试卷附答案
- 2026年北京市朝阳区高三二模英语试卷(含答案)
- 初中英语一般过去时课件
- 2026年焊工职业技能考试题(附答案)
- 2026广西机场管理集团有限责任公司第一批次招聘236人笔试历年参考题库附带答案详解
- GJB827B--2020军事设施建设费用定额
- T/CECS 10214-2022钢面镁质复合风管
- DL∕T 5776-2018 水平定向钻敷设电力管线技术规定
- 健康体检知识解读-PPT课件
- 农村集体三资管理流程图
评论
0/150
提交评论