




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中华人民共和国国家标准汉语信息处理词汇01部分:基本术语1 : 中包括基本术语、汉语和汉字、汉字编码、汉字识别、汉语语音处理、汉语理解、机器翻译、汉语信息处理设备、汉语信息处理系统软件、汉语信息处理技术应用及其他等约11个部分。在学科方面,本词汇具有相对的独立性和系统性。们是其他各部分的基础。计、生产、使用、维护、管理、教学和出版等方面。2 1用标准2312信息交换用汉字编码字符集基本集5271数据处理词汇3遵循的原则和规则31词条词条是本标准为使用者提供的便于查检和参阅的基本单元。同语种文本都是一致的);:”开头的一个或几个示例;1以“注:”开头的一个或几个注释(用以说明术语应用的特殊情况);表或表格。别在不同的词条中给予定义,以便于译成其他语种在定义、示例及注释中,不引起误解的情况下,可以省略掉其中一部分,可省略的部分为黑体字,并用圆括号括起。在定义、示例和注释中,只用完整的术语有些术语后圆括号内的非黑体字,不是术语的组成部分,而是用来说明该术语的使用须知和特殊应用形式或语法形式的3. 别词可;相同)时,可将它们合并在个同条中个别不相同的词放在方括号中,表示可以替换方括号前面的词。例和注释中用黑体字印示该术语已在术词汇的其它词条中给过定义,并用星号“*”将这两个术语隔开3. 引包括本部分的全部术语。根据汉语索引或英文索引,可查出术语正文的索引号4术语和定义4. 、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工。、义等信息进行处理,有时又称中文信息处理。汉字的输入、输出、识别等。或相关信息通过各种方式,把汉字输入到计算机中去的过程。字机等设备输出的过程。4. l. 1. 6多文种信息处理字字符集编码体系基础上,写)使计算机具备能够处理民族语言的开发能力。例:中文化,汉字化。1治言定和规则。注:同5271. 规则是根据当前流行的用法而不是用明确的形式规定的。注:同271. 规则在使用前已明确地规定了。注:同5271. 7的07. 02. 法、语义及语用等方面受到人为限制的自然语言的真子集。为生成模型、国家、然语言的语法具有一定的民族特点和相当的稳定性。. 14文本字信息处理的对象。15语言资料库种分类、检索、综合、比较的基础。是计算机从语音、文字、词汇、句法、语义、语用等角度对语应用计算机技术来研究和处理语言文字,内容包括:字频和同频统计、语音的识别与合成,机器词典的编纂、机器翻译、自然语言理解、计算机的自然语言接口等。 90汉族的语言。中国境内主要的通用语言,也是国际通用语言之一。属汉藏语系括它的主要地域分支:北方话、吴语、湘语、赣语、粤语、客家话、闽语等它的规范化语言是普通话。是规范化的现代汉语,以北京语音为标准音,以北方话为基础方言,案)of 通话语音的方案方案采用26个拉丁字母,有声母表和韵母表及拼写规则,对声调符号和隔音符号的标记也有规定。字也被其他一些国家或民族用作为书写符号。l) 23120(2)现代汉语通用字表、义三方面的特征及附加的有关特征。例:笔画、笔顺、部首、部件、汉语拼音方案、四角号码等。语拼音方案、笔画数、笔顺、使用频度、组词能力、文字结构、标准部件、换声旁、草书楷化、偏旁简化类推等方法制定的一批笔画较少的汉字。这些字取代了对应的笔画较多的汉字作为通行的正体。特指1986年重新公布的简化字总表,共2 235字。例:后巨俊仁511 _3z ,:荐专,封对,械机。同,只是字形笔画或结构不同的字例:升升、隆,迹跻,蹋,泪113有确定的语义和(或)照特定的规范,对汉语按分词单位进行划分的过程。语词语编码指定的汉宇汉语词语集内的元素编制相应的代码。:2312,盘)输入方法盘设备及计算机资源,汉宇编码(键盘)输人方法的素质和特性进行定虽的测试和定性的评价等。息)交换码存储、处理、传输汉字用。注:它与汉字信息交换码有一定的对应关系,式处理、常用点阵、矢量函数等方式表示。现对汉字的自动输入。可分为联机手写体汉字识别、印刷体汉字识别和手写体汉字识别。取语音特征,实现对汉语语音的自动识别。可分为特定人和非特定人两种。取汉语语音的特征,成出所需汉字、单词、缩技术,根据汉语语音特征模型(声母、韵母、声调、音节、语调、语气)建立的汉语语音数据、参数、特征数据库。析、存储、合成、传输等技术,实现对汉语语音的识别、录放、合成和通信功能。语语音的编码技术和汉语语音数字信号处理技术,实现汉语语音输入、输出、理解、翻译、断和推理。T(缩写)用计算机将种自然语言(源语言)转换成另一种自然语言(目标语言)的过程4. 1. 6. 3机器词典过对词法、句法、语义等信息的规范化和形式化描述,译成的语言。用给定的分析方法,确定每个成分的词法、句法和语义等信息,并将其转换成便于计算机进一步处理的中间表示。于汉语文稿的输人、编辑、存储、印刷及传送。字信息的具有键击输入、显示、校改、文本编辑、印文输出的印字设备。通常分为击打式和非击打式两种,一般都配有中、英文字形库。出功能的计算机终端,通常分为简易型、通用型和智能型。可分为整字型、部件(字根). 集合可按词语关系的结构作有序的排列,可以按收词多少、词语性质、功能、:汉字造字、排序、字所表述的信息的系统。它们可分为两类:一类是在原有单文种系统基础上扩充而成的,在这类系统中新纳入的文种应用的范围往往受到限制;一类是以能容纳多种文字字符的大字符集为基础设计的系统,可不受_卜述限制。特点是通用性强,汉字输人输出手段多,操作方便。4. 写)利用以计算机为主的电子技术代替传统的人工编辑、铅字排版的自动化印刷出版系统。储、检索、加工、助编辑教材,选择适于学员个人的学习程序和课程内容,达到教学汉语目的的一种信息处理系统考件)4. 1. 4. 一4. 1 多文种信息处理4. 1. 。汉字编码字符集,汉字点阵字形二”“”.汉字公用程序一汉字(信息)交换码.汉字内部码”二”汉字识别汉字输出汉字输入”“汉字输入键盘”“”汉字属性.一”:.:分词单位4. 汉卡汉语4汉语词语编码汉语词语库4. 1. 7. 6474. 汉字信息处理一汉字印字机汉字终端汉字字形库汉字字形码4. I . 4. 语分析汉语计算机辅助教学系统汉语理解汉语拼音(方案)1. 6. 74. 1. 1. 5. 34. 1. 5. 44. 1. 5. I . 5. 7机器词典,4. I . 6. 3机器翻译,.魂.!计算语言学.一4. I. 2. 17简化字,4. 1. ,.765二:23汉字编码方案汉字编码(键盘)输入方法朱东10J.,信息处理言知识库g. 1言资料库:.:字4. 1. 2. , 4。1二 ,二4。. 考件)。4. l. 3. ,4一二“.”.“”,。,4.。.“一。.。口。.。.764. 4东东4. t. 4. 4堆.】24.。I.,.,.,二,二,.。.74. 1. 1. 3I. l.4. 1. 7. l. 4. 又乐一;.:屯屯.1. 6. 1. 4. 1. 7. 151. 9. .,.,.。.“。l. 7. l . 2. 1. 2. 41. 3. I .
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年滨州市中级人民法院招聘司法工作人员考试笔试试卷【附解析】
- 2025就业援疆浙江省事业单位招聘阿克苏籍少数民族高校毕业生(7人)考试参考题库附答案解析
- 押题宝典教师招聘之《小学教师招聘》通关考试题库及答案详解【夺冠系列】
- 教师招聘之《幼儿教师招聘》强化训练高能附参考答案详解【轻巧夺冠】
- 2025年教师招聘之《幼儿教师招聘》题库附参考答案详解(培优b卷)
- 教师招聘之《小学教师招聘》综合检测模拟卷(模拟题)附答案详解
- 教师招聘之《小学教师招聘》考前冲刺模拟题库提供答案解析及答案详解【新】
- 2025年教师招聘之《小学教师招聘》考前冲刺模拟题库附答案详解【能力提升】
- 2025年教师招聘之《小学教师招聘》试卷及参考答案详解【巩固】
- 2025年教师招聘之《幼儿教师招聘》测试卷及完整答案详解1套
- 2025留置辅警笔试题库及答案
- 胸椎后纵韧带骨化症
- 2025年秋季小学三年级上册语文教学计划
- 2025未签合同劳动争议仲裁申请书
- 耳前瘘管继发感染诊疗要点
- 2025年北京中考真题英语试题及答案
- 2025年浙江省中考社会试题卷(含答案)
- 捐资奖学金活动方案
- 2025至2030中国螺纹插装阀行业项目调研及市场前景预测评估报告
- 机关档案管理工作培训
- 孤独症相关培训课件
评论
0/150
提交评论