

下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 国家标准建立术语研究用语料库的一般原则与方法(征求意见稿)编制说明 一、任务来源随着科学技术的发展,新术语、新概念层出不穷,为了更好的管理、规范日益增多的新术语,需要借助更先进的工具及方法。目前国内外已经建立了大量的术语数据库,为了更好的对大量术语资源进行研究就需要建立术语语料库,大规模真实语料库是术语研究的可靠基础和最主要的来源,建设与术语库相配合的、统一规范的精加工术语语料库,可以使我们对中文术语构成、术语专业分布、术语地域分布、术语来源以及术语发展等各种复杂现象获得更为直观、深刻的全面认识,进而为推动中文术语规范化和标准化的进程、促进语言信息处理技术的总体发展起到关键的作用。因此制定建
2、立术语语料库的标准已经十分必要。GB/T XXXX-XXXX建立术语研究用语料库的一般原则与方法项目由中国标准研究中心提出,于2002年列入国家质量监督检验检疫总局制、修订国家标准项目计划,项目编号:20020411-T-424。该标准由中国标准研究中心归口,计划于2002年底完成。二、工作情况:1、 标准起草小组的同志积极参与对建立术语研究用语料库的一般原则与方法国家标准的制定工作,在工作中深入的研究了术语语料库的功能,吸取国内外先进经验,制定出一套实用的术语语料库建立标准。2、 进行了广泛的调研工作,搜集了使用者的一些建议,同时争求了一部分专家的意见,作为本项目的重要参考。3、 在制定标准
3、过程中,标准起草工作组根据实际情况制定工作计划,保证工作顺利进行。4、 标准起草工作组多次召开会议,反复研究了建立术语研究用语料库的一般原则与方法讨论稿,广泛征求了该专业领域的专家及用户的意见,对讨论稿进行了多次修改,最终形成征求意见稿。5、 标准起草小组的同志积极学习了GB/T 1.1-2000标准化工作导则 第1 部分:标准的结构和编写规则,按要求对本标准的结构进行了编排。三、标准的目的和主要内容 本标准主要目的是规范统一建立术语语料库的方法,对术语语料库的设计原则、方法、过程、生成和使用、管理与维护等作了较为详细的规定。对术语语料库的规范化处理和数据检索与交换、信息资源共享等都具有指导性意义。四、标准的编制原则1、 为了更好的统一规范术语语料库的建立方法,标准起草工作组根据当前国际上对语料库研究的新思路以及语料库技术的发展情况起草了本标准。 2、 虽然语料库在国内外已经有了广泛的应用,但是国际上并没有相应的建立术语语料库的先进标准可遵循,本标准起草小组从不同的渠道收集有关资料,在认真分析研究的基础上,根据我国现有技术条件结合我国语料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论