


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
谈基于机器智能(知识)的机器翻译摘要目前机器翻译路线有基于规则的传统技术,基于统计的目前技术。我的思路是基于机器智能的。我们人类翻译一篇外文时,是否需要相关方面的知识呢?答案是 “肯定的,需要的”。那么,同理,机器翻译时,是否需要呢?我想,也是需要的。什么是机器知识,或者叫人工智能?就是计算机拥有人类的知识,比如知道星球类可以升起,而河水可以上涨,而且知道太阳是星球,可以说太阳升起,而不是太阳上涨,其实,升起和上涨差不多意思。机器拥有了知识,就可以自动推理,解决翻译中的歧义问题。那么,构建基于机器知识的机器翻译系统,需要哪些过程呢?首先,机器需要存储自己的知识,能够理解某个领域内的知识,包括理解语法,拥有常规知识(如衣食住行等)和某些行业知识。其次,能够人机交互,交流知识,这样,机器的知识才能越来越丰富,机器从人类学到越来越多的知识。再次,翻译的过程就是理解一种语言,将其转化为内部知识,再以另一种语言表达出来。文本试图从这几方面提供解决若干思考。l # 知识存储1) 借助人工语言如java语言。目前主流的计算机编程语言已经能够实现某些智能,但需要人工编制程序。编程语言总结下来,实现的执行顺序有:顺序、分支判断、循环、并行。实现的对象特性有:继承、多态、抽象。2) 如何表达智慧?a)有类和对象的概念,根据类生成对象。类之间关系:可以继承,可以将类抽象出概念(相当java里的抽象类或接口)。可以包含。如人类可以含有手脚头类维或叫向量、属性、成员,维是不相交的,如时间和长度这2个维。维的度量或测量。如时间的测量可以有年、月、日、时分秒(定量)或一会,很快(定性)。测量含测量的数量、测量单位。维也是对象,所以通过 包含几个维,可以生成新的维。如用电量的 千瓦时就是由千瓦和时组成的维。导出维:dest = f(src1,src2.)。由若干个维计算出来的一个维,可以为对象引用关系或值引用关系(相当c的指针和值传递)。引用关系时,当src1发生变化,dest也要跟着变化;值引用关系时,dest是脱离原来维的,不发生变化。当变量为一个时,导出维还是变量那个维;变量多于一个时,导出维为一个新的维。如 高=(身高测量值170cm),也是属于原来的身高维。千瓦时=(千瓦*时)属于一个不同于千瓦和小时的新的维。b)句型分为形式句型和逻辑句型,如主+谓+直接宾+间接宾语这种形式句型,其中隐含了 直接宾语和间接宾语 构成的逻辑主谓关系;这种逻辑句型就是一种知识结构(映射到java语言上的类)。所以,知识的存储就是存储一种逻辑句型的结构。注意,一句话可能含有多个知识,如“我打球等车时候,看见556路车来了”这句话,知识点有“我去打球了”,“我看见556车的时间是.(打球等车那时间点)”c)知识的检索。如sun rises的知识检索过程:识别出主谓结构,sun的中文解释有“太阳”,rise的中文解释有“升”,那么就命中“太阳升起”这个知识(假设这个知识已经被机器存储)。知识结构的各部分都可能要建立索引,如对主语建立索引,就是建立这样的索引。另外,可能会涉及到别名,别名不同于实例,如太阳是天体的实例,而日头是太阳的别名。d)知识的表达。如用英语表达 run rises,用中文 太阳升起,用河北方言 日头出来机器翻译需要有关知识:语法知识。语义单元:如主+谓+直接宾+间接宾语。 He bought me a pen. he bougth a pen, pen of me He asked us to do the work. he asked us,us to do the work常识知识 (人)吃饭、(人)穿衣、(人)睡觉、日出日落等。l # 向人类学习(人机知识交流)这里的学习,不是目前流行的机器学习技术。机器学习一般是基于统计的语料库,发现关联的东西。这里的学习,指机器向人类学习知识,将人类已经知道的知识消化,据为己有,比如填鸭式教学这样的知识教授机制。a)人类辅助翻译就是人类辅助机器翻译,帮助机器消除歧义。过程:i. 人类源语言(如英语)形式(语法)识别ii. 将理解的结构表达出来,用人类目标语言(如汉语),这时候可以不通顺的,歧义的,如对 run rises的表达为 “太阳,日 升,上涨,拉iii. 人类歧义消除iv. 机器记住知识(分别用人类源语言和目标语言)b)机人学习,就是人预先传授知识给机器。如告诉机器 太阳升起,戴帽子,穿衣服(尽管英语中都是wear)。这样,机器翻译 sun rises时候,就会自动消除歧义,找到太阳升起”这个知识。l # 进行翻译l # 机器智能的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美发装修合同协议书
- 解析纺织品评估中的数据处理试题及答案
- 协议书与合同书的区别
- 饭馆工作人员合同协议书
- 共同合同协议书
- 甲方强行解除合同协议书
- 劳动合同和培训协议书
- 租房房屋合同协议书
- 转租公寓合同协议书
- 分房合同协议书
- 考察提拔干部近三年个人工作总结材料
- 广东省专业技术人员申报专业技术资格评前公示情况表
- “新课程”“新高考”背景下的高中学科教学变革
- 电动吊篮安全施工计算书
- 2025年日历台历中文版纵向排版带节假日调休周日开始
- 2023-2024学年广东省深圳市南山区监测六年级下学期小升初真题数学试卷含解析
- DZ∕T 0054-2014 定向钻探技术规程(正式版)
- 教育质量评价模型与算法研究
- 广东省深圳市南山区2024年八年级下学期语文期末语文试卷附答案
- 辽宁省沈阳市第一二六中学2023-2024学年七年级下学期期中数学试题
- 国家开放大学-法学专业-2023年秋季《法律文化》形成性考核作业答案
评论
0/150
提交评论