人工智能的翻译发展.doc_第1页
人工智能的翻译发展.doc_第2页
人工智能的翻译发展.doc_第3页
人工智能的翻译发展.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能的翻译发展摘要:毫无疑问,人工智能是有着广阔应用前景与巨大商业价值的,因为完善的智能工具可以实现一个真人几乎所有的能力。这是多么诱人啊!然而,事情并没有我们想象的那么简单,事实上,这涉及到了哲学上的人的定义的问题,也就是从根本上讲,我们能不能用冰冷的无机质创造出一个有意识有智慧的类人机器的问题。为此,计算机之父图灵给出了自己关于机器思维的判断方法:“不要问机器是否思维,而应当问机器能否通过智能行为的测验。”他提出了著名的“图灵实验”:在彼此看不见的条件下,询问者分别与一个人和一台计算机进行问答试探,如果在一定的时间内,询问者分辨不出对方是人还是机器,则说明奇迹具有了智能。关键词:人工智能;前景;智能中图分类号:TP183 文献标识码:ADevelopment and Future of Artificial IntelligenceABSTRACT:There is no doubt that artificial intelligence is a broad prospect and huge commercial value, because the sound of a real smart tool to achieve almost all of the capabilities. What an attractive ah! However, things do not we think of as simple, in fact, this involves the person to the philosophical definition of problem, is fundamentally speaking, we can not with ice-cold of inorganic creating an intelligent humanoid Yi Shi machine problems. To this end, the father of the computer Turing machine is given its own thinking on the way to judge: "Do not ask whether the thinking machine, but should ask whether the machine intelligent behavior through the test." He made the famous "Turing test": invisible to each other under the conditions that the interrogators were with a question and answer session and a computer test, if a certain period of time that the interrogators can not tell the other side is human or machine, is illustrated with a smart miracle.KEYWORDS:Artificial Intelligence; Prospect; Intelligent一. 人工智能概述。 第一次工业革命是人手由于机器竞争而贬值。 现在的工业革命则在于人脑的贬值。至少人脑所起的简单的较具体、较具有常规性质的判断作用将要贬值。 维纳 人类,是大自然进化的最高产物;智能,是人类发展的至上精髓。在这个星球上。人类的许多能力(如体质和体力),都可以被其他许多生命系统(包括人造系统)所超越;唯独人的智能,是其他一切生命系统(包括人造系统)所难以望其项背的“奇妙禁区”。 钟义信 人类之所以区别于万物,便在于人类的智慧。笛卡尔说过:“我思故我在”,可见智能是人类的根本特征。人类追求先进的文化与文明,追求更好的生存与生活的环境,这正是人类进步的源源不绝的动力。在改造自然的过程中,人类发明了各种各样的工具,从最早的石刀石斧到现在的巨型计算机和互联网,人类的工具在随着人类文明的进步而不断发展着。在这些工具中,有可以代替人类进行体力劳动的机器,如起重机,挖土机,等等,也有一些可以代替人类进行计算的机器,譬如计算尺和计算器,另外还有一类机器,它们不仅可以代替人类做计算,还可以进行逻辑推理和定理证明,面向知识,以获得智能为最终目标。这就是智能工具。 这类工具和前两类有明显地差别,却又与第二类工具有千丝万缕的联系。它试图凭借超高速的计算能力和巨大的容量模拟人脑,接近上文提及的“奇妙禁区”。毫无疑问,人工智能是有着广阔应用前景与巨大商业价值的,因为完善的智能工具可以实现一个真人几乎所有的能力。这是多么诱人啊!然而,事情并没有我们想象的那么简单,事实上,这涉及到了哲学上的人的定义的问题,也就是从根本上讲,我们能不能用冰冷的无机质创造出一个有意识有智慧的类人机器的问题。为此,计算机之父图灵给出了自己关于机器思维的判断方法:“不要问机器是否思维,而应当问机器能否通过智能行为的测验。”他提出了著名的“图灵实验”:在彼此看不见的条件下,询问者分别与一个人和一台计算机进行问答试探,如果在一定的时间内,询问者分辨不出对方是人还是机器,则说明奇迹具有了智能。那么,如何能使计算机获得和人类似的知识与智能呢?50余年来,人们通过寻找不同的切入点进行人工智能的研究,从符号语言层次切入,形成了逻辑学派,认为认知基元是符号,智能行为通过符号操作来实现,着重问题求解中启发式搜索和推理过程;从人脑神经构造层次其融入,建立了人工神经网络形成了仿生学派,认为人的思维基元是神经元,把智能理解为相互连接的神经元竞争与协作的结果,着重结构模拟,研究神经元特征,神经元网络拓扑、学习规则、网络的非线性动力性质和自适应的协同行为;从感知一行为切入,形成了控制论学派,认为没有反馈就没有智能,强调智能系统与环境的交互,从运行的环境中获取信息(感知)。通过自己的动作对环境施加影响。(李德毅) 通过坚持不懈的努力,五十余年来人类在人工智能方面取得了巨大进步,在很多方面出现了希望的曙光。在李德毅先生的论文人工智能值得注意的三个研究方向中指出:“自然语言应该成为人工智能研究的直接切入点。”并说:“人们沉迷于越来越复杂的形式化符号中,却忽略了一个基本事实:人脑的思维基本上不是纯数学的,自然语言才是人类思维活动的载体”而机器翻译则是面向自然语言的直接应用,下面,就让我们看看机器翻译的历史与现状。 二. 机器翻译的历史。 机器翻译,顾名思义就是用机器进行翻译,这里的翻译对象一般指中文英文这样的自然语言。通常,翻译可以分为两个阶段没其一是“理解语言”,其二是“生成译文”。一个成功的翻译家,不用说需要熟练掌握原文语言和译文语言,更重要的是理解内容。一次,因此机器翻译研究实质上远远超过了用计算机处理语言的范畴,而是人工智能研究的中介目标。事实上,机器翻译也可以说是50多年来自然语言处理研究中唯一实用化了的一个领域。 机器翻译一般分为三种方式:变换方式,中间语言方式和直接方式。所谓变换方式,就是先对原文进行分析,得到原文的语法结构以至语义结构。然后利用预先准备好的变换规则将原文的结构变换成目标原因呢的就够,最后生成译文。所谓中间语言方式,就是对原语言句子进行分析时将之转化为不依赖于任何语言的概念结构,然后直接尤其概念结构生成目标语言,所谓直接方式就是在分析元语言的同时就去生成目标语言,该方式以结构变换为中心。 机器翻译这一思想早于1956年人工智能的提出,也早于1945年第一台电子计算机ENIAC的问世。俄国人托罗亚斯基在1933年申请了用机器进行翻译的专利。这可以成为世界上首先提出了由机器进行翻译的可能性,其主张认为通过变换单词而进行翻译。而真正意义上的人工智能则被认为是1947年有Warren W iener给Novbert Wiener的信中提出的,他说:“当我看到英文时,我只不过是看到了一些用一定的密码规则编写出来的俄文,我所要做的就是把这些密码再翻译出来。” 在1952年在美国MIT召开了第一节机器翻译会议,此后世界掀起了一股机器翻译研究的热潮。然而机器翻译面对着重重困难。1966年美国科学院自动语言处理咨询委员会他提出了一个在人工智能研究史、自然语言处理研究史和机器翻译研究史上有着重大影响的ALPAC报告,指出:“机器翻译系统与翻译家相比,无论在翻译质量上还是在翻译成本上均处于劣势,而且机器翻译非常难于实用化。”受到该报告的影响,美国以及其它许多国家停止了对机器翻译的资助,机器翻译进入冰河时期。 但是,1970年MIT的Terry Winograd的学位论文;“Understanding Natural Language”再度唤起了人们对自然语言的研究兴趣,该论文解释了在极其狭窄的积木世界里,机器和人可以进行自然对话。此后,各国再度开始了机器翻译的研究,至今。(此段文字皆引自任继福先生的文章机器翻译的历史、现状、课题和前景)三. 理解语言,机器翻译的根本瓶颈。 之前进行的机器翻译的有益的探索中,凡是取得了结果的研究,大都努力避开理解语言这一过程。因为这一过程本身涉及到了AI的终极目标,机器的智能化。然而,这又是一个无法回避的问题,不能理解语言就不可能进行真正意义上的翻译。现在媒体宣传机器翻译已经到了投入商业使用的前夜,甚至部分广告还在宣传只需要带上某某电子词典就可以直接通过机器与外国人对话,但在播出一段时间后该广告却又悄然消失了。一方面,媒体对机器翻译抱有极大的乐观态度,另一方面,专家们又告诉我们,我们离机器翻译还很遥远,那事实究竟如何呢?机器翻译进行到了什么程度了呢? 现在的各大搜索引擎也在做一些机器翻译的软件,下面我们来测试一下Google做的翻译软件的翻译效果究竟如何。我们来试着翻译一段歌词:burningPassion is sweetLove makes weakYou said you cherished freedom soYou refuse to let it go原文译文:强烈的感情是甜蜜的而爱使我们脆弱你说你珍惜你的自由所以你拒绝丢失它机器译文:激情是甜的 爱使弱 你说你珍惜的自由,以便 你不让它去 在这简单的一个测试中我们便不难发现其中的问题: passion是一个多义词,在这里表示的不是“激情”而是强烈的感情,sweet也不是指味觉上的甜而是指甜蜜,weak是脆弱,而不是弱小。 you cherished freedom so.中so是一个副词,用来强调cherished的程度,放在句末,以便押韵,可是google却翻译成了与上下文毫不相干的以便句型公式与相关度计算语用知识的机器实现。 上文已经进行过论述过,要实现真正的机器翻译,必须依赖于机器智能的实现,而这在短期内是不可能实现的,那么如何能在可以预见的未来实现初步的机器翻译呢?机器翻译分为四个层次:“词汇,语法,语义,语用。”前三个阶段现在都已经各有发展,但是语用的机器实现却一直停滞不前,因为语用知识包罗万象,在不同的语言,不同的背景中,不同的文章中语用知识千差万别,在不同的对话中上下文背景可能截然不同,面对这样的现状,我们唯有面向翻译对象本身,才可能获得有效的信息,我认为有一种可能的途径解决语用问题: 对语句结构进行明确的分类,形成一系列“句型公式”,直到每一类中都可以只通过变换相同类型的单词就可以实现句意的转化,通过分类,将每个句子的翻译都递归变化到单词的翻译。 并同时对词语进行分类,先按照词义进行种类分类,得到每个词语的具体分类库,这个过程类似于自然界对生物的分类,界-门-纲-目-科-属-种,再根据词汇可充当的句子成分,(依赖于句型公式的需要)进行分类,对于举行结构需要的每种词汇都建立一个词汇库,(以上两种过程均可以通过对词汇附加属性实现,实际上并不需要单独产生两个库)。还需要一个统计同一词汇不同含义比率的库,这个可以通过对现有所有网页进行字符统计实现。然而对语言结构进行明确的分类并形成句型公式却并不像它看上去那么简单,我们都知道,英语的基本结构有五种,即:基本句型一:S V(主谓)基本句型二:S V P(主谓表)基本句型三:S V O(主谓宾)基本句型四:S V o O(主谓间宾直宾)基本句型五:S V O C(主谓宾宾补) 对于基本结构,每部分由不同词性的词语承担,如:宾补可由名词、形容词、副词、不定式等类型的词语承担。但是,我们也知道不定式也有差别,有的不定式可以用来做宾补,如:to count. I have too many coins to count .然而,不定式有不仅仅可以做宾补,如:动词不定式作定语动词不定式作宾语动词不定式作宾语补足语动词不定式作状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论