200619100339张欣怡外文翻译.doc_第1页
200619100339张欣怡外文翻译.doc_第2页
200619100339张欣怡外文翻译.doc_第3页
200619100339张欣怡外文翻译.doc_第4页
200619100339张欣怡外文翻译.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Lexicographers Dreams in the Eectronic-Dctionary Age作者:Gilles-Maurice de Schryver来自:International Journal of Lexicography 2003 Vol.16, No.2: 143199翻译内容:Chapter 3 & 43电子词典理论“毋庸置疑很多原始的理论是想象得到的,如电子词典理论是基于词典的功能或获取信息组织地址的类型”。众所周知任何参考著作的理论很大程度上是不固定的,对于电子词典也不例外。在20世纪90年代,一些电子词典理论的简要概述已经被提出,它们将按时间顺序被介绍,每一个介绍之后都会有我们的建议。在20世纪90年代开始,Martin (1992: 1934)在辞书学领域观察一下他称之的“对象”:(1)人类用户的词典,(2)基于计算机的词典,(3)机器可读词典,(4)词典库/术语库,(5)机器字典,(6)词典数据库,(7)人工智能词库。正如人们可以看到的,没有试图区分计算机和非计算机的“对象”。一点也不要感到惊讶电子词典最先在远东地区流行,最早的专业的电子词典理论也是在这各地区发展起来。Ide的理论立足于硬件和软件的不同,而且仅专注于电子双语词典(EBDs)。Ide分为:(1)特定的电子双语词典(EBDs),(2)电子笔记本,(3)光盘的电子双语词典(EBDs),(4)电子词典(ED)软件。这个理论仅仅基于硬件和软件似乎不是非常有效,因为它需要连续的调整来迎合永无止尽的创新。事实上两年以后,Sharpe (1995: 41)已经在Ide关于电子双语词典(EBDs)的四种分类种增加了两种其他的电子双语词典(EBDs)类型:(5)基于便携式软盘的电子双语词典(EBDs),(6)在手提式光学字符识别(OCR)扫描仪。一年以后,来自Lehr的一个更有说服力的两步技术(元)辞书学的电子词典(ED)理论如图1。在第一部中,电子词典根据技术背景主要分为在线和单机词典,单机词典又分为掌上电子词典(PEDs)和电脑词典,电脑词典再分为光盘、软盘和其他词典。在第二步中,每一个电子词典(ED)按(元)辞书学的内容分类。不是基于纸质词典的电子词典(ED)就是新发展,它们分别又可进一步分类则有输出格式(如在屏幕上显示的电子词典看起来像纸质词典的版面)或新外观(如电子词典不模仿纸质字典的排版)。电子词典脱机词典在线词典掌上电子词典(PED)电脑词典光盘软盘其他基于纸质字典新发展输出格式新外观技术评价元辞书学评价图表 1:两步技术 (元)辞书学电子词典理论在最近的理论中都是支持Nesi的理论。根据她的理论,20世纪90年代见证一种为了语言学习的电子词典的产生和发展。关于这四种类型的数据在表1中列出。虽然在表1 中的区别在十年前可能是合情合理的,但是Nesi也公正地指出它们现在看来是模糊的,如高度创新词典正在往互联网发展(一些词典只能被它们的订阅者访问),在线课件越来越商业化还可以刻录到光盘上,光盘词典被放置在互联网上,掌上电子词典(PED)开始受到更严格的词典编撰的考虑。表格 1:电子时代的词典理论#类型资源谁收益1因特网词典(过时)免费版权资料和用户共享网民2在线课件的词汇表新资料在大学里的语言系工作人员3光盘学习词典较好的硬拷贝参考书主要的词典出版社4掌上电子词典没有命名(硬拷贝)资源电子产品制造商通过这个简要概述,很明显没有一个现有的电子词典理论是完全令人满意并且涵盖现今的所有类型的电子词典。因此我们建议理论基于一个主要的、严格的标准:一个词典访问的方式。特别是在设计这个理论时,我们考虑到一个问题:“谁访问什么、访问哪里?”因而发生的三步理论是被认为足够灵活去迎合未来新发明。在三步访问理论中,第一步解答了问题“谁访问词典?”这里有两种可能:它是机器或者人类。机器可以访问自然语言处理词库,人类可以访问人类可读词典,虽然机器和人类都可以访问那些设计自然语言处理和人类使用的词库。对于第二步,我们需要回答“访问什么?”举例来说就是我们查找词典媒体。其中物理对象(如非电子)媒体和电子媒体是不同的。这些媒体具体分为手持设备和耐用机器。现在讨论中心是电子词典媒体。通过在第二章的概述,以人为本的电子词典容易地使用人类可读数据库-允许增加自然语言处理软件(如形态学的分析仪),自然语言处理词库有自己的规则(如拼写检查)或设计自然语言处理和人类使用的数据库(如WordNet 和 FrameNet)。物理对象媒体包括人类可读词典和设计自然语言处理和人类使用词库的印刷渲染。最后,第二种印刷渲染的电子数据和自然语言处理词库适合于大规模工作的自然语言处理系统(不是本文的主题)。在图2中的最高两层显示到目前为止理论的第一、二步。如果第一、二步相当的简单,他们就需要设置第三步的场景。回答问题“访问哪里(的词典数据)?”,它也被视为对存储类型(或在电脑硬件方面)的调查。为了对比原因,我们从物理对象媒体的存储类型开始。这个分类维持最小量,我们只历时地考虑一些存储类型。就手持设备而言,我们列举泥板、木蜡板、纸莎草纸、羊皮纸以及打印界面。在这片文章中,打印界面被称为所谓的传统“纸质字典”。为了保存特别是早期存储类型的数据,数据将被拍照然后通过微缩胶片存储。坚固的机器要求读取多个来自原稿的微图像。回到电子词典,手持设备和耐用机器都可以进一步细分顺着单机和网络这条线分类。手持单机词典实例有掌上电子词典、录音笔、在移动电话里支持文本信息的词库。现在手持网络词典几乎没有太多的实例,当前已经有一些移动电子组织者在技术发达的国家推广和提供访问一些在线词典。如今最流行的耐用电子机器是台式和便携式电脑。在单机版本中,词典存储在不同类型的磁盘上(光盘、DVD、硬盘等),而在网络版本中硬盘是主要的存储设备。在网络版本中需要区分只能进入本地局域网络和内网,以这种方式存储的词典和可以进入万维网,因而存储在服务器上利用互联网的词典。伴随着当今的创新技术步伐,通过手持设备和无线电设备广泛和普遍地访问国际互联网成为可能。当那一天来临,通过这种方式进入的词典作为混合体能够结合大部分掌上电子词典和因特网词典的优点。如今很多内网电脑也能连接国际互联网,以及越来越多的家庭电脑用户可以登录国际互联网。在这种环境中,内网或光盘词典的优点可以和网络词典的优点结合。为了尽可能接近现在的平均水平,在市场没有准备好的情况下,我们将不混合各种类型。我们因此在表2中集中力矩了电子词典类型。表2中最后一排回答了问题“谁访问什么,访问哪里?”图表 2:三步访问字典技术字典(Ds)自然语言处理词库人类可读字典自然语言处理和人类可读的词库物理对象词典以人为本电子词典纯自然语言处理系统手持设备字典耐用机器字典手持设备字典耐用机器字典泥板纸微缩胶片脱机字典在线词典脱机字典在线词典掌上电子词典、录音笔移动磁盘光盘硬盘内网词典因特网词典本地磁盘万维网磁盘谁访问访问什么访问哪里表格 2:当今纸质词典和电子词典的情况电子词典(ED)脱机电子词典网络电子词典传统纸质词典手持词典(如:掌上电子词典)耐用机器词典(如:光盘)内网词典因特网词典用户使用手持书籍去查找印刷在纸上字母D的信息用户使用掌上电脑去访问储存在小型磁盘上字母D的信息用户使用便携式或台式电脑去访问储存在大型磁盘上字母D的信息一组用户使用便携式或台式电脑去访问储存在本地主机上字母D的信息世界范围的用户使用便携式或台式电脑去访问储存在在线服务器上字母D的信息4. 纸质字典和电子词典的优缺点Sharpe说:“我的观点是电子词典的优势和如今年轻人对电子设备的熟悉将使印刷字典这一概念降到次要的地位。”在关于电子词典的学术文献中,电子词典最常见的设置最可能是advantage,这种advantage认为是相对于纸质字典。我们显然完全支持这个观点,也想给这两种类型公平的待遇。因此在这一章中我们将讨论:(1)致力于这两种类型的优点用“”标记,而缺点用“-”;(2)评分优点使用星号“*/*/*”(越多的星号代表从文献中收集到越多肯定的反馈);(3)尝试思考“类似方面”,同时脱离以后部分的设想。在表2中列出了5中词典类型,我将安排讨论这个优点按纸质、掌上电子词典、光盘、INTRA to INTER这个顺序逐步介绍。在表中将伴随这种讨论,以及一个关于文献的选择。4.1不可替代的纸质词典在表3中列出了传统纸质字典的一些方面直至今天仍然是不能被超越。尽管Sharpe的观点是最终使印刷字典这一概念降到次要的地位,纸质字典到目前为止仍然是最常见的产品(#1)。它们具有象征价值在语言的重点以一种可触及的方式,而一本书或者一系列书可以在图书馆借到(#2)。查阅电子词典也依然情切友好:他们容易借阅,可以真正轻松的阅读,在自然的方式下显示视角,提供方便的物理操作,不用迫使眼睛盯着电脑显示器(#3-4)。纸质字典也允许用户在字典中手动注释或者划出特殊信息(#5)。最终纸质词典是最耐用,相对独立存在(尽管电子词典数据的传输和界面已经不用了),不需要打开电脑(#6-8)。后者听起来可能有些琐碎,但在世界很多地方这仍旧是关键因素。表格 3:纸质词典优势#优点纸质掌上电子词典光盘内网词典因特网词典1常见的、可靠的-2作为实物具有象征价值,可以拥有-3容易借阅,可以轻松的阅读,容易浏览全文-4容易阅读,对眼睛伤害小-5容易注释,可以直接用笔写在上面-6持久耐用,可以携带到任何地方不用担心严重破坏或者功能丢失-7独立存在(不被插入任何东西;也没有东西插入)-8不要求电脑保持开机-4.2手持设备在第二部分,我们将看纸质词典的几个方面仍然有得到较高评价相比于掌上电子词典。掌上词典是手持词典的代表。表4总结了它们的优点。纸质字典和掌上电子词典都便于携带和购买后可以在任何地方直接使用(#9-11)。不过掌上电子词典并不是与网站无关的纸质字典,多卷或者大规模的词典显然不如掌上电子词典便于携带。(该区别用不同星号评定等级来说明。)另一个纸质字典和掌上电子词典的优点是事实上它们可以脱机访问,类似于共享在磁盘上的脱机词典(#12)。最终纸质词典相对于电子产品时效率低的,尽管掌上电子词典通常认为只是小工具或是地位象征(#13)。观察得出被认为是地位象征的小工具增加使用过程中的动力所以该产品面向富有的购买者,实际上掌上电子词典是经常使用。根据Landau的观点,掌上电子词典已经影响双语词典市场。表格 4:手持设备词典优势#优点纸质掌上电子词典光盘内网词典因特网词典9在获得后可以随时使用(如:没有再次购买和不需要台式/便携式电脑)-10可以在任何地方使用,不依赖网站*-11轻便、尺寸小、重量轻*-12离线访问(如:词典需要和内网或因特网链接)-13低性能的产品(如:不能看见小器具或状态符号)*-*4.3.本地磁盘设备在20世纪80年代末,在一段时间小工具掌上电子词典已经流通,第一代词典中有光盘。随着光盘出现,打破了早期电子产品的硬件空间限制,一方面这个趋势延续到现在的DVD技术,另一方面越来越大的硬盘容量使数据容易从光盘传输到电脑银盘。当今,这一类磁盘在不同词典中最突出的优势在表5中列出。相比于纸质词典,存储在光盘上的词典占用很小的物理空间(#15)。如师,中国人经常在著作中提及用于表示对某人非常尊敬就把他们认为是老师。如今由于电子媒体,他们最终可以说话。各种各样有用的应用软件(确实加入文件部分)已经被运用如发音、一个声音范围文件和录音比较设备(#14,#16)。基于本地磁盘的词典最令人惊讶的特点是可以迅速的查找到(在多媒体库里的)数据(#17)。新的技术也是一种新的方法去显示数据,如计算机图形学(#18)。一些技术是出众的,如Corris et al.所提出的技术“彩色的网络增加相关文字的描述”然而其他则是完全误导,如“显示发音波形图”(在有说服力的评论中,Sobkowiak说明就算是原始的录音反馈的结果也不是相同的图形)。一些情况下在电子词典中有可能有不同的查询路线(模糊查找、超链接等),电子词典使这种媒体真实存在(#19)。然而其他人对“灵活性”(用户定制、互动、用户界面友好等),“灵活性”被认为是电子词典的最有吸引力的方面(#20-21)。最终,电子词典增加了复制粘贴工具(#22)。对每一个讨论的电子词典优点,网络应用迟于本地磁盘。表格 5:本地磁盘词典优势#优点纸质掌上电子词典光盘内网词典因特网词典14发声发音可用性和声音文件-*15词典花费很少空间和有一个非常低比重-*N.A.N.A.16记录自己的设施(如比较储存的发音和自己的发音)-*17快速访问词典数据-*18提供信息的两种方式(如:计算机图形学)-*19模糊搜索设备,多存取,查询路径的范围,超参考-*20(大规模)用户定制;互相作用-*21非常友好的用户界面-*22复制-粘贴设备-*4.4. 电子设备到目前为止在表中电子词典优点明显。如果认为电子词典是一个整体,记录一些关于纸质词典共享优点。这些内容将在表6中列出。许多创始者,特别是在掌上电子词典领域的一些著作,强调新奇的事物导致日益增加的积极性,实际上增加了查阅电子词典(#23)。值得注意的是这个优点正是表3中列出的#1优点相反。进入电子化也意味着减少办公室纸张(#24)。但是真正电子词典变革的核心在于用户不再局限于字母顺序的排列,超文本、菜单等消除了(人为的)连接文本的限制,数据显示在屏幕上不是静止的,强大的搜索能力总体保证了稳定的浏览。表格 6:电子词典优势#优点纸质掌上电子词典光盘内网词典因特网词典23新颖的吸引力-24在办公室减少纸张,生态无害-25用户从字母顺序中解放-26消除线性文本的限制;不是每一件事情都要记录/可见和连续-27交叉引用的最优化(如:避免必须查找两个条目,如果第一个必须是交叉引用)-4.5在线设备从网络词典考虑,显然在许多方面都毫无疑问有优势。这些优势将在表7中列出。从纸质词典到电子词典提供在公共领域联机像因特网,其中值得注意的是日益增加的存储能力(#28)。一些词典编撰者已经开始认为因特网可是为一个整体类似于巨大的知识商店或巨大的百科全书。从声音辞书学观点来看,以上观点是很难接受,虽然因特网当然是电子数据最便利的地方(容易进入,如网页抓取),也容易连接成上百个专用的组织(#29)。但是问题依然存在,是否普通用户能处理原始数据然后转换成辞书学的声音信息。后来出现一个类似的问题是“一站式咨询”,它是同时共享几百本电子词典因特网站。所有搜索数据显示成一个长列表,产生最值得信赖的资料来源和完全外行的混合物(#34)。虽然是技术层面,但对高级用户使用更方便。另外逐渐减小对存储空间的约束增加了新的信息类型如视频序列或者动画(#30-31)。另一个在线词典积极的因素(于脱机、磁盘词典相比,不是掌上电子词典)是它们大范围与其他软件链接(#32)。这种可能性是在计算机辅助语言学习开发最成功。Lingware 如果要说在线词典最突出的优点,那一定是词典永远不会过时,就像是一个最大的动态知识储存室(#33)。20年前,研究者Arnold 和Kay预言词典将不再是产品,而是开始提供一个面向用户的在线服务器。Dodd认为,在线词典有优势,但印刷字典价格是固定的不管使用次数,而在线词典可能每查阅一次就要收费(#35)。最终,因特网词典只能向大部分用户提供免费的信息,而一些优秀的词典事实上是不能再因特网上找到(#36)。Landau正确地指出“在大多数情况下,可接近性会限制查阅特定单词。这种访问方式是一个销售工具而不是一个信息服务器,故意让用户去买书、CD或以电子方式获得在因特网的权限。”表格 7:在线词典优势#优点纸质掌上电子词典光盘内网词典因特网词典28没有空间限制其他以及避免限制用户,大量数据质量-*29快速在语料库访问大量词库的证据-*30新信息类型-*31视频序列,动画-*32链接(其他)软件(如:嵌入在教学/学习游戏等)-33更新;动态知识库-34一站式查阅(如:数百个母语和双语词典的同步搜索)-35查阅花费取决于实际使用情况-36如果在不是免费情况下,也非常便宜-4.6.词典编撰者、研究者和出版商的收益到目前为止,我们已经从用户角度讨论了不同词典类型优点和缺点。在当今的元辞书学领域,这个方法是最大化实现用户的期望。因此总结本节,我们将简洁列出一些词典编撰者、研究者和出版商的收益。在表8中列出。如今因特网词典如雨后春笋般迅速发展。的确出现了成千上百种词典,遗憾的是大部分草率编撰的结果或者所谓“自下而上写作编辑”的过程输出。后者

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论