版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
76Computer-AidedTranslationTechnologyItisveryimportanttonotethatcorpusanalysistoolsdonotinterpretthedata-itisstilltheresponsibilityofthetranslatortoanalyzetheinformationfoundinthecorpus.需要重点注意的是,语料库分析工具不解释数据一一分析语料库中的信息仍是译者的责任。FURTHERREADINGEngwall(1994),Bowker(1996),MeyerandMackintosh(1996),Pearson(1998).Austermuhl(2001),andBowkerandPearson(2002)discussissuesrelatingtocorpusdesignandcompilation.Barnbrook(1996),Kennedy(1998),McEneryandWilson(1996),andBowkerandPearson(2002)providegoodintroductionstocorpuslinguisticstoolsandtechniques.Bowker(1998,2000),Lindquist(1999),andBowkerandPearson(2002)investigatehowcorporacanbeexploitedastranslationresources.L'Homme(1999a,chapter6)andBowkerandPearson(2002)explainhowmonolingualandbilingualconcordancersworkandexplorehowtheycanbeusefultotranslators.Pearson(1996)andZanettin(1998)explorehowcorpusanalysistoolscanbeintegratedintothetranslationclassroom.Garside,Leech,andMcEnery(1997)provideinformationonvarioustypesofcorpusannotation.扩展阅读英格沃尔(1994),鲍克(1996),梅耶和麦金托什(1996),皮尔森(1998),奥斯特穆勒(2001),和鲍克和皮尔森(2002)讨论了与语料库设计和编译相关的问题。巴恩布克(1996),肯尼迪(1998),麦克恩瑞和威尔逊(1996),鲍克和皮尔森(2002)较好地介绍了语料库语言工具和技术。鲍克(1998,2000),林奎斯特(1999),鲍克和皮尔森(2002)调查了如何将语料库作为翻译资源进行开发。洛姆(1999a,第6章)和鲍克和皮尔森(2002)解释了单语和双语词语索引的工作机制并探索译者如何将它们作为有用工具进行使用的。皮尔森(1996)和扎内廷(1998)探讨如何将语料库分析工具应用到翻译课堂中去。加赛德,利奇,麦克恩瑞(1997)为各种类型语料库注释提供了信息。Terminology-ManagementSystems_userswhotrytousestandardspreadsheet,database,orword-processingprogramstomanageterminologicaldataalmostinevitablyrunintoproblemsinvolvingcompromiseddataintegrityduetoinadequatemodelingfeatures,inadditiontodifficultiesmanipulatinglargevolumesofdataasresourcesgrowovertime.Schmitz(2001,539)word文档可自由复制编辑4术语管理系统那些尝试使用标准表格、数据库、或文字处理项目来管理术语数据的用户几乎不可避免地会遇到一些问题,除了难以操作由随着时间的流逝而不断增多的资源产生的大量数据,还包括由于建模功能不足而破坏数据完整性的问题,。施密茨(2001,539)Amajorpartofanytranslationprojectisidentifyingequivalentsforspecializedterms.Subjectfieldssuchascomputing,manufacturing,law,andmedicineallhavesignificantamountsoffield-specificterminology.Inaddition,manyclientswillhavepreferredin-houseterminology.Researchingthespecifictermsneededtocompleteanygiventranslationisatime-consumingtask,andtranslatorsdonotwanttohavetorepeatallthisworkeachtimetheybeginanewtranslation.Aterminology-managementsystem(TMS)canhelpwithvariousaspectsofthetranslator'sterminology-relatedtasks,includingthestorage,retrieval,andupdatingoftermrecords.ATMScanhelptoensuregreaterconsistencyintheuseofterminology.whichnotonlymakesdocumentationeasiertoreadandunderstand,butalsopreventsmis-communications.Effectiveterminologymanagementcanhelptocutcosts,improvelinguisticquality,andreduceturnaroundtimesfortranslation,whichisveryimportantinthisageofintensetime-to-marketpressures.任何翻译项目的主要部分都是识别专业术语的等价项。诸如计算、制造、法律和医学之类的学科领域都拥有大量的领域专业术语。止匕外,很多客户会优先选择内部术语。研究需要完成所有给定翻译的专业术语是一项非常耗时的任务,译员并不想每次开始新的翻译工作时都要重复这项工作。术语管理系统(TMS)可以帮助译员进行相关术语的各方面翻译工作,包括存储、检索和更新术语记录。术语管理系统(TMS)能够确保术语的使用更加一致,这不仅会使文档更易于阅读和理解,而且可以防止出现错误交流。有效的术语管理有助于降低成本,提高语言质量,减少翻译周转时间,在这个市场竞争激烈的时代中这些优势发挥着重要作用。TMSshavebeeninexistenceforsometime.Earlyeffortstousecomputersforterminologymanagementbeganinthe1960sandeventuallyledtothedevelopmentofseverallarge-scaletermbanks,suchasEurodicautom.Termium,andtheBanquedeterminologieduQuebec(nowknownastheGranddictionnaireterminologique),whichweremaintainedonmainframecomputersbylargeorganizations.Inthe1980s,whendesktopcomputersbecameavailable,personalTMSswereamongthefirstCATtoolscommerciallyavailabletotranslators.Althoughtheywereverywelcomeatthetime,theseearlyTMSshadsomelimitations.Theyweredesignedtorunonasinglecomputerandcouldnoteasilybeshared.Theytypicallyallowedonlysimplemanagementofbilingualterminologyandimposedconsiderablerestrictionsonthetypeandnumberofdatafieldsaswellasonthemaximumamountofdatathatcouldbestoredinthesefields.Recently,however,thistypeofsoftwarehasbecomemorepowerfulandflexible,particularlyintermsofstorageandretrievaloptions.术语管理系统已经存在了一段时间。利用电脑进行术语管理的前期努力始于20世纪60年代,最终开发了Eurodicautom、Termium、theBanquedeterminologieword文档可自由复制编辑duQuebec(现在被称为巨型词典术语)几个大型术语存储库,它们都是大型组织在主机上保存的存储库。20世纪80年代,当台式机进入人们的生活,个人的术语管理系统便成为了译者可从市场上买到的首批CAT工具中的一种。虽然当时很受欢大家迎,但这些早期的术语库管理系统仍具备一定的局限性。所设计的这些数据库管理系统只能在一台计算机上运行并不便于进行共享。他们通常只允许对双语术语进行简单管理并且极大限制了数据域的类型和数量以及可以存储在这些数据域中的最大数据信息量。然而,最近这种类型的软件功能变得更加强大和灵活,特别是在存储和检索选项方面。StorageThemostfundamentalfunctionofaTMSisthatitactsasarepositoryforconsolidatingandstoringterminologicalinformationforuseinfuturetranslationprojects.Previously,manyTMSsstoredinformationinstructuredtextfiles,mappingsource-to-targetterminologyusingaunidirectionalone-to-onecorrespondence.Thiscauseddifficulties,forexample,ifaFrench-EnglishtermbaseneededtobeusedforanEnglish-Frenchtranslation.Thenewer,moresophisticatedsoftwarestorestheinformationusingarelationalmodel.Thismeansthattheinformationisstoredinamoreonomasiologicalorconcept-basedway,whichpermitsmappinginmultiplelanguagedirections.存储术语库最基本的功能是作为存储库来巩固并存储术语信息,以备将来翻译项目之用。之前,许多术语管理系统将信息存储在结构化文本中,使用单向一一对应的方法进行源语和目标语之间的转化。这样,就产生了一些难题,比方说法英翻译需要用到的法语-英语术语库。较新、较复杂的软件采用关系模型来存储信息,也就意味着要通过一种更加偏向于以专名学或概念为基础的方法储存信息,允许进行多种语言之间的转化。Thereisalsoincreasedflexibilityinthetypeandamountofinformationthatcanbestoredonatermrecord.Formerly,userswererequiredtochoosefromapredefinedsetoffields(e.g.,subjectfield,definition,context,source),whichhadtobefilledinoneachtermrecord.止匕外,这也使可储存在术语记录中的信息类型和信息数量更加灵活。以前,用户需要从一组预定义字段(比如主字段、定义、上下文、来源)中进行选择,并且这些字段必须来自每一条术语记录。Thenumberoffieldswasoftenfixed,aswasthenumberofcharactersthatcouldbestoredineachfield.Forinstance,ifaTMSallowedforonlyonecontext,theuserwasforcedtorecordonlyonecontext,eventhoughitmayhavebeenusefultoprovideseveral.Anexampleofatypicalconventionalrecordtemplateisprovidedinfigure4.1.Term(En):Term(Fr)Subjectfield:Definition:Context:Synonyms:word文档可自由复制编辑Source:Comment:Administrativeinfo(date,author,qualitycode,etc,):Figure4.1TMStermrecordwithafixedsetofpredefinedfields通常,字段数目以及每个字段能够存储的字符数都是固定的。例如,如果一个术语管理系统只允许记录一个文本的话,即使对用户来说记录多个文本是有好处的,但他还是只能记录一个。图4.1所示的是传统记录模板的典型例子。术语(英文):术语(法文)主字段:定义:上下文:同义词:来源:注释4.1含有一套固定的预定义领域字段的术语管理系统的术语记录管理信息(日期、作者、质量、编码等):图4.1Incontrast,asillustratedinfigure4.2,mostcontemporaryTMSshaveadoptedafreeentrystructure,whichallowsuserstodefinetheirownfieldsofinformation,includingrepeatablefields(e.g.,formultiplecontexts)andsomeevenpermittheinclusionofgraphics.Notonlycanuserschoosetheirowninformationfields,theycanalsoarrangeandformatthem,choosingdifferentlayouts,fonts,orcolorsforeasyidentificationofimportantinformation.Thismeansthatthesoftwarecanbeadaptedtosuitaspecificuser'sneedsandcangrowasfuturerequirementschange.Theamountofinformationthatcanbestoredinanygivenfieldorrecordhasalsoincreaseddramatically.Differenttermbasescanbecreatedandmaintaineddesired.Term(En): selected(v)Subjectfield: computingContext1: TheitemyouselecteddoesnotexistSource:ComputermagazineABC,1999Context2: Whenyouarefinishedtheselectingthetext,clickontheFormatmenuSource:UsermanualXYZ,1998Client:CompanyAFr:SelectionnerDate:June2000Client:CompanyBFr:choisirDate:January2001word文档可自由复制编辑Figure4.2TMStermrecordwithfreeentrystructure如图4.2所示,相比之下,大多数术语管理系统当前都采用自由条目结构,让用户自行定义他们自己的信息字段,其中包括可重复字段(例如,处理多个文本时),还有一些甚至允许录入图表。用户不仅可以选择他们自己的信息字段,还可以将这些信息字段排序和格式化,为它们选择不同的布局和字体,对容易识别的重要信息进行标色等。这意味着可以对这款软件进行调整以满足特定用户的需求,并且它还可以随着未来用户需求的变化而发展。很明显,任何给定字段或记录所能存储的信息量也在增加。可以创建不同的术语库以满足不同需求。术语(英文): 已选择(v)主字段: 计算文本1: 你所选择的项目不存在来源:计算机基础杂志,1999文本2: 完成文本的选择后,单击“格式”菜单来源:用户手册指南,1998客户:A公司法文:竞选人日期:2000年6月客户I.B净有自由条目结构的术语管理系统的术语记录法2R选择eval密:锻年1月Oncetheterminologyhasbeenstored,translatorsneedtobeabletoretrievethisinformation.Arangeofsearchandretrievalmechanismsisavailable.Thesimplestsearchtechniqueconsistsofalook-uptoretrieveanexactmatch.SomeTMSspermittheuseofwildcardsfortruncatedsearches.Awildcardisacharacter.suchasanasterisk,thatcanbeusedtorepresentanyothercharacterorstringofcharacters.Forinstance,awildcardsearchusingthesearchstring"comput*"couldbeusedtoretrievethetermrecordsfor"computer,""computing,"andsoon.MoresophisticatedTMSsalsoemployfuzzymatchingtechniques.Afuzzymatchwillretrievetermrecordsthataresimilartotherequestedsearchpattern,butthatdonotmatchitexactly.Fuzzymatchingallowstranslatorstoretrieverecordsformorphologicalvariants(e.g.,differentformsofverbs,wordswithsuffixesorprefixes),spellingvariants(orevenspellingerrors),andmulti-wordterms,evenifthetranslatordoesnotknowpreciselyhowtheelementsofthemulti-wordtermareordered.Table4.1providessomeexamplesofthetermrecordsthatcouldberetrievedusingfuzzymatchingtechniques.Table4.1SampletermrecordsretrievedusingfuzzymatchingSearchpatternenteredbyuserTermrecordretrievedusingfuzzymatching“anovulatory” ovulation“discus” disk“departmentfordangerousgoodsdangerousGoodsEmergencyCentreemergencies”word文档可自由复制编辑一旦术语被存储起来,就要求译员具备就这些信息进行检索的能力。有一系列的搜索和检索机制可供使用。最简单的搜索技术就是通过查询检索出精确匹配项。一些术语管理系统允许使用通配符来进行截断搜索。一个通配符就是一个字符,比如一个星号可以用来代表任何字符或者字符串中的字符。例如,通配符搜索使用的搜索字符串“comput*"可以用来检索“computer”、“computing”等术语的记录。较复杂的术语管理系统还可以使用模糊匹配技术。模糊匹配可以检索出与所要求搜索模式相似的术语记录,但并不是精确匹配。即使译员不能准确理解多词术语中各种成分的组织形式,模糊匹配可以让他们检索出形态变体(例如,动词的不同形式,带有前缀或者后缀的单词),拼写变体(或者甚至是拼写错误)和多词术语的记录。表4.1所示是通过模糊匹配技术检索出的一些术语记录的例子。表4.1通过模糊匹配检索出的术语记录示例用户使用的搜索模式 通过模糊匹配检索出的术语记录“anovulatory” ovulation“discus” disk“departmentfordangerousgoodsdangerousGoodsEmergencyCentreemergencies”Whenwildcardsearchingorfuzzymatchingisused,itispossiblethatmorethanonerecordwillberetrievedasapotentialmatch.Whenthishappens,usersarepresentedwitha"hitlist"ofalltherecordsinthetermbasethatmaybeofinterest,andtheycanselecttherecord(s)thattheywishtoview.Samplehitlistsareshownintable4.2.Table4.2SamplehitlistsretrievedfordifferentSearchpatternsHitlistcontainingrecordsthatmatchthewildcardsearchpattern“cake”Hitlistcontainingrecordsthatfuzzysearchpattern“skate-boardingchampion”cheesecakechampioncupcakeskateboard(n)fruitcakeskateboard(v)pancakeskateboardingInternationalSkateboardingChampionships使用通配符搜索或者模糊匹配时,可能会检索出不止一条充当潜在匹配角色的记录。出现这种情况时,用户在术语库中会看到他们会感兴趣的“命中列表”,在这个列表中,这样用户就可以选择他们想要查看的记录。表4.2所示的是命中列样例表4.2不同检索模式下的命中列样例命中列表:包含匹配通配符搜索 命中列表:包含匹配模糊搜索模式的记录 模式的记录word文档可自由复制编辑“cake”“skate-boardingchampion”cheesecakechampioncupcakeskateboard(n)fruitcakeskateboard(v)pancakeskateboardingInternationalSkateboardingChampionships4.3Activeterminologyrecognitionandpre-translation4.3主动术语识别和预翻译AnotherfeatureofferedbysomeTMSs,particularlythosethatoperateaspartofanintegratedpackagewithwordprocessorsandtranslation-memorysystems(seesection)isknownasactiveterminologyrecognition.Thisfeatureisessentiallyatypeofautomaticdictionarylook-up.Asthetranslatormovesthroughthetext,theterminology-recognitioncomponentcomparesitemsinthesourcetextagainstthecontentsofthetermbase,andifamatchisfound,thetermrecordinquestionisdisplayedfortheusertoconsult.一些术语管理系统的另一功能,特别那些作为带有文字处理器和翻译记忆系统的完整软件包的一部分进行运作的术语管理系统(见节),以主动术语识别著称。从本质上来说,这是一种自动字典查询功能。随着译员逐渐深入研究文本,术语识别组件会将源文本中的项目与术语库中的内容进行对比,如果找到匹配项,就会把这个选中的术语记录展现给用户以供其参考。SomeTMSsalsopermitamoreautomatedextensionofthisfeatureinwhichatranslatorcanaskthesystemtodoasortofpre-translationorbatchprocessingofthetext.'还有一些术语管理系统具有自动扩展功能。这样,译者就可以利用系统完成文本的预翻译和批处理。82Computer-AidedTranslationTechnology计算机辅助翻译技术Table4.3Automaticreplacementofsource-texttermswithtranslationequivalentsfoundinatermbaseSourcetextsentencefollowingTermbaseentriesforitemscontainedinthesourcetextSentenceproducedpre-translationThefileoperationdiskdisqueTheoperationword文档可自由复制编辑defichiercannotbecompletedfileoperation-operationdefichiercannotbecompletedbecausebecausethediskisfullfull-sature thedisqueissature表4.3用术语库中的翻译等值项目自动替换源文本中的术语原文本句子 术语库条目中包含的源文本术语 预翻译后产生的句子Thefileoperation diskdisque Theoperationdefichiercannotbecompletedfileoperation-operationdefichiercannotbecompletedbecausebecausethediskisfullfull-sature thedisqueissatureInthiscase,theTMSwillidentifytermsforwhichanentryexistsinthetermbase,anditwillthenautomaticallyinsertthecorrespondingequivalentsintothetargettext.Theresultofthispre-translationphaseisasortofhybridtext,asshownintable4.3.Inapost-editingphase,itisuptothetranslatortoverifythecorrectnessoftheproposedtermsandtotranslatetheremainderofthetextforwhichnoequivalentswerefoundinthetermbase.在这种情况下,术语管理系统将会在已有的术语库中识别这些术语,然后自动在目标文本中插入相应的翻译等值项。这个预翻译阶段的结果就是生成一种混合文本,如表4.3所示。在文章编辑阶段,将由译者来验证所替换术语的正确性并翻译未能在术语库中找到翻译等值项的剩余部分。4.4TermextractionAnotherfeaturethatmaybeincludedinsomeTMSsisaterm-extractiontool,whichissometimesreferredtoasaterm-recognitionorterm-identificationtool.Mostterm-extractiontoolsaremonolingual,andtheyattempttoanalyzesourcetextsinordertoidentifycandidateterms.However,somebilingualtoolsarebeingdevelopedthatanalyzeexistingsourcetextsalongwiththeirtranslationsinanattempttoidentifypotentialtermsandtheirequivalents.Thisprocesscanhelpatranslatorbuildatermbasemorequickly;however,althoughtheinitialextractionattemptisperformedbyacomputer,theresultinglistofcandidatesmustbeverifiedbyahuman,andthereforetheprocessisbestdescribedasbeingcomputer-aidedorsemi-automaticratherthanfullyautomatic.Unliketheword-frequencylistsdescribedinsection3.2.1,term-extractiontoolsword文档可自由复制编辑attempttoidentifymulti-wordunits.Therearetwomainapproachestotermextraction:linguisticandstatistical.Forclarity,theseapproacheswillbeexplainedinseparatesections;however,aspectsofbothapproachescanbecombinedinasingleterm-extractiontool.4.4术语抽取一些术语管理系统可能还有另一个特点,就是包含了术语抽取工具,有时也被称为术语识别或术语鉴别工具。大多数术语抽取工具是单语的,它们试图分析源文本以确定候选术语。然而,也正在开发一些双语工具,这些工具可分析现有的源文本以及他们的翻译在以期识别出它们的潜在术语及等值项。这一过程可以帮助译者更迅速的建立一个术语库;尽管最初的提取尝试是由计算机执行的,但是必须由人来验证最终产生的候选列表,因此对它的最佳描述应该是计算机辅助或半自动翻译而非全自动。与3.2.1节中所描述的词频列表不同,术语抽取工具试图识别多词单位。术语抽取主要有两种方法:语言学方法和统计学方法。为了清楚起见,将在不同的章节对这两种方法进行分别解释;然而,这两种方法的某些方面也可以结合成一个单一术语提取工具。Terminology-ManagementSystems83术语管理系统83Antivirusprogramsnowincludeanumberofoptions.Integritycheckingperformschecksofthestatusofthefilesagainsttheinformationthatisstoredinadatabase.Behaviorblockingperformsbefore-the-factdetection.Heuristicanalysisisaformofafter-the-factdetection.Ashorttextthathasbeenprocessedusingalinguisticapproachtotermextraction.图4.3 一个使用语言学方法进行术语抽取加工的简短文本Antivirusprogramsnowincludemoreoptions.Integritycheckingperformsperiodicchecksofthecurrentstatusofthefilesagainsttheinformationthatisstoredinformation.Behaviorblockingperformsbefore-the-factdetection.Heuristicanalysisisaformofafter-the-factdetection.Aslightlymodifiedversionofthetextthathasbeenprocessedusingalinguisticapproachtotermextraction.图4.4 使用语言学方法进行术语抽取加工并轻微修正过的文本4.4.1LinguisticapproachTerm-extractiontoolsthatusealinguisticapproachtypicallyattempttoidentifywordcombinationsthatmatchparticularpart-of-speechpatterns.Forexample,inEnglish,manytermsconsistofNOUN+NOUNorADJECTIVE+NOUNcombinations.Inordertoimplementsuchanapproach,eachwordinthetextmustword文档可自由复制编辑firstbetaggedwithitsappropriatepartofspeech,asdescribedinsection3.3.Oncethetexthasbeencorrectlytagged,theterm-extractiontoolsimplyidentifiesalltheoccurrencesthatmatchthespecifiedpart-of-speechpatterns.Forinstance,atoolthathasbeenprogrammedtoidentifyNOUN+NOUNandADJECTIVE+NOUNcombinationsaspotentialtermswouldidentifyalllexicalcombinationsmatchingthosepatternsfromagiventext,asillustratedinfigure4.3.Unfortunately,notalltextscanbeprocessedthisneatly.Ifthetextismodifiedslightly,asillustratedinfigure4.4,problemssuchas"noise"and"silence"becomeapparent.First,notallofthecombinationsthatfollowthewillqualifyspecifiedpatternsasterms.OftheNOUN+NOUNandADJECTIVE+NOUNcandidatesthatwereidentifiedinfigure4.4,somequalifyasterms4.4.1语言学方法使用语言学方法的术语抽取工具的典型特点是:试图通过匹配特定的词性模式来识别单词组合。例如,许多英语术语的构成模式是:名词+名词或者形容词+名词。为了适应这种方法,首先必须适当标记出文本中每个单词的词性,如3.3节所述。一旦文本被正确标记,术语提取工具将很容易识别出与特定词性模式相匹配的所有术语。例如,一个术语抽取工具编程的潜在条件是识别名词+名词组合和形容词+名词组合,那么该工具可以从给定文本中识别出与这一模式相匹配的所有词汇组合,如图4.3所示。不幸的是,并不是所有的文本都可以被加工的这么整齐。如果对文本稍作修改,如图4.4所示,“噪声”和“无声”之类的问题将变得很显而易见。首先,并非所有的词汇组合都按照指定的术语模式以合格特定术语模式的身份出现。图4.4识别出的名词+名词和形容词+名词候选模式中,有一些符合("antivirusprograms,""integritychecking,""behaviourblocking,""heuristicanalysis"),然而另外一些却不符合,(moreoptions,”“periodicchecks,”“currentstatus,”“storedinformation,")。后面这个集合构成噪声并需要将其人工排除在候选名单之外。84Computer-AidedTranslationTechnology("antivirusprograms,""integritychecking,""behaviourblocking,""heuristicanalysis"),whereasothersdonot("moreoptions,""periodicchecks,""currentstatus,""storedinformation").Thelattersetconstitutesnoiseandwouldneedtobeeliminatedfromthelistofcandidatesbyahuman.Anotherpotentialproblemisthatsomelegitimatetermsmaybeformedaccordingtopatternsthathavenotbeenpre-programmedintothetool.Thiscanresultin"silence."-asituationinwhichrelevantinformationisnotretrieved.Forexample,theterms"before-the-fact-detection"and"after-the-factdetection"havebeenformedusingthepatternPREPOSITION+ARTICLE+NOUN+NOUN;however,thispatternisnotcommonandisnotlikelytoberecognizedbymanytermextractiontools.Afinaldrawbacktothelinguisticapproachisthatitisheavilylanguagedependent.Term-formationpatternsdifferfromlanguagetolanguage.Forinstance,term-formationpatternsthataretypicalinEnglish(e.g.,ADJECTIVE+NOUN.NOUN+NOUN)arenotthesameasterm-formationpatternsthatarecommoninword文档可自由复制编辑French(e.g.,NOUN+ADJECTIVE,NOUN+PREPOSITION+NOUN).Consequently,term-extractiontoolsthatusealinguisticapproacharegenerallydesignedtoworkinasinglelanguage(orcloselyrelatedlanguages)andcannoteasilybeextendedtoworkwithotherlanguages.84计算机辅助翻译技术另一个潜在问题是,一些根据未被预先编程到术语抽取工具中去的模式构成合理术语。这可能产生“无声”一一种未检索到相关信息的情况。例如,"before-the-fact-detection"和"after-the-factdetection"两个术语就是按照介词+冠词+名词+名词的模式构成的。当然,这一模式不常见也不易于许多术语抽取工具对其进行识别。最后,使用语言学方法进行操作的术语抽取工具的缺点是,它有严重的语言依赖性。不同语言的术语构成模式各不相同。例如,典型的英文术语形成模式(如:名词+名词,形容词+名词)在法文术语形成模式中却不如(名词+形容词,名词+介词+名词)常见。因此,使用语言学方法进行操作的术语抽取工具的设计目的是在一个单语(或密切相关的语言)工作环境中使用,而且很不容易延伸到其他语言环境中去。4.2:TMSspermitmoreflexiblestorageandretrieval.Inaddition,itiseasiertoupdateelectronicinformation,andfastertosearchthroughelectronicfiles.Eventhoughawordprocessorallowsinformationtobestoredinelectronicform,itisnotanadequatetoolformanagingterminologyinanefficientway,anditssearchfacilitiesslowdownconsiderablyasthetermbasegrowsinsize.AnotherwaythataTMScanpotentiallyspeedupatranslator'sworkisbyallowingtermstobepasteddirectlyintothetargettext,thusavoidingtheneedtoretypetheterm.Ofcourse,termsmayneedtobeeditedtofitintothecontext(e.g.,averbmayneedtobeconjugated),whichmeansthattimesavedoncopyingandpastingmayneedtobespentonediting.Insomecases,thishasledtoanewwayofrecordinginformationonterminologyrecords,andthisisdiscussedinsection.2:术语管理系统让信息的存储和检索更加灵活。此外,它让电子信息更新变得更加容易,让通过电子文件进行搜索的速度变得更快。尽管文字处理器允许以电子版的形式存储信息,但它并不能恰当有效地管理术语,并且其搜索设备的搜索速度也会随着术语库规模的扩大而大大减慢。术语管理系统能够帮助提高译员的工作速度,因为它允许将术语直接粘贴到目标文本中,而避免了重新输入术语。当然,必要时需要重新编辑术语以适应上下文的需要(例如动词可能需要变位配合),这意味着节省了在编辑过程中复制和粘贴术语所需要的时间。这在某种程度上也促成了一种记录术语信息新方法的形成,4.6.3节将就其展开讨论。4.6.2quality4.6.2质量Althoughanytypeofglossarycanhelptoimproveconsistencythroughoutatranslationproject,theactiveterminology-recognitionfeatureofsomeTMSstakesthisonestepfurther.AsClark(1994,306)notes,thereislittlepointingoingtothetroubleofensuringthatterminologyisagreedtobeforehandandstoredinatermbaseword文档可自由复制编辑iftranslatorschoosenottoconsultthistermbase.Withactiveterminologyrecognition,thechoiceistakenoutoftheirhandsbecausetermsinthesourcetextareautomaticallycheckedagainstthetermbase.尽管任何类型的术语表都能提高整个翻译项目的一致性,但是一些术语管理系统的主动术语识别功能在一领域领先了一步。正如克拉克(1994,36)所指出的那样,如果译员不查询术语库,那么为预先确定术语并将其存储在术语库中所做的努力就没有意义了。依靠主动术语识别,译员有了更多选择,因为可以在术语库中自动检索源文本中的术语。4.6.3ChangingthenatureofthetaskInadditiontospeedingupthetaskofsearchingforterminology,thereissomeevidencethatthetechnologyisbeginningtohaveanimpactontheamountandtypeofterminologicalinformationthatisbeingrecordedonatermrecord,aswellasonthewayinwhichthisinformationisbeingrecorded.4.6.3改变翻译任务的性质除了能够加快进行搜索术语的任务,一些证据表明术语管理系统应用技术正开始影响术语记录中的术语信息数量和信息类型,其影响方式也一同记录其中。Althoughflexibletoolsdoallowuserstoenterdetailedinformationintoglossaries,itisbecomingincreasinglycommontoseeglossariesusedinthelocalizationindustrythatcontainonlythesourceandtargetterm,andperhapsacommentifthesourcetermhasmultiplepossibletranslationsdependingonthecontext.AccordingtoO'Brien(1998,118),thereareseveralreasonsforthistypeofstripped-downglossaryformat.First,therequiredturnaroundtimeinthelocalizationindustryisoftensoshortthatitdoesnotallowforthepreparationofdetailedglossaries.Second,theterminologyused(evenbythesameclient)canchangerapidly,warrantingnewglossarieseachtimetheclienthasaproductlocalized.Finally,thetranslator,whoalsohastoproduceveryfastturnaroundtimes,isinterestedonlyintheclient-approvedtranslatedtermandthecontextinwhichatermcanoccurifthereismorethanonetranslationforthatterm.Ofcourse,thistrendhasbeencausedmorebythenatureofthetranslationmarketthanbythenatureofthetechnologyitself;however,thefactthattechnologymakesiteasytocompileandtransferinformationquicklyhascontributedtothetrendoftreatingglossariesasdisposableitems,ratherthanaslongstandingrecords.虽然灵活的工具允许用户将详细信息输入术语表,我们可以看到术语表正被越来越普遍(广泛)地用于本地化行业,但仅包含源语术语和目标术语以及可能的注释并且条件是根据上下文的含义源术语有多种翻译可能。根据奥布莱恩(1998,118)的看法,存在这种精简版的术语表格式的原因有以下几种:首先,本地化行业所需要的周转时间往往很短,它不允许编制详细的术语表;其次,使用的术语(即使是同一客户端)会迅速改变,以确保客户端在每次有一个本地化产品时会有相应的新术语表;最后,在周转时间内同样需要快速产出作品的译员只对经客户端核准的术语以及包含多种翻译意思的术语所适用的语境感兴趣。当然,比起翻译本身的性质,是翻译市场的性质更多地造成了这种趋势。然而,技术让快速编译和传输信息成为事实,这一事实已经促成将术语表作为一次性利用工具而非长期记录趋势的产生。Thetechnologyis,however,responsibleforpromptingachangeinboththetypeofword文档可自由复制编辑datathatarebeingstoredandthewayinwhichtheyarerecordedontermrecords.Forexample,inintegratedpackages(packagesthatarelinkedwithotherapplications,suchaswordprocessorsortranslationmemories),translatorscanautomaticallyinsertterminologyfromtheTMSdirectlyintothetargettext(e.g.,byclickingontheterminthetermrecord).Thiscansavetime,asthereisnoneedtoretypeorcutandpaste.Oneresultofthisisthatsometranslatorsarecreatingtermrecordsforphrasesorexpressionsthatoccurfrequentlyinaspecializedsubjectfieldbutdonotqualifyastermsintheconventionalsense.Forinstance,atranslatorworkingonthetranslationofacomputermanualmaycreatetermrecordsforexpressionssuchas"clickonOK"or"it'seasyto"becauseitisfastertoinsertthesefrequentlyusedexpressionsdirectlyfromtheTMSthanitistotypethem.然而,该技术负责推动正被存储的数据类型改变,以及将该数据被记录在术语记录中的方式的改变。例如,在综合程序包中(即与其他应用程序,如文字处理器或翻译记忆相关联的程序包),译员可以从术语管理系统中自动直接将术语插入到目标文本中(例如,通过点击术语记录中的记录插入)。这可以节省时间,无需重新输入或剪切和粘贴术语。这么做的后果是,译员将可以把频繁出现的某个专门学科领域的短语或表达制成术语,以区别于他们的传统意义。例如,一个致力于电脑使用手册翻译的译员可以创建属于表达式如“点击OK键”或是“这很容易”之类的术语,因为从术语管理系统中直接插入这些常用表达式要快于重新输入。'OfcoursewhenterminologyisinsertedintothetargettextfromtheTMS,someeditingmayberequired(e.g..toconjugateaverb),andthishasraisedaninterestingquestionregardingwhichformofatermshouldberecordedonatermfile.Traditionally,termfileshavealwayscontainedthecanonicalformofaterm(thesingularformofanoun,theinfinitiveformofaverb,themasculineformofanadjective)(Dubuc1985.80;Rondeau1984,84).However,Kenny(1999,71)hasobservedthatinordertoreducetheamountoftimespenteditingtermsthathavebeeninserteddirectlyfromTMSs,sometranslatorsarenowchoosingtorecordthemostcommonformofaterm,orindeedseveralformsofaterm,inthetermrecord,asshowninfigure4.7.Thisway,thecorrectformcanbeinsertedsimplybyclickingonit,andtherewillbenoneedtoedittheterminthetargettext.FurtherdiscussionontheintegrationofTMSsandtranslationmemorysystemscanbefoundinsection.当然,从术语管理系统中直接将术语插入到目标文本中可能需要一些编辑(如动词变位),这就产生了一个有趣的问题,即应将何种术语格式记录在术语文件中。传统上讲,术语文件总是包含标准格式的术语(名词单数、动词不定式、阳性形容词)。然而,肯尼(1999,71)发现,为节省从术语管理系统中直接插入术语所需要的编辑时间,有些译员选择记录术语最常见的一种或几种格式,如图4.7所示。通过这种方式,可以通过简单地点击将正确格式的术语插入到目标文本中,无需再次进行编辑。可以在节找到就整合术语管理系统和翻译记忆系统所作出的进一步讨论。4.6.4Shareabilityofinformation:networking,fileformats,andstandardsTerminology-managementsystemscanbeusedasstand-alonetools,butmoreandmore,theyarebeingnetworkedsothatseveraluserscanaccessandcontributetotheword文档可自由复制编辑termbase.Insuchcases,itmaybedesirabletogivedifferentusersdifferenttypesofprivilegesonthenetworksystem.4.6.4信息共享性:网络、文件格式和标准术语管理系统可以作为独立工具使用,但他们逐渐被网络化,以便于几个(多个)使用者(用户)能够同时访问,这有助于促进术语库的发展。这种情况下,给不同使用者不同类型的网络系统特权的做法是可取的。4.4.2Statisticalapproach统计学方法Themoststraightforwardstatisticalapproachtotermextractionisforatooltolookforrepeatedseriesoflexicalitems.Thefrequencythreshold(thenumberoftimesthataseriesofitemsmustberepeated)canoftenbespecifiedbytheuser.Forexample,asillustratedinfigure4.5,iftheminimumfrequencythresholdissetattwo,agivenseriesoflexicalitemsmustappearatleasttwiceinthetextinor
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届甘肃省高三高考冲刺(二)历史试题(含答案)
- 奢侈品皮具护理高级技师考试试卷及答案
- 青少年编程教育讲师考试试卷及答案
- 复合发泡水泥保温板工程专项施工方案
- 防灾疏散设计
- 解约支付违约金协议书
- 拆迁协议书已签没交钥匙
- 创业征集投资入股协议书
- 数据调取授权协议书
- 原油减产协议书后的变化
- 流行病学曲线图解读
- T1HBSEA 001-2024 石油天然气在役井口采油(气)树定期检验规范
- 中远集团财务信息系统SAP操作手册
- 查缉战术课件大纲
- 3.辽宁2017定额宣贯《房屋建筑与装饰工程定额 》
- 交通事故民事起诉书模板(合集8篇)
- 安全施工监理实施细则
- 民航概论全套课件
- GB/T 4622.2-2008缠绕式垫片管法兰用垫片尺寸
- GB/T 32622-2016社会保险征缴稽核业务规范
- GB/T 18926-2008包装容器木构件
评论
0/150
提交评论