UNL (Universal Networking Lang_第1页
UNL (Universal Networking Lang_第2页
UNL (Universal Networking Lang_第3页
UNL (Universal Networking Lang_第4页
UNL (Universal Networking Lang_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、An Introduction to UNL (Universal Networking Language)Wang-Ju TSAIGETA, CLIPS-IMAG,BP53, F-38041 Grenoble Cedex 09 FRANCEAbstractThe UNL (Universal Networking Language) project has be proceeding for 5 years until now, this is an electronic language that enables to represent the semantic meaning of n

2、ature language, thus suitable to be an interlingua for the machine translation when there are many languages to be processed. In this article we give an brief introduction of this project and some other information of the current status of the project. The article is written in Chinese, since there

3、is still very few information about this subject in Chinese. UNL (Universal Networking Language) 聯合國大學通用網路語言簡介蔡旺儒法國格列諾伯傅利葉大學資訊博士候選人一、UNL是什麼UNL為“聯合國大學通用網路語言”之簡稱,這是一個國際型的合作計劃,用意在提供聯合國會員國一套在網路上作電腦自動翻譯的中介語言,以方便資訊的流通。鑒於網際網路的日漸發達以及地球村的成型,對翻譯資源及多語言文件之管理及生成的需求也日增;然而現今發展之自動翻譯系統仍多集中在那些商機較看好的語言上(例如:英、日、中、法、德等)

4、;再者,現今在網路上流通的文件有百分之六十是使用英文,這會使那些無力發展自己的資訊系統的非英語使用國很容易被邊緣化。為了解決以上的問題,聯合國大學(東京)在一九九六年十二月提出此項研究計劃。在電腦自動翻譯理論裡,當要被處理的語言有很多種時,要去建立兩兩語言間相對應的文法及字典會成幾何級數的增加,這要耗費的人力是相當可觀的;中介語言是比較可行的做法,我們把所有的輸入語言都翻譯成此中介語言,再進一步翻成我們要的目標語言。這也是這個計劃的做法。透過編譯(enconversion*註一 )將自然語言轉成UNL碼,再透過解譯(deconversion)的過程將UNL碼轉成目標語言。下圖說明這之間的過程:

5、她愛她的孩子agt(love.entry, she)obj(love.entry, child)pos(child, she)She loves her child.Sie liebt ihr Kind.編譯解譯輸入語言UNL碼目標語言UNL碼本身是利用英語字彙表達語意的圖形碼(anglo-semantic graph),藉由二元關係來描述核心語意成分之間的關係,本身並不難讀,透過標註其語法之屬性及限制等多項描述,可以很有效地消除歧義及增加原先不存在本國語之新字彙。而一份UNL文件的格式和網路上網頁之標記語言HTML十分相似,因此十分容易和現今的標記語言(例:XML)相結合(附錄一為一UNL文

6、件之格式)。將來在網路上會有許多UNL計劃各國語言中心研發的編解譯器,一般的使用者可藉由編譯器產生UNL碼,之後再用解譯器產生他要的語言版本,如上圖所示:一個中文作者可以自行產生英文及德文之版本。若在網路上有另一法國讀者想要讀這份文件,他只需要將UNL碼送去法文解譯器即可產生法文版本。二、UNL計劃現狀UNL計劃為期共十年。自一九九六年至一九九九年,前三年為研發階段,這三年間制定了UNL語法,UNL-自然語言字典,UNL知識庫,編解譯器之架構及應用程式。此外還有一些UNL瀏覽器,編輯器等模組。自二零零一年起成立UNL基金會()及UNL線上社區,提供對UNL有興趣的使用者一個討論之區域。至此,現

7、已有十四個國家(日、法、韓、中國、俄、西、義、泰、印度、印尼、巴西、蒙古、希臘、約旦)*註二。有興趣之讀者可以在UNL中心之網站/) 或是本實驗室之UNL資源網站找到相關之資訊()。現今之計劃為各國之語言中心各自發展其模組及推廣,UNL-email,等。除此之外,十一月底將在中國蘇州召開研討會議。未來之前景,UNL可以帶領個人,政府或非政府組織超越語言的障礙,真的達到“網路無國界”的願景。除了可以幫助資訊不發達之國家更快地翻譯取得最先進的資訊,推展資訊教育,成立線上虛擬大學外,聯合國本身及聯合國科教文組織,及歐盟等需要用到許多工作語言的組織也對此計畫感到相當高的興趣。三、UNL之其他

8、相關問題由於UNL的問世相對地也帶來其他很有意思的研究課題:特別是多語言文件之管理及生成;利用現有資訊資源及架構改善資訊不發達國家或地區;或是研究UNL圖形對自然語言字串間的對應來改善翻譯的品質;個人翻譯工作站之設計(即將UNL模組放在個人電腦下之使用方式); 網路翻譯社區之民主化:人人皆可改善本國語之翻譯結果,等等。這些研究皆可在附錄之書目中找到相關的研究論文。註一)Enconversion及deconversion正式的中文名稱應由UNL中文中心定義,筆者在此用“編解譯”暫代。UNL中文中心為近十個大陸之研究單位所組成,其位址為註二)UNL德文中心目前不存在,IAI (Institut f

9、ür Angewandte Informationsforschung ) 及 DFKI (German Research Center for Artificial Intelligence GmbH) 曾參與前三年之規劃。四、參考書目論文Boitet Ch. (2001) Four technical and organizational keys for handling more languages and improving quality (on demand) in MT, " MT-SUMMIT VIII (2001) ", Proceedings

10、 of the Workshop (Towards a Road Map for MT), p.14-21. 18/09/2001Sérasset G. and Boitet Ch. (2000) "On UNL as the future "html of the linguistic content" & the reuse of existing NLP components in UNL-related applications with the example of a UNL-French deconverter", COL

11、ING 2000, Saarbruecken, Germany 31/07-04/08, p.768-774Sérasset G. & BOITET Ch. (1999),"UNL-French deconversion as transfer & generation from an interlingua with possible quality enhancement through offline human interaction" MT Summit 99, 13-17 september 1999, Singapore, pp 22

12、0-228.Boitet Ch. (1999) A research perspective on how to democratize machine translation and translation aids aiming at high quality final output, Machine Translation Summit VII (1999), Singapore, 13-17/9/99Munpyo HONG & Olivier STREITER (1998) "Overcoming the Language Barriers in the Web:

13、The UNL-Approach" , in 11.Jahrestagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV'99), 1999, Frankfurt am Main.Preedarat JITKUE (2001) Participation au projet SWIIVRE-UNL et première version dun environnement web de déconversion multilingue et déditeur UN

14、L de base, report de stage de Maitrise Informatique Université Joseph Fourier Grenoble 28/05-31/08 Wang-Ju TSAI (2001) “SWIIVRE-UNL project a Web Site for Initiation, Information, Verification, Research and Experiments of UNL”, 2001, UNL Conference, Suzhou, China.Etienne Blanc (2001) “From Grap

15、h to Tree: Processing UNL Graphs using an Exisiting MT System” , 2001, UNL Conference, Suzhou, China.五、附錄附錄一:一份XML格式的UNL文件在一份UNL文件中會有許多語言版本,用一般的瀏覽器加上一些樣式表(CSS, XSL)即可讀到要讀的語言版本。<?xml version="1.0" encoding="ISO8859-1" ?><!- ?xml-stylesheet type="text/xsl" href=&

16、quot;unlxsl01.xsl"? -> <!- XML pour UNL 4/10/2001 -><D DocName="La Salinidad"> <P Paragraphno="1" > <S Setenceno="1"> <version Versionno="1" Parentno="0" Date="01/07/2001" Author="WJT" > <u

17、nl> <arc> obj(triple(icl>do).plete.entry, salinity.def.topic) </arc> </unl> <text Langno="es01" Comment="org" > La salinidad se ha triplicado. </text> <text Langno="fr01" Comment="by WJT, 22/10/2001" > La salinité s'est triplée. </

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论