系统功能语言学的知识表示方法研究-北京科技大学学报(社会科学版)(2015年3期)_第1页
系统功能语言学的知识表示方法研究-北京科技大学学报(社会科学版)(2015年3期)_第2页
系统功能语言学的知识表示方法研究-北京科技大学学报(社会科学版)(2015年3期)_第3页
免费预览已结束,剩余22页可下载查看

下载本文档

文档简介

龙源版权所有系统功能语言学的知识表示方法研究

作者:李学宁范新莹

来源:《北京科技大学学报(社会科学版)》2015年第03期项目基金〕教育部人文社科青年基金项目“韩礼德的计算语言学思想研究”(编号为11YJC740056)的阶段性成果。〔作者简介〕范学宁(1971-),男,湖南湘潭人,江南大學外国语学院副教授,博士,博士后。范新莹(1989-),女,山东德州人,江南大学外国语学院硕士研究生。①在计算语言学、自然语言处理和人工智能的研究中,“系统功能语言学”和“系统功能语法”这两个术语往往不加以区分。严格地说,前者指的是整个语言学理论,而后者只是其中的词汇-语法系统。本文采用“系统功能语言学”这一术语,但是在涉及PENMAM的时候沿用了“Nigel语法”及其“系统语法”的提法。〔摘要〕系统功能语言学应用于语篇生成系统中需要进行知识表示。通过考察PENMAM,发现其一种主要的表示方法是系统网络。然而,这种方法不能充分表示语言的交际性以及三元功能,在进行计算机实现时也存在一些缺陷。基于此,文章进一步提出改进系统网络表示法的两种基本途径:基于复杂性科学的理论途径和基于人工智能的技术途径。此研究能够促进系统功能语言学与其他学科之间的交叉、融合,从而更好地开展面向自然语言处理用途的语言研究。〔关键词〕系统功能语言学;语篇生成系统;知识表示方法;系统网络〔中图分类号〕H319〔文献标识码〕A〔文章编号〕1008-2689(2015)03-0026-05引言“自然语言生成”又称为语篇生成,指计算机通过自然语言文本来表达给定的意图和思想。而“语篇生成系统”是相应的计算机软件系统,它能够自动地生成可以理解的自然语言文本。从20世纪60年代开始,系统功能语言学就开始应用于自然语言生成的研究。进入70、80年代之后,它在一大批语篇生成系统中得以实际采用,比较著名的有PROTEUS、PENMAM、SLANG、COMMUNAL等等。[1](39-42)90年代之后,它的影响力开始波及国内自然语言生成界,例如中科院研制的汉语句法实现系统[2][3]。直至今天,它对于一些新系统的建构也具有很强的借鉴作用。然而,系统功能语言学并不能直接应用于语篇生成系统。它需要进行“知识表示”或形式化表示,即采用一定的符号把语言学知识编码成一组数据结构,才能为计算机接收并便于软件系统使用。[5]本文将考察一个具有里程碑意义的语篇生成系统—PENMAM:结合它的基本框架,重点研究系统功能语言学在应用过程中所采用的系统网络表示法。根据复杂性科学和人工智能的最新发展,进一步提出改进系统网络表示法的理论和技术途径。一、PENMAM系统的基本框架PENMAM是Mann、Matthiessen等人在20世纪80~90年代开发的一个大型英语生成系统。它在应用系统功能语言学的过程中提出了著名的Nigel语法,并进一步应用到了德语、日语、法语、西班牙语、荷兰语、土耳其语等不同语种的自然语言生成。[6]目前,许多新建的语篇生成系统也往往与PENMAM/Nigel进行对比,以证明自己的先进性。①(一)PENMAM的设计框架在PENMAM的设计框架中,“资源”与“过程”被明确地区分开来。其中,“词汇-语法资源”应用的是系统功能语言学中的词汇语法知识。图示如下:图1PENMAN的设计框架下面,通过一段范文来演示PENMAM的工作流程:Youshouldreplace(setqx1)with(setfx1).Setfcanbeusedtoassignavaluetoanygeneralized-variable.Setqcanonlybeusedtoassignavaluetoasimple-variable.Ageneralized-variableisastoragelocationthatcanbenamedbyanyaccessorfunction.这个文本的目标是向读者建议用(setfx1)取代(setqx1)。首先,PENMAM从知识库中进行检索,选择两种Lisp形式差别方面的知识。然后,从修辞资源中选择合适的修辞结构,用以表示两种Lisp形式之间的对比关系。在这两个过程中都需要参考读者模型,目的是判断哪些信息与当前文本目标相关、但又不为读者所已知。最后,采用系统功能语言学进行词汇-语法表达,并编辑为上述文本。[1](9)(二)Nigel语法和环境Matthiessen等人进一步将PENMAM的设计框架概括为两个主要的组成部分:“Nigel语法”和“环境”。[1](10)图2Nigel语法和环境环境主要由“知识库”和“文本规划”两个部分组成。它们包含了许多语法信息,例如事物的性、数、格等。Nigel语法是一个以系统功能语言学为基础的模块,它包括“系统语法”和“选择与询问界面”。前者由“系统”、“实现规则”和“词库”三个基本要素组成。后者是系统语法与环境之间的交互界面。它的作用是向环境不断提出询问,并根据回答对系统进行有目的的选择。以名词词组的生成为例,界面会向环境询问有关事物的语法范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论