




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
序号: 编码: 第四届“挑战杯”河南科技大学学生课外学术科技作品竞赛作品申报书 作品名称: 可拓学和语用学相关理论 在信息检索系统中的应用 学院全称: 外国语学院 申报者姓名 (集体名称): 李闻达 类别:自然科学类学术论文 哲学社会科学类社会调查报告和学术论文 科技发明制作A类 科技发明制作B类 A1申报者情况(个人项目)说明:1必须由申报者本人按要求填写,申报者情况栏内必须填写 个人作品的第一作者(承担申报作品60%以上的工作者); 2本表中的学籍管理部门签章视为对申报者情况的确认。姓 名李闻达性别男专业英语申报者情况学院全称外国语学院身份证 历在读本科年级09级学制四年入学时间2009年09月作品全称可拓学和语用学相关理论在信息检索系统中的应用毕业论文题目通讯地址河南省洛阳市洛龙区开元大道 河南科技大学新校区外国语学院英语096班邮政编码471000单位电住地通讯地址河南省洛阳市洛龙区开元大道 河南科技大学新校区 嘉园10#606邮政编码471000住宅电话合作者情况姓 名性别年龄学历所在单位樊卓女21在读本科河南科技大学艺术设计学院资 格 认定学院学籍管理部门意见 是否为2011年7月1日前正式注册在校的全日制非成人教育、非在职的各类高等院校中国学生(含专科生、本科生和研究生)。是 否若是,其学号为: 年 月 日学院负责人或导师意见 本作品是否为课外学术科技或社会实践活动成果 是 否 负责人签名: 年 月 日B3申报作品情况(科技发明制作)说明:1必须由申报者本人填写;2本部分中的科研管理部门签章视为对申报者所填内容的确认; 3本表必须附有研究报告,并提供图表、曲线、试验数据、 原理结构图、外观图(照片),也可附鉴定证书和应用证书; 4作品分类请按照作品发明点或创新点所在类别填报。作品全称可拓学和语用学相关理论在信息检索系统中的应用作品分类(B)A机械与控制(包括机械、仪器仪表、自动化控 制、工程、交通、建筑等) B信息技术(包括计算机、电信、通讯、电子等) C数理(包括数学、物理、地球与空间科学等) D生命科学(包括生物、农学、药学、医学、健 康、卫生、食品等) E能源化工(包括能源、材料、石油、化学、化 工、生态、环保等)作品设计、发明的目的和基本思路,创新点,技术关键和主要技术指标随着计算机技术与网络信息资源的飞速发展,人们通过网络获取所需信息已成为日常工作和生活不可缺少的部分。但是在很多情况下,目前的搜索引擎和数据库系统所能给用户提供的检索结果太过粗糙,无法满足用户对信息准确度方面的需求。造成这种令人遗憾的局面的原因之一是目前搜索引擎和数据库系统智能化程度较低,无法支持查询用户在查询界面输入的以自然语言表述的精确检索要求。让计算机理解查询用户以自然语言表述的精确检索要求并设计出新的检索软件系统从而改善检索结果的准确度是本课题的研究目的。计算机所能识别的语言信息模式与人所能识别的语言信息模式是不同的。要想让计算机理解人类的自然语言,必须对自然语言进行形式化处理。自然语言比人们原先想象的要复杂得多。人们的言语行为是在句法语义语用的相互作用下进行的,决不是仅仅依靠孤立的语法和语义构建的。目前语用学在自然语言处理领域的地位日益上升。语用学的合成推理会话推理理性原则等理论也可应用于自然语言处理的人工智能模式的设计。 但是由于语用学理论应用于自然语言处理的人工智能模式的设计往往和语言形式化密不可分,有一定的抽象性,搞纯语言研究的人员便望而止步,使得这方面的研究还很欠缺,有待加强力度。本课题的初衷就是加入这方面的研究行列并有望在这方面作出自己应有的贡献。自然语言的理解与形式化处理是当今语言学及计算机人工智能领域人们热衷的研究课题。目前从事形式语义学研究的学者们用谓词逻辑、模态逻辑、内涵逻辑等理论对自然语言进行形式化处理。在量词、时态、情态等的形式化方面他们已取得了很大的成绩,在处理词与词、句子与句子关系的形式化方面也有其自己的特点,但真正与软件设计接轨还有不小的差距。本课题抛开目前人们通常使用的自然语言形式化处理的方法-用形式语义学理论描述自然语言,大胆使用可拓学理论的事元模型和物元模型对自然语言进行描述,这种大胆的尝试目前鲜有人做因为可拓学是1983年由中国人蔡文研究员创立的一门新兴学科。可拓学是用形式化模型研究事物拓展的可能性和开拓创新的规律与方法,它是一门用来解决矛盾问题的科学。当今可拓学理论在中国及世界上方兴未艾,主要开始应用于控制与检测自动化系统、智能机器人设计智能机器人设计及经济管理决策的分析等方面,但可拓学理论应用于自然语言理解与形式化处理以及信息检索系统软件制作方面还几乎无人在做。本课题从人们日常用来表达信息查询意图的自然语言语料的收集入手,利用可拓学基元模型、语用学理论和数学中的集合的概念建构了人们日常用于信息检索的自然语言的语境形式化模型,描述了自然语言中词与词、句子与句子的关系, 在此基础上建立了查询语句形式化泛式模型。这个查询语句泛式模型不仅可以对人们日常使用的信息检索语言进行形式化描述而且还可以为建构其他功能的自然语言的形式化模型提供范例和模式。本课题主要有两个创新之处。第一,本课题在自然语言理解与形式化处理方面进行了大胆的尝试并取得了突破性进展;第二,我们根据已经建立的查询语句形式化泛式模型以及所收集的语料设计了一个新的信息检索软件系统,此软件可以较大幅度提高信息检索结果的准确度。作品的科学性先进性(必须说明与现有技术相比、该作品是否具有突出的实质性技术特点和显著进步。请提供技术性分析说明和参考文献资料)计算机所能识别的语言信息模式与人所能识别的语言信息模式是不同的。要想让计算机理解人类的自然语言,必须对自然语言进行形式化处理。自然语言的理解与形式化处理是当今语言学及计算机人工智能领域人们热衷的研究课题。目前从事形式语义学研究的学者们用谓词逻辑、模态逻辑、内涵逻辑等理论对自然语言进行形式化处理。在量词、时态、情态等的形式化方面他们已取得了很大的成绩,在处理词与词、句子与句子关系的形式化方面也有其自己的特点,但真正与软件设计接轨还有不小的差距。本课题利用可拓学的基元模型、语用学理论及数学中集合的概念建构了人们日常用于信息检索的自然语言的语境形式化模型,描述了自然语言中词与词、句子与句子的关系, 在此基础上建立了查询语句形式化泛式模型。这个查询语句泛式模型不仅可以对人们日常使用的信息检索语言进行形式化描述而且还可以为建构其他功能的语言形式化模型提供了范例和模式。更为可喜的是本课题根据已经建立的查询语句形式化泛式模型以及所收集的语料设计了一个新的信息检索软件系统。此软件可广泛应用于人们的日常工作和生活,可以较大幅度提高信息检索结果的准确度。本课题在研期间使用的参考文献资料如下:1蔡 文.物元模型及其应用M.科学技术文献出版社,1994.2蔡 文,孙弘安,杨益,陈巨龙.从物元分析到可拓学M.科学技术文献出版社,1995.3董振东,董强.知网和汉语研究J.当代语言学,2004.4姜望琪.当代语用学M.北京大学出版社,2003.5李晶. Visual Basic 6.0程序设计实用教程M. 哈尔滨工业大学出版社, 2008.6佟晓筠,宋国龙.中文分词及词性标注一体化模型研究计算机科学, 2007,9.7赵显荣,梁大周. 试论Common Lisp语言的特色J.计算机工程与应用, 1989,7.8(美)扎克著,张云鹏等译. Visual Basic 6.0程序设计M.电子工业出版社,2007.9钟义信.知识学:信息 - 知识 - 策略 - 行为的统一理论A.中国人工智能进展2003C.电子工业出版社,2003.10 Glynn Winskel. The formal Semantics of Programming Languages M. MIT Press, 1993.11John C. Mitchell. Foundations for Programming LanguagesM. MIT Press, 1996.作品在何时、何地、何种机构举行的评审、鉴定、评比、展示等活动中获奖及鉴定结果作品所处阶 段(B)A实验室阶段 B中试阶段 C生产阶段D (自填)技术转让方式作品可展示的形 式 实物、产品 模型 图纸 磁盘 现场演示 图片 录像 样品使用说明及该作品的技术特点和优势,提供该作品的适应范围及推广前景的技术性说明及市场分析和经济效益预测本课题所设计的信息检索系统操作简便。查询用户只需在查询界面的主语项、谓语项、宾语项、时间项、地点项等输入表达检索要求的文字后,点击“造句”,查询界面的相应位置就会显示对应的句子,很显然该句子以自然语言的形式较精确地表达了查询用户的检索要求。句子生成后,查询用户点击“用百度搜索”或“用谷歌搜索”,检索结果就显示出来。检索结果来自百度和谷歌网站,因为我们设计的这个系统目前暂且只与这两个网站相连。本课题根据已经建立的查询语句形式化泛式模型以及收集的语料所设计的新的信息检索系统可用于人们在日常生活和工作中的各种信息查询,并能较大幅度地提高信息检索结果的准确度,从而大大节省人们用于信息查询的时间,因而具有较好的经济效益和社会效益,应该尽快推广应用。但是由于目前绝大部分数据库中的文献是以主题、题名、作者名以及关键词等编排,与本课题所设计的信息检索系统软件并不完全配套,而该查询软件系统必须与互联网上的数据库连接才可工作,因此这个新的查询软件系统在为用户提供准确度良好的信息检索结果的优势目前还不明显。为了大范围较大幅度地提高信息检索结果的准确度,必须创建改进与该查询软件系统匹配的数据库,才能使该软件系统发挥真正的经济效益。专利申报情况提出专利申报 申报号 申报日期 年 月 日已获专利权批准 批准号 批准日期 年 月 日 未提出专利申请科研管理部门签 章 年 月 日C.当前国内外同类课题研究水平概述 说明:1.申报者可根据作品类别和情况填写; 2.填写此栏有助于评审。由于计算机所能识别的语言信息模式与人所能识别的语言信息模式是不同的,所以要想让计算机理解人类的自然语言,就必须对自然语言进行形式化处理,即 “先建立一个符号系统,规定合法符号串如何表示自然语言中的意义,确立符号连接成合法序列的规则以说明这些符号可以进行一些什么样的数理逻辑演算”。自然语言的理解与形式化处理是当今语言学及计算机人工智能领域人们热衷的研究课题。目前从事形式语义学研究的学者们用谓词逻辑、模态逻辑、内涵逻辑等理论对自然语言进行形式化处理。在量词、时态、情态等的形式化方面他们已取得了很大的成绩,在处理词与词、句子与句子关系的形式化方面也有其自己的特点,但真正与软件设计接轨还有不小的差距。本课题抛开目前人们通常使用的自然语言形式化处理的方法-用形式语义学理论描述自然语言,大胆使用可拓学理论的事元模型和物元模型对自然语言进行描述,这种大胆的尝试目前鲜有人做。这是因为可拓学是1983年由中国人蔡文研究员创立的一门新兴学科,它是一种用形式化模型研究事物拓展的可能性和开拓创新的规律与方法,同时也是一门用来解决矛盾问题的科学。当今可拓学理论在中国及世界上方兴未艾,主要开始应用于控制与检测自动化系统、智能机器人设计智能机器人设计及经济管理决策的分析等方面,但将可拓学理论应用于自然语言理解与形式化处理以及信息检索系统软件制作方面还几乎无人在做。D.推荐者情况及对作品的说明说明:1由推荐者本人填写; 2推荐者必须具有高级专业技术职称,并是与申报作品 相同或相关领域的专家学者或专业技术人员(教研组 集体推荐亦可); 3推荐者填写此部分,即视为同意推荐; 4推荐者所在单位签章仅被视为对推荐者身份的确认。推荐者情 况姓 名陈红琳性别女年龄43职称副教授工作单位河南科技大学外国语学院通讯地址河南科技大学 外国语学院 大学英语一教研室邮政编码471003单位电话64231483住宅电荐者所在单位签章(签章) 年 月 日请对申报者申报情况的真实性作出阐述情况属实,支持申报。 请对作品的意义、技术水平、适用范围及推广前景作出您的评价自然语言的理解与形式化处理是当今语言学及计算机人工智能领域为人们所热衷研究的课题。但是由于该领域的研究具有相当定的抽象性,这就使搞纯语言研究的人员望而止步,导致这方面的研究还很欠缺。因而申报者所研究的课题敢于涉足该领域的探索,无疑是十分可贵的。该课题抛开目前人们常用的自然语言形式化处理的方法用形式语义学理论描述自然语言,转而大胆地使用可拓学的基元模型、语用学理论及数学中集合的概念的来对自然语言进行形式化处理,并根据已经建立的查询语句形式化泛式模型和所收集的语料设计出一个新的信息检索软件系统。可以说,该课题在自然语言形式化处理以及提高网络信息检索技术方面做出了大胆的尝试和令人惊讶的成绩。它不仅可以为建构其他功能的语言形式化模型提供范例和模式,其所设计出的信息检索软件还可以较大幅度地提高信息检索结果的准确度,从而大大节省人们用于信息查询方面的时间,具有较好的经济效益和社会效益,应该尽快推广应用。其它说明推荐者情况姓 名张喆性别女年龄38职称副教授工作单位河南科技大学外国语学院通讯地址河南科技大学 外国语学院 副院长办公室邮编471000单位电话64275851住宅电荐者所在单位签章 签章日期 年 月 日 请对申报者申报情况的真实性作出阐述情况属实,赞成申报。 请对作品的意义、技术水平、适用范围及推广前景作出您的评价该作品不仅在理论上大胆地使用了可拓学的基元模型、语用学理论及数学中集合的概念来形式化处理自然语言,更是创造性地运用此理论研
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电梯轿厢租赁协议书模板
- 驳回经纪合同解除协议书
- 附条件与附期限合同范本
- 签劳动协议不签劳动合同
- 浙江电商管理咨询协议书
- 机械厂员工外包合同协议
- 瓷砖维修质保协议书范本
- 法人代表转让协议协议书
- 空置楼房拆除补偿协议书
- 离心加湿器采购合同协议
- 劳务派遣与服务协议
- 2025年新修订治安管理处罚法课件
- 消费者权益保护培训课件
- DB11T 2454-2025 职业健康检查质量控制规范 生物样本化学物质检测
- 贸易公司员工职业操守行为准则制度
- 电气安全基础知识安全培训
- 部门保密培训课件
- 福建省南平市2024-2025学年八年级下学期期末考试数学试卷(含答案)
- 工厂绩效计件方案(3篇)
- 慢性阻塞性肺疾病急性加重(AECOPD)
- 尿路感染多重耐药诊疗与管理
评论
0/150
提交评论