




已阅读5页,还剩71页未读, 继续免费阅读
(计算机应用技术专业论文)面向远程教育的自动答疑系统设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着网络的普及与快速应用的发展,远程教育成为当前教育领域一个十分热 门的研究方向,由于远程教育无地区限制、无师资及场所限制,可以预见,远程 教育将成为教育模式中的重要一环,但从国内来看,与远程教育相关的相应配置 应用仍处于较为初级的阶段,从很大程度上影响了远程教育的发展。 1 9 9 9 年国家教委制订了远程教育的规范,远程教育已经从个体化向工业化、 快捷化、多元化的方向发展。国家教委指出远程教育分为教学资源与支撑工具两 个大的分类,教学资源是远程教学的基础,支撑工具是教育中不可缺少的学习工 具。支撑工具包括课件制作工具、师生交流、答疑系统、网上作业系统、网上自 测系统、远程考试系统、教育点播系统等。要建立一个完整的远程教育,就要对 支撑工具进行深入的研究。 支撑工具中的答疑系统是远程教育中的一个重要组成部分。它是用以解决远 程教育教学中,学生通过相应的手段,自动获得所需答案为目的的计算机应用系 统。但是目前的绝大部分答疑系统只是一个简单的数据库检索系统,或者是通过 b b s ,电子邮件、n e t m e e t i n g 进行的实时答疑系统。本文针对日前答疑系统的现状, 重点讨论对个面向远程教育环境下的自动答疑系统的设计与实现,分别讨论了 答疑系统中的分词技术、知识库的分类,结合中文检索中常用的扩展查询技术, 提出了针对答疑系统的扩展查询的应用。通过分词技术,实现了基于自然语言的 答疑效果,并能结合原有的实时答疑技术,真正的实现自动答疑和人工答疑的有 机结合;通过对知识库的特点分析,优化了答疑系统的知识分类,从而达到了快 速定位的效果,提高了查询的速度;提出了扩展查询在答疑系统中的应用,从某 个角度解决了现在答疑系统的智能化的要求。 关键字:远程教育:自动答疑系统:分词技术:模糊匹配:扩展查询 华南理工大学t 程硕十学位论文 a b s t r a c t a l o n gw i t ht h en e t w o r k sp r e v a l e n c ea n dt h ed e v e l o p m e n to fr a d ( r a p i d a p p l i c a t i o nd e v e o p m e n t ) ,d i s t a n c ee d u c a t i o nh a sb e e nb e c o m in go n eo fv er y p o p u l a rr e s e a r c hd i r e c t i o n si np r e s e n te d u c a t i o nr e a l m b e c a u s ed i s t a n c e e d u c a t i o nn o n et h er e g i o n1 i m i t i n g ,n o n et e a c h e r sa n dp l a c ei i m i t i n g ,i t c a nb e ef o r e s e e n ,t h ed i s t a n c ee d u c a t i o nw i l lb e c o m ea ni m p o r t a n tk e yt o c o n s t r u e tt h er ( n go fc u r r e n te d u c a t i o nm o d e u n f o r t u n a t e l v ,s e e nf r o m d o m e s t i c ,t h ec o r r e s p o n d n gc o n f i g u r a t i o na s s o c i a t e dw i t hd i s t a n c e e d u c a t i o ni ss t i l li nv e r yp r i m a r ys t a g e i tw i1 ih a v et oa f f e c tt h e d e v e lo p m e n to fd i s t a n c ee d u c a t i o ni nag r e a tm e a s u r e s i n e ec r i t e r i o no fd is t a n c ee d u c a t i o ni se s t a b l i s h e db yt h en a t i o n a l m i n i s t r yo fe d u c a t i o n ,d is t a n c ee d u c a t i o nd e v e l o p st ot o w a r d s i n d u s t r i a l i z a t i o n ,c h a r a c t e r i s t i c ,c e l e r i t ya n dm u l t ie l e m e n t s d i s t a n c e e d u c a t i o nh a st w op a r t s o n ei st h er e s o u r c eo fe d u c a t i o n ,a n dt h eo t h e r iss u p p o r t i n gt o o i s t h er e s o u r c eo fe d u c a t i o nist h ef o u n d a t jo no fd is t a n c e e d u c a t i o n ,a n ds u p p o r t i n st o o l sjsi n d is p e n s a b ee d u c a t i o nt o o l so fm a k i n g c o u r s e w a r e ,a n s w e r i n gs y s t e m ,t h ec o m m u n i c a t i o ns y s t e mb e t w e e nt e a c h e r s a n ds t u d e n t s ,e x e r c i s es y s t e mo nn e t ,d i s t a n c ee x a m i n a t i o ns y s t e ma n d e d u c a t i o no nd e m a n d ,e t c t ob u i l da ni n t e g r a t e dd i s t a n c ee d u c a t i o ns y s t e m , t h es u p p o r t i n gt o o l ss h o u l db ei n v e s t i g a t e dd e e p l y o nt h eb a s i so ft h ea p p li c a t i o na c t u a l i t yo fa n s w e r s y s t e m isa n i m p o r t a n c ep a r to fd i s t a n c ee d u c a t i o ns y s t e m ,w h i c hi sac o m p u t e rs y s t e m , u s e di nd i s t a n c ee d u c a t i o ns y s t e m ,t oh e l ps t u d e n t sa u t o m a t i c a l l y a c q u is i t i o na n s w e f ss u i t e df o rt h e i rq u e s t i o nb yc o r r e s p o n d i n gm e a s u r e s , b u tm o s to fa u t o m a t i ca n s w e rs y s t e mi sp r o b a b l yo n l ya s i m p l ed a t a b a s e , o risi m p l e m e n t e db yu s i n ge m a i l ,b b so rs u c hr e a l t i m ec o m m u n i c a t i o nt 0 0 1 s a sn e t m e e tin g t h eo r i g i n a li sa i m e da t t oa n s w e rq u e s t i o r sa tt h em o m e n t t h es y s t o mp r e s e n ts il u alio n ,a n ds t r e s st a l k sa b o u ta d j u s t i n ga n a u t o m a t eb a s eo nb e l o wt h e1 o n g d i s t a n c ee d u c a t i o ne n v i r o n m e n tt oa n s w e r q u e s t i o n ss y s t e md e s i g nt o g e t h e rw jl hr e a l i z a t i o n a n dt a l k e da b o u t p a r t i c i p l et e c h n i q u ei nt h es y s t e mt h ea n s w e r e dq u e s t i o n sa n dk n o w l e d g e b a s ec l a s s i f i c a t i o ns e p a r a t e l y ,a n du n i t et h ee x t e n s jo ni nc o m m o nu s ei n a b s t r a c t t h ec h i n e s el a n g u a g er e t r i e v a li n q u i r i n ga b o u tt h et e c h n i q u e ,a n dp r o p o s e b e i n ga i m e da tt h ea p p i c a t , i o i lt h a tt h es y s t e me x t e n s i o i la n s w e r e dq u e s t i o t i s w a si n q u ir e da b o u t b ym e a r l so ft h en a t u r a ll a n g u a g ep e t r t i c i p let e c h n i q u e , a c h i e y i n gt oh a s e do nn a t u r a ll a n g u a g ea f i s w e i ir i gq u e s t i o n se f f e c t a n d b ea b l et ou n i t eo r i g i n a lr e a lt i m e l , n s w e t sq u e s t i o n st h et e c h n i q u e , o r g a n i cc o m b i n a t i o r lw i t ha r t i f i c i a la n s w e r e dq u e s t i o f i s i sa n s w e f e c l q u e s t i o n sir l t h et r u er e a l i z a t i o nv o l u n t a r i y :b ym e a n so ft h e d is t i n g u i s h i n gf e a t u r ea n a l y s i s o p t i m i z e dt of = t , r l s w e rq u e s t i o n st h a ts y s t e m n f o r m a t s p e e d il y a p p l i c a t o f iisc l a s s i f i e d t h e r e b ya t t a l n i n ge f f e c tw h i c h1o c a t e d a n dl i f t e di n q u i r yv e l o c i t yt 0t h ek n o w l e d g eb a s e :p r o p o s et h e 0 1 3 t h a tt h ee x t e n s i o nw e t si n q u i r e da b o u tt ob e1 i v i n gi i 1t h es y s t e m a n s w e r e dq u e s t i o n s a n dt h r o u g hs o m oa n g l e sr e s o l v e dt oa t r l s w e rq u e s t i o n s s y s t e mi n t e l l i g e n td e m a n dn o w i ( e y w o r i ) $ :d i s t a n c ee d u c a t i o n ,a u t o a n s w e rs y s t e m ,o b s c u r em a t c h i n g p a r t i c i p l et e c h n i q u e q u e r ye x p a , n s i o n 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究 所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包 含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出 重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到 本声明的法律后果由本人承担。 作者签名:窜寝孺 日期:a 叩r 年箩月吾p 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,刚 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权华南理:【:大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制 手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于 不保密口。 ( 请在以上相应方框内打“”) 作者签名: 导师签名: 日睬硒 砂琵 日期:占多哆年歹月口日 日期:枷年j7 月;。日 第一章绪论 1 1 远程教育发展概况 第一章绪论 美国于1 9 9 9 年出版的远程教育指导一书指出:现代远程教育是指“不在 同一教室的教师和学生通过音频、视频和计算机技术等进行授课和交流的过程。 它不受时间和空间的限制,学生】丁以集中在远方的同一教室进行学刊,也可以在 家里通过基于网络的虚拟环境进行学习和交流”。 远程教育经过函授教育、广播电视教育和现代远程教育i 个历史阶段。现代 远程教育是随着现代信息技术的发展而产生的一种新型教育方式。计算机技术、 多媒体技术、通信技术的发展,特别是因特网( i n t e r n e t ) 的迅猛发展,使远程 教育的手段有了质的飞跃,成为高新技术条件下的远程教育。现代远程教育是以 现代远程教育手段为主,容面授、函授和自学等教学形式,多种媒体优化、有机 组合的教育方式。现代远程教育町以有效地发挥各种教育资源的优势,可以为各 类教育提高教育质量提供有力支持,可以为各种社会成员学习提供方便的广泛的 教育服务。 现代远程教育手段的主要特点是教师和学牛能够跨越空问进行实时或非实时 的交_ 工。这也是现代远程教育与传统教育方式最显著的区别,也是它的优势所在。 现代远程教育手段有以下优点:教师的讲授和学生的学习町以在不同地点同时进 行,师牛之间可以进行充分的交流;学牛能够根据自己的需要自主安排学习时间 和地点,自由选择学爿内容,自行安排学习计划,随时提出学习中的问题并能及 时地得到解答;现代远程教育手段有利于个体化学习。它以学生自学为主,充分 发挥学生自丰学习的主动性、积极性及创造性;现代远程教育手段可以为学生提 供优质的教学服务。教师可以及时地了解学生的学习进度和对课程的理解程度, 解答学生所提出的问题。现代远程教育给教与学的概念赋予了新的内涵,将给教 育带来深刻的变革,推动教育观念、教育思想、教育模式和教学方法的更新。当 然,现代远程教育手段并不是种万能的教f 彳方式,它不可能完全取代面授,也 不一定适用于所有的教育层次和课程。它要求学生有较强的自学能力,并能够初 步使用计算机。在目前技术手段的支持下,现代远程教育手段比较适合于知识的 传授,对职业技能培训有很大的难度,现代远程教育手段更适宜于开展继续教育 课程。利用计算机互联网络进行远程教育现已受到了许多国家和人们的关注,我 国正在加紧建设和发展。 远程教育中的网络学校( 教育) 其实就是建立虚拟学校,是以学生为主体的自 主学习环境;它是一种新型的、丌放式的没有围墙的学校。它与传统广播电视教 华南理丁大学t 程硕十学位论文 育的不同之处在于,人们可以在计算机网络的环境下,不受时问和空问的限制, 完成“随时、随地的交互式”教学活动,使人们接受方便、高效的教育,教育质 量得到明显提高。在工业经济时代,教育的模式是学生走进教室,而在信息经济 时代,教育的模式是教室通向学生。随着现代远程教育发展,未来的教育思想、 教育内容、教育模式和教育结构都将发生重大变化。发展远程教育,可以为更多 的人提供各级各类的受教育的机会。发展现代远程教育,能够有效地发挥现有各 种教育资源的优势,实现资源的合理配置,提高全民族的科学文化素质,足我国 经济、社会、文化发展的现实要求。 1 2 远程教育系统的答疑系统 对于网上学习,由于教师和学生在地理位置上的分离,没有了教师而对而的 解释和演绎,学习者必须进行自主学习。它要求学习者从听众变成索求者,进行 深入的思考,但到了百思不得其解时,及时的答疑和帮助则成了必不可少的内容。 这就要求网上教学系统能够及时解答学生的疑难问题,消除学生的学习障碍。答 疑是教学环境中不可缺少的一个重要教育环节,动态的、智能化的答疑工具是交 互式教育刚站必不可少的一个重要组成部分。基于网络的远程答疑系统的优势表 现如卜 ”1 1 、改善教学效果 通过学生在课程学刊过程巾所反映和提出的其同问题,教师以及课件编制者 等远程教育过程中涉及的各管理和参与者,能够藉此反馈直接调整教学的内容、 进度,改善教学方式等,从而提高教学效果。 2 、提高教学效率 通过在答疑系统中对一些简单的公共的问题和概念提供详细的解答和解释, 可以避免教学中的大量时间花费在基本概念的解释上,从而可以投入进行更深入 的讨论和交流等。 3 、丰富教学资源 学习者在学习过程中产生的问题以及教师等的解答使得知识和信息库不断扩 充,经过一定时间的积累,成为可以重复利用的宝贵资源。其它的学习者可以方 便快捷地从以往学生的问题中取得收获,教师也能够利用这些资源来有针对性的 制定教学内容和进度等。 4 、优化教育教学环境 远程教育系统中,整个系统的设计、教学方式的制定也直接影响了教学效果。 根据学习者的反馈可以调整它的结构,改善现有系统的不足。作为远程教育的一 个重要辅助系统,答疑系统可以直接与课程学习、考试等系统结合在起,成为 2 第一章绪论 其中不可分割的一部分,也可以在实时的教学模式中使用,作为课后学生答疑、 师生交流或教师获得学生反馈、衡量教学效果的一个配套系统。 目前,国内远程教学系统中答疑系统主要分为以下三个类型: 第一类,没有专门的答疑部分,师生的信息交流仅仅限于电子邮件、留言板 或聊天室等简单的方式。这一类远程教育系统可以看成是电视大学的网络版,没 有发挥网络教学的优势。 第二类,具有初步答疑功能的答疑系统,提供了类似于b b s 形式的讨论、在 老师主持下的以聊天方式进行的模拟课堂。供师生进行实时或非实时答疑讨论。 属于这类系统的如北京大学现代远程教育系统”3 、北京理工大学现代远程教育学 院“。的远程教育系统和华南师范大学网络教育学院”1 的远程教育系统等。 以北京大学现代远程教育系统为例,该答疑系统是典型的以b b s 的形式提供 文字非实时和语音实时答疑的系统。 图卜1 北京大学现代远程教育网上答疑的界面”- f i g 1 1t h ei n t e r f a c eo fl h ec o n t e m p o r a r yl o n gr a n g ee d u e a t i o no f b e i j i n gu n i v e r s i t yq u e s t i o n 8a n s w e r ss y s t e m ”1 第三类,具备了一定能力的答疑系统。该类系统大多数采用的是搜索引擎, 即所谓的关键词查询方式。通过用户自己去输入所消的“关键词”,然后返回一 大堆与问题相关或不相关的材料,最后用户自己进行筛选吸收。 典型代表是上海交通大学远程教育中心没计开发的a n s w e rw e b 自动答疑系统。 a n s w e rw e b 自动答疑系统是个动态的问题及答案的数据库,包括问题查询、用 户提问、问题和解答管理、数据统计分析旧个模块。a n s w e rw e b 自动答疑系统提 华南理t 大学工程硕士学位论文 供了三种问题查询方式,即对常见的问题和解答进行查询、按照章节和知识点分 类查询以及根据关键词进行查询。系统学生端主要采用了以下流程:系统在接收到 学生提交的问题时,首先通过关键词拆分、匹配,在系统问题库中查找出相关问 题集,同时根据关键词,系统自动为该问题划分章节,关联知识点;如果学生在 此问题集中找到某个问题及其解答回答了他的疑问,系统则被认为完成了自动答 疑的过程;如果学生并没有找到他所满意的答案,系统则将问题提交问题库并同 时自动将问题以em a i l 形式题转给教师”,的问题和解答将被增加到系统库中,随 着数据库中用户的询问和系统的解答越来越多,系统中的有用资源也就越来越多。 以上的三种类型的不足:第一种方式对用户存在的问题不能及时解答,对同 一问题多次回答;第二种方式要求有限数目的教师全天候实时应答人量学生的问 题;第三种方式应该看为一种辅助查询系统,要求学生具备一定的查询技术背景, 显然不能称之为完全的答疑系统,只是一种辅助查询系统,他类似于h t t p :w w w g o o g l e c o m ,h t t p :e p k u e d u e n 等搜索引擎,他们对使用者有一定的要求, 至少您必须对所要查询的问题的“关键字”有所确定。如果您对所提问题了解不 多,那可能您输入的“关键字”得不到有用的匹配,这时h t t p :w w w g o 0 9 1e c o m 、 h t t p :e p k u e d u c n 会告诉您“没有找到符合您要求的网页”并要求您减少关 键字的数量或改变提问的方式。在某种程度上来说,类似于h t t p :w w w g o o g l e c o m 、h t t p :e p k u e d u c n 等门户型搜索引擎的答疑系统不能够担负远程教育的 自动答疑功能。而后一种的局限性也比较强,首先要求学生询问的教师必须在线, 其次学生提问重复的概率非常高,使得答疑教师的工作重复率非常高。可见,国 内大部分教育人员对网,卜- 答疑的认识还局限在传统教学中的人际交互的模式中, 回避了网络技术、人工智能等先进技术给答疑提供的强大支持。 1 3 国内外答疑系统的现状 整合了网络通信、人工智能等高新技术的基于网络的智能答疑系统使教育答疑 突破了答疑行为的时间、空间局限,并广泛扩展了问题解答的资源内容、资源呈 现形式和资源获取方式,提供了高效率高质量的学生与教育资源的交互,不但支 持了网络教学的顺利进行,而日成为传统课堂教学的有益补充。然而国内外智能 答疑系统发展的现状是真的发挥其优势,满足了教与学的需求? 带着问题李爽等 对国内外的智能答疑系统进行了调研。下面是他们基于调研对国内外智能答疑系 统的发展现状和特点进行比较,希望通过比较能够发现目前网上答疑系统的问题, 并借鉴国外好的经验探索建设我国网上智能答疑系统的方法。 4 第一章绪论 1 3 1国内网上答疑系统发展现状 在调研的过程中发现,有些教育网站中真正具有智能功能的答疑很少,大多数 有答疑系统的教育类网站采用电子邮件、留言板和b b s 聊天室等基于网络的人际 交互方式实现答疑。可见国内大部分教育人员对网上答疑的认识还局限在传统教 学中的人际交互的模式中,而忽视或者应该说回避了网络技术人工智能等先进技 术给答疑提供的强大支持。 1 系统的独立性 在对国内的网上答疑系统的调研过程中,我们发现国内具有答疑功能的独立平 台或系统非常少,大部分的答疑系统都嵌套在网络教学平台或系统之中。这与国 内前一段网络教学和学习平台建设热潮有一定关系。这类答疑系统所履行的主要 的功能是提供给学生就课程相关问题与教师或其它课程权威以及同伴进行交互的 环境。 2 系统的功能 国内网上智能答疑系统中的主要功能、包括答疑功能、问题查询和浏览功能、 用户信息和知识管理功能、系统统计功能,除此之外还包括了其它的附加功能, 如用户个性化定制、问题操练、问题解答评价等功能。 国内答疑功能主要是通过人工答疑和基于数据库的自动答疑两种方式来实现。 人工答疑通过电子邮件、网上异步讨论区和留言板、网上同步聊天室、网卜语音 会议等方式来实现。然而人j i :答疑中没有从结构上给用户设计更有益于深入探讨 问题的环境,结构比较松散讨论的内容很难控制。自动答疑是通过对知识库的自 动搜索实现的,无论提问者输入关键字或是自然语占短语或句子,系统都会根据 问题进行系统知识库的全文搜索,然后将与这个问题相关性较强的问题及其答案 反馈给提问者。然而蕞丁自然语言的答疑准确率和针对性埘比较差,会有很多与 问题中词语有关的信息被呈现出来,真正的答案需要用户自己来再次寻找。除了 提问用户还可以通过浏览已睁1 答问题列表解答问题,国内很多系统给用户设计了 多个属性查询已回答的问题。 系统的统计功能提供了与答疑情况有关的数据和信息的简单处理,然而统计对 象的选择缺乏对整个教学或学习系统的考虑,另外只提供了如频率统计这样的简 单统计,缺乏对原始数据的深层处理,在统计数据与教学系统其它子系统数据交 流方面也没有较好的渠道,这样统计功能对系统的改善意义就非常有限了。 总体而占,国内系统的功能较为全面和丰富,但许多功能质量较低,有些功 能的实用意义较小,而且操作性不强。 3 系统的智能性 华南理工大学工程硕士学位论文 日前国内答疑系统的智能性主要体现在低水平的机器对人类自然语言的理解, 自动的问题资源库检索和相关信息的反馈。然而利用自然语言进行查询的精确性 和有效性没有得到科学的证明,经验表明其查询准确性较低,此外反馈的答案针 对性和有效性也比较低。 4 系统的资源库 固内答疑系统寻求问题答案的资源库主要是基于课程章节组织的,这与国内答 疑系统大多是教学系统的子系统有关。系统将每章学生提出的常见问题和教师的 解答作为数据库的基本内容,有的系统将学科知识以章节为单位组织起来作为资 源库的基本内容( 如上海交通大学远程教育研究中心的网上答疑系统) ,有的系统 的资源库是基于课堂的常见问题而建设,有的两者合一。这种基于课程的资源库 结构在资源扩展时容易造成资源重复的现象。 国内网 :答疑系统的一个主要问题是系统的资源库内容不够丰富,比起浩瀚 的网络教学资源,网上答疑系统的资源非常有限,嵌入教学系统的答疑系统的资 源库和教学系统本身的资源库是割裂的。 1 3 2国外网上答疑系统发展现状 调研了国外网上教学平台和几家有名的提供el e a r n i n g 解决方案的公司的网 络学习平台,我们发现,国外教育网站中答疑的实现,主要通过各种网络人际交 互的手段和技术来实现当我们在g o o g l e 中输入q u e s t i o na n s w e r i n g 进行查询, 会发现许多专门的答疑网站这些答疑网站,涉及k 1 2 教育、大学教育和大众教育 等领域这其中有些答疑系统在智能化方面作的非常出色如a s kj e e v e s 公司a s k j e e v e sf o rk i d s 网上答疑系统”人工智能实验室b o r i sk a t z 博士组织开发的 s t a r ts y n t a c t i ca n a l y s i su s i n gr e v e r s jb let r a n s f o r m a t i o n 系统“1 。下面我 将对比国内的系统具体介绍这些系统的特点。 1 系统的独立性 国外出色的智能答疑系统,全部都是独立运行的系统它们不属于任何教学或学 习平台。这类系统所扮演的角色更像一个专业领域资源的提供者,提问者借助系 统回答他们的问题,不一定是某个完整的教学过程巾的一部分,他们通过寻求答 案可能是为了解决他们在相应学科的问题也可能仅仅是为了满足他们的好奇心, 或者是为了寻找作业或任务中需要的资源。 2 系统的功能 相比国内答疑系统的丰富功能而言,国外答疑系统的功能更加简洁。虽然主要 的功能与国内类似,但是所有的功能都是尉绕答疑功能而设计,功能设计重点突 出、设计精良。 6 第一章绪论 答疑功能的实现也是通过人工答疑和自动答疑共同实现人 :答疑的方式。与国 内差异在于国外的答疑系统中人工答疑的主要方式是电子邮件和信息板,很少有 讨论区或聊天室。 国外在自动答疑方面作的非常有特色。有的系统如a s kj e e v e sf o rk i d s 在提 问模块系统不但支持了自然语言提问,而且设计了问题的确认交互,通过这层交 互,系统能够更精确地理解用户的问题,为问题的准确解答提供了保障;在问题 呈现方面系统会基于问题的类型提供给用户较为简洁的答案,一般有关时间、人 物、地点概念等类型的问题,其答案的简洁性和正确性较高如向s t a r t 系统提问 “哪个国家拥有人口最多”系统只会反馈给你国家的名字,以及关于该国家人口 的详细介绍,而不是很多与“国家”和“人口”有关的信息。此外,很多解答语 言的表述上会也有差异;答案的来源不像国内系统那样只是系统自身建设资源库, 还会包括其它相关网站上的资源,因此答案虽然力求准确、简洁,但也具有丌放 性。 3 系统的智能性 围外系统的智能性也主要体现在人机理解的自然语言接n 和相应的问题查询 和反馈上,但是国外系统在基于自然语言的提问方而作的比国内更加准确和人性 化( 如带有问题确认的功能) ,主要原因是国外在问题处理部件增加了问题类型判 断以及增加了答案处理和解释部件,冈此不但保证了系统对问题的更准确地理解, 也使呈现的答案简明扼要。 4 系统的相关资源库 国外答疑系统的资源库的突出特点是拥有= f 富、高质量的内容,比如a s k j e e v e sf o rk i d s 系统的所有答案是来自数万计通过查询和研究确定的和问题有关 的其它网站链接( 主要的来源是y a h o o l i g a n s e d u c a t i o hw o c l d 和f e d e r a l e d u c a t i o nr e s c o u r c e s 三个网站) 这些网站资源是人为建设的,而并不是软件搜 索得到的,因此,每个答案链接都与问题相关。 国外系统的答案资源库不只包括知识库。还包括信息库这样答案中呈现的信息 可能是对问题的解答,也包括能够解答相关问题的网上资源的信息。 与系统的独立性相关的是和国内针对学科和课本的内容体系相比,国外系统答 案资源库的内容采用了内容更加丰富和广泛的主题式或专业领域式内容组织体 系。1 6 3 1 4 研究课题的提出 近年来,自动问答( q u e s t i o na n s w e r i n gt r a c k ) 在每年一度的文本信息检索 ( t r e c ) 会议上是最受关注的主题之一。它即能够让用户用自然语言句子提问,又 7 华南理t 大学丁程硕上学位论文 能够为用户返回一个简洁、准确的答案,而不是一些相关的网页。因此,自动问 答系统和传统的依靠关键字匹配的搜索引擎相比,能够更好地满足用户的检索需 求,更准确地找出用户所需的答案,具有方便、快捷、高效等特j _ 。远程教学中 的答疑系统与检索中的自动问答系统有很多相同之处,本文认为可以借用自动问 答系统的一些思想,结合远程教学的特点,开发一种适应丁远程教学的自动答疑 系统,应能很好地提高教师资源和答案资源的利用率。 教学的过程是“传道授业解惑”的过程,可见成功的教学“解惑”是关键,而 答疑系统在远程教育中就是扮演着“解惑”的角色。目前答疑系统采用的搜索引 擎,即所谓的关键词查询方式,通过学生自己输入关键词,返回一大堆与问题相 关或不相关的材料,最后学生自己进行选择,这样的搜索效果显示不理想,本文 对目前常规的答疑系统的模式上进行分析,从数据的分类、查询速度改善、查询 的扩展等方面对常规答疑系统进行改进,从而解决常规答疑系统的分词速度慢、 智能性低和自我调节差等问题。 1 5 论文的组织 第一章是绪论,主要分析了现代远程教育的发展趋势以及答疑系统在远程教育 中的作用,阐述了国内外远程教育系统中答疑系统的现状及其发展的方向,提出 了本文研究的方向:第二章是系统的总体设计,详述了系统设计的目标,系统的 需求分析,针对答疑系统的特性,对本答疑系统的主体结构以及系统各功能模块 进行了概括性的叙述;第三章讲述了本系统所用到了一些关键技术分词技术、分 类算法、文本表示、相似度和扩展查询算法的理论依据,并提出了本系统所采用 的方法;第四章涉及知识库的概念提取、概念之间的关系判定和本系统知识库的 构建方法说明;第五章系统的详细设计,把第章的总体设计进行细化,包括对 平台功能的分析设计和数据库设计等;第六章是系统主要模块的实现,详述了本 系统中的分词实现、检索的实现、查询扩展并对各页面进行介绍;最后是评价和 展望,总结了本系统的优点及不足,分析了未来答疑系统的发展方向。 第二章系统总体设汁 2 1 系统的目标 第二章系统总体设计 随着网络技术、现代教育技术的日新月异地发展,远程教育技术越来越受到 教育研究者的高度重视。在远程教学中,教师与谋堂在地理位置上的分离,没有 了教师面对面的解释和演示,及时的答疑和帮助则成了必不可少的内容,因此,答 疑系统是网卜教育平台的重要组成部分之一。答疑是一个智能适应性的知识库系 统,它分自动答疑与人工答疑、实时答疑与非实时答疑两大部份。在教学设计阶 段,教师将本学科最常见的疑难问题按一定的组织方式,存放到知识和信息库中, 当学生在遇到疑难问题时,通过网络远程提交问题的描述,系统将根据学生提交 的问题描述,对知识和信息库进行自动搜索,按照检索内容相关程度,将对该问 题或相关问题的解答呈现给学生。 目前,基于网络的远程教学模式”1 。主要集中在h y p e r t e x tw e b 和i n t e r a c t i v e w e b 两种应用形态上,通常是教学内容以课件形式存放在w e b 服务器或数据库服 务器卜,学员可在任意时问、任意地点通过浏览器独立地学习,如果学员有问题 需解答,可在网上通过聊天室、b b s 、n e t m e e t i n g 进行交流获得,或从教师建立 的答案库中找到答案,或通过电子邮件的形式从教师那里得到解答,有个别的远 程教育平台采用虚拟教室的形式,学员同教师在白板上交流( 学习时间不自由) 。 但上述答疑模式存在以下主要缺陷“ 1 、教师答疑工作量大。教师不仅要建立常见问题答案库,而且还要在网上 交流答疑或通过电予邮件答疑,这会花费教师大量的时间和精力,且往往是从事 重复性的劳动;如果学员数量大,必然有相当一部分学员的i 、u j 题得刁i 到解答。 2 、系统缺乏智能性。对于学员所提出的问题,必须有人的参与才能获得解 答,而上l 在相当多的时间里,不能得到及时、比较j f 确的回答。 3 、受传统的集中在教室上课、答疑模式的影响,不能充分体现计算机教学 的先进性、自适应性和科学性。 4 、系统往往只简单地给出参考答案,没有进一步分析学员在哪些知识点上欠 功夫,也不能给出合理的学划策略方面的建议。 鉴于这种情况,凶此本文所设计答疑系统的总目标是系统自动理解用户问题 文本,给出办为清晰的答案,应具有以下特征: 1 、限定领域 远程教育中,教学科目繁多,建立适应和和课程的答疑系统工作量巨大,很难 实现。本文只针对某一具体的专业课程建立自动答疑系统。专业课知识点相对固 9 华南理t 大学t 程硕十学位论文 定,变化不大,所以问题库相对稳定,容易实现。本系统是以v b 程序设计这门计 算机编程语言课为基础建立的答疑系统。 2 、智能性 本文的智能性主要指系统对自然语言的理解和用户问题的提供的扩展查询。 用户输入问题文本后,系统利用自然语言处理技术,进行分词、特征提取、加权 等步骤,把自然语言转化成计算机能够处理的数据,与资料库中的答案进行匹配, 并将分解的数据进行按规则的扩展,最后返回与问题文本相关的一组答案,并根 据相似度的高低,进行有序的排列,同时还提供了与该问题相关的问题的查询选 择。 3 、快速定位 本文自动答疑系统主要应用于远程教学中,因此对系统的执行效率要求较高。 分词和相似度匹配运算运用了较多的乘除运算,极大的加大了系统运算量。另外, 系统答案库随时问的推移,会逐渐变得庞大,如果简单的采用问题与答案的顺序 匹配策略,势必降低系统的效率。本文在系统实现过程中,考虑这一现实问题, 采用索引和_ 级检索策略,使问题和答案能够快速定位,提高系统效率。 2 2 需求分析 根据远程教育的教学要求和自动答疑系统的实现模型,作者对系统做了详细的 需求分析。主要包括功能需求和性能需求。 2 2 1 功能需求 自动答疑系统基本应该具有自然语言处理和查询两大功能,为了让用户更好 的、及时的获得所查询的答案,本系统还考虑了讨论区和电子邮件功能作为自动 答疑的功能有利补充。 1 、运行方式 从第章中对国内外答疑系统的比较来看,主要的区别在丁运行方式的不同。 目前答疑系统的运行方式大致可以分为两种,即嵌套方式和独立运行方式。运行 方式是进行系统设计的基础,其决定系统资源库的设计、系统功能的设计、答疑 方式的设计等。因此,采取什么样的运行方式是进行系统设计开发的第一步。 本系统的定位是面向远程教育的,系统工程的设计初衷是独立运行的系统有完 善的功能,但也可以作为远程教育平台的其中一个功能模块。 2 、提问解答方式 1 0 第二章系统总体设计 以答疑主体是人还是机器来划分,远程答疑系统功能的实现主要是通过人工答 疑和自动答疑两种方式。人工答疑是通过电子邮件、b b s 、网上同步聊天室、语音 答疑等方式来实现。这种方式最大的优点是可以进行个别化答疑,但人工答疑中 知识的组织小够系统,结构比较松散,讨论的内容难以控制,因此,很难对一个 主题进行深入讨论和探究,也就很难获得对问题的准确理解和把握。自动答疑则 是通过对数据库的自动搜索实现的。系统根据提问者输入的关键词自然语言处理 功能或自然语言短语或句子进行系统数据库的全文搜索,然后将与这个问题相关 性较强的问题及其答案呈现出来。自动答疑提供了学习者与教育资源的高效率、 高质量的交互,但目前答疑的准确率和针对性比较差。 目前,国内很多网上教育平台或教育网站都开设了网络答疑,但答疑方式比较 单一。大多数答疑系统仅仅提供人工答疑,即采用电子邮件、留言板、b b s 、聊天 室等基于网络的人际交互方式实现答疑,而提供智能化的自动答疑功能的系统非 常少。 然而,对于网络答疑来说,并不能仅仅局限于传统教学中的人际交互的模式, 当今的网络技术、计算机技术甚至是人工智能等先进技术给人机交互式的答疑提 供了强大的支持。 本系统的方式是以a 动答疑为主,人工答疑为辅,两者有机结合,以达到快速、 准确解答的目的。 3 、自然语言处理功能。 主要是指把用户语言问题文本转化为计算机能够处理的计算机能够识别的 组向量。原有的答疑系统基本上采用关键字查询的方法,这种系统对问题的关键 字要求比较高,对系统的提问方式要求有一定的技巧,也有可能要通过多次查询 才找到相关答案,本系统实现的是以自然语言提问为主,系统自动对自然语言进 行分解,变成一组计算机能识别的向量。 4 、查询功能 这一功能是a 动答疑系统的核心。计算机理解自然语言后,在资料库中进行检 索,返回与问题文本相关的组信息( 主要是为用户提供扩展查询使用) ,同时 也将分解出米的向量与知识库中的进行匹配后,返回给用户。其中匹配的算法设 计的好坏极大影响整个答疑系统最终效能。本系统采用综合相似度算法对词频相 似度和句_ 了语义相似度进行综合考虑,以达到较高的准确率,同时也要实现扩展 查询的功能。 5 、讨论区功能 讨论区功能是对自动答疑系统的补充,当用户问的问题知识库中不存在时,用 户u 。以通过进入讨论区参与提问和讨论,讨论区由教师或高年级的学生作为版辛, 即时解答学生的疑问。 1 1 华南理工大学工程硕上学位论文 6 、电子邮什功能 电子邮件功能是对自动答疑系统的另一补救措施,当查询的结果不满意或讨论 都不理想时,还可以通过电子邮件的方式来获得答案。 2 2 2 性能需求 自动答疑系统的性能主要从准确率和速度两个因素考虑。如果准确率太低,就 失去了设计答疑系统的意义,如果速度跟不 = 实时在线要求,就不能应用于远程 教学要求。准确性不同于设计开发者,系统普通用户对于答疑系统的要求更多地 表现在系统是否能给出令人满意的准确答案。准确率和针对性是衡量答疑系统性 能好坏的重要指标之一。在远程教育中,刚络课件、专业知识和信息库中的问题 及其答案等都扮演着教科书的角色,因此,无论足人工答疑还是自动答疑,无论 是实时答疑还是非实时答疑,无论采取何种方式旱现答案,都必须做到有针对性 地、准确地对问题进行解答。对于自动答疑而言,由于受到中文信息处理技术等 相关技术的制约,基于自然语言的答疑准确率比较低、针对性比较差,会有很多 与问题中词语有灭的信息被呈现出来,而真正的答
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年乡村振兴农村电子商务基础设施建设资金申请指南
- 分布式能源系统生物质能源应用2025年与生物质能发电技术专利布局研究报告
- 高校产学研合作技术转移与成果转化在海洋工程领域的应用研究报告
- 2025年工业互联网平台雾计算协同机制与智慧家居设备的协同发展报告
- 策略深度报告:关税博弈下的大类资产策略
- 公司开工第一课管理制度
- 办公室公司工作管理制度
- 晋钢员工宿舍管理制度
- 增值税发票合规管理制度
- 乡镇公共卫生院管理制度
- 2025年内蒙古能源集团煤电板块所属单位招聘笔试参考题库含答案解析
- 山东省菏泽市2023-2024学年高一下学期7月期末教学质量检测政治试卷(含答案)
- T/CI 312-2024风力发电机组塔架主体用高强钢焊接性评价方法
- 2025-2030中国汽车涂料行业市场现状供需分析及投资评估规划分析研究报告
- DBJ50T-147-2025 住宅电气设计标准
- 工程成本控制实例试题及答案
- Proe有限元分析在工程硕士课程中的应用课件
- 2024版国开电大法学本科《国际私法》在线形考(任务1至5)试题及答案
- 2025年下半年南京大数据集团限公司工作人员招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025年教师招聘考试教育综合知识复习资料
- 2024版压力容器设计审核机考题库(综合题)
评论
0/150
提交评论