




已阅读5页,还剩56页未读, 继续免费阅读
(计算机软件与理论专业论文)基于datamining的智能化、开放化远程教学环境.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于d a t am ini n g 的智能化、开放化远程教学环境研究 摘要 f 计算机网络技术的日益成熟为远程教育的发展带来了新的机遇。w e b 为非实 时的远程教育提供了一个优秀的平台,基于w e b 的远程教育因为其学习方式灵 活、客户端使用简单而得以广泛推广。国内外许多大学和研究机构都已开办了远 程教育站点,提供网上课程学习、答疑、考试等服务。但是却存在一个普遍的问 题:没有一套完备的远程教育教学管理模式,将课程、作业、答疑、考试、交流、 用户管理集为一体;各个子系统是独立的,联系少、可扩展性差、移植困难,离 实际的应用还相差甚远。要使远程教育既达到传统课堂教育的教学效果,又能充 分利用互联网的优势,就必须研究一个全新的远程教育模型。 同时,在站点上却积累了大量有用的教学信息,如用户的访问日志、注册信 息、答疑信息、考试成绩、作业情况、交流信息、学习进度等,没有被利用,造 成了资源的极大浪费,这时迫切需要种新的技术来充分利用这些有用信息,以 1 建立起一个智能化、个性化的远程教育环境。、从 本课题的主要研究内容概括为两个方面: 开放性远程教学体系结构的构建。构建一个具有一体化管理特性和可扩展性 的远程教学平台,在该教学平台上,通过采用总线式构建方式,各个功能子系统 在遵循一定标准定义的基础上,可以像组件一样方便地增删、修改。并以此作为 智能化实现的结构基础。 智能化监控评估模块的构建。采用d a t am i n i n g 和w e bm i n i n g 技术,充分 利用教学系统中积累的教学管理与教学行为信息,构建监控评估模块并以此作为 开放性教学平台的子系统智能地、主动地作用整个一体化教学环境中。 ,、 关键词:远程教莆数据挖掘,。面向对象:反馈,跟踪,可视化 r e s e a r c ho ni n t e l l i g e n ta n d o p e nt e a c h i n ga n d l e a r n i n ge n v i r o n m e n tb a s e do nd 钢r am i n i n g a n d i t si 咿l e m a n b 气t i o n a b s t r a c t w i t ht h ed e v e l o p m e n to ft h ei n t e m e t t e c h n o l o g i e sa sw e l la st h em u l t i m e d i a t e c h n o l o g i e s ,d i s t a n c e e d u c a t i o nh a sb e e ne x t e n d e dt oan e wf i e l d a m o n gt h e d i f f e r e n tb r a n c h e so fi t ,w e b b a s e dm o d ep r o v i d e saf l e x i b l es t a g ef o rt e a c h i n ga n d l e a r n i n ga c t i v i t i e s a c t u a l l y , t h e r ee x i s t al o to f e d u c a t i o n a lw e bs i t e so v e rt h e i n t e m e t , m o s to fw h i c hs u p p l yu s e r saf u n c t i o n a l l ye d u c a t i o n a le n v i r o n m e n t h o w e v e r , t h e r e d o e s n te x i s tas t a n d a r de d u c a t i o n a ls c h e m at o m a n g ea n dc o o r d i n a t ed i f f e r e n t f u n c t i o n a ls u b s y s t e m s ,s u c ha sq & a ,t e s t i n ga n dd i s c u s s i o n b e s i d e s ,t h e r el a c k sa n e f f e c t i v e p o l i c y t o a n a l y z e a n df i n d m e a n i n g f u l i n f o r m a t i o nf r o mt h ed a t a a c c u m u l a t e di nt h e s ew e bs i t e s t h i sp a p e re s t a b l i s h e ss u c hk i n do fe d u c a t i o n a l m a n a g i n gs c h e m a , c h o o s e s s o m ed a t a a n a l y z i n g m e t h o d sa n d e x p l a i n s i t s i m p l e m e n t a t i o n t h i si so u r s o l u t i o nt ot h e p r o b l e m sd i s c u s s e d a b o v e p f i m l y ,t h ep a p e rc a nb ed i v i d e di n t ot w op a r t s t h ef i r s to n ei st oc o n s t r u c t a no p e na n df l e x i b l ee d u c a t i o n a lp l a t f o r m o ni t ,d i f f e r e n tf u n c t i o n a ls u b s y s t e m sc a n b ea d d e da n dm o d i f i e dd y n a m i c a l l y a l lo ft h em a n a g e m e n ts c h e m ai sb a s e do nt h e s t u d e n t so r i e n t e dm o d eo fr 1 4 8 4 t h es e c o n d p a r ti sa na n a l y z i n gm o d u l ew o r k i n g o nt h eb a c k g r o u n d t h r o u g ha p p l y i n gd a t am i n i n ga l g o r i t h m st o w a r d st h et e a c h i n g a n dl e a r n i n gd a t a ,t h es y s t e mt r i e st of i n dm e a n i n g f u lr u l e ,w h i c hc a nw o r ka sa f e e d b a c ki n c o n s t r u c t i n g t h e i n t e l l i g e n tf o r e g r o u n dp l a t f o r m t h es y s t e m i s c h a r a c t e r i z e df o rt h e s ef e a t u r e s : 1 b eo p e na n ds t a n d a r d i z e df o rt h es t r u c t u r eo f t h ee d u c a t i o n a lp l a t f o r m 2 b e i n t e l l i g e n ta n d f l e x i b l ef o rt h ea n a l y s i so f t h ed a t aa n a l y z i n gt o o l s 3 b ei n d i v i d u a l i z e df o rt h e c o m p r e h e n s i v es y s t e m b a s e do nt h ea b o v et w o s u b m o d u l e sa n dt h ec o o r d i n a t i o no f t h et w oo n e s k e yw o r d s :d i s t a n c ee d u c a t i o n ,d a t am i n i n g ,o b j e c t o r i e n t e d ,f e e d b a c k ,t r a c k , v i s u a l i z e 土塑奎望查兰堡圭堂垡笙壅 基于d a t am i n i n g 的智能化、开放化远程教学环境 第一章、引言 “科学技术是第一生产力”。当今世界,日新月异,随着以信息技术为主 要标志的科技进步的长足发展,随着高新技术成果向实际生产力的转化,随着社 会对于劳动者的知识结构和知识更新要求的不断提高,全民教育、终身教育的呼 声越来越高,教育作为一种新兴产业呈现出光明宽广的发展前景。然而,由于地 域、时间、人力等诸多原因,传统的学校教育已经无法满足这种需求,与此同时, 现代信息技术尤其是i n t e m e t 技术的飞速发展,为我们带来了一种全新的教学理 念“远程教育”。 1 远程教育特点及其发展现状 p a t a n t h o n yf e d e r i c o 1 1 提出目前远程教育的两种模式:( 1 ) 同步实时的远程 教育模式,主要是利用视频会议系统传输视频和音频,构建一种分布式的教室, 这种环境下教师和学生只是在物理位置上不同。( 2 ) 异步的基于w e b 的远程教育 模式,在这种模式下,教学内容以课件的形式放在w e b 服务器上,学习者可以 在任意时间、任意地点独立地进行学习。在以上的两个研究领域中,基于w e b 的教学模式由于对系统配置无特殊要求,在i n t e r n e t 上可随时随处访问等特点 而得到了广泛的应用。国内外的许多大学和研究机构、以及国外的一些商业机构 都已经开发了这种模式下的应用系统。下文主要针对基于w e b 的远程教学模式展 开讨论。 2 个性化远程教育发展成为远程教学发展的一个趋势 基于w e b 的远程教育模式,借助i n t e m e t 的先进技术,不仅实现了4 w 的 优势( w h o e v e r 、w h e f e v e r 、w h e n e v e r 、w h a t e v e r ) ,即任何人在任何地点、任 何时候都可以学习任何他( 她) 所需要的学习内容;而且它还具有多媒体、超文 本、超时空、长时效、多模式等基本特征。 目前,基于w e b 的远程教育模式的研究与应用主要集中在以下几个方面: 交互式、异步学习模式: 典型的应用有k o u l i a n a1 3 提出基于w e b 的异步交流系统。利用i n t e m e t 现有的异步工具,如u s e n e t ,b b s ,e m a i l 等建立交互的网上教学环境。 s c h l a g e t e r 4 】等提出了虚拟大学( v i r t u a l u n i v e r s i t y ) 的基于w e b 的教学模型, 通过多个不同服务器( w w w 服务器、e m a i l 服务器、聊天服务器、新闻服 务器等) 为学生提供一个基于w e b 的学习环境。 圭塑奎望查兰堡主堂垡笙苎 基于d a t a m i n i n g 的智能化、开放化远程教学环境 多媒体教学为中心模式: 典型的应用有申瑞民、丁大宇等【5 】提出的多点语音支持的多媒体师生交流系 统【s :r e i n h a r d 陆e u t z 嘲等则通过在所构建的n e t c h a t 系统,集成电子白板, 文本交流,课件浏览功能,提出基于w 曲的学习模型。 学习成果分析为中心模式: 典型的应用有c h i e nc h o u 等 7 】提出的基于w e b 的教学评测系统,采用有效 的统计分析方法,针对学习者评价其对于某门课程的掌握程度。 以学习模式类型分析为中心模式,评测分析驱动模式相结合模式: 典型的应用有d r a n n ac i c o g n a n i 等嘲开发的基于概念图理论的学生理解情 况交互式分析工具;c h i u n g h l l ic h i u 等【9 】开发的基于w e b 的学生能力评价 工具。 教学管理驱动模式: 典型的应用有桂芳、吴杰等【l l j 提出的基于w e b 的远程教育3 层参考模型, 其在第一层描述了学习者在教学一体化环境中的角色分配,第二层则描述 了学习者在教学一体化环境中各功能子系统的逻辑行为,第三层描述系统 底层实现的各个功能模块。舒蓓、申瑞刚加】提出的个性化的远程学习模型, 后者主要从数据库管理角度结合个性化服务的特点描述了一体化教学管理 的流程。 引入个性化特性而构建的远程教育是一个开放的系统,可以更多并且及时 地了解到学生的状况、需求、能力差异、学习进度、兴趣爱好,同时动态地根据 这些诸多因素调整学习计划及进度,让用户得到针对其个性化信息定制的教育。 传统的远程教育网站对每个用户来说都是一样的,浏览的课件、考试的题目与整 个学习的流程都是单固定的,在应用了个性化模型的远程教育中,每个学生都 仿佛找到了一位针对自身特点进行教学的“老师”,充分发挥学习的主动性。 直观说来,同样一个远程教育系统,但是对于不同的受教育的对象,表现出的不 同的页面和教育信息资源的组织。 另一方面,对远程教育网站来说,也可以统计学生的学习情况,更直接、 科学地了解到用户的需求与自己提供的教育资源信息的冗余和不足,适时地调整 自身的策略、方案来满足受教育对象的需求。 得益于高速发展的互联网技术,人工智能和数据库技术,知识发现 ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,简称k d d ) 这些数据处理过程也进入到了 w e b 领域,它通过机器学习,统计分析或其他方法,从大量数据中进行数据挖掘, 提取有用的信息。这些使个性化数字服务成为可能,使用户能更多更高效地获取 4 圭塑窒望查堂堡主堂堡堡塞 基于d a t am i n i n g 的智能化、开放化远程教学环境 所需要的教育信息资源,这将为目前的远程学习系统带来一次新的革命与机遇。 由此可见,在传统的远程教育基础上引入智能化、开放化的个性服务是必 要的,也是可行的。 3 研究背景 本文是针对上海交通大学远程教育研究实验室和i b m 公司上海分公司项目 “基于数据挖掘的开放化、智能化远程教育环境”进行研究和撰写的。 综观目前流行的教学站点,他们或是侧重于交互式、协同环境的构建,或 是侧重于一体化、集中式的教学管理,或是侧重于基于多种统计分析方法的准确 的教学评价。而事实上,正如教学本身是一个不可分割的流程,上述系统实质上 构成了教学系统的各个子功能系统,而这些子系统无论是在数据基础,逻辑流程 上都不是彼此孤立的。而目前还没有一个在充分分析数据信息资源( 教学信息: 注册信息,学习信息,测试信息,作业信息等,教学行为信息:学习时间,学习 频度,学习路径等) 基础上,全面集成上述各功能模块的,具有开放式结构、智 能化的远程教学系统设计与实例。这也正是本研究课题所希望达到的研究目标。 该课题的主要任务是在充分分析传统的基于w e b 的远程教育环境的优缺点的基 础上,结合现有资源和教育特点,构造和搭建基于w e b 的智能化、开放化远程 教学平台体系结构。同时建立数据分析子系统,提供一个教学信息分析的平台, 利用数据挖掘算法,挖掘潜在的教学规律。 所搭建的远程教学平台主要实现几个方面的特性: 智能化管理:即构建一个具有一体化管理特性和可扩展性的远程教学平台。 在该教学平台上,各个功能子系统在遵循一定标准定义的基础上,可以像 组件一样方便地增删、修改。并以此作为智能化实现的结构基础。 一体化管理:系统中信息都能遵从一定标准而方便共享,作为后期分析, 监控,反馈的基础。 可扩展性:它是用以针对系统的开放性的,通过数据信息的分析与挖掘, 一个智能系统如何不断的进行自我学习和扩展,这需要该系统本身体系结 构的可扩展性来保证。 所建立的教学信息分析系统主要实现几个方面的特性: 可扩展性:针对教学信息数据种类的多样性,系统可能需要采取多种数据 挖掘分析的算法,系统的可扩展性结构,保证各算法以函数库的形式动态 加入系统。 一体化管理:系统根据配置文件的设置,可实现部分数据分析过程的一体 化处理。 圭堡窒望查堂堡主兰垡堡苎 基于d a t am i n i n g 的智能化、开放化远程教学环境 第二章、技术背景 1 i e e ep 1 4 8 4 l d 6d r a f ts t a n d a r df o rl e a r n i n gt e c h n o l o g y ( 1 ) 远程教育的几种模式 根据i e e ep 1 4 8 4 1 j 定义的基于不同角色分配、教学流程、教学信息的一体 化框架结构,远程教育根据应用的侧重点不同可分为以下几类: 学习者需求驱动模式,即学习者为中心( l e a r n e r - c e n t e r e d ) : 评测分析驱动模式,即以教学评价为中心( a s s e s s m e n t - c e n t e r e d ) : 学习成果分析为中心模式( r e c o r d s ,c e r t i f i c a t i o n s ) : 以学习模式类型分析为中心模式( l e a r n e r p r o f i l e s ) ; 学生管理模式( s t u d e n t a d m i n i s t r a t i o ns y s t e m s ) : 教学任务驱动模式( t a s km o d e l ,s c h 0 0 1 t o w o r k ) ; 教务管理驱动模式,即以教学管理为中心( i n s t i t u t i o n c e n t e r e d ) ; 教学内容驱动模式,即以教学内容为中心( c o n t e n t c e n t e r e d ) ; 以教学内容管理为中心模式( l e a r n i n gc o n t e n tc a t a l o g i n g ,m e m d a t a ) ; 教学资源分析为中心模式( o n t o l o g i e s ,e x p e r ts y s t e m s ) ; 教学资源管理发布为中心模式( d i g i t a ll i b r a r i e s ) : 教学资源管理为中心模式( l e a r n i n go b j e c t s ) ; 教学资源发布为中心模式( c o g e n t l a u n c h ) ; 多媒体教学为中心模式( d i g i t a la u d i oa n d v i d e o ) ; 多媒体信息检索为中心模式( m u l t i m e d i as e a r c ha n dr e t r i e v a l ) ; 交互式、异步学习模式( c o l l a b o r a t i o n ,a s y n c h r o n o u sl e a r n i n g ) ; 多角色、群体学习模式( m u l t i p l e r o l el e a r n i n g ,t e a ml e a r n i n g ) ; ( 2 ) 学习者需求驱动模式( l e a r n e r - c e n t e r e d ) 本课题的研究主要采用“学习者需求驱动模式”的思想。根据i e e e p l 4 8 4 1 定义,学习者需求驱动模式( l e a r n e r - c e n t e r e d ) 强调关注学习者本身,通过维护 学习者记录,对学习者行为做出分析并加以指导。具体模式参见下图: 6 土塑奎望查兰堕圭堂壁堡奎 基于d a t am i n i n g 的智能化、开放化远程教学环境 图2 - 1 2 学习者需求驱动模式 ( f i g 2 - 1 - 2l e a r n e r - c e n t e r e dm o d e ) 在i e e ep 1 4 8 4 1 中,l t s a 设计主要重点首先在于: 学习者实体接口界面 学习者偏好传递协议 学习者表现和偏好信息的格式和协议 指导系统作为支持学习者实体对象所应具有的功能 维护学习者实体的学习记录的能力 其次才是评估信息格式和协议。 在非l t s a 标准下,我们则关注于学习者学习记录和学习者对自己的学习 方法、目标等的影响,以及对于学习者的评估反馈和过去学习情况的表现。 2 基于关系数据库的面向对象理论的应用 2 0 世纪5 0 年代开始,计算机开始被应用于事务管理以解决大量的数据处 理和非数值计算。由于数据处理的比重在计算机应用中的逐渐加大,数据处理的 技术就随计算机技术的发展一起发展,并像其他学科一样经历了从低级到高级、 由简单到逐步完善的发展过程。 数据库产生的主要目的是有效地管理数据资源,研究如何存储、使用和管 理数据,是计算机数据管理技术发展的崭新阶段。7 0 年代是数据库技术蓬勃发 展的年代,层次系统和网状系统占据整个商用市场,而关系系统则处于实验阶段。 自8 0 年代以来,关系系统逐渐代替网状系统和层次系统而占领了市场。由于关 系模型具有严格的数据基础、概念清晰简单,非过程化程度高,数据独立性强, 对数据库的理论和实践产生了很大影响,成为最为流行的数据库模型。 关系模型在某些方面比较层次模型和网状模型,其关系式( 表) 更容易理 解,在表中操作数据的形式为大多数人所熟悉,并且效率也很高。关系代数提供 了支持数据分析的形式化数学基础。由于能在运行中动态地把数据连入关系表 :垦塑奎塑查堂堕主堂垡堡塞 基于d a t a m i n i n g 的智能化、开放化远程教学环境 中,因而关系数据有助于开发具有较高数据独立性的应用程序,它在很多应用领 域发挥了巨大作用。 关系模型通常不能用一张表模型表示出复杂对象的语义,也不擅长于数据 类型较多、较复杂的领域。随着数据库的应用从简单转向复杂,当需要存储和查 询复杂的嵌套数据、复合数据( 如数组、结构等) 和多媒体数据( 如声频、视频 和图像等) ,传统的关系数据库就难以满足新的需要了。在此背景下,人们提出 了面向对象数据库。 面向对象数据库中,信息作为和其他数据有着内在联系的对象加以存储。 它们主要应用于包含复杂数据的多媒体应用程序和系统中。 ( 1 ) 面向对象的数据库 、定义 什么是面向对象数据库,目前还没有一个统一的定义。 由于计算机应用范围的扩大以及研究组织的增多,使得面向对象数据库的研 究与开发过程与关系数据库很大的不相同。关系数据库系统遵循由理论研究提 出、成熟再到开发实现的过程,所以具有整齐、规范、一致的特点。而面向对象 数据库的发展则出现了理论研究和商业化开发齐头并进甚至理论落后于实践的 局面。可以把目前的这方面的研究开发分为4 种不同方式:扩展关系数据库系统 ( e x t e n d e dr e l a t i o d rd a t e b a s es y s t e m ) 、持久程序设计语言( p e r s i s t e n t p r o g r a m m i n gl a n g u a g e s ) 、纯面向对象数据库系统( p u r eo b j e e t o r i e n t e dd a t e b a s e s y s t e m s ) 和数据库工具箱( d a t e b a s es y s t e m t o o l k i t s ) 。 扩展关系数据库系统( e x t e n d e dr e l a t i o n ad a t e b a s es y s t e m ) 扩展关系数据库系统是通过对关系数据库的基本数据类型扩充来实现的, 它保留了关系数据库的关系特征和查询语言s q l 的基本特征,同时增加了 抽象数据类型a d t s ( a b s t r a c td a t et y p e s ) 和用户自定义函数u d f ( u s e r d e f i n e df u n c t i o n s ) ,使其具有了面向对象的基本特点。因此现在一般把它 称为对象一关系型数据库系统。为了定义一个新的抽象数据类型a d t ,用户 需要用外部程序设计语言( 如c + + 或c 等) 去定义a d t 的结构表示和相应 的函数u d f 。一旦定义完成,用户可将其注册到数据库系统,以便让系统 了解它的大小及相应的函数,这些函数中包括a d t 实例的输入和输出函数。 a d t 的函数可直接由用户查询、描述,并在系统运行时自动被装入。杨静 掣1 2 1 就上述方面进行了一些研究,在关系数据库基础上部分地实现了面向 对象数据库模型。对象- 关系型数据库系统是当前研究开发最为成功的一种 面向对象数据库系统,商业化的产品包括d b 2 ,o r a c l e ,s y b a s e ,i n g r e s 等。 土查奎望塑主鲨壅 苎王里塑坚! ! 垫! 堕塑! ! 些:茎垫垡堕堡塑堂堡堡 所以有人把对象关系型数据库系统称为第三代数据库管理系统( 第一代为 层次及网状型,第二代为关系型) 持久程序设计语言 持久程序设计语言是从一般的面向对象程序设计语言( 如c + + ,s m a l l t a l k 等) 出发,对其增加了对象的持久性和程序执行的原予性控制。从而使程 序设计人员不必去关心数据对象的存储问题以及存储对象与内存中临时对 象之间的一致性问题。增加了程序设计语言对事务性应用管理的能力。其 学术上的研究仍在进行,但至今没有一个商业化的系统出现。 纯面向对象数据库系统 纯面向对象数据库系统是直接根据面向对象的基本特点,用全新的技术和 方法去设计和实现数据库系统。在近年的研究中,纯面向对象数据库系统 的理论研究取得了丰硕成果,也出现了许多商业化产品,如g e m s t o n e , o b j e c t i v i t y ,o b j e c t s t o n e 等。但由于这种数据库系统过于追求理论上的完美, 而没有很好的借用关系系统成熟的技术,增加了系统实现的难度。而纯面 向对象机制又缺乏理论上的一致性,导致各家的研究和开发都自行其道的 局面。 数据库工具箱 数据库工具箱方面的研究人员认为:仅用一种类型的数据库管理系统很难 满足各种不同应用领域的需求。所以倡导开发一种可在任何层次上进行扩 充的d b m s 。这种可扩展型的d b m s 由核心系统加上若干开发工具构成, 用户可用这些工具开发出各类的应用系统。基于这种方法所开发出的原型 系统包括e x o d u s ,g e n e s i s 等。但由于利用这种系统进行应用开发时, 需要用户掌握很多专业技巧,其柔性差而且不完备,导致遵循这种模型的 系统在商业化方面到目前为止仍未成功。 总之,对于下一代数据库的发展方向主要有这么三种观点,他们都与面向 对象数据库相关。 第一种观点认为,如果一个数据库具有诸如复杂对象、对象标识、对象封 装、类型和类及类层次、重载与动态捆绑、可扩充的预定义类型、持久性和二级 存储管理等这些不可缺少的规则,那么它就是一个面向对象数据库。这些规则主 要强调了面向对象的特性,而关系数据库只能应用于简单的商务处理,不适应新 的复杂应用。 第二种观点则是针对第一种观点的反面观点,它给出了一组自己新定义的 规则并强调关系数据库引入了两个主要开发方法即非过程访问和数据独立性。认 为在以后的系统中放弃它们是愚蠢的。在数据库中,s q l 作为“星际数据语言”, 9 圭塑奎望查兰堡主堂竺笙苎 基于d a t am i n i n g 的智能化、开放化远程教学环境 必须被支持。 第三种观点则比前两种更加形式化和技术化,它主要是基于关系数据库模 型提出了一个系统。持这种观点的学者认为忽略关系数据模型是错误的,而强调 s q l 语言也是错误的。他们提出的系统是关系模型上的扩充,允许定义新的数 据类型。 、主要特点 面向对象数据库主要具有如下特点: 用户可以定义数据类型。 在关系型数据库系统中,用户不能自定义数据类型。而在面向对象数据库 中,用户可以和用程序设计语言定义数据类型一样,自主定义任意类型的 数据,而且类型间能表达继承关系,类型和数据有实例化的关系 有s e t 、l i s t 、b a g 等聚集类。用s e t 、l i s t 、b a g 等聚集类能自然表达查询结果, 他们通常是一组对象 对象上有方法,还可以定义规则。用方法对于对象的一些属性值进行属性 值计算,比用查询语言激活已定义的函数来计算对象属性值更自然更高效, 同时,用方法还能很容易的定义对象上的约束规则,数据与方法的封装也 有利于应用开发。 对象上有类型检测。数据库与程序语言的相同数据类型检测有利于两者的 正确通信。 此外,面向对象数据库还可嵌套对象。由于上述这些特点使得面向对象数 据库具有了丰富的数据类型,能够很自然地表达复杂的嵌套对象,在实现 技术上采用静态或动态的对象簇聚机制,在复杂对象上获得良好的性能。 数据库与程序设计语言的类型系统和操作方法的统一,消除了数据库中的 阻抗不匹配问题 ( 2 ) 面向对象的数据库与关系型数据库的比较 、面向对象的数据库与关系型数据库比较 面向对象数据库提供比r d b 更优的数据模型,它能支持关系模型不能支持 或支持不够好的复杂应用,增强了程序的可设计性和性能,提高了导航访问能力, 简化了并发控制。对于数据库系统本身,包括完整性维护、查询优化和并发控制 的能力来说,这种有关应用知识的增加,具有潜在的益处,而r d b 却无这种能 力。 支持复杂应用 可存储大型数据结构 1 0 上海交通大学硕士学位论文 基于d a t am i n i n g 的智能化、开放化远程教学环境 直接引用对象 优良的应用开发环境 简化并发控制 完整性 当然,目前的面向对象数据库系统尚且存在许多方面的不足之处。其与关 系性数据库的比较情况,肖伟器冯玉才等做了一定研究可参见下剥1 3 : 关系数据库系统现有的面向对象数据库系统 ( r d b s )( 0 0 d b s ) 查询机制支持嵌套子查询、集合( 交、大多数o o d b s 缺少查询机制,有 并、差) 查询、聚集功能、分少数系统支持显式的查询机制,查 组、类联接 询语言与a n s i s q l 不兼容 视图支持视图作为存储数据的动不支持视图 态窗口、视图定义包括查询语 句,从一个或多个关系( 表) 中取数据,按照定义格式组成 视图的数据,视图与表一样也 能被授权 授权允许用户用g r a n t 命令对表或大多数不支持授权 视图授权,让其他用户共享表 或视图中的数据,也允许用 r e v o k e 命令收回授给其他用 户的特权 动态改变数允许用户用a l t e r 命令动态的大多不支持动态改变数据库模式, 据库模式改变数据库模式,可以向关系不允许用户给类增加新的属性和 增加新的列属性,可以改变现方法 有列的宽度和类型,也允许用 户用d r o p 命令删除关系和 视图 加解锁自动加锁和解锁,也允许用户不能自动加、解锁,只能由用户显 加锁和解锁式的加锁和解锁 系统性能调系统性能可以由系统管理员 对参数化的系统性能调节能力没 节 设置参数来调节有砌) b s 强 层次性数据用户必须用多个关系的元组 在o o p l 中一个对象属性的数据 来表达层次性的数据或复杂类型,没有什么实质性的限制,既 的嵌套数据。因此,查询d b可以是基本类型,也可以是用户定 要通过多个关系的自然联接,义的类型。新的数据类型可以以新 代价很高的形式创建,也可以作为类的子类 来建立,并且继承超类的属性方法 数据类型没有增加用户定义数据类型 o o p l 对象属性的数据类型,没有 的机制,既不允许加上新的数什么实质性的限制,它既可以是基 据类型,要加入新的数据类本类型,也可以是用户定义的类 上海交通大学母i 士学位论文基于d a t am i n i n g 的智能化、开放化远程教学环境 型,必须对系统结构做大的改型,而且新的数据类型可以以新的 动。向d b s 加入新的数据类形式创建,也可以作为已类的子类 型,意味着系统能存储,查询来建立,并且继承超类的属性和方 以及更新这种类型的数据法 对象封装支持“存储过程”,允许用一 对象封装不仅是存储与管理d b 中 些过程性语言写程序,并把这数据的基础,也是存储与管理程序 些程序存在r d b 中供以后调的基础 入执行。但是r d b 中存储的 过程不和数据封装在一起,他 们不与任何关系或关系的任 何元组相关联。由于r d b s 没有继承机制,所以存储的过 程不能自动的重用 表2 - 2 2 关系数据库和面向对象数据库性能对照表 ( t a b l e 2 2 2o o d b & r d b ) 尽管面向对象数据库有许多的优点,但是目前其商业化的数据库系统仍然 很少。其理论方面还有待进一步完善,标准也有待进一步统一,实用性更是有待 进一步加强。相反,关系数据库数据被组织成一张二维表,这是一种简单自然的 表示方式。它概念清晰,理论严密,易懂易用,且效率颇高,可用的商业化产品 也较多。故而,本课题力图在关系性数据库的基础上,引入面向对象的设计思想。 数据库设计过程中,力图通过合理的构建,在视图这一层次上,把对象的属性从 茫茫的数据表中提炼出来,实现初步的对象化的设计思想。 ( 3 ) 在远程教育系统平台中引入面向对象的概念 远程教育管理系统是一个复杂的数据库应用领域。它涉及到方方面面大量 信息的存储、管理和分析。这些数据主要有 用户对象的基本个人信息 用户对象的登陆信息 用户对象的行为记录信息 教学资源信息( 包括授课、作业、考试、答疑、交流,以及其他相关资源 信息) 辅助教学资源信息 教学情况跟踪信息 数据挖掘所产生的用户分类信息 数据挖掘所产生的用户操作信息 其它系统信息 有待扩充的信息 堂堕翌里壁堡主兰垡丝壅 苎里坐坚! ! ! ! ! 塑塑! ! 些:墅垫些垩堡墼堂堑垫 如果仅仅是把这么多的数据信息按照关系模型的方式,以一张张表的形式 存放于数据库中,固然可以实现。然而,如果我们仔细分析一下这些数据信息, 可以发现,这些数据的产生其实都是一种“对象一属性一行为”的关系。 我们可以把所有数据信息分为简单的几种类型的对象: 用户对象 这种对象最为明显,他们自身的属性( 个人信息) 以及他们的行动( 学习 行为) 将产生数据。这些数据或是它们所携带的属性,或是他们的行为记 录构成了对于一个用户对象的描述。例如一个学生用户对象: 学生 姓名:张三 性别:男 参加答疑 参加考试 图2 - 2 3 1 学生对象( f i g 2 2 - 3 1s t u d e n to b j e c t ) 资源对象 这类对象主要存在于教学系统中。他们是学习者的主要学习对象,也是指 导者的主要管理对象。他们本身具有一定的属性( 如,资源名称、存储路 径等) ,同时也具有一定的行为。通过对这一类对象的操作,可以实现不同 的教学效果。例如一个作业资源对象: 作业 编号:0 0 1 类型:简答题 对象组:0 0 5 做作业 批改作业 图2 - 2 3 2 资源对象( f i g 2 2 - 3 2r e s o u r c eo b j e c t ) 行为对象 这一类对象往往对应于用户对象的某一种行动,即用户对象的行动是一个 新的对象。这些行为对象的属性( 行为执行人、行为发生时间等) 是我们 所关心的。它是后台实现数据挖掘,实现智能化指导的一个重要基础。 例如系统日志: 系统日志 执行人:张三 执行时间:2 0 0 1 5 2 6 执行行为:登陆系统 为对象 3b e h a v i o r o b j e c t ) 燮燮兰婴主兰堡笙苎 薹主旦塑兰! ! ! ! ! 箜塑丝些:墅垫些垩堡塾兰至望 行为结果对象 这一类对象主要是一些行为发生后所产生的结果对象。由于行为的结果可 以反映用户对象,尤其是学习者的学习偏好和学习效果,所以这一类对象 也是后台数据挖掘、学习评估和智能化指导的一个基础。 例如一个学生的学习成绩情况 学生学习情况 成绩类型:作业 题号:0 0 1 科目:计算机基础 得分:9 5 图2 - 2 3 4 结果对象( f i g 2 - 2 3 4r e s u l to b j e c t ) 对象组对象o b j e c t g r o u p 这一对象是个特殊的对象。它的出现其实是在系统引入了“组”的概念, 即系统不再以简单的用户对象类型( 教师、学生、管理员) 的方式来分类 用户对象,而是把用户对象按照“对象组”的方式来组织。处于相同用户 组的用户对象,具有某些相同的属性和行为。这是实现一种动态划分用户 对象的方式,只要通过修改用户对象所在的“对象组”,就可以实现用户分 类。当然,由于用户在不同的方面会有不同的表现,例如一个学生可能在 某门课程上表现优秀,而在另一门课程上表现一般;又或者一个学生可能 擅长考试、却不认真作业,或者只爱听老师讲课而不喜欢提问题。正是由 于用户对象对于不同的行为有不同的表现,所以,一个用户可以同时处于 多个针对不同行为而制定的对象组中。 这个对象的基本结构是这样的: 对象组o b j e c t g r o u p 对象组编号:l 所属的子系统;作业 图2 - 2 - 3 5 对象组对象 ( 堍2 - 2 - 3 - 5o b j e c tg r o u po b j e c t ) 而资源对象则带有属性“对象组号( o b j e c t o r o u p l d ) ”。 而用户也具有属性“对象组号( o b j e c t g r o u p l d ) ”,且可以没有或者有1 个 或者有不只1 个对象组号。 圭塑窭望查堂硕士学篁堡塞基于d a t a m i n i n g 的智能化、开放化远程教学环境 用户 用户编号:0 0 1 状态:在线 对象组号1 :0 0 3 对象组号2 :0 0 8 对象组号n :0 2 3 图2 - 2 3 6 用户对象组配置对象 ( f i g 2 2 - 3 6u s e r - o b j e c t g r o u po b j e c t ) 系统对象 这一类对象描述了整个远程教学管理系统的内部子系统的情况和它们的相 互关系。为了实现动态、个性化的教育平台,需要系统对象来提供关于整 个系统和目前可用系统的基本信息情况。 例如作业子系统: 作业子系统 子系统编号:0 1 0 所述系统:教学系统 关闭子系统 修改予系统 图2 - 2 3 7 系统对象 ( f i g 2 - 2 - 3 - 7s u b s y s t e mo b j e c t ) 后台信息统计对象 这一类对象是由于后台数据挖掘而产生的对象。这些对象是后台系统对用 户对象的行为、表现、偏好,根据一定的数据挖掘算法得到的结果。它们 是实现系统的智能型指导的一个基础。 其它对象 其它对象是指那些为了实现系统功能而产生的不属于上述主要类别的那些 对象。它们在系统中所占的比例相对较小。 由此可见,由于整个远程教育管理系统是一个庞大的系统,其信息量巨大 且结构复杂。因此,如果仅仅使用关系型数据库的方式构造系统,固然可以把所 有的信息存储其中,但将忽略了所有这些数据的结构关系。 显然,在本课题中,我们将要搭建的是一个智能化的、开放化的远程教育 平台。从智能化的角度来讲,这不仅要求系统可以完成所有的常规功能,更要求 我们能够真正的把一个学生在整个学习过程中的状态、偏好、效果等教学信息收 集起来,作为对学生的动态指导的基础。如果仅仅使用关系性数据库结构,那么 面对最后建立起来的众多二维表、众多的二维关系,将使我们难以迅速的找到所 生塑窒望蠢塑学堕篓文 基于d a t am i n i n g 的智能化、开放化远程教学环境 需要的信息和记录。而引入面向对象的思想,我们不再把信息看作是简单的二维 关系,而是把各种信息看作是不同对象的不同行为所产生的不同结果,那么我们 可以很方便的收集到我们所要求的信息。举例说明,假设我们想要了解一个学生 对象的近期的活动情况。在数据库中,这个学生的个人信息可能被存放在一个叫 做s t u d e n t 的表中,他的登陆信息可能被存放于一个叫做l o g 的表中,而他在线 活动的情况可能被存放于系统的u s e r _ t r a c k i n g 表中,那么通过面向对象的思想, 我们可以把信息组成在一起,在视图层上描述出该用户的所有这些属性,通过这 种方式,我们可以知道这个学生是那个班级的、叫什么名字、性别是什么( 来源 于s t u d e n t 表) ,在什么时候登陆了系统( 来源于l o g 表) ,之后在系统上使用了 那些资源( 来源于u s e rt r a c k i n g 表) ,又在什么时候离开系统( 来源于l o g 表) , 如此,一个用户对象的一系列属性和行为就很容易的收集了起来。 其次,面向对象的技术具有良好的数据封装性和扩展性。从开放化的角度 看,这种面向对象的思想将帮助我们实现一个可动态扩展的系统。即在该教学平 台上,各个功能子系统在遵循一定标准定义的基础上,可以像组件一样方便地增 删、修改。所以在本课题中各个子系统也被看作是一个对象,增加、删除或者修 改子系统的过程,可以被抽象看作为是对一个对象的操作。 3 面向教学属性的数据挖掘研究 数据库技术在八十年代的辉煌使得它的应用已经触及乃至普及到人类活动 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 46267-2025大型全喂入联合收割机
- 2025辽宁沈阳地铁集团有限公司所属公司拟聘用人员模拟试卷及答案详解(网校专用)
- 2025湖北荆州市石首市第二批校园招聘教师6人考前自测高频考点模拟试题及一套参考答案详解
- 安全培训教师基本条件课件
- 2025年威海火炬高技术产业开发区公开招聘教师(第二批)(61人)考前自测高频考点模拟试题及答案详解一套
- 2025年锂电池配套试剂项目建议书
- 广昌消防安全培训课件
- 2025江西赣南医科大学高层次人才招聘180人模拟试卷及答案详解(全优)
- 小学安全专项培训反思课件
- 2025年高通量试验反应堆及配套产品合作协议书
- 2025影视演出经纪居间合同正规范本
- 对外投资管理知识培训
- 耕地占用税培训课件
- 110kV变电站及110kV输电线路运维投标技术方案
- 轮机英语词汇汇总
- 组织行为学核心主题全系列(MBA研修班学生版4日)课件
- 桥梁基础工程施工
- 始祖鸟新员工基础知识考试(NEW)试题含答案
- 渣浆泵基础知识课件
- 布赫液压样本
- 防错验证报告
评论
0/150
提交评论