(计算机软件与理论专业论文)移动学习服务器的构建研究.pdf_第1页
(计算机软件与理论专业论文)移动学习服务器的构建研究.pdf_第2页
(计算机软件与理论专业论文)移动学习服务器的构建研究.pdf_第3页
(计算机软件与理论专业论文)移动学习服务器的构建研究.pdf_第4页
(计算机软件与理论专业论文)移动学习服务器的构建研究.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 伴随信息技术的发展以及无线通信设备普及,移动学习( m - l e a r n i n g ) 应运而生。 移动学习是一种新型的学习方式,它充分利用无线技术和移动计算机设备来辅助教学, 为学生通过移动设备和移动网络开展教育活动、传递教育信息成为了现实。特别是3 g 技术的出现,它能够处理图像、音乐、视频等多媒体业务,提供包括网页浏览、电话会 议、电子商务等多种信息服务,人们可以通过移动设备进行学习,学生的学习不再受固 定时间、固定场所等条件的限制,对人们实现终身教育起到积极和深远的影响。 作为一种新型的学习方式一移动学习,由于具有个性化、便利性、普及性等优点, 因此有较大的发展潜力。但是由于移动学习作为一种新型学习方式还是一个新生的研究 领域,作为一个全新的研究领域还是有许多的问题有待我们去发现、去思考、去解决, 有效的使用移动计算技术辅助教学和学习成为这个领域研究中心,因此,研究移动学习 服务器的构建具有重要意义。 本文在对移动学习技术作了深入研究的基础上,提出了一种移动学习服务器的构建 方法,该方法通过多线程网络爬行分类器构建移动学习个性化知识库,建立数据网格节 点,共享数据资源。在网格服务器的管理下,学习者通过短消息服务应用程序( s m s a ) 从网格节点获取知识。 本文主要工作有:( 1 ) 多线程网络爬行分类器的设计与实现,构建移动学习服务器 的知识库。( 2 ) 提出基于w e b s e r v i c e 的网格模型,充分利用w e b s e r v i c e 和数据网格融 为一体的特点构建网格节点,共享网络资源。( 3 ) 采用短消息服务( s m s ) 技术开发s m s a , s m s a 通过计算机电话集成网关( c t i g w ) 与短信网关程序( s m g w ) 进行短信息的发送与 接收,在网格服务器上进行资源的搜索和反馈。( 4 ) 通过浏览器直接访问网格节点,解 决了知识的异构、零散分布的问题,实现了基于浏览器的学习方式。 关键词:移动学习;网格;w e b s e r v i c e :b p :s m s a b s t r a c t m o b i l e l e a r n i n ge m e r g e s 雒t h ed e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g ya n dt h e p o p u l a r i z a t i o no fw i r e l e s sc o m m u n i c a t i o nd e v i c e s ,髂an e wl e a r n i n gm o d e ,m l e a r n i n gm a k e f u l lu s eo fw i r e l e s st e c h n o l o g ya n dm o b i l ec o m p u t e re q u i p m e n tt oa i dt e a c h i n g e s p e c i a l l yt h e a p p e a r a n c eo f3 gt e c h n o l o g y , t h e3 gt e c h n o l o g yc o p e d 、i t hm u l t i m e d i ai n f o r m a t i o ns u c h 雒 i m a g e ,m u s i c ,v i d e os t r e a m ,a n dp r o v i d em u l t i p l ei n f o r m a t i o ns e r v i c e si n c l u d i n gw e bp a g e b r o w s i n g ,c o n f e r e n c ec a l l ,e c o m m e r c ea n ds oo n s t u d e n t s l e a r n i n gn ol o n g e rr e s t r i c tb yt i m e a n dl o c a t i o nv i a3 gm o b i l ep h o n ea n do t h e ri n t e l l i g e n tt e r m i n a le q u i p m e n t ,i tw i l lh a v e p o s i t i v ea n dd e e pi n f l u e n c eo nt h es t u d e n te d u c a t i o n m l e a r n i n gh a sm a n ya d v a n t a g e ss u c h 硒p e r s o n a l i z a t i o n p o p u l a r i z a t i o n , c o n v e n i e n ta n d s oo n ,t h e r e f o r eh a sg r e a tp o t e n t i a l i t y h o w e v e ra san e w l e a r n i n gm o d a l ,m - l e a f i n gi san e w r e s e a r c hf i e l da n dt h e r ea r es t i l lm a n yp r o b l e m sa w a i t i n gs o l u t i o n e f f e c t i v e l yu s i n gm o b i l e c o m p u t e ra i d e dt e a c h i n ga n dl e a r n i n gb e c o m er e s e a r c hc e n t e ro ft h i sf i e l d t h e r e f o r ei th a s i m p o r t a n ts i g n i f i c a n c et os t u d y0 nt h ec o n s t r u c t i o no fm l e a r n i n gs e r v i c e h a v i n gt h o r o u g h l yr e s e a r c h e dt h em - l e a r n i n gt e c h n o l o g y , i nt h i sp a p e r , w ep r o p o s ea c o n s t r u c t i o nm e t h o do fm o b i l e l e a r n i n g s e r v i c e t h em e t h o dc o n s t r u c t s p e r s o n a l i z e d k n o w l e d g eb a s e do nm - l e a r n i n gd a t a b a s ev i am u l t i t h r e a dn e t w o r kc r a w lc l a s s i f i e r h e s t a b l i s h e sg r i dn o d ea n ds h a r e sd a t ar e s o u r c e s o nt h em a n a g e m e n to f 鲥ds e r v i c e ,l e a r n e r s a c q u i r ek n o w l e d g ef r o mg r i dn o d eb yt h es h o r tm e s s a g es e r v i c e 。a p p l i c a t i o n t h em a i nc o n t r i b u t i o n so ft h i s p a p e rc o n c l u d e :( 1 ) t h ed e s i g na n dr e a l i z a t i o no f m u l t i t h r e a dn e t w o r kc r a w lc l a s s i f i e r , c o n s t r u c tk n o w l e d g ed a t a b a s eo fm o b i l el e a r n i n gs e r v i c e ( 2 ) p r o p o s ean e t w o r km o d a l b a s e do nw e b s e r v i c e ,c o n s t r u c t 酣dn o d ea n dn e t w o r k r e s o u r c e sb yu s eo ft h ec h a r a c t e r i s t i c st h a tw e b s e r v i c ei si n t e g r a t e di n t od a t ag r i d ( 3 ) s m s a d e v e l o p e db ys h o r tm e s s a g es e r v i c e ( s m s ) s e n da n dr e c e i v es h o r tm e s s a g ew i t hs h o r tm e s s a g e g a t e w a yb yc o m p u t e rt e l e p h o n yi n t e g r a t i o ng a t e w a y ( c t i g w ) ,m e a n w h i l es e a r c ha n d f e e d b a c kr e s o u r c e so nt h eg r i ds e r v i c e ( 4 ) q u i t eg o o ds o l v e sp r o b l e mo fh e t e r o g e n e i t y , s c a t t e r e dd i s t r i b u t i o nt h r o u g hb r o w s e ra c c e s s 鲥dn o d e ,a n dr e a l i z et h el e a r nm o d e b a s e do n b r o w s e r k e yw o r d s :m - l e a r n i n g ;g r i d ;w e b s e r v i e e ;b p ;s m s l i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名:捌! 茎 日期: 2 丝2 = 乏兰主 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:燃望指导教师签名: e t 期:带旧 期: 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 东北师范大学硕士学位论文 第1 章引言 1 1 移动学习 人类的文化发展史是一个不断的学习过程,经历了从简单到复杂,从低级到高级的 发展阶段,人们的学习方式从古老的口、耳发展到后来的文字印刷、报纸、书刊、广播、 电视、计算机等远程学习( d - l e a r n i n g ) ,从远程学习和数字学习( e l e a r n i n g ) 发展 到现在,随着移动电话、掌上电脑、智能手机,便携式电脑等设备在全球的迅速发展和 普及,以及3 g 通信时代的到来,为移动教育的开展提供了坚实的技术基础与物质准备【2 0 1 。 移动通信技术与移动计算技术及其相关设备在教育中的应用,使得教育中出现了一种崭 新的学习方式一移动学习( m - l e a r n i n g ) 。 1 1 1 移动学习的定义 目前国内外关于移动学习还没有一个明确的定义,领域内的专家学者各抒己见,从 不同的角度去理解和诠释移动学习。第一种是将移动学习理解为远程教育的一种教育阶 段。如远程教育专家d e s m o n dk e e g a n 博士【1 0 1 于2 0 0 0 年在上海作了从d - l e a r n i n g 到 e - l e a r n i n g ,从e - l e a r n i n g 到m - l e a r n i n g ) 的报告,提出远程学习、数字化学习和移 动学习是远程教育的三个发展阶段的观点。第二种认为移动学习是数字化学习的扩展学 习内容与数字化学习相同只是信息与知识获取的方式借助于移动通信网络和移动通信 设备。如欧盟数字化欧洲行动研究计划中特别开展的一项名为“行动”的移动学习 专项研究计划中对移动学习的界定,还有s u n 公司的移动学习专家m i c h a e lw e n g e r 针 对移动学习提出了他独到的见解,他认为移动学习并不是什么新鲜事物,因为在传统学 习中印刷课本同样能够很好的支持学习者随时随地进行学习,可以说课本在很早以前就 已经成为支持移动学习的工具,而移动学习也一直就在我们的身边。第三种是从认知与 学习的角度开展的研究,认为从内容与形式方面看,移动学习与数字化学习、网络学习 没有本质区别,但是移动学习的移动性、情境相关的特点使得其成为一种完全不同于数 字化学习、网络学习的一种全新学习技术与方式,学习环境是移动的,教师、研究人员、 技术人员和学生等学习者都是移动的( 3 5 】。如英国伯明翰大学移动学习研究小组就持此观 点。 最具有代表性的是a l e x z a n d e rd y e 1 j 等人在题为 m o b i l ee d u c a t i o n :ag l a n c ea t t h ef u t u r e ) 的文章中对移动学习( m - l e a r n i n g ) 作了一个较具体的定义:移动学习是 一种在移动计算设备帮助下的能够在任何时间任何地点发生的学习, 移动学习所使用 的移动计算设备必须能够有效地呈现学习内容并且提供教师与学习者之间的双向交流。 确切地说,移动学习是远程教育发展的新阶段,其特点是实现“随时、随地、随身、 随意 的学习。移动学习依托目前比较成熟的无线移动网络、国际互联网以及多媒体拱 术,人们能够使用移动设备( 如无线上网的便携式电脑、p d a 、智能手机、移动电话等) , 东北师范大学硕士学位论文 通过移动教学服务器,更为方便灵活地为人们实现交互式教学活动。 通过以上理解,移动学习是指依托无线移动通信网络技术和无线通信设备,学习者 能够随时、随地、个性化的获取数字化学习信息、资源和服务并且能够通过交互,有效 提高自身学习绩效的一种学习形式。 1 1 - 2 移动学习的特点 在普通的远程学习中,现代教育技术的兴起及其在远程教育中的广泛应用,为现代 远程教育展现了一个独特的学习环境,但由于信息传播媒介的局限,现代远程学习体系 无法建立广泛的、卓有成效的教育教学服务运行机制,仍然无法达到现代远程学习“在 任何时间、任何地点为任何学习者提供任何学习支持 的目标,因而影响远程学习者学 习的机会、效果和效率【4 ,6 】。移动学习的出现使得上述问题迎刃而解。这是因为移动学习 几乎具有固定远程学习所拥有的高效性、广泛性、交互性、共享性等优点,并且相对于 固定远程学习来说,它还具有如下特点: 1 无线性移动学习设备突破了有线连接所带来的束缚,可随时随地进行无线连 接。 2 灵活性由于移动终端具有便携的特点,而移动网络可以实现随时随地的通讯方 式,因此在移动学习中,学习者可以利用自己的任何时间( 例如乘车、娱乐的时间) 进 行学习,可以随时获取网上的学习信息,进行学习交流。 3 便捷性移动远程教育在应用上具有简便性的特点。首先,移动远程教育使用的 设备是便携设备,能随身携带,有效实现随时随地的网络连接、快速安装及设备的重新 使用等等。其次,它的有关功能仍然拥有固定远程教育所有的方便性。 4 个体性在现代社会中,传统的固定学习很难满足学习者的学习需要。作为网络 教育的延伸,移动学习继承了网络学习的特点,学习者可以根据自己的需要选择学习时 间、地点以及学习内容,从而实现学习的个性化【乳。 1 2 选题背景 从2 0 0 0 年开始美国加州大学伯克利分校( u cb e r k e l e y ) 人机交互研究室启动了名 为“m o b i l ee d u c a t i o n ”的项目以来,全世界的教育技术界的学者和无线移动与计算技 术设备研发商都开始密切关注移动学习的研究和实践1 2 1 1 。国外研究主要集中在欧洲和北 美的部分经济发达国家,研究目的主要是为了推向市场和改善教学环境。我国于2 0 0 1 年 1 2 月份由教育部高等教育司发出关于“移动教育的理论与实践研究项目的立项通知后, 移动学习开始在国内得到了广泛的关注。 目前国内关于移动学习的研究主要集中在基于短信业务的移动学习和基于浏览器 的移动学习,并且伴随移动通讯芯片、d s p 性能的提高以及3 g t g l 通信时代的到来,其研究 前景将更加广泛。中国移动的手机用户以每月2 0 0 万部的速度递增,可见手机的使用在 中国已经相当普遍,发送和接收短信是手机的一个普通功能,并且短信业务已经发展到 多媒体彩信业务阶段,除了语音、文字的传输外,还实现了彩色图像的传输。国内也有 东北师范大学硕士学位论文 学者对移动学习展开研究,如北京大学教育技术研究所申请了教育部的移动教育项目, 他们开发的短信教育平台已投入教学实验,并正在研究移动计算、移动数据库、移动网 站等。 移动学习使人们的学习不再受空间、时间、有线网络环境的限制,人们通过无线移 动计算设备的帮助,可以方便、灵活、个性化的通过移动学习服务器获取数字化学习资 源【1 9 】。发送短信到移动学习服务器,服务器根据人们的需要将信息进行反馈,也可以通 过浏览网页的方式访问移动学习服务器的资源,即使当前在带宽上还有一定的限制,但 随着3 g 时代的到来,所有眼前的问题将迎刃而解,为移动学习的发展带来更广阔的空间。 现代社会的人们需要进行终身学习,而移动学习是辅助人们实现终身教育的一种重要学 习方式,因此其发展在社会上将产生及其深远的意义。 1 3 研究意义 目前通过移动终端设备对知识的获取无论是基于浏览器【2 3 ,2 9 3 0 1 的还是基于短信息的 学习方式,都是知识的简单罗列,不能满足学习者个性化的要求,并且学习资源是零散 分布的,不能统一整合到一起。本文通过爬行分类器获取个性化知识,从而建立起知识 库,满足了不同学习者的个性化学习的要求,同时提出了基于w e b s e r v i c e 的网格模型, 网络资源不再是孤立的存在,网格服务管理器根据用户的请求将相应的资源通过短信息 以字节流的形式或者通过浏览器以x m l 的格式将数据反馈给学习者,实现了个性化学习 和资源共享,对移动学习技术的发展具有重要的意义。 1 4 论文的主要内容及结构框架 本文的主要工作: 1 通过阅读大量的国内外相关领域的文献,掌握了移动学习技术的发展趋势以及 移动学习发展中所面临的问题,详细阐述了移动学习服务器的模型和构建过程。 2 。本文实现了基于b p 人工神经网络的多线程网络爬行分类器,对多线程的类结构 设计进行了阐述,并对其性能进行了测试。提出了基于网格的w e b s e r v i c e 1 l , 1 5 月e 务模型, 分析其结构模型,阐述了其在实际应用中的可行性及其重要意义。实现了短消息应用程 序( s m s a ) ,s m s a 通过计算机电话集成网关( c t i g w ) 与短信网关程序( s m g w ) 进行短 信息的发送与接收,在网格服务器上进行资源的搜索和反馈。 3 移动学习服务器由网络爬行分类器构建的知识库、基于网格的w e b s e r v i c e 实现 的数据接口、短消息服务( s m s ) 2 2 , 2 3 , 2 4 中心组成,在实际应用中测试基于短信业务的移 动学习和基于浏览器的移动学 3 3 , 3 5 1 。 文章结构如下: 第一章为引言,介绍了移动学习的定义、特点、选题背景及研究意义。 第二章建立移动学习服务器的知识库,介绍基于b p 人工神经网络构建的多线程网 络爬行分类器,论述了b p 网络及知识库的构建。 第三章是知识库数据接口的实现,提出了基于网格的w e b s e r v i c e 服务模型。详述 3 东北师范大学硕士学位论文 了w e b s e r v i c e ,并对其架构模型进行了分析。 第四章对短消息程序进行设计和实现,对多线程多业务的管理进行详细设计,对其 工作过程进行说明。 第五章是由二章、三章、四章组成移动学习服务器,测试基于s m s 的移动学习和基 于浏览器的移动学习。 最后对本文工作进行了总结并对以后的工作提出展望。 4 东北师范大学硕士学位论文 第2 章建立移动学习服务器知识库 移动学习服务器的知识库主要是为满足人们个性化学习的特点,对外提供数据资 源。知识库的构建采用网络爬行分类器获取w e b 网络的资源,并对资源进行分类,存入 知识库。分类器采用b p 人工神经网络实现,因为b p 人工神经网络在非线性分类器中是 一个比较经典的算法,具有很好的容错性和鲁棒性。系统流程图如下: 图2 1 系统流程图 2 1 人工神经网络的应用 人工神经网络最早的研究是由2 0 世纪4 0 年代心理学家m c c u l o c h 和数学家p i t t s 合 作提出的,他们提出了一种简单的人工神经元模型,称为m - p 模型,拉开了神经网络研 究的序幕。目前神经网络理论的应用己经取得了令人瞩目的成绩,特别是在人工智能、 自动控制、计算机科学、信息处理、机器人、模式识别等方面都有重大的应用实践。下 面列出一些重要的应用领域。 1 模式识别和图像处理:主要有印刷体和手写体字符识别、语音识别、指纹识别、 图像识别、人体病理分析、目标检测与识别、图像边缘监测、图像分割、图像压缩和图 像恢复等。 2 自动控制:主要有化工过程控制、机器人运动控制、家电控制、石油精炼优化 控制和超大规模集成电路布线设计等。 。 3 处理组合优化问题:最典型的例子是成功地解决了t s p 问题,即履行推销员问 题,另外还有最大匹配问题、装箱问题和作业调度等。 4 预报和智能信息管理:主要有股票市场预测、地震预报、有价证券管理等。 5 信息技术领域:主要有自适应均衡、回波抵消、路由选择和a t m 网络中的呼叫 接纳识别及控制等。 6 卫生保健、医疗:比如通过训练自主组合的多层感知器可以区分正常心跳和非 正常心跳、基于b p 网络的波形分类和特征提取在计算机临床诊断中的应用。 7 焊接领域:国内外在参数选择、质量检验、质量预测和实时控制方面都有研究, 5 东北师范大学硕士学位论文 部分成果已得到应用。 8 空间科学:主要有空间交会对接控制、导航信息、智能管理、飞行器制导和飞 行程序优化管理等。 9 。经济:能对商品价格、股票价格和企业的可信度等进行短期预测。 1 0 其它领域:在数据挖掘、电力系统、交通、军事、矿业、农业和气象等方面也 有应用。 近几年来,神经网络理论引起世界各国企业家和科学家的重视。他们正在组织和实 施与此有关的重大研究项目。如美国的d a r p a 计划、日本的h f s p 计划、法国的“尤里卡 计划、德国的“欧洲防御计划和俄罗斯的“高技术发展”计划。我国在1 9 9 0 年举办神 经网络的学术年会,研究工作已在高等院校和研究单位开展。 2 2 人工神经网络的结构 由大脑神经网络的活动机理可知,仅由单个神经元是不可能完成对输入信息的处理 的,只有当大量的神经元组成庞大的网络,通过网络中各个神经元之间的相互作用,才 能实现对信息的处理与存储。同样道理,只有把人工神经元按一定规则连接成网络,并 让网络中各神经元的连接权按一定的规则变化,才能实现对输入模式的学习与识别。因 此,神经网络由许多并行运算、功能简单的单元组成,这些单元类似于生物神经系统的 神经元。神经网络是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同 处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能 实现的行为却是极其丰富多彩的。神经网络系统具有集体运算的能力和自适应的学习能 力。此外,它还有很强的容错性和鲁棒性,善于联想、综合和推广。 一般而言,人工神经网络中每一个神经元具有完全相同的结构,在没有特别规定的 情况下,神经网络是一个并行和分布式的信息处理网络结构,它一般由许多个神经元组 成,每个神经元只有一个输出,它可以连接到很多其它的神经元,每个神经元输入都有 多个连接通路,每个连接通路对应于一个连接权系数。大脑神经网络往往具有层状结构, 如大脑皮层的六层结构和小脑的三层结构:人工神经网络的连接形式,尽管其拓扑结构 有一些差别,但总的来说主要是如图2 1 ( 2 ) 所示的两种形式:阶层型和全互连接型。 ( a ) 阶层型 图2 2 人工神经网络的连接形式 6 ( b ) 全互连接型 东北师范大学硕士学位论文 2 3b p 神经网络分类器 2 3 1b p 神经网络结构 人工神经网络模型各种各样,目前己有数十种,它们是从各个角度对神经系统不同 层次的描述和模拟。代表性的网络模型有感知器、多层映射b p 网络、r b f 网络、双向联 想记忆( b a m ) 、h o p f i e l d 模型、b a t s m a n 机、自适应共振理论( a r t ) 、c p n 模型等。 目前以神经系统为中心的神经网络理论的研究正取得迅速的发展,它以自组织、自 学习、自适应的特点,已经广泛的被应用于众多领域。反向传播网络( b a c kp r o p a g a t i o n n e t w o r k ,简称b p 网络) 是对非线型可微分函数进行权值调整的多层网络。b p 网络包含 了神经网络理论中精华的部分,由于结构简单、容错性及鲁棒性强,得到了广泛的应用。 特别是它的数学意义明确、步骤分明的学习算法更使其具有广泛的应用前景。 b p 网络的结构如图2 2 所示,它有输入层和输出层,还有一层或多层隐层。 一- 图2 2b p 神经网络三层结构图 由于b p 神经网络隐层的存在,使得网络可以实现输入到输出的非线性映射,增加 网络层数可以更进一步地降低误差,但同时也使网络复杂化,增加了网络权值的训练时 间。误差精度的提高也可以通过增加隐层中的神经元数目来获得,其训练效果比增加层 数更容易调整。因此,一般情况,应优先考虑增加隐层中的神经元数,其直接影响神经 网络的学习能力和记忆能力。隐层神经元数目较少时,网络每次学习的时间较短,但有 可能因为学习不足造成网络无法记住全部学习信息,使权值无法达到全局最小。隐层神 经元数目越多那么网络识别也就越精确,但训练时间也越长,因此隐层神经元数不宜过 多,否则会造成网络存储容量过大,也会降低网络的抗嗓能力,进而使识别率急剧下降。 2 3 2b p 神经网络学习规则 b p 网络的传递函数一般为s 型函数: 。j m ) 2 高 误差函数为: 7 ( 3 1 ) f 一 一 一 一 一 一 东:t hv j i l i 范大学硕士学位论文 ( f 一y ,。,、 = t p 吃 其中,t 。,和d 。分别为网络的期望输出和实际计算输出。 反向传播算法的主要思想是从后向前逐层传播输出层的误差,以间接算出隐层误 差。算法分为两个阶段:第一阶段( 正向过程) 输入信息从输入层经过隐层逐层计算各 单元的输出值;第二阶段( 反向传播过程) 从输出层开始,误差逐层向前算出隐层各单 元的误差,并用此误差修正前一层权值。 在反向传播算法中通常采用梯度法修正权值,为此要求输出函数可微。我们研究处 于某一层的第,个计算单元,下标i 代表其前层第f 个单元,下标k 代表后层第k 个单元, o ,代表本层输出,形,和形汝是前层到本层的权值,如图2 3 所示: 图2 3b p 神经网络信息传播示意图 当输入某个样本时,从前到后对每层样本作如下计算: 1 一 n e t j2 乞q f o j = f ( n e t i ) 对于输出层而言,乃= d 是实际输出值,乃是理想输出值,此样本下的误差为: ( y j - y j ) 2 = l 一 2 定义局部梯度 艿j :旦 。 o n e t j 考虑权值,。,对误差的影响,可得 一一焉= 旦e n e t j 署瑚 籼跏- j j l 权值修正应使误差最快的减小,修正为 8 ( 3 - 3 ) ( 3 - 4 ) ( 3 - 5 ) ( 3 6 ) ( 3 - 7 ) 东北师范大学硕士学位论文 k = 1 6 一 ( 3 - 8 ) w o ( t + 1 ) = w v ( t ) + a w o ( t ) ( 3 - 9 ) 如果节点,是输出单元,则: 0 = y j ( 3 1 0 ) 6 ,= 蒡玺_ _ ( 乃一巧咖呦 ( 3 - 1 1 ) 如果节点歹不是输出单元,则0 j 对后层的全部节点都有影响。因此 呼盖o n e t = 莩盖o n e t 等o o 盖o n e t k ( 叫 ( 3 - 1 2 ) 。 ,乍iff 二一 。、 ”一7 综上所述,采用s i g m o i d ( s i g m o i d 函数如图2 4 所示) 作传递函数的反向传播算法 步骤如下: jl , 厂 。 l 0 7 图2 4s 函数曲线 1 选定权系数初始值。 2 重复下述过程直至收敛 ( 1 ) 从前向后逐层计算各单元口 忍p t = g 1 乃2 鬲 ( 2 ) 对输出层计算6 8 j = ( y o j ) o j ( 1 一o j ) ( 3 ) 从后向前计算各层6 , 9 ( 3 1 3 ) ( 3 - 1 4 ) ( 3 - 1 5 ) 东北师范大学硕士学位论文 6 2 哆( 卜哆) 咿t ( 3 1 6 ) 膏 ( 4 ) 计算并保持各权值正量 a w 驴( f ) = a a w 口o 一1 ) + t 1 8 0 , ( 3 - 1 7 ) ( 5 ) 修正权值 o + 1 ) = w v ( t ) + a w v ( t ) ( 3 1 8 ) 爬行分类器的目的是获得特征后,设计分类精度高、误识率低、可靠性好的分类器, 神经网络分类器在模式识别中得到了广泛的应用。本章研究了基于b p 神经网络的分类 器。b p 神经网络其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程 组成。正向传播时,输入样本从输入层传入,经过隐层处理后,传向输出层,若输出层 的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传时将输出误差以 某种形式经隐层向输入层逐层反传,并将误差分摊给各层所有单元,从而获得各层单元 的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向 传播的各层权值调整过程是周而复始地进行的。权值不断调整的过程,也就是网络的学 习训练过程。 2 4 多线程网络爬行分类器 多线程网络爬行分类器的运行分为三个阶段,训练阶段、爬行阶段、分类阶段。在 训练阶段,首先对网页进行预处理操作,提取正文、关键词提取、训练b p 神经网络; 在爬行阶段的主要任务是利用多线程爬行器抓取w e b 网页的资源,存入待分类队列;分 类阶段主要任务是对待分类队列中的资源按先进先出的顺序输入b p 神经网络,并把分 类结果存入知识库。训练阶段工作由主线程来完成,爬行阶段的工作由爬行线程来完成, 分类阶段的工作由工作线程完成: , 2 4 1 多线程网络爬行分类器的主要对象 1 爬行器( c r a w l e r a s ) :爬行器线程的主要功能是使用正则表达式获取w e b 资源 的正文,提取超级链接和纯文本。提取的超级链接保存在等待队列中,等待爬行线程的 运行,纯文本则以文本文件的格式保存在制定目录,等待分类器线程对资源进行归类。 图2 5 爬行器 2 分类器( b p a s ) :分类器的主要功能是对爬行器获得的资源,按照先进先出的顺 序进行特证提取,输入训练好的b p 网络,根据输出判断资源类别,存入知识库。b p 结 构类对象由输入模式、输出模式、神经元组成。 1 0 东北师范大学硕士学位论文 图2 6 输入模式 图2 7 输出模式 图2 8 神经元 图2 9b p 结构 2 4 2 分类器的主要功能实现 1 激活函数( s i g m o i d ) 。p x :中间层或输出层的输入;_ a l p h 孕:退火系数;t h e t a :。 阈值。 s i g m o i d 激活方法定义 d o u b l en e u r o n :s i g m o i d ( d o u b l ep x ) x = p x : y = 1 0 ( 1 o + m a t h :e x p ( - 1 o , a l p h a * ( x t h e t a ) ) ) ; r e t u r ny : 2 计算误差。如果计算得到的误差大于预先给定的误差,训练过程将反复进行, 直到收敛为止。 对应每一输入模式得到期望输出与相应输出的误差进行迭代 f o r ( j = 0 :j g e t m e m b e r ( ) :j + + ) d = d e s i r e d 一 g e t d e s i r e d ( i ,j ) - : y o = o u t p u t j g e t y 0 : e r r o r = e r r o r + ( d y o ) 半( d y o ) : 东北师范大学硕士学位论文 计算误差 e r r o r = e r r o r d e s i r e d - g e t n u m b e r0 d e s i r e d 一 g e t m e m b e r ( ) : e r r o r = m a t h :s q r t ( e r r o r ) : 2 5 小结 移动学习服务器的知识库主要是为满足人们个性化学习的特点,方便人们获取知 识,改变以往提供知识量小的缺点。本文采用基于b p 神经网络的多线程网络爬行分类器 构建知识库,将网络知识分为数学、语文、金融、政务等,这样人们可以通过手机以基 于浏览器的方式查询自己感兴趣的知识。之所以采用b p 神经网络作为分类器,是因为b p 人工神经网络在非线性分类器中是一个比较经典的算法,具有很好的容错性和鲁棒性。 1 2 东北师范大学硕士学位论文 第3 章知识库数据接口的实现 知识库对外提供服务的数据接口采用基于网格的w e b s e r v i c e 实现,w e b s e r v i c e 为 实现资源共享提供了一种新的解决方案,是网格服务的基础。基于网格的资源共享可以 称为数据网格,它能将各种不同的计算资源有机的整合在一起。采用基于网格的 w e b s e r v i c e 实现,可以有效的减少服务器的压力,知识资源分布在各个网格节点,由网 格服务器统一管理,面对不同用户提出的不同的知识请求,可以由不同的网格节点为其 提供服务,并且知识可以被跨平台应用程序访问,解决了知识零散、异构、封闭性等问 题。 3 1w e b s e r v i c e 介绍 w e b s e r v i c e 使用易理解的、简单的标准w e b 协议作为组件界面描述和协同描述规 范,通过) ( m l 、s o a p 、w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) ,u d d i ( u n i v e r s a l d e s c r i p t i o n ,d i s c o v e r y ,a n di n t e g r a t i o n ) 【1 4 】等技术手段,这些协议在涉及到操作 系统、对象模型和编程语言的选择时,没有任何倾向,因此w e b 服务将会有很强的生命 力,完全屏蔽异构软件平台的差异,是一种跨平台和具有高度可集成能力的技术。同 c o r b a 、d c o m 、r m i 和e j b 一样,w e b s e r v i c e 是一种分布式计算技术,在w e b s e r v i c e 基 础上可以编写出b s 或c s 程序,调用知识库对外提供的数据接口,全面解决资源的零 散性、异构性和封闭性等问题,实现了在当前环境下最高程度上的资源共享。 3 1 1w e b s e r v i c e 平台及组成协议 为了达到具有跨平台的可互操作性这一目标,w e b s e r v i c e 建立在一些通用协议的基 础上,w e b s e r v i c e 最基本的平台由h t t p + x m l 组成,功能全面的平台提供了使用标准协 议( 如h t t p 、) ( m l 、x s d 、s o a p 、w s d l 和u d d i ) 在松耦合环境中交换消息的能力的应用 接口程序。w e b s e r v i c e 使得可以在不同环境中的公司内部以及在这样的公司之间生成 模块化应用接口程序,从而使这些应用接口程序可以与多种多样的实现、平台和设备进 行交互。这些应用接口程序的基于s o a p 的捌l 消息可以具有定义完善的部分( 结构 化和类型化的部分) 或者定义比较松散的部分( 使用任意) ( m l ) 。w e b s e r v i c e 使用面向 服务的构架,它包含三个参与者:服务提供者、服务请求者和服务代理【】2 1 。首先,服务 提供者将所能提供的服务接口用w s d l 描述出来,然后使用u d d i 在服务代理将这些服务 接口进行注册:服务请求者到服务代理查询自己所需的服务:服务请求者通过使用u d d i 在服务代理处查询,得到所需的服务接口的描述文件,然后绑定到这些服务,最终完成 调用。三者之间的关系如图3 1 所示: 1 3 东北师范大学硕士学位论文 下面对其组成协议进行详细介绍: 1 可扩展标记语言x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 。w 3 c 发布的是一种简化 标记语言,它具有形式与内容分离的特点,目前已经是w e b 应用领域的数据标准。利用 x m l 统一数据描述格式,可建立教育资源描述的规范体系,解决目前同类程序由于数据 格式的不一致而无法相互集成的问题。 2 简单对象访问协议s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c 0 1 ) 。定义了传递x m l 编码数据时的统一方式及使用h t t p 作为底层通信协议时执行远程调用( r p c ) 的方法。 利用s o a p 协议统一数据交换格式,可保证资源在异构平台之间的无障传输。s o a p 协议 使得w e b s e r v i c e 具有平台和语言无关性、使用多样性等特点,可满足资源分布于不同 操作系统平台、用不同软件产生并应用于不同场合。 3 w e b s e r v i c e 描述语言w s d l ( w e b s e r v i c ed e s c r i p ti o nl a n g u a g e ) 。定义了 w e b s e r v i c e 以及如何调用它们。w s d l 文档可用于动态发布、查找以及绑定w e b s e r v i c e 。 4 u d d i 统一描述、发现、集成。提供一套标准化描述以及动态提供一套对 w e b s e r v i c e 的标准化描述和动态发布、查找、调用w e b s e r v i c e 的机制。是分布式 w e b s e r v i c e 的信息注册规范,w e b s e r v i c e 可以根据这一规范进行注册,以便被其他需 要该服务的用户发现。各种不同的应用系统通过u d d i 机制发现并集成不同的 w e b s e r v i c e ,从而大大减少了重复开发,实现共享与协作的目的。 标准核心构件如下: 服务发现 u d d i 服务描述 w s d l 、x m 【l 、s c h e m a 、d o e s 消息格式 s o a p 编码 x m l 传输 h 1 1 p 、s m t p 图3 2 标准核心构件 1 4 东北师范大学硕士学位论文 综上所述,w e b s e r v i c e 是基于x m l 的通讯协议,用于零散和分布式环境下网络信 息交换。在此协议下,软件组件或应用程序能够通过标准的h t t p 协议进行通讯。它的 设计目标就是简单性和扩展性,这有助于大量异构程序和平台之间的互操作性,从而使 存在的应用程序能够被广泛的用户访问。 3 1 2 基于网格的w e b s e r v i c e 服务序列 移动学习服务器对外提供服务的数据接口采用基于网格的w e b s e r v i c e 实现, w e b s e r v i c e 提供了在不同体系结构下构建应用接口服务、数据的一种方案,它是网格服 务的基础。网格就是一个集成的计算与资源环境,或者说是一个计算资源池【i7 1 。基于网 格的资源共享可以称为数据网格,它能将各种不同的计算资源有机的整合在一起,让人 们从知识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论