




已阅读5页,还剩69页未读, 继续免费阅读
(计算机应用技术专业论文)基于flex的企业协作平台及其用户使用挖掘的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文摘要 摘要 随着信息技术的高速发展,富客户端技术在w e b 应用中越来越广泛。w e b 作为推动电子商务发展的媒体,越来越多的企业通过它来改善业务运行模式,提 、高与客户的合作效率。另一方面,随着企业信息平台用户的与日俱增,如何从大 量的用户使用信息中挖掘出有用的知识就成了企业发现新的商机和改善现有业 务模式的关键问题。 本文首先介绍了f l e x 技术和w e b 使用挖掘。然后对基于f l e x 的企业协作平 台设计进行了深入的分析,包括系统的整体架构,客户端设计和基于j 2 e e 架构 的服务器端设计。给出了一种s p r i n g 框架与b l a z e d s 相集成,数据持久层采用 h i b e r n a t e 的服务器端设计方案。同时也对客户端的重用组件库构建、c a i m g o r m 框架的改进、f l e x 页面的深度链接、客户端的性能调优等问题进行了分析并给出 详细的解决方案。接着根据企业需求,研究了企业协作平台中如何实现用户使用 挖掘。提出了一种基于f l e x 客户端的用户使用数据采集框架,并通过蚁群聚类算 法对用户使用数据进行聚类分析,从而得到关于用户使用后台服务的有用知识。 本文最后分析了如何用f l e x 图表进行聚类结果的可视化分析,构建了一个基 于f l e x 自身组件的聚类分析可视化组件并将其集成到企业协作平台中去。 关键词:富客户端,w e b 应用,f l e x 技术,用户使用挖掘,蚁群聚类算法,聚 类分析,可视化分析 浙江大学硕士学位论文 a b s t r a c t a b s t r a c t w i t ht h er a p i di m p r o v e m e n to fi n f o r m a t i o nt e c h n o l o g y , r i c hc l i e n th a sb e c o m e m o r ea n dm o r ep o p u l a ri nw e ba p p l i c a t i o n m o r ea n dm o r ee n t e r p r i s e su s ew e b ,w h i c h i sam e d i af o rd r i v i n ge - b u s i n e s sd e v e l o p m e n t ,t oi m p r o v et h ew a yo fd o i n gt h e i r b u s i n e s s ,a n dt oi m p r o v et h ee f f i c i e n c yo fc o m m u n i c a t i o nw i t ht h e i rc l i e n t s o nt h e o t h e rt 姗d ,耐吐lt h er a p i di n c r e a s eo fe n t e r p r i s ei n f o r m a t i o np l a t f o r m su s e r s ,t h e p r o b l e mt h a th o wt od i go u tu s e f u lk n o w l e d g ef r o m m a s su s e r su s a g eh a sb e c o m et h e k e yp r o b l e mf o re n t e r p r i s et od i s c o v e rn e wb u s i n e s so p p o r t u n i t i e sa n di m p r o v ec u r r e n t b u s i n e s sm o d e t h i sp a p e rf i r s t l yi n t r o d u c e df l e xt e c h n o l o g ya n dw e bu s a g em i n i n g t h e ni td i d f u r t h e ra n a l y s e sf o r t h ed e s i g no ff l e xb a s e de n t e r p r i s ec o l l a b o r a t i o np l a t f o r m , i n c l u d i n gs y s t e ma r c h i t e c t u r e ,c l i e n ts i d ed e s i g na n dt h es e r v e rs i d ed e s i g nb a s e do n j 2 e ef r a m e w o r k b e s i d e s ,i tp r o p o s e do u tas e r v e rs i d es o l u t i o nt h a ts p r i n g f r a m e w o r ki n t e g r a t e sw i t hb l a z e d sa n dh i b e r n a t ei sc h o s e na st h ed a t ap e r s i s t e n c e l a y e rf r a m e w o r k m e a n w h i l e ,i td i dt h ea n a l y s e sf o rc l i e n tr e u s a b l ec o m p o n e n t sl i b r a r y c o n s t r u c t i o n , c a i m g o r mf r a m e w o r ki m p r o v e m e n t s ,d e e pl i n k i n gf o rf l e xp a g e sa n d c l i e n ts i d ep e r f o r m a n c ei m p r o v e m e n t s ,a n dp r o p o s e do u tt h ed e t a i l e ds o l u t i o n s a n d t h e n , a c c o r d i n gt oe n t e r p r i s er e q u i r e m e n t s ,t h i sp a p e rf o c u s e do nt h ep r o b l e mt h a th o w t oi m p l e m e n tu s e ru s a g em i n i n g i tp r o p o s e dad a t ac o l l e c t i o nf r a m e w o r kb a s e do nf l e x c l i e n t ,a n da p p l i e dt h ea n tc o l o n yc l u s t e r i n ga l g o r i t h mt od ot h ec l u s t e r i n ga n a l y s i sf o r u s a g ed a t a , a n df i n a l l yw eg o tu s e f u lk n o w l e d g eo ft h eb a c k e n ds e r v i c e su s a g eb y c l i e n t s a tl a s t ,t h i sp a p e ra n a l y z e dh o wt ou s ef l e xc h a r t i n gt od ot h ev i s u a la n a l y s i sf o r u s e r s u s a g ed a t a , c o n s t r u c t e dav i s u a lc o m p o n e n tf o rc l u s t e ra n a l y s i sb a s e do nf l e x i t s e l fa n di n t e g r a t e dt h i sv i s u a lc o m p o n e n ti n t oe n t e r p r i s ec o l l a b o r a t i o np l a t f o r m k e y w o r d s : r i c hc l i e n t ,w e ba p p l i c a t i o n , f l e xt e c h n o l o g y , u s e ru s a g em i n i n g , a n tc o l o n yc l u s t e r i n ga l g o r i t h m ,c l u s t e r i n ga n a l y s i s ,v i s u a la n a l y s i s 浙江大学硕士学位论文图目录 图目录 图1 1 数据库中知识发现的过程4 图2 1f l e x 应用程序运行机制8 图2 2f l e x 客户端程序的一般结构9 图2 3f l e x 企业级应用整体框架1 0 图2 4w e b 使用挖掘的流程。1 5 图3 1 系统的整体架构。2 2 图3 2 基于组件构成的客户端页面2 3 图3 3 企业协作平台服务器端的整体设计2 4 图3 4 可配置弹出窗口的截图31 图3 5 改进前的页面更新策略3 2 图3 6 改进后的页面更新策略3 3 图4 1 基于f l e x 客户端的数据采集架构4 6 图4 2 一组用户使用数据初始化后的情况5 3 图4 3 一组用户使用数据迭代1 0 6 后的情况5 4 图5 1 各公司对常用服务使用情况的线条图5 7 图5 2 各公司对s e r v i c e2 使用情况的圆饼图5 8 图5 3 各公司对常用服务使用情况的柱状图5 9 图5 4 具有交互性的聚类结果显示组件6 1 i v 浙江大学硕士学位论文 表目录 表目录 表4 1 企业协作平台中的用户使用记录样本4 2 表4 2 扩展日志格式的样本数据4 4 表4 3 聚类结果的数据统计5 5 表4 4 各公司常用服务使用的百分比5 5 v 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得逝姿盘堂或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文作者签名:前环狁矽 签字日期: 珈扣年夕月夕日 学位论文版权使用授权书 本学位论文作者完全了解逝婆盘堂有权保留并向国家有关部门或机构 送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘堂可 以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 吻懈矽 导师签名: 签字日期:劢f 。年;月7 日 签字日期: 蚀 客户端应用程序不能缓存多页面的数据,每次页面的跳转,浏览器都需 要从服务器端重新读取数据,从而增加了服务器的负载。此外,页面数 据下载的过程中,整个页面是处于“阻止”状态,用户访问页面的等待 时间大大地增加。 传统b s 结构应用程序跨平台维护成本较高。不同操作系统下的浏览器, 相同操作系统下的不同浏览器,以及同一浏览器的不同版本,都有可能 导致浏览器端的数据显示不一致。因此,开发和维护统一的客户端成本 相对较高,也需要较长的时间。 , 传统b s 结构应用程序中,数据显示元件种类不丰富,用户友好性和交 互性较差,同时也影响开发者的开发效率。 1 1 2 富客户端技术 富客户端应用程序( r i c hi n t e m e ta p p l i c a t i o n ) 概念源于m a c r o m e d i a 公司在 2 0 0 2 年3 月发表的一份白皮书,它最大的特点是将大部分处理任务都从用户界 面端移植到客户端,仅保留一些必要数据与服务器端进行信息交互。与传统w e b 应用技术相比,它具有如下特点: 提高了服务器的性能。r i a 页面一般不需要页面刷新就可以将应用程序 下载到客户端,而且a 框架能使更多的计算放在客户端,所以服务器 1 h t t p :w w w c 2 i s o f t i n w h i t e p a p e r s r i c h c l i e n t p d f 2 浙江大学硕士学位论文第l 章绪论 端的计算负载在很大程度上减轻了。 提高了用户体验。r i a 中的用户接口提供了传统h t m l 中没有的用户行 为特征。这些特征包括:控件拖放,客户端进行的复杂计算,数据动态 更新的组件。 为可执行代码,客户端内容,以及客户端与服务器的通信提供一个高效 的、高性能的运行环境。 将内容,通信,和应用程序接口集成到一个通用的环境。 为用户交互性提供强大的、可扩展的对象模型。 使富客户端能够使用应用程序服务器提供的w e b 和数据服务。 使用户能够使用在线和离线的客户端。 在不同的平台和设备下使开发仍然非常简单。 提高开发者的效率。r i a 开发是基于可重用组件的开发模型的,并且这 种开发方法很容易学习。 1 1 3 数据挖掘 数据挖掘【4 】最早于1 9 9 5 年美国计算机年会上提出,它是指人们从大量的数据 中,通过某些分析技术,提取出隐含在其中有用的信息和知识的过程。数据挖掘 的实质是知识发现( k n o w l e d g ed i s c o v e r y ) 技术在数据库领域中的应用【5 1 。近年来, 随着互联网的普及和发展,人们接触到的数据和知识呈指数级增长,如何从海量 且丰富多样的数据中提取出有效知识就成了首要解决的难题。因此,知识发现和 数据挖掘已经成了这一方面非常重要而又热门的研究领域。 知识发现和数据挖掘中一个重要的共同目标是将数据转换成知识。因此,数 据挖掘应该是知识发现过程中的核心部分。如图1 1 【6 】所示,知识发现由以下步骤 组成: 数据筛选:是指从数据库中得到原始数据之后,由于原始数据含有大量 的无关数据,因此根据挖掘的需要,经过一定的筛选过滤,从而得到我 们要进行深入知识发现的目标数据。 浙江大学硕士学位论文第l 章绪论 数据清洗:是指将目标数据通过某种方法进行增加删除,从而得到利于 挖掘的数据集。 数据转换:由于实际应用过程中,预处理后数据的某些属性特征不能以 数学的形式表示,直接将数据挖掘方法应用上去则难以挖掘出有效信息。 因此,如何用数学方法将预处理后的数据进行转换,使之满足数据挖掘 数学模型成了这一步的关键问题。 数据挖掘:这步的主要工作是,通过上一步得到转换后的数据集后,选 择适当的数据挖掘模型,并从这一数据集中挖掘出有效的信息。 结果评价:得到挖掘出的信息后,人们需要建立起一套指标来评价所得 到的信息是否是人们所感兴趣的、有用的知识。评价结果的好还直接反 映了上一步骤所选模型的优劣程度。 1 2 研究内容和意义 图1 1 数据库中知识发现的过程 企业协作平台是企业为改善现有业务流程,改变与客户的商业合作方式,为 用户带来全新用户体验的富互联网应用程序。本文在介绍f l e x 技术和w e b 使用 挖掘的基础上,给出了基于f l e x 的企业协作平台架构,解决了平台设计中的关键 问题,并提出了其中的用户使用数据的分析问题。重点分析了在基于f l e x 的企业 4 浙江大学硕士学位论文 第1 章绪论 协作平台中,如何进行用户使用挖掘的问题。尤其是关于用户使用数据采集的问 题,本文给出了一种基于f l e x 与j 2 e e 框架的方法。然后对所采集的数据运用蚁 群聚类算法进行聚类,并且通过f l e x 图表的形式,将聚类结果进行可视化模式分 析。最后提出了一种基于f l e x 图表的可视化组件构建,从而为企业协作平台提供 了一种高效简便的聚类分析工具。 本文的研究意义在于,通过分析和实现企业协作平台的用户使用挖掘,从而 给基于f l e x 客户端的用户使用挖掘这类问题提供一种较为通用的实现框架。同 时,企业根据用户使用挖掘的结果,往往能发现有效的信息和知识,从而为企业 协作平台管理人员发现用户需求、优化服务模块提供重要依据,同时也为企业高 层发现新业务,做出新决策提供新方向,为企业将来发展带来潜在的商机。 1 3 论文组织结构 论文分为六章,各章主要内容如下: 第一章介绍相关研究背景,研究内容和研究意义。 第二章介绍f l e x 技术和w e b 使用挖掘,重点介绍了f l e x 的客户端开发框架 和w e b 使用挖掘的过程和相关技术。 第三章介绍了f l e x 技术在企业协作平台中的应用,包括系统的业务性需求分 析和非业务性需求分析。然后在系统整体设计的基础上,重点分析了客户端和服 务器端的设计中所遇到的关键问题,并给出了详细的解决方案。最后还对系统的 安全性设计做了适当的论述。 第四章主要介绍了企业协作平台中如何进行用户使用挖掘,它包括用户使用 挖掘的原因,用户使用数据格式的分析,用户使用数据的采集框架设计,以及蚁 群聚类算法在用户使用数据挖掘中的应用。 第五章主要根据聚类结果可视化需求,介绍了如何使用f l e x 图表组件进行用 户使用挖掘结果可视化分析,并且提出了一种基于f l e x 图表的可视化分析组件构 建的方法,最后还分析了如何将该组件集成到企业协作平台中去。 第六章对全文的进行了概括和总结,并分析了需要进一步工作的情况。 浙江大学硕士学位论文第l 章绪论 1 4 本章小结 本章简要介绍了论文的研究背景,包括相关领域研究状况、相关技术介绍, 以及论文在这方面的研究内容和意义。 6 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 第2 章f l e x 技术与w e b 使用挖掘 由于f l a s hp l a y e r 在浏览器中的普遍性安装,使得f l e x 技术成为当今世界上 最为热门的富客户端技术。而互联网的普及使得w e b 上的数据每天都在海量地增 长。因此,w e b 使用挖掘也逐渐成了w e b 技术中的热门研究领域。 2 1f l e x 概述 e q u a ti o ns e c ti o n ( n e x t ) 传统的应用程序开发者发现,将动画元素 添加到w e b 应用中具有很大的挑战性。于是,m a c r o m e d i a 公司为解决该问题而 创建了f l a s h 平台。而f l e x 则是由a d o b e 公司开发提供的一个软件开发工具,它 主要用于开发和部署基于a d o b ef l a s h 平台的,跨平台通用的富互联网应用程序。 其特点是开发高效,源代码开源,并且能运行在所有主流的浏览器和操作系统之 上。除此之外,由于a d o b ea i r 技术的支持,使用f l e x 开发的a i r 应用程序也 能部署为桌面应用程序,从而拓宽了f l e x 的应用领域。f l e x 的核心是f l e x 软件 开发包( f l e xs d k ) ,它由一系列用户组件构成,它包括按钮、列表、树、数据格 ( d a t a g r i d ) 、文本控件,以及各种各样的页面和控件容器。图表和图片等资源可以 另外添加。而其它特性,如控件托放、对话框、动画效果、应用程序状态、表单 验证等,也都包含在该框架中。 2 1 1f l e x 运行机制 f l e x 主要由m x m l 和a c t i o n s c r i p t 构成。m x m l 语言是基于x m l 语言演化 而来,它为应用程序开发者创建图形界面提供了一种非常简便的方式。而基于 e c m a s c r i p t 标准的a c t i o n s c r i p t 语言,则是f l a s hp l a y e r 中的核心语言,f l e x 中 图形界面和用户的交互性基本上是通过它在f l a s hp l a y e r 中的执行来完成。由于 f l e x 的运行最终需要通过f l a s hp l a y e r 对s w f 文件的解释执行,所以f l e x 应用程 序运行的关键问题是如何将一堆源文件编译成可运行的s w f 文件。图2 1 描述了 f l e x 是如何运行的。首先,应用程序开发者编写的m x m l 文件和a c t i o n s c r i p t 7 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 文件,结合相关的资源文件( 如图片文件,音频文件,x m l 文件等) ,以及f l e x 自 身类库,通过f l e xs d k 编译,生成了s w f 文件。然后,用户通过浏览器访问包 含该s w f 文件的网页,服务器就会寻找到相应的s w f 文件,并且将其下载到客 户端浏览器,该s w f 文件就可以在浏览器中的f l a s hp l a y e r 运行。如果运行时需 要服务器端的数据和服务( 如h t t p 服务,w e b 服务等) ,那么该文件会使用相应 的协议进行远程调用,读取远程数据或运行结果并显示在浏览器上。事实上,与 基于h t m l 的w e b 应用程序相比,f l e x 客户端具有强大的数据保存能力和处理 能力,当客户端有数据需要改变时,用户不需要重新下载该页面并且等待数据下 载完毕才可进行交互性操作,而只需要等待相应控件更新完数据即可。 图2 if l e x 应用程序运行机制 8 学碰# 位t 文第2 章n c x 技术5 w e b 使月挖掘 2 1 2f l e x 客户端程序结构 f l e x 中很重要的一个特点是,页面元素种类丰富,易于重用,而且m x m l 语言使得开发界面变得更加简单高效。如图22 所示,一个f l e x 应用程序的结构 非常清晰,它一般由三层容器结构,加上具体的用户控件和a c t i o n s c f i p t 实现组 成。a p p l i c a t i o n 在f l e x 中表示为应用程序容器,一个f l e x 应用程序只能有一个 a p p l i c a t i o n 。因此,f l e x 应用程序的最外层是a p p l i c a t i o n 。然后在a p p l i c a t i o n 容 器中,添加适当的应用程序具体需要的容器,如c a a v a s ,b o x 等等。在这基础之 上,继续添加具体的页面排版容器,这些容器往往是具体用户控件的父类,它们 直接负责用户控件的位置排放。最后,将用户控件直接添加上这些排版容器之上, 并且添加相应的a e t i o n s c r i p t 实现,包括远程调用。控件事件处理,和控件之间 的逻辑。 图2 2f l e x 客户端程序的一般结构 由于f l e x 的高效开发的特点一般情况下,其主要开发流程如下: 使用一组预先定义的控件( 如表单,按钮等) 来定义一个应用程序接口。 根据用户接口设计重新排放这些组件。 使用样式( s t y l e s ) 和主题( t h e m e s ) 来做可视化设计,从而增强页面元素的用 户体验度。 9 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 添加动态行为,例如使应用程序的某部分和另外某部分相交互。 定义并连接所需要的数据服务,以便f l e x 端代码能进行远程调用。 将源代码编译成一个s w f 文件并运行在f l a s hp l a y e r 中。 2 1 3f l e x 企业级应用体系结构 由于在多层结构模型中,f l e x 属于表现层,因此要发挥它在企业级应用中强 大的客户端优势,必须结合有效的服务器端技术。j a v a2e n t e r p r i s ee d i t i o n ( j 2 e e ) 由于其自身的成熟性和跨平台性,是与f l e x 技术相结合的热门技术平台。图2 3 - 描述了基于j 2 e e 的f l e x 应用程序整体框架。从中可以看出,f l e x 数据服务( f l e x d a t as e r v i c e s ,简称f d s ) 为f l e x 客户端提供了丰富的远程通信协议:简单对象传 输协议( s o a p ) ,h t t p h t t p s 协议,a c t i o nm e s s a g ef o r m a t ( a m f ) 协议和实时消 息协议( r t m p r t m p s ) 。这些协议可以同时被一个客户端使用,从而充分发挥了 f l e x 与j 2 e e 服务器之间强大的通信能力。 w e bb r o w s e r s f l a s hp l a y e r if r a j 2 1 竺! ! 竺= = = 二= j - 二丌嘴m f 。 1 2 e es e r v e r f f l e x | d a t a 鲫dm e s s a g e 、 已d a t as e r v i c e snl 、,j ,m a n a g e m e n t - ,。脚 肌s i n e s s l a y e r i e 皿,朋, : l r 伽a y e r s e t r v i 如,h i b e r n a t e , i b a tis , 、 石n t e r p r l s e, 、 r e s o u r c e s r e s o u r c e s1 同同匿司围 图2 3f l e x 企业级应用整体框架 1 h t t p :p o w e r i b o f i l e s w o r d p r e s s c o m 2 0 0 7 0 6 i n t r o d u c t i o n - t o - f l e x - 2 p p t l o 浙江大学硕士学位论文 第2 章f l e x 技术与w e b 使用挖掘 2 2f l e x 客户端开发框架 传统的客户端开发模式是以界面为中心,根据界面添加数据显示和相关逻 辑。于是,当系统较为庞大的时候,以界面为中心的页面代码,数据显示以及应 用程序的逻辑就杂乱地混合在一起,增大了系统继续开发和维护的难度,代码重 用率不高,程序的错误也难以发现。因此,采用合理正确的设计模式对客户端开 发就显得尤为重要。 m v c 设计模式【7 】就为该问题提供了一套很好的解决方案。这里的m v c 分别 代表模型( m o d e l ) 、视图m e w ) 、控制器( c o n t r o l l e r ) 。其核心思想是减少数据显示 和应用操作的耦合度,将应用程序的数据和程序逻辑分离开来,从而提高了代码 的可维护性和扩展性,同时也极大程度地优化了程序的整体结构,提高了代码的 重用率和开发效率。 c a i m g o r m 框架一是f l e x 客户端应用m v c 设计模式的一种轻量级的主流框架, 是a d o b e 公司推行大型r i a 系统开发的最佳实践。除了m v c 设计模式,单例模 式( s i n g l e t o np a t t e r n ) 和命令模式( c o m m a n dp a t t e r n ) 也是c a i m g o r m 框架中的重要 模式。下面就从m o d e l ,v i e w 和c o n t r o l l e r 三方面理解c a i r n g o r m 框架。 m o d e l m o d e l 层是客户端数据存储的地方,它并不需要知道页面视 ( v i e w ) 或者控 制器( c o n t r o l l e r ) 的情况。c a i m g o r m 的m o d e l 层主要由m o d e l l o c a t o r 和数据对象 组成,m o d e l l o c a t o r 是c a i m g o r m 提供的接口,所有客户端的m o d e l 类都要实现 它。只有这样,应用程序初始化的时候,客户端的m o d e l 类也会随之实例化,并 且只有一个实例。因此,一般情况下,客户端页面之间较为通用的数据需要存储 在m o d e l 中。这里所强调的是通用数据,因为只有当数据在不同页面被共享的时 候,m o d e l 实例中的数据才体现出m v c 的思想。事实上,如果将大量只是在某 一页面下使用的数据添加到m o d e l 类的实例,会导致c a i r n g o r m 的m o d e l 层数据 过于庞大,不利于管理,同时也增加了客户端的内存开销。 v i e w 1 h t t p :o p e n s o u r c e a d o b e c o m w i k i d i s p l a y c a i m g o r m l l 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 v i e w 层是指客户端的页面层,也就是用户所看到的各种页面元素的集合。 c a i m g o r m 中的v i e w 层主要包括v i e w l o c a t o r ,v i e w h e l p e r ,以及v i e w s ( 页面的 各种控件和页面容器等) 。v i e w l o c a t o r 是在客户端应用程序初始化时创建好的单 实例化的类,它主要用于获取v i e w h e l p e r 实例,从而实现对页面中的各个元素进 行读写操作。而v i e w h e l p e r 是一个具体页面的一部分,它随着页面的实例化而实 例化。使用v i e w h e l p e r 就可以在访问页面元素非常困难的情况下,对目标页面的 元素进行操作。 c o n t r o l l e r c o n t r o l l e r 层是c a i m g o r m 框架中用来控制逻辑的核心部分,它由五大部分组 成:f r o n tc o n t r o l l e r , c o m m a n d ,d e l e g a t e ,e v e n t , s e r v i c e l o c a t o r 。f r o n t c o n t r o l l e r 在 客户端应用程序中是单实例化的,用于捕获系统发出的c a i m g o r m 事件,并将该 事件映射到相应的命令( c o m m a n d ) , c o m m a n d 主要用于页面的功能或逻辑操作; d e l e g a t e 是c o m m a n d 进行页面操作的代理层,一般情况下,d e l e g a t e 层进行了复 杂的逻辑操作和真正的远程调用;e v e n t 是c a i r n g r o m 框架运行的基础,因为所有 页面的操作只有以c a i r n g o r m 事件的方式发送出去,f r o n t c o n t r o l l e r 类才会根据该 事件找到相应的命令并执行具体操作;s e r v i c e l o c a t o r 类用于获取c a i m g o r m 中已 实例化的远程对象,是客户端调用远程方法必不可少的一个类。 c a i m g o r m 框架一般的工作流程如下: 1 ) 页面分派( d i s p a t c h ) f l s - - 个c a i m g o r m 事件; 2 ) 随应用程序单实例化的f r o n t c o n t r o l l e r 类接收到该事件,并将它映射到相 应的命令,然后执行该命令; 3 ) 该命令通过适当的业务对象代理执行业务逻辑; 4 ) 相应的业务对象执行逻辑操作,包括调用一个或多个远程方法,并通过 分派一个新的事件将所得到的结果返回给调用该代理的命令; 5 ) 该命令将结果写入到单实例化的m o d e l 类的对象; 6 ) 任何将数据绑定于该m o d e l 类的对象的控件都得到更新。 1 2 浙江大学硕士学位论文 第2 章f l e x 技术与w e b 使用挖掘 2 3f l e x 远程调用方式 为了和服务器端的数据交互,f l e xs d k 中提供了各种各样访问服务器数据的 方式。f l e x 数据访问组件是基于面向服务的体系结构( s o a ) 【8 1 的,这些组件都使 用远程过程调用的方式与服务器应用程序如p h p , a d o b ec o l d f u s i o n 9 1 ,m i c r s o f t a s e n e t 等交互,从而为f l e x 应用程序提供源数据,或者将f l e x 应用程序的数 据传送到后台服务器。 f l e x 与后台交互的方式主要有如下三种: h t t p s e r v i c e h t t p s e r v i c e 通过使用f l e x 现有的h t t p s e r v i c e 组件,借助于h t t pg e t 或 者p o s t 方法来访问远程数据。远程数据访问的结果是以x m l 的形式,而不是 h t m l 的形式,返回给f l e x 客户端应用程序。这里使用x m l 格式的数据在应用 程序开发中具有很强的通用性,但也给数据转换带来了额外的开销。 w 曲s e r v i c e 这种方式使用的是s o a p 1o 】协议。采用w r e bs e r v i c e 方式访问后台,f l e x 应 用程序访问的是w e b 服务的端点( e n d p o i n t ) 。由于w e bs e r v i c e 遵守某一标准,所 以开发人员根本不需要知道它与f l e x 应用程序交互的具体实现代码。这点对这些 需要高度抽象的应用程序显得非常有用,例如b u s i n e s s t o b u s i n e s s 应用程序。然 而,s o a p 协议经常显得非常冗余,并且对网络资源有较大的占用,从而导致客 户端内存消耗更多,处理时间也相应增加。 r e m o t eo b j e c t 这种方式使用的是a m f 协议。相比较h t t p s e r v i c e 和w e bs e r v i c e ,这种方 式是最高效的通信方式。通过使用r e m o t eo b j e c t ,f l e x 可以直接访问后台对象, 而不用将对象数据转换成x m l 格式,从而节省了大量的文件转换时间。此外, 使用r e m o t e o b e j c t 能较大程度提高数据在网络上的传输速度。虽然数据交互仍然 通过h t t p 或h t t p s 协议传输,但是数据本身被序列化为二进制的格式,从而 减小了网络上传输数据的大小,进而减少客户端的内存消耗,并缩短处理时间。 浙江大学硕士学位论文 第2 章f l e x 技术与w e b 使用挖掘 2 4w e b 挖掘分类 由于w e b 中所含有的数据类型有很多种,根据挖掘的数据类型,w r e b 挖掘主 要分为三类:w e b 内容挖掘( w e bc o n t e n tm i n i n g ) ,w e b 结构挖掘( w e bc o n t e n t m i n i n g ) j f 1 2w e b 使用挖掘( w - e bu s a g em i n i n g ) t 1 1 1 。 内容挖掘 w e b 内容挖掘是指对w e b 页面中真正展现给用户的数据进行挖掘。这里的内 容包括w e b 中的非结构化数据( 如文本) ,半结构化数据( 如h t m l 文档) ,以及结 构化数据( 数据表格等) 。 结构挖掘 w e b 结构挖掘所关心的是w e b 站点中的组织结构和链接关系,其目的是发现 w e b 链接中一些潜在的有用模型,通过这些模型有助于发现基于同一网站结构的 所有站点概况。 使用挖掘 w e b 使用挖掘对日益兴起的电子商务具有重要意义,它通过挖掘用户使用数 据或w e b 日志,可以发现用户使用w e b 页面的模式,发现用户对w e b 站点的喜 好程度,也可以发现潜在的用户群体,改进站点服务,提高站点的服务竞争力。 2 5w e b 使用挖掘 w e b 使用挖掘是指将数据挖掘技术应用于发现w e b 数据中的使用模式,从而 使用户更好地理解基于w e b 的应用程序,并更好地满足用户对w e b 应用程序的 需求【1 1 1 。w e b 使用挖掘对于发现用户使用w e b 的规律,改善w e b 系统服务,实 现w e b 系统个性化服务等都具有重大意义,因此w e b 使用挖掘是w e b 挖掘领域 中的一个热门研究方向。 w e b 使用挖掘的任务是从w r e b 的使用数据或w e b 日志中提取有用的模式。 它最常用的方法是分析w e b 服务中的访问日志,这里面记录了大量的用户访问信 息,比如i p 地址,页面引用,以及访问的日期和时间等。但单纯地基于w e b 日 志进行使用挖掘往往具有很大的局限性,如今更多方法倾向于全方位的数据获取 1 4 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 方法。 2 5 1w e b 使用挖掘的过程 w e b 使用挖掘的目的是通过应用统计学和数据挖掘技术,从经过预处理的 w e b 日志数据中找出有用的模式。w e b 日志分析被看作是w e b 使用挖掘过程中最 简单的技术,这一过程通常采用最常见的统计学分析。其它更加高级的适用于 w e b 使用挖掘的技术包括相关性规则发现,序列模式发现,以及分类和聚类。如 图2 4 所示,w e b 使用挖掘主要的三个步骤为:数据预处理,模式发现,模式分 析【1 2 】。 图2 4w e b 使用挖掘的流程 数据预处理 数据预处理是指,对数据源的数据进行提取、分解、合并,最后转换成模式 发现中可以理解的数据。也就是,数据预处理的目的是使w e b 使用挖掘的数据源 成为适合进行模式发现的抽象数据。该阶段是w e b 使用挖掘过程中较为关键的一 步,数据预处理结果的好坏在很大程度上影响了w e b 使用挖掘的结果。事实上, 若数据源为w e b 日志,那么预处理的步骤主要包括:数据清洗,用户识别,用户 会话识别,路径补充,和事务识别【1 3 】。 模式发现 模式发现是指对预处理后的数据通过有效的挖掘算法进行数据挖掘,从而发 现潜在的、有用的、新颖的,可理解的知识和模式。一般情况下,统计学、数据 挖掘、机器学习和模式识别等领域中的方法和算法,均可作为w e b 使用挖掘的方 法。一般较为常用的技术有统计分析、路径分析、关联规则、序列模式、分类和 聚类等【1 4 1 。 模式分析 浙江大学硕士学位论文第2 章f l e x 技术与w e b 使用挖掘 模式分析是指,通过使用合适的工具和技术,从模式发现阶段所得到的模式 和规则中,提取用户感兴趣的模式和规则,使之成为人们可以理解的知识。常用 的模式分析技术有:知识查询、联机分析处理( o n l i n ea n a l y t i c a lp r o c e s s i n g ,即 o l a p ) 、可视化技术掣1 1 】。知识查询是指能够通过一种像s q l 语言的机制对模式 发现结果进行查询分析,从而使用户得到某些感兴趣的模式和知识。o l a p 分析 是基于多维数据模型的数据集合,它能在多维数据模型中快速地进行知识查询和 发现,并能基于主题进行数据分析。因此将o l a p 分析应用于w e b 使用挖掘模式 是一种非常高效的模式分析途径。而可视化技术以直观的图形图像的形式表示出 w e b 使用挖掘模式结果,从而能更好地帮助人们理解模式结果集合中的错综复杂 的关系。 2 5 2w e b 使用挖掘的应用 w e b 使用挖掘结果经过最后一步的模式分析,就得到了对服务站点距离非常 重要的知识。这些知识在商业信息化时代中,在为用户提供个性化服务,网站结 构的改进与优化和商业智能等方面都具有广泛的应用【1 1 】。 用户个性化服务 通过w e b 使用挖掘,了解用户对w e b 站点的喜好,从而为用户定制个性化 服务,为用户提供信息导航和推荐信息,逐步实现将站点的服务从“以网站为中 心 转变为“以用户为中心 。 网站结构的改进和优化 一般大型的网站都具有较复杂的组织结构,从一个页面导航到另一个页面也 许要经过很多步才能到达。这样用户在感兴趣之间的页面导航将要花很多的时间 和精力。因此,通过w e b 使用挖掘分析网站的使用情况,将用户感兴趣的站点页 面尽量集中在一起,以便用户缩短导航时间,增加网站的使用方便性,是网站结 构的改进和优化的重要目的,也是网站在同类站点中提高竞争力的重要手段。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中华传统文化知识竞赛题库
- 2025年人力资源行业招聘面试预测题及备考指南
- 2025年新型节能水泵、风机和压缩机项目建议书
- 2025年糖果、巧克力、蜜饯及类似食品项目发展计划
- 2025年非晶、微晶合金项目发展计划
- 2025年高绝缘高导热氮化铝陶瓷基片合作协议书
- 抢救仪器使用教学课件
- 抛丸机安全培训总结课件
- 抗逆性育种课件
- 河南省商丘市夏邑县多校2024-2025学年七年级下学期3月月考生物试题(含答案)
- 2025-2026学年人教版(2024)初中信息科技七年级(全一册)教学计划及进度表(第一学期)
- 埃菲尔铁塔精品课件
- 德国工业标准DIN8077聚丙烯(PP)管材尺寸赵彦波
- 大班语言《我喜欢我》课件
- 拖拉机和联合收割机查验记录表
- (公开课)26个英文字母书写笔顺动态演示(基础教育)
- Q∕GDW 11304.2-2021 电力设备带电检测仪器技术规范 第2部分:红外热像仪
- 部编版一年级道德与法治上册第1课《开开心心上学去》精品课件
- 高分子化学6离子聚合阳离子
- 注塑机各部件的中英文名称和作用
- NB_T 10337-2019《水电工程预可行性研究报告编制规程》_(高清最新)
评论
0/150
提交评论