(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf_第1页
(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf_第2页
(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf_第3页
(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf_第4页
(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(计算机应用技术专业论文)搜索技术在portal平台中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

幽北t 业人一顺口乎位论文摘要 摘要 门户删站被用作w e b 应j h 程序的简单统一访问点,此外还提供有价值的附 加功能,例如安全性、搜索、协作以及:l :作流。门户网站提供集成的内容和应用 程序以及一个统一的协作工作空问。搜索引擎是伴随着互联网发展起来的一门信 息技术,通过输入查询条件,它可以帮助用户迅速查找到相关文档的位置,节省 了用户的时间,提高了信息获取效率。搜索是门户网站的基础元素,通过建立优 良的搜索引擎,可以使用户快速准确地查找网络上迅速增长的信息资源,具有重 要的应用价值。 本文首先对企业信息门户和搜索引擎作了概述,然后针对中小企业的信息化 需求提出了面向中小企业的门户平台m e o p ( m i n o re n t e r p r i s eo r i e n t e dp o r t a l ) 。 普通中小企业一方面有着日益增加的信息化需求。另一方面中小企业对门户产品 的投资受到财力的限制,追求简单实用。m e o p 是专门针对国内普通中小型企业 量身定做的信息门户平台,以最小的工程投入实现了工作流、内容管理、搜索和 应用集成等功能。 本文提出了一个应用于门户的搜索系统p s s ( p o r t a l s e a r c hs y s t e m ) ,作为一 个功能模块集成在m e o p 平台中。针对中小企业信息系统简单实用的特点,搜 索系统实现了对i n t r a n e t 上多种类型的搜索( 文档、网页、p o r t l e t 等) 。系统基于 检索开发包l u c e n e 以及应用程序框架t u r b i n e ,它调用l u c e n e 提供的低级a p i 实现了对门户的搜索,被封装成一个服务集成在m e o p 平台中。论文对p s s 的 设计实现作了详细阐述,同时对系统的应用做了实践。 关键字:门户,m e o p ,搜索,索引,l u c e n e ,s e r v i c e 阿i li q k 人学硕十学位泛文 a b s t r a c t a b s t r a c t p o r t a li su s e da sau n i v e r s a la c c e s sp o i n to fw e ba p p l i c a t i o n ,a n da l s op r o v i d e e x t r au s e f u lf u n c t i o n ,s u c ha ss e c u r i t y , s e a r c h ,c o l l a b o r a t i o na n dw o r kf l o w p o r t a l p r o v i d et h ei n t e g r a t e dc o n t e n ta n da p p l i c a t i o n ,a n dau n i v e r s a lc o l l a b o r a t i o nw o r k s p a c e s e a r c he n g i n ei sai n f o r m a t i o nt e c h n o l o g yd e v e l o p e dw i t hn e t w o r k ,v i at y p i n g t h eq u e r ys t r i n g ,i tr a p i d l yl o c a t et h er e l a t e dd o c u m e n t sf o ru s e r , s a v et h et i m ea n d i m p r o v et h ee f f i c i e n to fi n f o r m a t i o nr e t r i e v a l w i t ht h ed e v e l o p m e n to fn e t w o k ,m o r e a n dm o r ed o c u m e n t sa r ep r o v i d e d ,t h e i rv a l u ea r ea l s oi n r e a s i n g s e a r c hi st h eb a s e e l e m e n to fp o r t a l ,v i as e a r c he n g i n eo fg o o dd e s i g n ,u s e rm i g h tl o c a t et h ei n f o r m a t i o n r e s o u r c eo nt h en e t w o r kr a p i d l ya n dp r e c i s e l y s e a r c hi np o r t a li sg r e a tv a l u a b l e t h i sa r t i c l ef i r s th a sm a d et h eo u t l i n et ot h ee n t e r p r i s ei n f o r m a t i o np o r t a la n dt h e s e a r c he n g i n e ,t h e ni nv i e wo ft h ed e m a n do fm i n o re n t e r p r i s e ,g i v eo u tt h ep l a t f o r m m e o p ( m i n o re n t e r p r i s eo r i e n t e dp o r t a l ) o nt h eo n eh a n d ,t h em i n o re n t e r p r i s eh a s t h eg r o w i n gd e m a n do fi n f o r m a t i o ns y s t e m o nt h eo t h e rh a n dt h em i n o re n t e r p r i s e s i n v e s t m e n tt op o r t a li sl i m i t e db yf i n a n c i a lr e s o u r c e ,t h ep o r t a lt h e yw a n ti ss i m p l ea n d p r a c t i c a l m e o pa i m sa tt h ed o m e s t i co r d i n a r ym i n o re n t e r p r i s e ,h a sr e a l i z e df u n c t i o n b yt h es m a l l e s tp r o j e c ti n v e s t m e n t ,s u c ha sw o r kf l o w , c o n t e n tm a n a g e m e n t ,s e a r c h a n da p p l i c a t i o ni n t e g r a t i o n t h i sa r t i c l ep r e s e n t sas e a r c hs y s t e mf o rp o r t a l 一p s s ( p o r t a ls e a r c hs y s t e m ) , p s sw a si n t e g r a t e di nt h em e o pp l a t f o r ma saf u n c t i o nm o d u l e f o rt h ec h a r a c t e r i s t i c o fm i n o re n t e r p r i s ei n f o r m a t i o ns y s t e m 一一p r a c t i c a la n dn o tc o m p l e x ,t h es e a r c h s y s t e mh a sr e a l i z e do nt h es e v e r a lk i n d so fs e a r c h ( d o c u m e n t s ,w e bp a g e ,p o r t l e ta n d s oo n ) f o ri n t r a n e t s y s t e mb a s e do nr e t r i e v a ld e v e l o p m e n tk i tl u c e a ea sw e l la s a p p l i c a t i o np r o c e d u r ef r a m e w o r kt u r b i n e ,i tu s e dt h ea p lw h i c hl u c e n ep r o v i d e dt o r e a l i z e dt h ec o n t e n ts e a r c ht op o r t a l ,a n dw a se n c a p s u l a t e dt oat u r b i n es e r v i c e ,a n d w a si n t e g r a t e dt om e o p t h i s p a p e rg a v e ad e t a i l e d d e s c r i p t i o nt ot h ep s s d e s i g n ,r e a l i z a t i o n ,a n d a l s oc o n s t r u c tt w os e a r c h a p p l i c a t i o n b a s e do ut h es e a r c h s y s t e m k e y w o r d s :p o r t a l ,m e o p , s e a r c h ,i n d e x ,l u c e n e ,s e r v i c e 阳北f :业人学硕l 学侮论文第一章绪论 1 1 研究背景与意义 第一章绪论 门户( p o n a l ) 一般是指将上下文相关信息、应用程序和服务合并在一起的w e b 站点。门户对提供给用户的复杂多样的信息和服务进行提炼,简化为一个满足用 户需求和利益的单一界面。门户直接解决了网上世界广泛性和复杂性的问题| 1 l a 门户可分为适用于雇员的内部网站( i n t r a n e t ) 和针对客户和合作伙伴的外部网站 ( i n t e r a c t 和e x t r a n e t ) 。面向雇员的门户通常融合了一些协作功能和应用程序集 成。也就是说,i n t r a n c t 门户提供( 并控制) 了雇员完成工作所需的信息和协作 环境访闻权限,与多重业务领域系统进行交互的统一界面访问权限。i n t r a n e t 门 户正迅速成为一个关键的重要领域;它们允许雇员查找和收集相关信息、高效率 地开展协作,并在完全不同的信息来源和应用程序之间建立新联系。 搜索是所有门户( 尤其是内容驱动门户) 的基础元素,因为搜索有助于用户 准确找到他们需要的内容,而不论它们需要访问的资源是否在门户的导航结构或 分类系统中有直观的分类。最简单的搜索操作允许以自定义方式搜索一组文档、 网页或其它内容。此外,搜索工具还可能具有根据门户上的文档的任何元数据进 行参数化搜索的功能。更多复杂的操作支持在内容管理系统中搜索资料,以及在 各种文件类型的实际内容中进行搜索。 对于企业来说,门户中的搜索有重要应用价值。很多i n t r a n e t 上的信息由一 些离散的信息节点组成,它们独立且没有被很好的组织链接在一起,它们可以是 文档或者是网页上的信息等等。在这样个环境下,访问这些信息的主要模式必 然是使用搜索引擎。研究设计门户中的搜索引擎对于员工迅速找到所需文档并充 分利用i n t r a n e t 信息资源有重要意义。 中小企业在国民经济中发挥了重要作用,在企业信愚化发展过程中,他们对 门户有着广泛和迫切的需求。通过门户可以将中小企业中现有的各种应用系统、 各类结构化及非结构化数据进行最大可能的整合,将各种信息和知识进行基于角 色的有效组织,为每个最终的使用者提供最大可能的个性化界面。同时中小企业 的财力有限,常常难以应用规模庞大、功能而面俱到的企业信息门户,他们希望 得到功能实用、规模适巾的门户产品。 州北i 业尺学硕+ 学位论文第一章绪论 在中小企业中的信息系统中,存在大量的备类文档、数据,职员和决策者们 经常难以集中、快速的查找和分析数据,实现搜索是中小企业对门户产品的基本 要求。 1 2 研究目标与研究内容 论文提出了一个面向中小企业的门户平台并重点研究了其中的搜索模块。 针对中小企业的特点,本文提出了面向中小企业的信息门户平台( m e o p , m i n o r e n t e r p r i s eo r i e n t e dp o r t a l ) ,m e o p 是针对普通中小型企业量身定做的信息 门户平台,m e o p 以较小的工程投入实现了访问控制策略、工作流、内容管理、 搜索和应用集成等典型功能,可以满足中小企业信息化建设的实际需要。 搜索是m e o p 的基本功能模块,本文设计实现了一个门户搜索系统p s s ( p o r t a l s e a r c h s y s t e m ) 用于实现门户内容以及i n t r a n e t 的搜索。搜索系统对p o r t a l 中实现搜索的过程进行封装,给开发者提供了a p i ,涵盏文档解析、索引入库、 查询等方面,它将具有如下几个主要特点: 1 适用于中小企业信息门户。p s s 针对中小企业信息系统的特点,提供a p i 对i n t r a n e t 上的信息进行索引和查询。系统将作为一个功能模块集成到面 向中小企业的信息门户m e o p 中。 2 系统设计合理、易于扩展。系统的类设计采用了简单工厂、f a c a d e 模式 可以扩展更多类型的搜索,而且别的程序调用p s s 也比较简单。 3 搜索系统基于j a v a 语言和成熟的开发环境,利用l u c e n e 开发包和应用程 序框架t u r b i n e ,架构成熟,实用性较好。 本文第一章分析了研究背景,提出了研究方向;第二章简要分析了企业信息 门户和搜索引擎的相关技术,并对搜索开发包l a c e n e 做了研究;第三章说明了 面向中小企业的门户m e o p 的设计原则和主要功能,并对其框架设计作了简要 分析。第四章描述了门户搜索系统p s s ( p o r t a ls e a r c hs y s t e m ) 的设计实现细节, 包括总体设计和索引器、查询器的详细设计,并应用p s s 在m e o p 平台中构建 了搜索程序。第五章是对全文的总结和展望,总结了系统的优缺点,对进一步的 :i :作进行了展望。 州北i 。业人学硕i :学位论文第:章企业信息fj 户与搜索 第二章企业信息门户与搜索 2 1 企业信息门户概述 2 1 1 门户的发展历程 门户( p o r t a l ) 实际上是一个入口点,“一个虚拟的前门”,提供了一个丰 富的基于w e b 的浏览的用户界面,在这个用户界面里,提供资源和链接到集成的 信息【1 4 1 。对于门户,人们最早熟悉的是w e b p o r t a l ,如y a h o o 、s i n a 等,它们被 称为i n t e m e t 信息f p ( i n t e m e ti n f o r m a t i o np o r t a l ) ,可服务于广泛的社会群体,为 它们提供各种各样的信息服务;而企业信息门户( e l i ,e n t e r p r i s ei n f o r m a t i o n p o r t a l ) 则集成了i n t e m e t 信息门户的特点,它通过一个唯一入口,为企业员工、 分销商、代理商、供应商、合作伙伴等同一价值链上的相关人员,提供的基于不 同角色和权限的、个性化的信息、知识、服务与应用。它不仅集成企业的信息资 源,同时也集成企业的各种应用系统,企业的内、外部用户只需要通过浏览器就 可以管理、组织、查询、个性化定制相关信息与服务,同时它还提供数据报表分 析、业务决策支持等功能。可以说企业信息门户集成了整个企业所需的所有数据 和应用。 在企业信息化建设过程中,由于历史、技术、成本等各方面的原因,大多数 企业经历了针对不同的应用需求建立各自的业务子系统的过程( 例如c r m 、e r p 等) 。这些早期建设的信息化系统使得企业数据开始以几何级数迅速增长,缺乏 有效的管理工具;另一方面由于分散建设的原因,这些系统往往采用不同的体系 架构和平台,自成一体,使得企业中大量有关联的数据信息无法集中存放与处理, 数据不能整合和共享,甚至还存在不一致和不完整的现象;最后,由于缺少对非 结构化数据的管理,使得企业内部到处散落着仍旧以传统纸媒体承载的各类企业 文档等。 在这种情况下,企业信息门户e i p 应运而生。简单的说,e i p 就是一个企业 信息系统的应用框架,它通过个单+ 的访问入口,及时的向用户提供准确的信 息,优化企业运作,提高生成力。企业信息门户是伴随着企业信息化的逐步深入 而产生的,它面向的是企、运作的各个层面。企业信息门户同时也是企业的信息 化建设发展到定阶段的必然产物。它是企业进行信息化改革过程中的必经之 3 两匕i 啦人学硕十学位论文第二章企业信息户与搜索 路,是企业在建设了一些专用应用系统后,希望打破各应用系统之州的壁垒,摆 脱结构化信息和非结构化信息纷杂繁复的困扰境地的必然选择,是企业在进行了 低水平的系统集成和应用集成阶段后向更高级别应用的转变。它的实施,必将提 升提高员工工作效率、优化资源利用效率、提升企业应变速度、增强企业竞争优 势。 e i p 的发展以及对e i p 的认识经历了一个从简单到复杂的过程【1 3 】。在初始阶 段,门户实际上就是些静态的网页,企业将相关的信息发布在这些网页上;在此 基础上,又将企业中可以为大家共享的文档进行集成,并增加了高级的搜索功能 以及内容管理功能;随后,一些工作流、电子邮件、人力资源管理、后勤管理的 功能被纳入到e i p 中,使得e i p 逐渐发展成为企业运营的平台。在这个阶段,e i p 的概念逐渐成型,其功能也相对完善。随着业务应用系统的增多,如e r p 、c r m 、 s c m 等,人们又希望能够透过信息门户获取其中的信息。于是,e i p 又逐渐成 为与这些业务系统进行交互的平台,再加上一些高级的个性化功能,e i p 便成为 了日臻完善的门户。 随着互联网应用于企业市场,企业也逐渐将各类业务搬到一个开放统一、安 全度很高的网上平台,这表明企业门户网站对于企业的发展来蜕越来越重要。世 界各大软件厂商对门户产品的介入也说明e i p 具有良好的发展势态。e i p 的迅速 发展源于1 9 9 8 年1 1 月美国美林( m e r r i l l l y n e h ) 公司的一份关于企业信息门户( e i p ) 的研究报告。正是这个报告引爆了企业信息门户市场,推动了e i p 的研究和开发。 在这份副标题为“超越y a h o o ! 企业信息门户己经上路”的报告中,列举了一系 列令人吃惊的市场机会。e i p 自提出以后,先后有众多的软件厂商倾力投入并推 出自己的产品。最早推出门户产品的软件厂商有e p i c e n t r i c 。p l u m t r e e 和v i a d o r 等,然后有一些基础软件供应商的介入,包括i b m ,o r a c l e ,b e a ,s y b a s e 以及 m i c r o s o f t ,并且成为门户产品中具有实力的供应商,此外一些c m ,c r m 和e r p 的厂商也进入这一市场,并跟他们原有的系统进行集成,主要包括 d o c u m e n t u m ,i n t e r w o v e n ,b r o a d v i s i o n ,v i g n e t t e ,s a p 和p e o p l e s o f t 1 3 j 。国内的企 业门户产品则有北京慧正、方正呈思、山东金益康等。 2 。1 2e i p 的功能分析 企业信。g , f l 户e 1 p 通过。个唯入口,为企业员工、分销商、代理商、供应 p t i - l lr 业火学硕i “学位论文第一:章企业信息fj 户与搜索 商、合作伙伴等同一价值链上的相关人员,提供的基于不同角色和权限的、个性 化的信息、知识、小务与应用。它不仅集成企业的信息资源,同时也集成企业的 各种应用系统,企业的内、外部用户只需要通过浏览器就可以管理、组织、查询、 个性化定制相关信息与服务,同时它还提供数据报表分析、业务决策支持等功能。 可以说企业信息门户集成了整个企业所需的所有数据和应用。 p o r t a l 技术与应用服务器紧密结合,加强了高级的个性化功能,发展成为应 用服务器之上的管理客户、员工和合作伙伴应用的一个框架。p o r t a l 作为应用服 务器之上的面向企业应用集成的产品里的必不可少的组成部分,在企业信息化方 面扮演着重要的角色门户不是单一的技术或应用系统。而是由一组相关服务或功 能组件组成的复合体系,门户把提供给用户各式各样的信息与服务进行整合,抽 象为一个满足用户需求和利益的简单界面,从而解决了网上世界广泛性和复杂性 问题。门户平台一般融合了某些协作功能和应用程序集成,并向商业客户和协作 伙伴提供有意义的信息,允许他们个性化的自定义需要浏览的内容和浏览的方 式,并根据用户资料提供用户所需的内容和服务等等。由此可以看出,门户是在 企业系统的构架层次上,为电子商务提供了一个跨越多种分散的、内部和外部的 信息处理过程的系统链,并淡化了传统的企业内外分界,使电子商务应用的外部 事务处理与企业内部的c r m 、e r p 及各种应用信息系统集成为一个统一体。 不难看出,门户是帮助企业提升内部管理和外部经营效率的有效手段。通过 门户,企业对内实现了对c r m 、e r p 、办公等信息系统的有效管理与整合;对 外,向协作伙伴提供了有效接入及访问途径,并将协作伙伴、供应商的业务与企 业内部的信息化建设有机地结合在一起,大大地提高了企业的商业竞争力。一般 门户平台的会具有如下几个重要功能:用户验证、个性化、应用程序集成和合并、 搜索、协作、网站内容管理、工作流q 1 用户验证 通过定义,门户隐含着为单独用户特制的内容和功能。第一步是识别需要访 问门户的用户。对于某些门户应用程序( 例如w e b 站点店面) ,可以通过较低的 用户识别方式( 例如c o o k i e s ) 来实现。但是对其他门户( 尤其是i n t r a n e t1 7 户) 而言用户验证必须更有力,这要求使用安全的用户i d 和密码。 如果门户上集中的不同系统各自要求本身的用广1i d 及密码,则进行验旺会 带来麻烦。确保门户可用的父键在于用p 本身仅需要验证次( 进行门户或系统 曲此l :业火学硕_ :学位论文第一:章企业信息f j 户与搜索 注册时) ,即可使用该门户提供的所有内容和功能。这就是单点登录( s s o ) ,要 求该门户上所集合的各个组件都能利用或集成相同的网络验证方案。 2 个性化 个性化是一个泛指性术语,用于描述根据用户身份、在门户上所处位置、甚 至他们与门户的过往交互记录为用户提供不同内容的过程。将门户个性化的基本 方法分为两种: 1 显示信息。用户可自定义用户界面的特定部分,例如在什么位置布置什 么内容、挑选不同的显示样式、选择要展示的服务和后端系统等。 2 内容和功能。用户浏览的内容通常结合了基础应用程序自动设置的用户 喜好和选择。这些系统选择根据业务逻辑作出,例如根据用户资料( 雇员与合作 伙伴) 或过往的购买或浏览行为。 这两种个性化模式一般要求采用两种不同的方法。前一种类型的个性化( 通 常称为“界面个性化”) 要求建立一个用户资料数据库以及个在业务逻辑流程 指导下的网页绘制引擎。后一种( 称为“内容导向”) 要求进行更深入的分析, 通常被称为分析学,它涉及运用数据发掘、基于点击流的用户信息收集和用户分 隔来传达用于确定绘制内容的复杂业务逻辑。 3 应用程序集成 应用程序集成指通过数据共享和自动化交易连接不同系统。例如,企业解决 方案集成0 s 鼻a ) 可连接h r 系统和工资及会计应用程序。尽管这些应用程序在 门户实施中无需彼此童接集成,但由于门户为多个应用程序和内容来源提供单一 界面,因此他们可能必须自行与门户进行通信( 显示数据和功能) 。 数据驱动集成的目的是在不同的非面向生产系统之间转移数据,或从生产系统向 非生产数据仓库转移数据以便进行分析。基于交易的集成目的是在不同的生产系 统( 例如采购系统和记帐系统) 之间转移生产数据。这种交易强调数据转移、数 据完整性和分散式交易的重要性。 此外,共同框架有助于简化问题。例如,单点登录技术可以简化对不同数掘 来源和应用程序的设置访问。如果用户资料禁止用户访问特定数据,则门户不会 向该用户提供访问权。 4 内容合并 两北f 。业人学硕+ :学位论文第二章企业信息fj 户与搜索 内容合并详细阐述了一次创建内容并在多个位置重复使薜| 这一重要概念。内 容合并涉及从完全不同的来源搜集内容,然后在单一界面( 门户) 中显示该内容。 通过使用内容合并功能,门户可显示统一的视图,其中的内容可能属于不同的所 有者、来自不同的生产位嚣或包含在不同的系统中。例如,某家技术公司的外部 门户可能提供有关该公司每个合作伙伴的资料,而该内容直接从每个合作伙伴的 外部门户中合并而来。当合作伙伴更改信息时,更改的部分会自动反映在该技术 公司的门户中。其他典型事例包括新闻馈送、股票行情和目录。 内容合并可通过内容管理技术来实现。由于门户本身必须具备强大的内容管 理功能( 见下文) ,因此通过一个单一的内容管理系统进行集中管理具有许多益 处。即便内容散布在多个不同的数据库和服务器中也一样。 5 搜索 搜索是所有门户( 尤其是内容驱动门户) 的基础元素,因为搜索有助于用户 准确找到他们需要的内容,而不论他们需要访问的资源是否在门户的导航结构或 分类系统中有直观的分类。 最简单的搜索操作允许以自定义方式搜索一组文档、网页或其他内容。此外, 搜索工具通常具有根据门户上的文档所捕捉或隐含的任何元数据进行参数化搜 索的功能。例如,您也许想搜索由某位人士所著的全部文档,或包含某个特定关 键词的所有文档。更多复杂的操作支持在内容管理系统中搜索资产,以及在各种 文件类型的实际内容中进行搜索。 同时,搜索功能必须与用户资料和安全设置一同使用,以便进行搜索的用户 只能看见他们具有访问权限的资产结果。搜索功能还会利用用户资料中的丰富信 息,以进一步优化及个性化搜索标准。 6 协作 协作是另一项应用广泛的门户功能。集会场所、项目地点、工作流、文档登 记和版本控制、登入登出、讨论小组、实时通信( 聊天) 、投票、预订和自定义 警告等协作功能都能促使工作人员高效地组合其工作。协作功能有助于用户进行 同步和异步协作。 此外,与其他功能进行紧密集成有助于降低成本和风险。例如,与生产宰 应用程序和搜索工具进行集成的协作工具不仅有助于知识工作人员找到作出决 策所需的资料,还有助于他们将这些决策记录在文档中,然后与同事共享这些义 阳北i :业大学硕士学位论文 第一章企业信息户1 0 搜索 档并对其展l 丌协作一所有这些均单一、无缝门户环境中进行,使创建、维护 和修改所需的i t 技术参与降至最低。 7 网站内容管理 内容管理指储存、管理和交叉引用所有类型文档的能力。因此,内容管理是 数据中心门户的基础部分。w e b 站点内容管理( w c m ) 着重于撰写、储存、管 理以及向网站发布内容的能力。基于网站的内容可能包括h t m l 页面、a s p 页 面、图象、声音剪辑、x m l 文件、纯文本和丰富媒体,并且还可能包括其他辅 助内容,例如样式表和元数据。 尽管门户传统上具有合并功能,然而在门户上创建和管理独特的基于w e b 内容的能力越来越被视为一项基础能力。例如,公司i n t r a n e t 阏站可能主要提供 业务领域系统的访问权,不过也可利用w e b 内容管理功能使公司h r 组能够发 布内部“突发新闻”故事。此外,w c m 系统也可用于将公司外部网站上所公布 的新闻稿并入i n t r a n e t 门户的一个综合“内部新闻”部分。 w c m 所提供的主要服务之一就是协助企业用户控制其自有内容。复杂的内 容管理系统可使w e b 管理员从每日向门户发布内容的繁重工作中脱离出来。相 反,企业用户可在w c m 系统中工作,自行处理内容创建、批准和发布等任务。 因此,一个稳固的并与用户验证、个性化和搜索等其他门户功能紧密集成的 w c m 系统可以为门户部署带来巨大价值。 8 工作流 在门户环境中,工作流主要是指控制内容批准和发布方式的过程。由于工作 流根据i t 部门预设的标准对批准和发布权限加以限制,因此使用户可以控制其 内容。复杂的工作流包括提示下一位批准者有内容待其检查的警报功能、启用并 行处理的可自定义批准途径以及适用于不同类别内容的可变检查等级。此外,工 作流还构成协作门户的基本部分,例如,多个参与者必须先注册小组工作然后才 能作为最后结果提交。 其他工作流要求更倾向于交易导向。例如,在消费者将订单输入商务门户后, 利用业务规则确定订单的处理方式。 不管什么情况,工作流都必须便于业务用户访问( 可优先在他们用于一l :作的 工具中集成状态报告和通知) ,并且便于技术人员自定义和扩展以设计跨越多个 系统和方案的解决方案。 州北i 业人学硕十一学位论文第二章企业信息f j 户与搜索 2 1 3p o r t a i 的相关技术研究 1 门户组件p o r t l e t p o r t a l 中的基本组件是p o r t l e t ,图2 - 1 表示了p o r t l e t 的一些概念。 图2 1p o r t l e t 概念 p o r t l e t 是一个由容器管理的w e b 组件,它可以生成动态内容。p o r t l e t 是被编 译成平台中立的字节码因而平台独立的j a v a 类,可以由w e b 服务器动态的加载、 运行。s e r v l e t s 通常直接和w e b 客户端交互,p o r t l e t s 则是通过p o r t a l 间接的和w e b 客户端交互,这种交互是通过一个由p o r t l e t 容器驱动的请求反应模型完成的,请 求一反应模型的行为基于超文本传输防议完成。 p o r t l e t 是种特别的s e r v l e t ,嵌入在p o r t a l 中并由p o r t a l 运行。p o r t l e t s 被设 计成可以共存在一个大的p o r t a l 页面环境。它们要用到p o r t a l 的底层架构的功能, 例如,访问现在的用户的用户的配置信息,访问代表p o r t l e t 显示窗口的对象,共 用p o r t a l 窗1 :3 和事件模型,访问w e b 客户端信息p o r t l e t 之间的消息机制,持久 的存储和获取每个用户或实例的数据的标准方式。 般来说,在处理一个请求时许多p o r t l e t 被调用,通过在一个页丽中添加自 己的p o r t l e t 输出的方式来聚集它们各自产生的内容。p o r t l e t 产生可以在p o r t a l 范 围内聚集在一起的标记,包括适合在一个p o r t a l 中聚集的链接,行为和内容。提 供了u r l 重写方法,可以使p o r t l e t 可以透f | j j 的刨建链接,而不需要则道u r l 西北i :业人学硕十学位论文第二章企业信息户与搜索 在一个特定的p o r t a l 中是怎么样被组织的。p o r f l e t 可以拥有不同的模式。所有的 p o r t l e t 必须实现个负责显示p o r t l e t 界面的视图模式,比如,在一个股票报价 p o r t l e t 中,显示 系列股票代码和它们的价格。另於p o r t l e t 还可以实现编辑、配 置以及帮助模式。p o r t a l 让p o r t l e t 的模式可以访问的典型方式是一在一个p o r t l e t 的标题栏上显示可以访问这些模式的按钮【7 i 。 2 开源门户j e t s p e e d j e t s p e e d 是a p a c h e 组织开发的一个采用j a v a 和x m l 的开放源代码的企业信 息门户的实现。门户可以让终端用户可以很方便的访问网络资源( 应用、数据库 等) 。用户可以通过w e b 浏览器、w a p 手机、寻呼机以及其它一些智能设备来 访问p o r t a l 。j e t s p e e d 就像是中心的控制器,可以很方便地以各种形式展示那些 来自不同数据源的数据。通过j e t s p e e d 展示的数据形式完全独立于内容的类型。 这就意味着j e t s p e e d 可以集成各种各样的数据源,如:x m l 、r s s 、s m t p 。然 后通过x s l 技术将数据组织成j s p 页面或h t m l 页面传给客户端。j e t s p e e d 还支 持模板和内容的发布框架,比如:c o c o o n , w e b m a c r o 和v e l o c i t y 。除了一般 的浏览器,j e t s p e e d 也支持w a p 设备。j e t s p e e d 的底层基于应用程序框架t u r b i n e 。 j e t s p e e d 具有以下的特征: 1 具有基于模扳的页面布局,包括j s p 和v e l o c i t y 2 使用数据库进行用户认证 3 内存缓存技术,加速页面的响应 4 通过开放的内容同步技术支持远程x m l 内容交换 5 通过r i c hs i t es u m m a r y 技术。支持同步内容 6 支持w i r e l e s sm a r k u pl a n g u a g e ( w m l ) 7 使用x m l 格式的配置文件注册p o r t l e t 8 完整的w e b a p p l i c a t i o na r c h i v e ( w a r ) 支持 9 可以在本地缓存远程内容 1 0 与t u r b i n e 模块和服务集成 1 1 使用皮肤技术使得用户可以选择p o r t l e t 的颜色和显示属性 1 2 通过j e t s p e e d 的安全p o r t l e t s 来管理用户、角色和权限 1 3 基于角色对访问p o n l e t 进行控制 i 4 可以选择p o r t l c t 以及定义个人页面的伽局 l ( 】 p q 北i 业人学硕士学位论文第二章企业信息门户与搜索 j e t s p e e d 由如下几个模块组成 1 注册机制 j e t s p e e d 的注册登记部分存储了j e t s p e e d 引擎中大多数的动态配置信息,其 中包括所有可提供的p o r t l e t 的登记信息、布局信息登记、用户自定义信息等。 j e t s p e e d 的注册机制采用可插入的t u r b i n e 服务体系。因此可以根据自己的需要 采用不同的实现。现有两个已提供的默认实现:基于x m l 文件的实现;基于 o j b 的s q l 数据库的实现。 2 安全机制 j e t s p e e d 安全服务基于以下一些组件接口:p o r t a l a u t h e n t i c a t i o n , p o r t a l a c c e s s c o n t r o l l e r ,u s e r m a n a g e m e n t r r o l e m a n a g e m e n t ,g r o u p m a n a g e m e n t , p e r m i s s i o n m a n a g e m e n t ,c r e d e n t i a l s m a n a g e m e n t 。这些组件接口都是可插入的。 j e t s p e e d 提供了这些接口的一个或多个默认实现,大多数这些实现都是基于数据 库的安全机制。安全服务和p o r t a ls e r v e r 中的一些标准的基础安全对象接口一起 工作。这些安全对象包括:j e t s p e e d u s e r 、r o l e 、g r o u p 、p e r m i s s i o n 。 3 内容整合 能够支持内容整合是p o r t a l 和普通w e b 网站、普通w e b 应用之间相比最大 的优势。j e t s p e e d 中的内容整合是通过o c s ( o p e nc o n t e n ts y n d i c a t i o n ) 来支持 的,同时j e t s p e e d 也支持r s s ( r i c hs i t es u m m a r y ) oo c s 和r s s 都是基于x m l 的应用程序,用来支持页面的部分共享、频道列表、公共标题栏等实现。 4 n 4 躁 j e t s p e e d 支持w a p ( w i r e l e s sa p p l i c a t i o np r o t o c 0 1 ) 。这项技术使得用户可以 通过移动终端来访问p o r t a l 页面,可以进行多应用程序的简单集成和页面组织。 p o r t l e t 可以将页面的形式以w m l 来表示。j e t s p e e d 目前支持w m l1 1 和1 2 标 准。 5 个性化定制 支持个性化定制是p o r t a l 的另一大优点。j e t s p e e d 可以让用户很容易的进行 个性化定制。用户可以很方便创建页面,为每一个页面选择具体的p o t t i e r 内容、 页面布局、显示风格。用户个性化必须在系统权限允许的范围内进行。 6 缓冲机制 为1 r 吐j e t s p e e d 更好的支持远程内容f i 勺娃示和内容f ( j 发如,必须采蹦缓冲机 i s + f j k i 3 1 k 人:学硕 :学位论文 第:章企业信息r j 户与搜索 制。 7 p s m l p s m l ( p o r t a ls t r u c t u r em a r k u pl a n g u a g e ) 佼得在j e t s p e e d 内允许内容组织 和提取。p s m l 由两部分有关联的标记部分组成。r e g i s t r ym a r k u p :描述j e t s p e e d 引擎内可提供的资源;s i t em a r k u p :描述在用户的页面中显示了哪些p o r t l e t ,是 怎么组织的,需要哪些显示属性。 j e t s p e e d 是基于t u r b i n e 网络应用框架( f r a m e w o r k s ) 的w e b 应用引擎,简单的 看,j e t s p e e d 就是添加了门户组件的t u r b i n e 。t u r b i n e 是一个基于s e r v l e t 的w e b 应用程序框架,使得j a v a 开发者可以快速、安全的构建自己的网络应用。 t u r b i n e 有五个模块组成:p a g e 、a c t i o n 、l a y o u t 、n a v i g a t i o n 、s c r e e n ,每一 个模块服务于特定的目的,它们是执行用户的请求和生成所需页面的真正场所。 从对象封装的角度看,p a g e 对象包含l a y o u t 对象,l a y o u t 对象又包含n a v i g a t i o n 对象和s c r e e n 对象。p a g e ,a c t i o n ,l a y o u t ,s c r e e n ,n a v i g a t i o n 都被定义为抽 象类,使用时需要有实现类。t u r b i n e 为这些抽象类提供了缺省实现,例如: d e f a u l t a c t i o n 就是a c t i o n 抽象类的缺省实现。我们可以根据自己的需要,创建 自己的抽象类实现,修改t u r b i n e r e s o u r c e s p r o p e r t i e s 文件中的配置,替换抽象类 的缺省实现。 j e t s p e e d 采用t u r b i n e 做主要的框架支持,t u r b i n e 为j e t s p e e d 提供用户认证、 页面布局管理和计划服务等。p o r t l e t 可以直接使用t u r b i n e 服务提供的r u n d a t a 对象。j e t s p e e d 向用户展示的页面由t u r b i n e 控制产生,它的主要内容部分由一 些标准的p o r t l e t 构成。p o r t l e t 是可以在单个页面上多个同时显示的w e b 应用程 序窗口,这些窗口的显示风格可以订制。p o r t l e t 通过r u n d a t a 对象与t u r b i n e 提 供的服务进行交互。j e t s p e e d 通过自己的a p i 与t u r b i n e 进行交互,面t u r b i n e 是一个运行于s e r v l e t 引擎之上的通用的s e r v l e t ,用于处理从j e t s p e e d 传来的各 种请求。同时t u r b i n e 管理j e t s p e e d 门户的页面表现层和页面布局,即j e t s p e e d 的页面布局是在t u r b i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论