



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分布式网络资源检索 (山东师大)一.题目背景目前,网络上存在大量的资源共享服务器。这些服务器存储了一定量的资源,并以web服务的方式供用户和其它服务器访问。现存的问题是不同服务器的资源组织方式往往不同,有的是通过数据库,有的是通过一些描述文件(如XML),而且数据库的种类和结构也有很大的差别,这就导致不同服务器之间资源共享和资源发现都十分困难。因此,用户如果想访问这些资源,就要登陆每一个服务器去检索和下载需要的资源。由于服务器的分布广泛,数量众多,用户显然难以检索到自己需要的资源。而分布式的资源检索策略则可以有效的解决这一问题。该策略的思想是当用户登陆任何一台服务器的时候,这个服务器除了要检索自己本地的资源以外,还可以作为一个客户端,自动地去连接其它服务器,发出检索请求,并将检索的结果进行合并和汇总,返回给用户。这样,用户只需要登陆任意一台服务器,就可以检索到大量所需资源,尽管这些资源来自于不同的服务器,但检索的过程对用户来说是透明的,用户检索和获取这些资源就如同检索和获取所请求的服务器上的资源一样。再进一步,目前移动设备已经成为了信息传递的主要手段之一。尤其是近年来手机技术的不断完善和功能的增加,利用手机上网也以成为一种获取信息资源的主流方式,移动和互联网融合的发展趋势注定了移动搜索是未来的发展方向,从而实现终端移动设备的资源检索成了本命题的一大亮点,即移动检索。移动搜索是指以移动设备为终端,进行对服务器资源的搜索,从而实现高速、准确的获取信息资源。在此命题的开发中,用到web开发技术、信息服务器技术、移动客户端开发技术,如java、c#、xml、android、objective-c等,这都是目前流行的IT开发技术。通过该命题,选手在此开发过程中可了解和掌握这些技术,从而自身得到全面的提高。二.功能与设计要求在网络环境下(也可以是一个局域网),每一台机器是一个Web服务器,并且在服务器上按照一定方式保存了大量资源,这些资源的信息保存在一个test.xml文档中,存放在服务器根目录下。要求参赛者:(一)基本功能1设计一种资源检索系统,用户只需要登陆任意一台服务器,就可以检索到该xml所描述的所有资源,并以友好方式呈现,另外需要提供查询花费的时间。2对于其中特定格式的资源,如动画、视频等能够直接播放。3对于word或PPT文档,能够预览其中的部分内容。(二)扩展功能 通过无线路由器构建局域网,设计移动客户端或构建WAP网站,利用移动设备(手机、平板电脑)完成资源检索。另外,选手可充分发挥自身的想象力,在如下方面拓展功能:1)语义检索,语义检索可以作为一个拓展的方面,以返回该资源域内最符合用户需要的资源。2)分词技术,可以对用户提交的字符串进行分词处理,以检索到合适的资源。3)网络拓扑,对于一个资源域,我们可以假定有一个注册发布的主服务器,其他资源服务器都是通过这个服务器获得其他资源服务器的信息,通过这个服务器可以构造不同的分布式检索拓扑结构,好的网络拓扑结构可以提高检索的效率。4)资源服务器动态的加入和退出,资源服务器可能会动态得开启或关闭服务器,一旦服务器关闭,如何在检索时自动去掉这个服务器,当这个服务器开启时,在检索中自动的加入这个服务器。5)全文检索,通过对资源文件进行预处理(如果建立索引),支持多关键字的全文检索功能。三 test.xml文档的格式 07各地高考作文题 作文,高考 doc 07各地高考作文题 2007-12-1 8:50:43 22:8080/Query/source/07各地高考作文题.doc 李明 山东师大 四常见问题分析自大赛开始以来,收到很多同学提出的问题,现将常见问题总结如下:1XML文件(资源描述文件)是否由自己创建?是否需要根据资源的变化修改?xml文件不需要自己创建。我们知道,每个资源都有其自己的描述信息,这种描述信息是资源检索的依据,而资源的描述信息的提取和保存是一个非常复杂的过程。本题目不要求参赛者自己提取和保存资源的描述信息,资源的描述信息以一个xml文档的形式提供。每个资源服务器上的xml文件保存了这个服务器上所有资源的描述信息,它充当了一个数据库的角色。由于每台资源服务器上的资源是确定的,所以这个xml文档也是确定的,不需要由参赛者创建或修改。2视频文件的格式和播放问题?视频文件包括多种格式:avi,wmv,swf, rm ,asf,只要求调用相应的嵌入式播放器播放即可。3xml文档和资源的位置和名字问题?xml文档放在服务器的根目录上,名字是test.xml。例如在tomcat服务器中,test.xml会放在webapps文件夹下,资源文件会放在webapps文件夹之下的resources子文件夹下。4关于测试资源的数目问题?测试资源的数目一般是3-5个资源服务器,每台服务器上大约有200-500个资源项。5Word、ppt的预览问题?预览的比例问题?Word、ppt的预览是指预览该文档的一部分内容,比例自定。6题目有哪些可以拓展的地方?1)语义检索,语义检索可以作为一个拓展的方面,以返回该资源域内最符合用户需要的资源。2)分词技术,可以对用户提交的字符串进行分词处理,以检索到合适的资源。3)网络拓扑,对于一个资源域,我们可以假定有一个注册发布的主服务器,其他资源服务器都是通过这个服务器获得其他资源服务器的信息,通过这个服务器可以构造不同的分布式检索拓扑结构,好的网络拓扑结构可以提高检索的效率。4)资源服务器动态的加入和退出,资源服务器可能会动态得开启或关闭服务器,一旦服务器关闭,如何在检索时自动去掉这个服务器,当这个服务器开启时,在检索中自动的加入这个服务器。5)全文检索,通过对资源文件进行预处理(如果建立索引),支持多关键字的全文检索功能。7大赛的测试环境JAVA默认运行环境:操作系统:windows xpJDK:jdk1.6TOMCAT:apache-tomcat-6.0.16端口:8080test.xml文件位置: %TOMCAT_HOME%webappstest.xml资源文件位置:%TOMCAT_HOME%webappsresources.NET默认运行环境:操作系统:windows xpIIS:IIS 6.0.FRAMEWORK:.net framework 2.0/1.1test.xml文件位置:c:inetpubwwwroottest.xml如需要其他环境或不同的软件版本,请在提交作品时声明,并附带安装软件。五注意事项结合近两年的参赛情况,将在评审中遇到的问题总结如下,希望引起各参赛队的注意:1软件运行太依赖于环境 在近两年的评审中,我们发现有不少作品的安装过程过于繁琐,有很多作品的运行需要更改大量的配置文件,指定或建立需要的文件,其运行太过于依赖环境。2软件是集中式检索方式以往的参赛队中,存在将test.xml文件传输到一个服务器上,再进行集中式检索的情况,其本质上仍为集中式检索方式,不符合分布式检索的基本要求。3抄袭以往参赛队作品 对于抄袭严重的作品
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社会责任在家具设计中的体现与挑战试题及答案
- 科技销售面试题及答案
- 理论分析与乐理联系试题及答案
- 项目管理相关专业知识试题及答案
- 音乐旋律的构建乐理考试试题及答案
- 电动车市场竞争与政策环境的分析试题及答案
- 表现形式与技巧分析试题及答案
- 物理学科整合题及答案2025年
- 建峰集团招聘考试试题及答案
- 穿脱无菌手套试题及答案
- 2025年高考历史答题技巧与答题模板专题08影响、作用类(答题模版)(学生版+解析)
- 韵达加盟合同协议
- 2025-2030中国药物递送系统行业市场深度分析及发展前景与投资研究报告
- 泰康集团入职测评题库及答案
- 第四章 问题解决策略:特殊化 课件 2024-2025学年北师大版七年级数学下册
- 2025-2030全球及中国普拉提和瑜伽馆行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 预防AI换脸诈骗
- 针对项目实施的重点、难点的分析和解决方案
- 2025年甘肃省定西市渭源县中考数学第一次模拟试题(原卷版+解析版)
- 古诗词诵读《鹊桥仙(纤云弄巧)》课件(共37张) 2024-2025学年统编版高中语文必修上册
- (高清版)DBJ33∕T 1286-2022 住宅工程质量常见问题控制标准
评论
0/150
提交评论