信息存储与检索课程实验指导书.doc_第1页
信息存储与检索课程实验指导书.doc_第2页
信息存储与检索课程实验指导书.doc_第3页
信息存储与检索课程实验指导书.doc_第4页
信息存储与检索课程实验指导书.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息存储与检索课程实验指导书 一、实验的地位、作用 本课程通过基于“虚拟企业”教学平台的学习与实践训练,使学生掌握信息存储与检索的基本原理,基本掌握信息存储与网络信息搜索的方法,了解重要检索工具的概况和特点,掌握科技信息检索的方法和技能,培养学生应用所学知识解决企业实际问题的能力。从长远来讲,培养学生具有良好的信息素质和信息吸收能力,使其具备自我知识更新的获取信息的能力,提高制订并实施企业信息存储与信息搜索方案的水平。同时,掌握学术信息的检索利用和综述能力,为毕业论文的撰写和进一步学习和科研打下坚实的基础。二、实验开设对象 本实验开设对象为信息管理与信息系统专业的学生,实验为必修内容。 三、基本原理及课程简介 本课程在教学内容方面着重基本理论、基本知识和基本方法。在实践能力方面着重培养系统分析方法、 系统设计方法与基本技能的训练。 本实验课程不同于理论课程,“虚拟企业”教学平台上,充分体现“教师指导下的以学生为中心”的教学模式,以学生为认知主体,充分调动学生的积极性和能动性,重视学生自学能力的培养,共开设4个实验项目。本实验属技术基础实验课,在实验过程中,注意掌握信息存储、网络搜索、文献检索、学术论文写作规范与信息方案制作的基本理论、基本知识和基本技能,为将来工作打下基础。每次实验前必须做好下列准备:1了解实验作业内容;2根据实验内容,回顾所学信息存储、网络搜索与文献检索的理论与知识;3掌握信息存储、网络资源采集与检索的技术与方案制订方法。四、指导教师 原则上由本专业教师负责,实验室人员配合指导。指导教师应在每次实验前讲清实验目的、基本原理、实验要求等,指导学生在规定的时间内完成相关课程实验。 五、实验设备配置每人配置1台电脑, 可访问Internet以及校园网。 六、考核与报告 1每次实验后,学生依据个人或分组将实验结果等内容写出实验报告(例如系统分析报告等)或信息处理方案,符合实验教学的要求,并得到指导教师的认可。 2指导教师对每份实验报告进行审阅、评分。 实验一 信息存储技术实验目的:理解信息存储的基本概念和作用与主要的存储设备;掌握信息存储的主要方式及计算机信息存储体系;了解信息存储的主要技术与特点;了解信息存储的容灾和备份技术,初步具备制订企业信息存储方案的实际工作能力。实验内容: 收集分析信息存储设备体系、技术标准、信息存储内容等专业知识,并加以总结; 用Visio软件画出企业的信息存储体系结构图;认真分析网上已有的企业信息存储方案与技术特点,写出信息存储技术的发展状况与趋势评论性总结。实验二 网络搜索引擎实验目的:掌握网络检索的主要工具(特别是Google)的基本使用方法、技巧和步骤,采集并了解网络搜索引擎的工作原理,采集并了解Google公司的发展历史、技术进展与企业经营战略和企业文化。实验内容: 网络检索的主要工具(特别是Google与Baidu)的基本使用方法、技巧和步骤。 总结网络搜索引擎的工作原理、结构与流程。 利用搜索引擎收集整理并写出本虚拟企业所处行业的发展状况的评述。实验三、中国期刊网检索实验目的:能够采用不同的检索途径如作者、关键词、出版机构(刊名)、中文摘要等进行文献全文检索。实验内容: 检索出2005-2008年“果树设施园艺” 类的相关文献,保存5篇文献目录(即包括文章题名、作者、刊名、出版年);自己浏览其中任一篇文献原文,不保存全文内容。 检索题名中包含“鲜食玉米” 或“马玲薯”任一词的文献,保存10篇文献目录。 通过二次检索查出题名同时包含“温室”和“蔬菜”(或“大棚”和“黄瓜”)两词的文献。保存其中20篇文献(目录)。 查出2000- 2006年发表的篇名中包含“水泵”和“节能”两词的期刊论文,按相关度排列检索结果,保存前5条文献题录。 通过“高级检索”检索西北农林科技大学作者2000-2004年发表的题名中包含“塑料大棚” 一词的文献,记录其中2篇文献题录。 查出西北农林科技大学作者1999-2006年发表在SCI来源刊上的文章,保存5条文献题录。 通过“跨库检索”选择“中国期刊全文数据库”和“中国重要会议论文全文数据库”检索题名中包含“山楂加工”的文献,分别记录5条论文题录。 查出最近半年东北水利水电期刊中发表的文献,保存5条文献题录。 查出国家自然科学基金2006-2008年资助课题文献,保存5条文献题录。实验四、学术论文写作与企业信息方案制作实验目的:掌握学术论文与企业信息方案的写作流程、格式规范与要求,掌握企业信息存储与采集需求与特征,具备制订并实施企业信息存储方案的能力;具备制订并实施企业信息采集与处理方案的能力。实验内容:能够根据所学知识制订出本虚拟企业所采用的信息存储、采集、容错与救灾的整体性解决的技术方案。初步制订出的信息处理工作规范、流程与组织措施。按照专业论文的规范格式,完成一篇论文的写作,论文题目自定,范围为本虚拟企业范围内的内容,格式为学术论文的规范格式。 信息存储与检索课程实验报告开课实验室: 2014年12月18日学院电子科技大学成都学院学院年级、专业、班2012级信管五班姓名唐廷楷成绩课程名称信息存储与检索实验项目名 称 信息存储技术指导教师王宏教师评语教师签名:年 月 日一、实验目的理解信息存储的基本概念和作用与主要的存储设备;掌握信息存储的主要方式及计算机信息存储体系;了解信息存储的主要技术与特点;了解信息存储的容灾和备份技术,初步具备制订企业信息存储方案的实际工作能力。二、实验步骤 收集分析信息存储设备体系、技术标准、信息存储内容等专业知识。 将收集到的信息加以总结; 用Visio软件画出企业的信息存储体系结构图; 认真分析网上已有的企业信息存储方案与技术特点,写出信息存储技术的发展状况与趋势评论性总结。 最终得出实验结果,然后进行最后的分析总结。三、实验结果及分析存储设备是用于储存信息的设备,通常是将信息数字化后再以利用电、磁或光学等方式的媒体加以存储。常见的存储设备:1、利用电能方式存储信息的设备如:各式存储器,如RAM、ROM等存储设备(6张)2、利用磁能方式存储信息的设备如:硬盘、软盘、磁带、磁芯存储器、磁泡存储器,U盘3、利用光学方式存储信息的设备如:CD或DVD4、利用磁光方式存储信息的设备如:MO(磁光盘)5、利用其他物理物如纸卡、纸带等存储信息的设备如:打孔卡、打孔带、绳结等6、专用存储系统:用于数据备份或容灾的专用信息系统,利用高速网络进行大数据量存储信息的设备。 对存储过程的介绍存储过程是由流控制和SQL语句书写的过程,这个过程经编译和优化后存储在数据库服务器中,应用程序使用时只要调用即可。在ORACLE中,若干个有联系的过程可以组合在一起构成程序包。 存储过程是利用SQL Server所提供的Transact-SQL语言所编写的程序。Transact-SQL语言是SQL Server提供专为设计数据库应用程序的语言,它是应用程序和SQL Server数据库间的主要程序式设计界面。它好比Oracle数据库系统中的PL-SQL和Informix的数据库系统结构中的Informix- 4GL语言。n 服务器是企业运转的基石 p WWW服务器,每月有几万或几十万人了解到相关的信息;p 邮件服务器,企业内外平均每天要成百上千封邮件的交流;p 数据库服务器,应用程序正常运行的后台保障;p 媒体服务器,辅助业务系统的一个重要部分;p 文件服务器,几百GB或上TB级的文件存储容量;p 其它服务器n 这些基石有时会出现问题p 硬件故障;软件故障;误操作;病毒入侵;意外事故; 信息存储与检索课程实验报告 开课实验室: 2011年11 月 7日学院电子科技大学成都学院年级、专业、班2014级信管五班姓名唐廷楷成绩课程名称信息存储与检索实验项目名 称网络搜索引擎指导教师王宏教师评语教师签名:年 月 日一、实验目的掌握网络检索的主要工具(特别是Google)的基本使用方法、技巧和步骤,采集并了解网络搜索引擎的工作原理,采集并了解Google公司的发展历史、技术进展与企业经营战略和企业文化。二、实验步骤 网络检索的主要工具(特别是Google与Baidu)的基本使用方法、技巧和步骤。 认识网络信息的特点,关注因特网信息资源的建设与应用。 掌握搜索引擎的分类查找,关键词查找等方法。总结网络搜索引擎的工作原理、结构与流程。利用搜索引擎收集整理并写出本虚拟企业所处行业的发展状况的评述。三、实验结果及分析利用Google进行专题信息检索的方法和技巧关键词检索功能是网络信息检索工具的基本检索功能,也是Google最基本的检索功能。关键词属于自然语言,灵活、不受词表控制,但简单的关键词检索方法,命中过多,查准率很低,Google为改善关键词检索性能,提供了按相关度排列结果、布尔逻辑检索,短语或者句子检索、加权检索和限制检索等增强措施。利用Google进行专题信息检索,为提高查准率,须认真分析课题,选择恰当的关键词,掌握和运用Google检索语法规则,准确设计表达需求的检索式,反复调整检索策略,才能获得高质量的检索结果。简单专题信息检索,最直截了当就是在搜索框内输入一个关键词,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。如果检索人员或用户对查询的领域熟悉,只想寻找某些专题网站,首先考虑用目录检索,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以使检索具更高效率,按所需主题确定沿某类层层查找网站,目录分类明确,网站专题信息集中,剔除了大量不相关的信息,不过对查找中文信息,Google的中文目录太少,只有非常普通简单的类目,可能很难满足要求。 熟练掌握Google的基本搜索:+,-,OR ,学会使用两个关键字进行复杂专题信息检索 检索复杂专题依靠单个关键词查准率很低,要提高查全检准率,需进行详细的主题分析,选择多个关键词构造检索式。要分清主要概念和次要概念,去掉被隐含了的概念,确定需要排除的某些概念和不宜选用的泛指概念,以便在制定检索策略时有所侧重,保证检索提问的确切表达。正确选择关键词,各种类型的检索课题对检索的查全率和查准率有着不同的要求,可以增加上位概念或下位概念的方法来扩检4,若查准率要求较高,应使用专指性较强的概念或增加限制概念来缩小检索范围,还可通过对字段进行限定的方式来保证查找的准确性。对于那些对查全率和查准率无特殊要求的用户来说,也要针对不同的课题,制定相应的检索策略。对文献量较大或属于成熟学科的课题,应优先考虑查准率,从众多的相关文献中选取针对性较强的文献。对文献较少或新兴学科的课题,可适当放宽检索范围来保证查全率,以免遗漏重要的参考文献。选择正确的关键词后,就要运用Google检索语法规则构建检索式。Google无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。Google用减号“-”表示逻辑“非”操作。Google用大写的“OR”表示逻辑“或”操作( 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询)。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。 “+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。 熟悉Google的辅助搜索方法:通配符、大小写、句子、忽略字符以及强制搜索 5Google不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。Google的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。 Google对一些网络上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。 1、搜集信息(抓取网页):搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(Network Spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。3、接受查询:用户向搜索引擎发出查询请求,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。1)搜索器在互联网中发现并且取回尽量多的网页信息;2)索引器将搜索器所搜索到的网页信息切分成多个关键字,以关键字作为索引项,用于表示文件以及生成文件库的索引表;3)检索器根据用户的查询在索引库中快速检索文件,进行相关度匹配,对检索到的结果进行排序,返回相应的网页给用户;4)查询器的作用是接纳用户查询,显示查询结果,提供个性化查询项。索引器的好坏直接影响搜索引擎的质量,索引器从搜索器获取的资源中抽取并建立利于检索的索引表。目前搜索引擎中最流行也最有效的索引方式是倒排文件,先将切词形成的顺排文件组织成索引数据,然后再进行倒排处理。搜索引擎已成为一个新的研究、开发领域。因为它要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。又由于搜索引擎有大量的用户,有很好的经济价值,所以引起了世界各国计算机科学界和信息产业界的高度关注,目前的研究、开发十分活跃,并出现了很多值得注意的动向: 1.十分注意提高信息查询结果的精度,提高检索的有效性 2.基于智能代理的信息过滤和个性化服务3.采用分布式体系结构提高系统规模和性能4.重视交叉语言检索的研究和开发 信息存储与检索课程实验报告 开课实验室: 2011年11 月 7日学院电子科技大学成都学院年级、专业、班2014级信管五班姓名唐廷楷成绩课程名称信息存储与检索实验项目名 称中国期刊网检索指导教师王宏教师评语教师签名:年 月 日一、实验目的能够采用不同的检索途径如作者、关键词、出版机构(刊名)、中文摘要等进行文献全文检索。二、实验步骤(1) 在IE浏览器的地址栏中输入中国期刊网的网址/index.htm,出现如1的界面 图1 中国期刊网主页面 图2 中国期刊网全文数据库检索界面 图2即为初级检索界面。初级检索系统方便快速,执行效率较高,但查询结果有很大的冗余,会检索出一大批检索者所不期望的结果。如果能在检索结果中进行二次检索则检索命中率会大大提高。对于一些简单查询或是不熟悉多条件组合查询的用户,建议使用该检索系统。 (2)选择检索途径:检索途径共有11种(篇名、作者、关键词、机构、中文摘要、引文、基金、全文、中文刊名、ISSN、年、期、主题词),根据检索要求选择一种途径。这里,选择检索途径为“篇名/关键词/摘要”方式。 “输入检索词”意思是指在检索词输入框中输入与检索途径相对应的检索词。“选择检索时间”是指由于中国期刊网收录了1994年至今的期刊,用户可根据需要进行选择。“选择检索结果输出方式”指可选择按“相关度”或“更新日期”排序输出,默认为“无”排序输出。“无序”为数据无序排列;“相关度”指以检索词在检索字段内容里出现的命中次数排序,次数越多越靠前;“更新日期”指以更新数据日期最新排列,数据更新的日期越新越靠前。“选择检索专辑范围”指可根据需要选择一个、几个专辑或子专辑,当不确定检索范围时也可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论