




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
名词解释1 信息检索所谓“信息检索” ,广义是指“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,其中包括了“存”和“取”两个基本环节。而狭义上的理解只涉及“取” ,所以可称为“信息查询”与“信息查找” 。2 联机检索是指信息用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行直接的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载、显示和打印出来的过程。3.信息源人们在科研、生产及其他一切人类活动中产生并积累下来的成果和各种原始记录,以及对这些成果和原始记录加工整理后得到的产品。4.超媒体(hypermedia):超文本与多媒体的融合产生了超媒体。通俗的说,就是允许超文本的信息结点存储多媒体信息(图形、图像、音频、视频、动画和程序) ,并使用与超文本类似的机制进行组织和管理,就构成了超媒体。5.CBRCBR 即基于内容的检索,其含义为:根据多媒体对象的听,视觉特征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别,语音识别和图像理解等相关领域的研究成果,对多媒体数据的听,视觉特征和语义特征进行自动或半自动的分析,表达和组织。6.网络信息源是指所有以电子数据的形式把文本、图像、声音、动画等多种形式的信息存贮在光、磁等非纸质载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息资源。7.URL统一资源定位符(URL)是用于完整地描述 Internet 上网页和其他资源的地址的一种标识方法。Internet 上的每一个网页都具有一个唯一的名称标识,通常称之为 URL 地址,这种地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是Internet 上的站点。简单地说,URL 就是 Web 地址,俗称“网址” 。8.倒排文档是指把数据库中记录的一切可检字段或属性值,或称称检索标识(著者,主题词,自由词,出版年等)抽出来,按某种顺序重新加以组织后得到的一种文档9.检索语言检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言。 10.自然语言从广义上说,指人们日常说话、写文章和交流思想所使用的语言。(或者解释为:包括关键词、自由词和出现在文献题名、摘要、正文或参考文献中的具有一定实质意义的词语)。11.超文本是一个非线性的网状结构,它以结点为单位组织信息,在结点与结点之间通过链接加以连接,构成表达特定内容的信息网络。12.搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。简答:1.因特网信息检索的特点(1)范围大(2)检索效率高( 3)工具性强(4)信息冗余(自己解释吧)2. 搜索引擎的工作原理是:搜索引擎的工作原理是:运行特定的网络搜索程序,定期地搜索 Internet 的各个站点,送回收集到的文献信息(包括 Web 页面和新闻组文章等) ,并利用索引软件对这些文献进行自动标引,加入集中管理的索引数据库;同时,在 Internet 上设立提供检索界面的 Web 站点,由用户输入提问检索式,通过特定的检索软件,查找其索引数据库,给出与检索式相匹配的查询结果,供用户浏览。3.简述检索系统的“提问处理/检索匹配”子系统的主要作业流程?书上 52“提问处理与检索匹配”模块主要负责处理用户输入的检索词或提问式,并将它们与数据库索引文档中存储的数据项进行匹配运算,然后把运算结果返回给用户。该功能模块是信息检索系统的技术核心,其主要的操作流程可以描述如下:1)接受用户提问;2)提问校验,包括对提问式进行语法、格式、用词、等方面的检查,主要由程序自动完成。3)提问加工;指对源提问式进行解释或编译性的加工,生成便于机器处理的目标提问式。4)检索匹配,即将目标提问式与数据库索引文档的记录进行匹配,把满足要求的数据库记录输出到结果文档中,或直接显示在检索屏幕上。4.Web 搜索引擎评价指标?搜索引擎的评价标准概括为1)检索结果相关性排序、2)查全率和查准率、3)系统响应时间(检索速度)4)链接可靠性或信息有效性(索引数据库的更新周期) 、5)系统检索简单主题、复杂主题和冷僻主题的能力4.(检索性能评价标准:)(1) 收录范围(2) 查全率(3) 查准率(4) 响应时间(5) 用户负担(6) 输出方式(7) 新颖程度、更新速率、应该两个都行 5.因特网搜索引擎划分类型?按照检索机制不同,可划分为关键词型搜索引擎,目录型搜索引擎和混合型搜索引擎。按照数据收录范围不同,可以划分为综合型搜索引擎,专题型搜索引擎和特殊型搜索引擎。按照包含检索工具的数量不同,可以划分为独立搜索引擎和元搜索引擎。按照开发运作背景不同,可以划分为学术型搜索引擎和商业型搜索引擎。6、简述常用计算机信息检索策略。计算机信息检索中,美国人鲍纳(Charles Bourne)提出的五种检索策略,影响较大,它们分别是:A、 “最专指面优先”策略B、 “最低登录量的面优先”策略C、 “积木式”策略D、 “引文珠形增长”策略E、 “逐次分馏”策略(“连续分割”策略)7.什么是布尔逻辑检索?布尔逻辑运算符包括哪些?各代表什么含义?布尔检索是通过标准的布尔逻辑关系词来表达检索词与检索词间逻辑关系的检索方法。主要的布尔逻辑算符有:逻辑与(AND):其含义是检出的记录必须同时含有所有的检索词。逻辑或(OR):其含义是检出的记录中至少含有两个检索词中的一个。逻辑非(NOT):表示它所连接的检索词中应从前面的概念中排除后面的概念。8.信息检索工具的工作原理(和第二题类似)9.标引的网罗度和标引深度,是影响信息检索系统全面性的最主要因素。标引的网罗度(或穷举度):定性描述,指的是文献主题被标引出来的广泛程度;(较大较小)标引深度:定量描述,指的是文献被标引的文献标识的数量。 (一二三)10.信息检索原理信息检索包含信息存贮和信息查找两个过程,信息存贮是对文献进行收集、标引及著录,并加以有序化编排,编制信息检索的工具的过程,信息查找是从大量的信息中查找出用户所需的特定信息的过程,而实施检索的主要方法就是利用各种检索工具。a用户信息需求与存储在文献集合体中的文献进行比较和选择,即“匹配”过程;b提问标识与文献标识的对比。11.信息检索步骤是指根据科研课题的需要,使用一定的检索工具,通过特定的检索途径,选择适当的检索方法查找所需文献的全过程。信息检索可以从下面 4 个步骤进行:(1)检索需求的分析和表达(2)检索方法的制定(检索途径;检索语言) (3)检索式的编制,检索策略的制定(4)检索结果的反馈调整(5)检索结果的输出12.网络信息资源的特点:(1)数量庞大,增长迅速;(2)信息类型多,范围广;(3)信息变化频繁,质量参差不齐;(4)信息分散、无序;(5)分布式、跨平台;(6)共享程度高,使用成本低。13.网络信息资源的检索方法:网上浏览网络资源指南(目录型检索工具)搜索引擎图书馆网站的学科导航14.网上免费学术资源的类型及获取方式:类型包括:网络图书与图书信息、网络期刊与期刊论文、网上会议与会议论文信息、网上学位论文信息、网上专利、科技报告、微信息获取方式可以是:1.学术搜索引擎 2.开放存取资源系统 3.学科信息门户 4.学术专业论坛 5.免费的资源网站 6.专家博客 7.网络参考工具 8.搜索引擎小技巧15.全文数据库的特点(1) 可直接利用(2) 简化数据标引和建库工作(3) 避免了文献二次加工中人为的差错(4) 后处理能力强(5) 对检索技术的要求较高16.全文数据库的作用(1) 为用户提供快速的文献信息源(2) 为用户提供详尽的文献信息(3) 可作为文献载体进行保存17.期刊的特点(1) 规模大、品种多,内容丰富多彩,能满足人们多方面的信息需求(2) 出版周期短,报道速度快,内容新颖(3) 发行面广,流通渠道多,影响大。论述题1.手检机检的区别和联系;优缺点机检是在手检上发展起来的,检索原理、步骤是一样的。最大的区别在于效率。手工检索:以手工操作的方式,利用检索工具书进行信息检索。灵活、具有一定的模糊性、允许一定程度的变化, (人工匹配)优点:检索成本极低或者无需成本,便于控制检索的准确性,缺点:检索速度慢、工作量较大。机器检索:以机械、机电或电子化的方式,利用检索系统进行信息检索。严格、快速,但较为机械(字符匹配 )优点:检索速度快、能够多元检索、检索的全面性较高;缺点:检索成本较高,需要借助相应的设备进行检索。机器信息检索主要就是指:计算机信息检索。计算机检索的特点:(1) 查找迅速,反馈及时(2) 检索全面,主题广泛(3) 内容新颖,实时性强(4) 使用方便,功能完善(5) 组配灵活,检索多元(6) 检索相关的费用较高(7) 检索的适应性有时较差(8) 检索回溯的年限不够长2 论述信息检索系统的基本结构,并图表说明。 信息检索系统包括物理结构和逻辑结构。从信息检索系统的物理构成角度来看,包括:系统的硬件,软件和数据资源等构成的一个实体系统。信息系统的逻辑结构主要是指它所包括的功能模块(或子模块)及其相互关系,可以用如下的图示方法表示:检索结果信息源信息采集信息标引处理创建/更新数据库及索引文档用户用户界面提问处理检索匹配信息存储 信息查询数据库及索引文档知识组织工具3. 网络检索时存在的问题及解决问题:(1) 网络信息良莠不齐(2) 检全率低(3) 检准效率低(4) 检索效率低(5) 无统一检索规范(6) 缺乏多语种检索(7) 缺少基于内容的信息搜索引擎(8) 索引数据库更新速度慢(9) 个性化需求差解决:(1) 统一搜索引擎分类标准(2) 网络信息工具标准化(3) 开发多语种网络信息检索工具(4) 加强基于多媒体技术特点的信息检索研究(5) 加强基于内容的信息检索研究(6) 发展智能检索技术(7) 完善个性化服务(8) 加强用户培训(9) 加强宏观管理4.人肉搜索是否违法定义:“人肉搜索”是一种新型的搜索方式,指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制,其往往表现为利用现代信息科技,变传统的网络信息搜索(机器搜索)为人找人、人问人、人碰人、人挤人、人挨人的关系型网络社区活动。利弊辩证:“人肉搜索”从最初的互助行为正转化成极易侵犯公民隐私权的行为。根据我国民法学基础理论的理解,隐私权是指公民享有的对其个人的、与社会公共利益无关的个人信息、私人活动和私有领域进行支配的一种人格权。任何未经自然人同意或授权而披露、传述、散步、窃取他人的个人隐密事项,无论其主观上是无目的(如在过失情况下) 、恶意(如为了泄愤)抑或善意(如为了批评教育) ,都会构成对隐私权的侵犯。 在“人肉搜索”实践中,侵犯公民隐私权的现象明显且严重。5.搜索引擎侵犯隐私如何解决:鉴于“人肉搜索”已经成为当前最为常见的侵犯公民隐私权的网络行为之一,许多学者认为,其社会危害性已经相当大,应该立法予以禁止。但需要考虑的是, “人肉搜索”虽然是一种极易侵犯公民隐私权的行为,但其也是网络时代实现资源共享的有效途径,是信息时代的一种社会产物与资源,因此,对其予以彻底的立法禁止似乎并不妥当。对“人肉搜索”应当通过立法予以适当的引导与规范,以促进其在法律的规制下,在不侵犯公民隐私权的前提下,实现最初善意目标的回归。规制“人肉搜索” ,避免其对公民隐私权的侵犯,当然首要的就是要解除侵权产生的法律制度原因,即需要建立和完善网络行为规范法律制度,健全和完善公民隐私权法律保护制度。(1) 确认隐私权在我国法律体系中的地位,加快对个人信息保护法律制度的建设(2) 健全和完善网络行为的规范立法,明确与细化网络服务提供者的法律责任制度(3) 建立以案例为中心的网络行为规制和引导的宣传体系(4) 建立较为便捷的网络侵权责任追究实现机制实践题检索效果的评价判断 原因 专家认为合理范围应在(查准率 4050% 查全率 6070%) ,因此不合理;效果不理想;不理想原因(系统性能;标引人员标引网罗度与深度;用户检索需求的表达) ;如何提高检索效果:(1) 提高检索工具的质量 (2) 提高用户利用检索工具的能力 (3) 制订优化的检索策略 (4) 制定检索策略可供参考的意见 (5) 要广开思路 查全率的提高:(1) 降低检索词的专指度,选出一些上位词和相关词补充到检索式中。(2) 调节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025呼伦贝尔农垦集团有限公司社会招聘50人考试备考带答案详解
- 教师招聘之《幼儿教师招聘》每日一练及1套参考答案详解
- 2025年教师招聘之《幼儿教师招聘》预测试题及答案详解【名校卷】
- 2025年教师招聘之《幼儿教师招聘》练习题包含答案详解【黄金题型】
- 2025年教师招聘之《幼儿教师招聘》能力检测试卷附答案详解(基础题)
- 演出经纪人之《演出经纪实务》每日一练附参考答案详解(精练)
- 2025年教师招聘之《幼儿教师招聘》基础试题库【含答案详解】
- 2025年学历类自考国际公共关系-英语(二)参考题库含答案解析(5卷)
- 2025年学前教育机构师资队伍教师培训师资力量建设与管理的创新研究报告
- 教师招聘之《小学教师招聘》练习题库附参考答案详解【突破训练】
- 龙门铣床操作规程(3篇)
- 《冠心病》课件(完整版)
- 标志设计(全套课件88P)
- 数字货币投资入门指南
- 2024年“学宪法、讲宪法”应知应会题库
- HG-T 5367.5-2022 轨道交通车辆用涂料 第5部分:防结冰涂料
- 原油加工承揽合同
- QCT268-2023汽车冷冲压加工零件未注公差尺寸的极限偏差
- 【大数据“杀熟”的法律规制探究17000字(论文)】
- 初中九年级英语课件宾语从句 公开课比赛一等奖
- 患者安全和护理质量的关联
评论
0/150
提交评论