下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1信息检索简答题1.信息、知识、情报关系 : 知识情报都是特殊的信息,知识是人类大脑反映事物运动规律的系统化信 息,其中最有价值。 情报是具有特定传递对象的特定知识或有价值的信息。其中 一部分在知识内一部分在知识外的信息内, 三者是相容关系 (或属种关系) 信息 是属概念其它是有交叉关系的种概念2.信息检索的发展趋势 网络时代,信息检索主要朝着更加灵活、实用、界面友好、智能化和可视化 等方面发展发展趋势 统一的检索界面, 提倡一站式服务, 强调界面友好,保护 用户使用方便 主动的信息推送服务 多种检索模型将融为一体, 取长补短 可视化技术实用化,信息形象化 检索的智能化3.比较自然语言和人工语
2、言 人工语言:(控程语言)由人工采用规范词,规范处理重在:使一个概念 只用一个词汇表达, 避免多词一义; 使一个标引词只能表达一个概念, 排除一 词多义。 自然语言 :检索用词从信息内容本身抽取,计算机自动抽词。 (查准率 高)人工语言与自然语言的比较 :人工语言查全率、查准率均比较高,故人工语 言检索效率高于自然语言, 但人工语言标引, 工作量大, 成本高,用户不易掌握; 自然语言标引主要由计算机检索系统自动完成,具有灵活性、新颖性和专指性, 用户很容易掌握。总之,二者相互补充,通常交互使用,满足不同检索需求。4.数据库 定义:至少由一种文档组成并能满足某一特定目的或某一特定数据处 理系统需
3、要的一种数据集合。 其是计算机信息检索对象,是信息检索系统的重 要物质基础。 一般来说, 一个数据库至少包括一个顺排文档和一个倒排文档, 而 记录是文档的基本组成单位, 记录本身又由多个字段组成。 顺排文档 按一种重要 字段顺序排列而成的数据库中全部记录的集合。相当于手工检索工具的 正文 倒 排文档 :抽出顺排文档记录中的可检或其他特征标识, 分别将包含该字段或标识 的所有记录按某种顺序排列组织, 并在每条记录后附上其存取号, 所得文档是倒 排文档.相当于手工检索工具的 索引部分。 目的:加快数据库的检索速度,提供 更多的检索途径。5.数据库的特点 数据库的数据具有结构化特点 数据库中所存储的
4、数据是面向现实世界的数据库中数据的共享性好、冗余度低。数据库中数据的独立性强 数据库由数据库管理系统统一管理和控制6.用于事务处理的数据库系统与用于决策分析的数据仓库系统的区别: 事务处理(是存取)与分析处理(分析处理)性质不同数据集成方面,前者不需,而后者必需。历史数据的使用(前者不需,而后者必需。)7.检索程序(文献信息检索步骤)A.全面分析课题,确定信息需求和检索目标。B.选择检索系统(检索工具)一一P392C.确定检索途径和检索方法D.确定检索词和检索词之间的关系,编制检索式。E.检索,并根据需要随时调整检索策略,得到所需检索结果F.索取原始文献信息8.联机检索及国际联机检索特点 联机
5、检索系统;是以大型计算机和大容量存储设备为基础,以公共设备交换网或 电话通讯线路为传输媒介建立起来的大型计算机检索系统。联机检索 在检索终端上, 通过通讯线路, 以人俊辑对话方式, 使用一定的指令和 算符,与检索中心的中央计算机练联机, 从该检索系统的数据库中检索所需信息 的一种计算机检国际联机检索的特点数据库资源丰富检索速度快,效率高 文献信息全面、准确、可靠、及 时安全费用较高,其收费有:联机检索费、通讯费联机检索程序 分析课题,明确检索目的 确定检索词和检索策略,先进行预检 接通联 机检索系统选择数据库输入检索式,检索分析检索结果如不满意可调 整检索式,重检。选择输出格式和方式,输出结果
6、。9信息检索工具的发展趋势:信息检索资源的载体多元,除了传统的印刷型 文献还出现了磁带光盘等各种载体。 信息工具内涵更为丰富, 除了印刷型检索 工具还包括面向计算机和网络的联机数据库检索系统,以及搜索引擎。 如今信息检索已从手工检索、 脱机检索、联机检索、光盘检索发展到了网络检索。10.(论述: 衡量检索效果的指标有哪些?理想的检索效果是什么?在实际中如 何处理好各项指标间的关系?)衡量检索效果的指标: (P65)查全率、查准率、漏查率、误查率,另外新颖率。 理想的检索效果是查全率和查准率为100%,也就是 漏查率和误查率为0。在实 际中是无法作到的, 因为查全和查准率之间在某种程序上存在反比
7、。 因此,在实 际检索中,要结合信息需要和检索要求在他们之间作出适当的取舍。11.检索策略调整的原因和方法(1)从检索结果数量上看 ,机检经常出现检索结果过少或过多的现象,这时应 调整策略,扩大或缩小检索范围, 以增加或减少命中结果, 提高查全率或查准率。 扩大:要扩大检索范围可:A.扩大概念B.增加同义词或同族相关词并运用逻辑 或进行组配、 减少检索词或少用逻辑与算符、 减少位置算符的使用或有关的字段 的限制,扩大检索的年代、文献类型、文种范围等方法。 缩小:缩小检索概念、 使用逻辑与等算符、缩小检索年代、文献信息源等方法。(2)从质量上看, 机检中, 标引标识和提问标识的类比和匹配是由计算
8、机完成, 用户根据检索结果判断此次检索是否成功。 如果要求为满足, 应调整策略再次检 索。去除误检结果,可以通过逻辑非;注意截词符的使用是否合理;使用字段限 制、位置限制等方法解决。(3)持续时间长的检索过程中, 根据研究的不同阶段, 不同的信息需求,不断调整检索策略。12.参考型工具书和普通图书有何区别?P73(属三次文献)指能直接提供事实、知识数3据、观点和资料等的检索工具。包括 事实型工具书、数据型工具书(参考工具书包括辞典、百科全书、年鉴、手册、 类书、政书、名录、表谱、图录、边缘性资料)特点和公用: 汇集一定范围的资料,按照一定、易于检索的方式编排,供人们查 考使用的书籍。信息密集、
9、资料专指性性强,便于查考、易于检索。普通图书 只有阅读功能,没有检索功能13.中文检索工具的主要排检方法 :字顺排检法(部首法、笔画笔形法、音序法、号码法。)、分类(A按实物性质归 类(尔雅开创);B按学科体系分类(如四部分类法:古籍文献分类多采用此。 七略)、主题(按既定的主题汇集和编排文献的方法。 (其不受学科领域限制, 能使同一事物的知识相对集中,再利用参照项沟通相关知识。如:年鉴、百科全 书)、 时序、地序排检法。14.专利制度对促进科学技术发展的作用 : 保障了专利权人的合法权益 技 术公开有利于发明创造的推广应用和技术成果转化,避免重复研究 具有保护 投资的作用因为科技发明成果是一
10、种无形资产 有利于促进国际间经济、 技术、 交流与合作。15.网络信息资源的特点(1)信息量大、内容丰富,形式多样、增长迅速。(2)多语种,传播及应用范围广泛(3)信息有较强的实时性、动态性,更新速度快。(4)用户可以自主存取,信息往往具有共享性、廉价、快捷且交互性强。16.网络信息问题:网页变更频繁,许多网页在较短的时间内小时或变更地址。 许多信息出处难以查证信息发布机构的权威性难以确认 信息的新颖性、真实 性和准确性难以确定 信息结构复杂, 分布广泛, 繁复无序 网页内容重复问题17.网络信息检索与传统文献信息检索的区别 : 检索对象和检索范围不同。其比传统的信息检索大,检索对象多种多样。
11、传 统的只能使用存储在特定计算机上的数据库信息特点不同:网络信息资源的特点:信息量大、内容丰富、形式多样、 增长迅速。多语种,传播及应用范围广泛 信息有较强的实时性、动态性, 更新速度快。 用户可以自主存取,信息往往具有共享性、廉价、快捷且交互 性强。 检索工具不同,传统信息检索多在一个检索系统中进行网络检索则是针对数 以百万计的网站或网页进行的,目前常用的检索工具是搜索引擎。18.网络信息检索的基本方法(获取网址的途径):分类收藏有价值的网址,需要时直接从熟悉的或已知的 站点获取信息通过网络检索工具搜索相关网址,再在有关网站内进行传统的 信息检索 通过网漫游的方法浏览相关信息 其他方式:利用
12、应用软件收集信 息:利用有关机构的资源和服务19.光盘数据库检索 (光盘数据库是机读文献) 光盘检索优势在于:存储密度高、存储容量大、保存时间长、操作简便快捷、成 本低。420.光盘检索与联机检索比其特点: 光盘数据库成本低,配置简单 购买光盘是一次性投入, 使用时间不受限制 其是独立的系统不受通讯费和 机时费限制 检索方便快捷、 操作简单易学 不受时间限制, 增加时长检索费 用不必增加。(缺点:更新周期长、容量有限、规格不一)21.光盘与网络数据库比其优势 : 成本低,投入少 运行速度快 安全性好 使用时间长 下载方便检索 效果好22.网络数据库检索优势和特点: (与光盘联机数据比较)不受时
13、空限制。 数据库内容的更新周期更短。 收录范围更加全面, 容易获 取原文节省费用更适合最终用户的使用。 其多由最终用户直接完成, 传统多 由检索人员提供服务。23.因特网信息检索与手工(即印刷型各类检索工具书)及计算机检索不同的原 因 因特网信息资源丰富、分散、无序,目前还没有足够大的检索索引,因此查全率有时不高。 信息量庞大无法精细地将之分类、编目并组织。查准率不高 检索途径不同, 传统检索系统用规范化语言标引, 网络则是自动从用自然语言编 写的网页中收集关键词建立索引数据库提供关键词的全文检索途径24.获取免费数据库地址的主要途径网上免费数据库指南通过传统途径(翻阅介绍网络检索的图书期刊)
14、相关网站的推荐或提供的友情链接 利用搜索引擎查找25.元搜索引擎P221又后搜索引擎或搜索引擎之上的搜索引擎, 是在分类目录、 网页全文等搜索引擎 基础上建立的,可以同时查询多个搜索引擎的WWW站点,是一种调用其它独 立搜索引擎的引擎。与一般搜索引擎 搜索原理不通,没有自己的搜索引擎和索 引数据库, 代之搜索接口代理机制。 依赖源搜索引擎检索网络信息, 只能进行关 键词查询。包括:Mamma、Meta Crawer中文元搜索引擎:搜星其搜索原理 :搜索接口代理机制。26.用搜索引擎搜索网络信息的基本方法步骤方法:关键词查询 目录浏览 查询与浏览相结合步骤:分析信息需求,确定搜索对象 确定搜索途
15、径,选择搜索引擎 确 定搜索方式 搜索 评价搜索结果 拷贝或保存。 重新搜索(根据线索重新 搜索全文)27.因特网信息搜索策略与技巧 (获取因特网信息基本方法: 选择合适的搜索引 擎;确定合适的搜索方法)搜索方法的选择技巧 :选择使用分类搜索 (因为其还是人工标引和整序,分类体系较为系统实用, 类名浅显易懂,归类准确、内容有一定的参考价值。)选择使用全文搜索引擎 结合使用关键词搜5索和分类浏览 (当关键词有多义、 歧义及频繁适用于热门新闻 标注是,可先进入分类目录在所属类目中进行关键词搜索, 可将搜索结果限定在 所需类目中。关键词搜索技巧 关键词的数量(适当)关键词的(要有)明确性和代表性。(
16、尽量不用忽略词,少用普通词。 )关于搜索的范围缩小搜索范围方法:使用更特定更专指的词搜索 不适用常用词或含义泛指的 词,去除近似词、近义词 增加关键词并用AND NOT组配 在前次检索结 果中进行二次检索 使用系统提供的选项限定搜索结果 利用类目先顶搜索 结果扩大范围 点击搜索结果中的“查询类似网页”等按钮 使用同同义词、 近义词输入多个意义相近的词并用OR组配 改用含义较为泛指的词 利用 元引擎 利用搜索结果分析网址查找上层网页28.因特网信息检索与手工及计算机检索不同的原因.不同:传统手工检索是指印刷型的各类检索工具书。是用户用手直接翻检纸质 检索工具查找文献信息资料的检索方式。 优点:不
17、需要附加设备即可进行, 随手 可得,且纸质工具书能长期保存, 使用方便免区了机检中常发生的内容丢失、 乱 码不兼容等麻烦。 网络信息检索 一般指因特网检索, 是通过网络接口软件, 用户 可以在一终端查询各地上网的信息资源。 这一类检索系统都是基于互联网的分布 式特点开发和应用的, 即:数据分布式存储, 大量的数据可以分散存储在不同的 服务器上; 用户分布式检索, 任何地方的终端用户都可以访问存储数据; 数据分 布式处理,任何数据都可以在网上的任何地方进行处理。 检索的对象和范围不同; 信息特点不同;检索工具不同。不同的原因: 因特网信息资源丰富、分散、无序,目前还没有足够大的检索索引,因此查全
18、率有时不高。 信息量庞大无 法精细地将之分类、编目并组织。查准率不高检索途径不同,传统检索系统用规范化语言标引, 网络则是自动从用自然语言编写的网页中收集关键词建立索 引数据库提供关键词的全文检索途径。29.课题检索的基本步骤 分析研究课题 (找出课题涉及的主要及相关内容选取主题词, 明确课题 需要的文献类型 确定检索的时间范围 确定检索语种 了解课题对查新、查准、查全的具体要求) 选择检索工具或检索系统(网络检索工具有:搜索引擎、商业数据库、各专 业学会的官方站点、专题信息网址、纸质文献、灰色文献) 确定检索途径和检索策略 选定检索方法 整理检索结果索取原始文献30.数字图书馆服务的内容 网
19、络资源的整合服务 个性化信息服务 (是一种能够满足用户个体信息需 求的服务 网上参考咨询 (是个性服务的大众化延伸, 为用户提供一对一的服 务。) 用户培训服务(其可为读者提供有关数字信息检索等方面的技术培训,培养 读者自我服务、独立检索的能力。)智能搜索引擎的建设。31.图书馆实体资源的利用可通过图书馆的OPAC系统(公共联机书目查询系统)获得某图书馆实体资源 其又可分:6馆藏目录查询系统、联合目录查询系统。馆藏目录查询系统: 只反映某个特定图书馆的文献入藏情况。 联合目录查询 系统:(针对一个地区) 有两种模式传统的集中式联合目录, (将多个图书馆 数据汇集到一个数据库中)模拟式虚拟联合目
20、录 (本相互独立, 检索时视为整体通过通用界面同步并行检索 并将结果返回。32.图书馆电子资源的利用1图书馆自建特色数据库2各图书馆研究信息 (通报最新消息、 研究成果等达到共享) 利用各馆引进 的联机数据库 网络电子期刊 光盘和网络数据库 视频点播33.图书馆网络导航利用网络导航 是根据用户的信息需求,利用超链接技术、对网络信息进行搜集、 筛选、分析、组织与发布,建立起科学、系统的资源组织体系、动态连接、信息 数据库和检索平台,利用计算机和网络检索指引用户通过网络及时准确获取所需 信息资源的过程。网络导航的作用: 通过对网上信息的筛选、分析、整序、链接,使得其由分 散到集中,由杂乱到系统由无序变有序,由无用变实用。 导航系统为用户信 息查询提供了方便,节省了时间精力和费用,获取信息方便快捷 沟通了网络 馆员与用户的联系发挥了馆藏和网络资源作用 促进知识的转化与创新。网络导航的内容:(主要方式): 网上资源导航 馆藏资源导航 数据 库导航 网站导航 电子资源导航 出版信息导航 学科导航34.中文常用数据库检索 : 中国知网、 万方数据资源系统、 维普天元数据库系统、 国务院发展研究中心信息 网数据库、 人民大学书
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5.1《人民代表大会制度》教案 2025-2026学年统编版道德与法治八年级下册
- 倒三角工作制度
- 工厂装配工作制度
- 完善派驻工作制度
- 局办公室工作制度
- 宣传部门工作制度
- 公关部工作制度
- 小学创卫工作制度
- 政协协商工作制度
- 双服务工作制度
- DB31∕T 8 2020 托幼机构消毒卫生规范
- 2024劳务清包工合同
- 2025高考物理专项复习:带电粒子在复合场中的运动(含答案)
- PPAP全套表格模板
- 火灾痕迹物证课件
- DL-T5842-2021110kV~750kV架空输电线路铁塔基础施工工艺导则
- 【幼儿园大班阅读区科学绘本阅读现状探究(含问卷)12000字(论文)】
- 部编版语文四年级下册第三单元教材解读大单元集体备课
- 2024年广东省中学生生物学联赛试题解析(word)及答案(扫描版)
- 民兵护路知识讲座
- 校园安全教育关乎每个孩子的生命
评论
0/150
提交评论