




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第五章 明确信息需求,3,提纲:,概述 所需信息源的类型 一次和二次信息源 多学科与主题交叉 明确研究领域和局限 已知内容,4,5.1 概述,在开始查找信息之前,有必要做一个计划。显然,研究者无法想到他不了解的事情,可以利用最基本的知识产生一个需求的清单 随着项目推进,研究者会不断加深对信息资源的了解,也有能力排除最初认为是重要的内容 明确课题、目的及研究范围后,研究者就进入了信息搜集的第二个阶段-明确信息需求,5,5.2 所需信息资源的类型,图书章节 期刊论文 报纸文章 网站 统计学出版物 官方出版物 活页(散页印刷品),学位论文 会议录 一般出版物 学科专家 视频音频资源 公司报告 标
2、准,6,5.3 一次和二次信息源,一次信息源:指事件的最初记录,没有任何分析与注释。它可以是一些数据,也可能是事件第一手的报告或直接证据。原始的研究通常需要一次信息源。例如: a.一个音乐系的学生想找到原始的乐稿来弄清作曲家是如何创作的 b.一个药品研究者想掌握药物试验的第一手数据来明确药效 c.事件的调查人想阅读有关的日记与书信,7,二次信息源:是对事件或现象的解释与分析,它通常会尝试对一次信息源进行描述和解释。二次信息源比如教科书可能会包括一些一次信息源。 a.一个学者找到与有争议作品相关的文章与评论来评估其他同行的观点 b.一个医学工作者阅读与流行疾病相关的期刊论文来发现同行的经验 c.
3、一个历史学的研究者会接触其他学者对事件进行阐述的原文,8,对某些研究来说,获取原始数据是有必要的。这些数据提供了分析与阐述的基础。研究者在开始搜集信息之前可能知道他们需要接触一次信息源,即使他们不确知他们要找什么。 如果需要二次信息源,研究者需要考虑合适的资源类型。,9,5.4 多学科与主题交叉,尽管大量研究只存在于单一主题领域里,但还是有许多课题涉及两个或更多学科。 心理声学-研究声音与其心理生理效果间关系的学科,10,5.5 明确研究领域与界限,设定课题的广度与深度以保证研究始终在既定范围内开展,研究者应该清楚包括什么,排除什么。 这么做可以确定何时结束信息搜集、有助于确定信息是否相关、保
4、证研究始终切题,避免摊子铺得太大,11,5.6 已知内容,在为课题确定所需信息的同时,研究者还应梳理出已知的相关信息,列出已知信息源: 专家;出版物;其他来源比如记录、视频音频资料和实物;组织和其他实体;相关信息源比如索引、网站、书目或在线数据库。,12,本章重点:,确定研究者是否需要获取一次信息 对需要的资源类型有一个清楚的认识 在其他学科领域找出主要的与多学科研究相关的信息资源 确定研究的详细范围以避免跑题 列出已知内容,第六章 资源发现,14,提纲:,资源发现 文摘与索引 在线书目数据库 与在线数据库有关内容 目录与书目 开放存取期刊 其他来源与信息类型 参考文献和引文检索 选择与主题相
5、关的资源,15,6.1 资源发现,确定信息需求后,获取资源三步曲: 资源发现-找出现有主题领域里的信息资源 资源定位-找出信息资源收藏地点 资源获取-实际地获取信息 2. 资源发现是一个寻找与所选主题相关的现有资源细节(书目或其他)的过程。大量可用资源有助研究者完成他们的项目。常见的有文摘和索引、目录和书目。,16,6.2 文摘与索引,文摘(Abstract)是系统著录、报道、积累和揭示文献信息外表特征和内容特征的信息资源,如著名的化学文摘剑桥科学文摘 索引(Index)是将文献信息中的题名、人名、地名、字句及参考文献等分别摘录出来,并注明出处,按一定的规则编排起来的一种信息资源,如工程索引
6、索引也经常包含文摘,17,6.3 在线书目数据库,一个在线的书目数据库就是一个关于期刊文章(或者书评、报告和会议录等)书目信息的电子仓储。许多是光盘形式(在一些机构内网络化),但经常可以通过网络进行检索。一个以网络为基础的数据库很容易更新并且通过互联网被用户检索。 尽管互联网上大量有价值的信息可以通过搜索引擎来发现,但包含在数据库中的绝大部分有价值信息却无法检出。数据库用户要为以下内容付费:数据库的有序结构、检索功能、专业内容、索引和词表功能 许多大型的印刷型索引和文摘服务都有在线版本。网络数据库的另一个好处是它们强大的链接功能 数据库一般通过代理进行推广。订户通过他们的代理商付款及签订协议,
7、18,书目数据库中的记录,书目数据库中的记录包含着与印刷型文摘和索引同样的信息。然而,仅仅提供书目信息和文摘的数据库与那些能够提供全文的数据库之前的差别日渐模糊。随着出版商之间的合作以及现代信息检索技术的应用,许多数据库都可以提供到全文的无缝链接。,19,书目数据库中的记录,记录(Record)是数据库的基本单元,是对某一实体属性进行描述的结果。 字段(Field)是记录的基本组成单元,是有关一篇文献或称一条记录的基本数据单元,每一个字段都反映该篇文献的一个方面的信息,组合在一起形成对一篇文献信息的内容特征和外表特征的完整描述。比如:作者、题名、来源、卷期、出版日期、入库日期、文摘等等 若干字
8、段构成一条记录(演示一条完整记录),20,6.4 与在线数据库有关内容,尽管数据库的检索规则相同,每一个数据库又都有自己的特点。一些很简单,检索途径少,但很容易用。一些则比较复杂,允许根据检索需求编制检索策略。还有一些可能连最基本的特征也和其它数据库不一样,因此,学会使用帮助文件很重要 如果检索提问不被数据库接受,就会产生不满意的结果甚至没有结果,21,6.4.1 内容与范围,一个数据库通常会包括以下列表:数据库的主题范围、刊名列表,研究者通常会参考这些内容来确定该库是否被需要 数据库内容的另一个方面是它的时间范围,22,6.4.2 在线数据库的检索选项,大小写敏感 自然语言与结构化的检索标识
9、(提问) 快速检索与高级检索 检索界面 字段检索 词表检索 索引检索 相关文献检索 跨库检索,23,检索标识,检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。它与检索字段相对应,是检索字段的具体化。 如主题字段的检索标识就是主题词,分类字段的检索标识就是分类号,著者字段的检索标识是著者姓名,其他依此类推。,24,弄清什么是检索课题、检索词及字段,了解意大利著名作家艾珂的生平及作品 艾柯 作者(著者、责任者),字段,检索词 检索标识,检索课题,25,快速检索与高级检索,(simple/e
10、asy/quick/basic search) 简单检索又称为基本检索、快速检索,即为用户提供一个简单的检索界面,帮助非专业或初入门用户方便地提交检索提问。页面上通常只有一个检索框,不提供或提供很少的检索字段,不使用或很少使用组配算符。用户提交检索提问后,系统将提问发送到默认的一个或几个字段中进行匹配运算。 (advanced/guided/expert search) 也可以称高级检索、指南检索、专家检索,为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索提问,帮助用户进行精确检索。 复杂检索包含组配检索,即将两个或两个以上的检索词用不同的组配算符组合起来,如布尔逻辑组配,
11、使检索更为灵活,检索结果更为精确、全面。,26,27,字段检索,字段检索最具灵活性和精确性,可以通过下拉菜单选择所需字段或者在检索提问中包含字段(缩写)来完成 t=雷达(维普) Harbin Engineering University wn af (EI) 用题名字段来检索比在全部字段或文摘中检索得到的结果相关性更强,关键词-文摘-题名,检出结果数量减少,相关度增强 也可选出版物类型,甚至在已知期刊内进行检索,28,29,词表检索,如果数据库包括同义词词表,检索者一定要利用它。有助于选择数据库索引的检索词,也能提供相关词、上位词、下位词。,30,索引(Index)检索,索引是一个线性的表单,
12、可以将任何一个字段中的概念按字母顺序线性排列起来,不分等级。用户通过检索,可以定位在索引中的任意某个位置,并浏览在这个位置附近的所有词语,进而查询所需词语对应的结果列表。 索引的种类很多,如人名索引、出版物索引、地名索引、主题索引、机构索引等。,31,32,相关参考文献检索,许多数据库提供相关参考文献检索,可以将同一主题的参考文献检还。,CNKI参考文 献检索,33,跨库检索,34,6.4.3 解读记录,检中记录数量(检索结果数量) 检索数(sets) (EBSCO演示) 记录格式切换 结果导航 可用链接,35,6.4.4 管理结果,标记记录 打印、保存、或电邮记录 检索历史 保存检索历史 提
13、醒 注意每个数据库的个性 帮助,36,6.5 目录与书目,OPAC 联合目录 出版者书目 网上书店提供的书目,37,6.6 开放存取期刊,另章介绍,38,6.7 其他资源和信息类型,其他格式的资源,如音频视频资源也可以通过数据库进行检索,如: 新华社多媒体数据库 KUKE音乐数字图书馆 网上报告厅 灰色文献,39,6.8 参考文献与引文检索,另章介绍,40,6.9 选择与主题相关的资源,研究者在利用数据库时往往只习惯用专业领域内的某一个或某几个数据库而忽略其他内容。 许多综合数据库收刊质量也很高,研究者应该熟悉可用的数据库范围,41,本章重点:,信息发现是一个发现相关信息细节的过程 研究者需要
14、发现有关细节,如书目或者其他所需内容 在线书目数据库是一种发现书目细节的方式 研究者应该学会利用每一个数据库的帮助信息 检索出的记录以及检索历史应该记载下来以备后用 目录、书目和参考文献列表可以用来发现信息 研究者应该利用数据库的多样性来完成复杂检索并且注意数据库的局限性,第七章 在线检索过程,43,提纲:,编制检索计划的重要性 在线检索过程 如何编制检索策略 确定检索词 限定检索 截词检索与通配符 短语检索,布尔逻辑检索 位置算符检索 实施检索 评价检索结果 储存检索结果 完成检索,44,7.1 编制检索计划的重要性,所谓检索计划,就是制定正确、恰当的检索策略,为检索过程进行指导,目的是为了
15、优化检索过程,提高检索效率,全面、准确、快速、低成本地找到所需信息。 对于一个具体的检索过程而言,编制出一个好的检索策略,使其能够确切地反映检索需求,就有可能使检索者以最短的时间和最低的成本获取最满意的检索结果。编制检索策略对检索过程能否顺利进行具有举足轻重的重要影响。,45,7.2 在线检索过程,检索计划 执行检索 得出可管理的相关结果数量 评价结果 保存结果 调整计划,再次执行检索,检索,检中记录,开始,完成,保存,评价,46,7.3 如何编制检索策略,第一步:确定检索词 第二步:限定检索 第三步:截词、通配符与短语 第四步:执行布尔逻辑检索 第五步:位置算符检索,参考下图,47,第一步:
16、确定检索词,明确概念和关键词,同义词,上位词 下位词,相关检 索词,可选 拼写,词形变化 数人称时态语态,专业 词汇,从阅读中发现一些有意义的词,明确停用词,检查选中词,第二步:设置限定条件,第三步:截词、通配符与短语,第四步:编制检索表达式,与、或、非,用小括号来改变顺序,检索组配,第五步:其他连接符,位置算符,字段检索,执行检索,48,7.4 确定检索词(Term),研究领域与信息需求已经确定。接下来的重点集中在查找信息所用的词语上。检索词是研究得以进行下去的基础。 在研究的最初阶段进行小范围阅读时,可以记录一些重要的词以便后来用作检索 可以备上一本专业词典、词表或者百科全书 导师或者其他
17、专家也可以给一些建议 可以将课题进行分解,49,1 所选出版物的特点 2 英国新闻媒体的类型 3 涉及一些什么人,英国的新闻媒体更追求轰动效应而非安定的报告,新闻媒体,轰动效应,安定的报告,报告风格 语言的使用 图片及其他多媒体手段的使用 读者群(观众或听众) 不同主题领域的覆盖(政治、 大众娱乐、环境),报纸(大幅印刷品、小报) 电视(公共服务和商业; 电缆和卫星) 广播(公共报务和商业) 网络新闻,记者 编辑 报社老板 读者 故事主人公等等,轰动效应的定义; (辞典定义,本次调查所用定义) 英国民众对于轰动效应的态度; 英国法律(私法、诽谤),何谓安定的报告 商业利益(既定利益,观众、听众
18、及读者数字) 媒体公正,50,概念(concepts),利用题名(陈述或提问)作为一个起点,摘录主要概念(主题或观点), 列成一个表或者作为图表的起点 将概念的数量限定在四个以内,否则,会使检索变得复杂。概念太多说明研究领域过于宽泛或者模糊,51,关于英国的组织,“玻璃天花板”已经粉碎到什么程度,52,同义词(Synonyms),研究者的课题或假设可能使用了某个特别的词,但是其它同类文章可能用了一个类似的词。在研究中不包括同义词会漏检相应内容 如组织的同义词:公司、社团、联盟、合伙、机构 利用同义词表可以更容易确定同义词。结构化的数据库通常会提供一个研究者应该利用的同义词表(演示EI、维普)
19、同时考虑缩写与全称;数字与日期的不同表达方式;连字符的使用;名称的更迭,1.1930s nineteen thirties 2.14th century fourteenth century 3.Neoclassical neo-classical 4.哈尔滨军事工程学院-哈尔滨船舶工程学院 -哈尔滨工程大学 5.Harbin Engineering University HEU,53,上位词(Broader)与下位词(Narrower),西方音乐,流行音乐,爵士乐,爵士乐队,新奥尔良爵士乐队,杰利罗莫顿和他的红辣椒乐队,上 位 词 下 位 词,关键词或概念,54,男人,人类,脊椎动物,哺乳动
20、物,红细胞,血液,血液循环系统,55,包括或排除上位词及下位词的原则有:,检中记录的数量太多或太少 概念专指度太强 上位词可能太宽泛以致不相关 检索者应当对整体情况有全面了解以便于在上下文中确定主题 特殊领域的范例是必需的 同一测试环境的范例是必需的,因此上下位词不相关,56,相关词(Related terms),相关词是在主题方面与检索词有联系,但并非同义词、上下位词 与“玻璃天花板”相关的词有:升迁、个人管理、歧视、女人 与主题相关的知识和经验有助于选择相关词,一些数据库包括相关记录索引 如果一个数据库有同义词表,则词表中会包括相关词,57,可选择的拼写,许多英文词有不同拼写,主要在于美语
21、与英语的差别。如果没有注意则会漏检相应内容 中文数据库不存在这样的问题 如behaviour与behavior,58,2008.03.15 10:04,59,词形变化(人称、数、时态、语态),要考虑到名词复数的正常变化,也要考虑非正常变化,如party-parties, thesaurus-thesauri 除了复数,还要考虑到一个词的所有形式,包括名词、动词、形容词,过去时态等等。如 organize-organized-organization-organizational-organizationally,60,短语或者单独的词,一条短语充当检索提问时,要求连续并且词序固定 有些短语按单
22、个字词检索时会失去其特指的含义 如 glass ceiling,61,专业词汇,如果在题名、文摘或索引中使用专业词汇,则可以缩小检索结果,产生特别相关的记录 当检索结果过多时,可以考虑使用专业词汇来缩检 专业词汇通常没有第二选择 Stroop test史楚普实验,是认知心理学里很有名的实验。它是由美国心理学家约翰里德利史楚普(John Ridley Stroop)(1897-1973)在1935年首次提出,因此一般称作史楚普实验。正式名称为“颜色与文字的冲突实验”(color word conflict test)。史楚普实验可以用来评价抑制习惯性行为的能力。,62,检查所选检索词,63,干扰
23、或停用词(Noise and stop words),西文数据库通常不会检索如by,but,if,within, near等等的词,这些不被检索的词称为停用词,64,7.5 限定检索(Limiting the search),同明确检索需求相比,明确哪些内容不需要以及如何限制检索同样重要 数据库在提供的限定选项上不尽相同 利用限定检索可以使检索更明确结果更相关 一般来说,可以从语言、出版日期、出版物类型、学科等几个方面进行限定,65,7.6 截词检索与通配符Truncation, Wildcards,用截词符号(通配符)“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的
24、词。这种检索技术可以扩大检索范围,提高查全率,主要用于西文数据库检索。 Organization-organizational-organizationally- organizatio* or organizatio? or organizatio$ 使用截词检索可能带出不相关的词,如 bit-bits-bite-bit* 就会一并检出bito bitt-,66,7.7 短语检索(精确检索),用短语检索可以提高结果的相关度,许多数据库要求用”来明确短语检索 检索者应该注意到数据库的默认设置,对一些数据库来说,输入两个以上单词,系统就会自动进行短语检索,而另外一些数据库则执行逻辑运算 Glas
25、s ceiling -”glass ceiling” or glass AND ceiling,67,7.8 布尔逻辑检索,布尔逻辑检索即运用布尔逻辑算符(AND OR NOT)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。,A AND B A*B,A OR B A+B,A NOT B A-B,68,优先运算,当连接检索词时,很容易无意间生成一个意义模糊的检索策略,为了避免这种情况,许多数据库提供了(优先算符)检索 女人 OR 女性 AND 均等机会 OR 歧视 (女人 OR 女性) AND (均等机会 OR 歧视),机会均等,女性,女人,歧视,女人,女性,机会均等,歧视,69,在实践中如
26、何组配(combine)检索词,利用检索词图表进行组配,要考虑到所有可能性。这样可能会产生一个长的检索提问列表,运用截词和通配符可以减少提问的数量. 应尽可能使提问相对简单,因为: 长的复杂的检索提问容易出错;使用简短的检索提问,数量可多些,检索者可以灵活地进行组配,70,(1)玻璃天花板 AND (组织 OR 合伙 OR 公司 OR 企业 OR 社团 OR 机构) AND (英国 OR 大不列颠联合王国)(2)(歧视 OR 机会均等) AND (女人 OR 女性) AND 车间(3)(歧视 OR 机会均等) AND (女人 OR 女性) AND 升迁,(1)组织 OR 合伙 OR 公司 OR 企业 OR 社团 OR 机构 (2)英国 OR 大不列颠联合王国 OR 北爱尔兰 OR 威尔士 OR 英格兰 (3)升迁 (4)机会均等 (5)歧视 (6)女人 OR 女性,联合检索,检索序号,AND (2) (3) A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论