科技文献检索与利用.ppt_第1页
科技文献检索与利用.ppt_第2页
科技文献检索与利用.ppt_第3页
科技文献检索与利用.ppt_第4页
科技文献检索与利用.ppt_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科技文献检索与利用 北京工业大学图书馆信息咨询部刘彩娥E mail liucaie wenxian Tel 6739218567396505 2007 11 课程内容 基础知识数据库检索特种文献的检索网络资源及资源利用原文获取与围绕自己的课题查找文献 基础知识 一信息素养二文献三文献检索 一信息素养的含义与标准信息素养 Informationliteracy简称IL 一词最早来源于美国 简单地讲信息素养即通过教育所培养的在信息社会中对信息资源的获取 加工 处理以及信息工具的掌握和使用等的能力 2000年1月 美国大学与研究图书馆 ACRL 公布了 高等教育信息素养能力标准 认为信息素养包括五项能力标准 1 能够确定所需信息的性质和范围2 能够有效地检索所需信息 3 能够正确鉴别信息及其来源并且把所选择的信息融入自身的知识基础和评价系统之中 4 作为个人或群体的一员能够有效地利用信息来完成一个具体的任务 5 了解同信息利用相关的经济 法律和社会经济问题 并合理 合法地检索和利用信息 我国颁布的 中华人民共和国国家标准 文献著录总则 GB T3792 1 1983 中文献的定义为 记录有知识的一切载体 注 可参考国家标准 文献类型与文献载体代码 GB T3469 1983 二 文献 literature document 文献由三个要素构成 知识 载体 记录方式三位一体不可分割 内容 形态 构成文献的手段 信息知识文献情报 加工 记录 传递应用 信息 知识 文献 情报间的关系 文献的类型根据不同的划分标准 文献可以分成多种类型一 按载体形式划分 1 印刷型文献 2 缩微型 现在很少使用 3 声像型文献 4 电子型文献 二 按加工层次分 或功能与形成 一次文献 PrimaryDocument 通常是指原始制作 即作者以本人的研究成果为基本素材而创作 或撰写 的文献 如期刊论文 专著 会议论文 专利说明书 科技报告二次文献 SecondaryDocument 是指文献情报工作者对一次文献进行加工整理后所得到的产物 也是为了便于管理和利用一次文献 由文献情报工作人员编辑 出版和积累起来的工具性的文献 二次文献的重要性在于可以帮助人们查找一次文献 如目录 题录 文摘 索引 各种书目数据库大量的印刷版 网络版检索工具都是二次文献 网络版的检索工具的优势在于可以有全文连接 这样 查找一次文献一步到位 三次文献 TertiaryDocument 是指利用二次文献 选用一次文献内容 经综合 分析和评述后形成的指南性文献 如综述 述评 词典 百科全书 年鉴 指南数据库 书目之书目零次文献 也叫灰色文献 比如作者的手稿 谈话记录等 三 按内容与出版形式划分图书期刊报纸科技报告会议文献专利文献标准文献学位论文政府出版物产品资料科技档案 十大科技情报源 指以上不包括报纸在内的十种文献形式 图书 BOOK 由正规出版社正式出版的出版物 对已有的研究成果或经验作概括论述 特点 成熟 全面 可靠 但时效性差阅读型 教科书 Textbook 专著 Monograph 文集 Anthology 等工具型 词典 Dictionary 百科全书 Encyclopedia 手册 Handbook 年鉴 Yearbook 等 国际标准书号 ISBN InternationalStandardBookNumber 国际标准书号一共有10位 依次分为4个区 第一区是语言区 表明这本书是哪个国家出版的 以下为常见的国家代码 0或1表示英语国家 2表示法语国家 3表示德语国家 4表示日本 5表示俄语国家 6表示伊朗 7表示中国大陆 89表示韩国 957和986表示台湾 962和988表示香港 第二区是出版商代码 用于识别出版社 由各国出版主管机构分配 第三区是出版物序号 由各个出版商分配 第四区是一个个位数的校验码 用来核对前9位数字 它的计算方法是 用1 9这9个数依次乘以前面的9位数 然后求它们的和除以11的余数 如 科技信息检索 孙平 任其荣编著 清华大学出版社1997年 ISBN号为 7 302 02372 7 7 表示中国大陆 302 表示清华大学出版社 其书号为02372 7 为该书的校验码 从ISBN的构成规则 大家可以看出 它的有效数字最多只有9位 也就是说最多只能容纳10亿种书 这显然是不够的 于是 国际标准化组织规定 从2007年1月1日起 国际标准书号升级为13位 现有的出版机构在其出版物前加上一个三位数字的前缀 978 新成立的出版机构则加上前缀 979 期刊 Journal 期刊俗称杂志 是周期性出版的连续出版物 特点 内容新颖 信息量大 出版周期短 传递信息快 传播面广 时效性强用途 获取最新研究成果和动态 据统计 科研人员从期刊中得到的信息约占65 以上 是十分重要的情报源 核心期刊 某学科 或某领域 的核心期刊 是指那些发表该学科 或该领域 论文较多 使用率 含被引率 摘转率和流通率 较高 学术影响较大的期刊 中文核心期刊目前 判断中文期刊是否核心刊有以下几种标准1北京大学图书馆主编的 中文核心期刊要目总缆 2中信所的 中文科技期刊引证报告 3南京大学的 中文社会科学期刊引证报告 4 中国人文社会科学核心期刊要览 它是由中国社会科学院文献信息中心和社科文献计量评价中心共同建立的核心期刊库 同行评审期刊 控制文章的质量预印本 或在编文献 开放存取 OpenAccess 期刊 如 DirectoryofOpenAccessJournals DOAJ http www doaj org 期刊的其他方面 期刊影响因子 ImpactFactor 影响因子 该刊前两年发表论文在统计当年被引用的总次数 该刊前两年发表论文总数 比如 Science 杂志1996年的影响因子计算方法 1995年共出版文献1037篇 1994年共发表文章1054篇 1995年的文章在1996年被引用24189次 1996年的文章在1996年被引用25170次 1996年的影响因子 25170 24189 1037 1054 23 605 中文科技期刊引证报告 中文社会科学期刊引证报告 可以查中文刊物的影响因子 被SCI收录的刊物影响因子可以检索JCR JournalCitationReport 评价期刊的其他指标 立即指数 ImmediacyIndex 用某一年中发表文章的被引用次数除以发表文章的总数得到的 立即指数可衡量期刊中 平均论文 被引用的迅速程度 它能告诉你文章发表当年被引用的频率 被引半衰期 CitedHalf Life 指期刊达到50 被引用率所需的时间 有助于您评估该期刊中文献被引用的时间跨度施引半衰期 CitingHalf Life 指引文数达到当前期刊发表的论文中的参考文献数的50 所需要的年数 识别期刊的主要依据有 期刊名称 期刊出版的年 卷 期 国际标准刊号 ISSN 等 正式出版的期刊有ISSN InternationalStandardSerialNumber 代码 ISSN由8位数字组成 分为两段 最后一位是计算机校验号 如 ISSN1001 8867为 中国图书馆学报 的国际标准编号 我国正式出版的期刊都有国内统一刊号 CN 它由地区号 报刊登记号和 中图法 分类号组成 如CN11 2257 G3 地区号依 中华人民共和国行政区划编码表GB2260 82 取前两位 如北京为11 天津12 上海31 辽宁21 吉林22等 报纸 newspaper 报纸是指以新闻为主要内容的连续出版物 就其内容说 报纸大体可分为政治时事性和专业性两种类型 其特点是 出版快 传递及时 阅读面广 是人们工作和生活不可缺少的组成部分 许多情报和情报线索是首先出现于报纸的 因此 报纸也是一种情报源 CNKI中 中国重要报纸全文数据库 可以检索2000年至今的中文报纸信息 NewsBank世界各国报纸全文库 可以检索世界上著名报纸信息网络上有许多知名报纸的网络版 如 人民日报 中国日报 等 科技报告 Sci TechReport 也称技术报告 研究报告 它是科学研究工作和开发调查工作成果的记录或正式报告特点 内容新颖 详细 专业性强 出版及时 传递信息快 发行范围控制严格 不易获取原文识别科技报告的主要依据有 报告名称 报告号 研究机构 完成时间 美国政府四大报告 一 PB报告 是美国国家技术信息处 NTIS 出版的报告 报道美国政府资助的科研项目成果 内容涉及广泛 几乎包含自然科学与工程技术领域所有学科领域 主要侧重民用工程 如 土木工程 城市规划 环境保护 生物医学等方面 二 AD报告 是美国国防技术信息中心 DTIC 出版的报告 主要报道美国国防部所属的军事机构与合同单位所完成的科研项目 内容涉及与国防有关的各个领域 如 空间技术 海洋技术 核技术等38类 三 NASA报告 美国国家航空宇航局出版的报告 内容侧重于航空和空间科学技术领域 广泛涉及空气动力学 飞行器 生物技术 化工 冶金 气象 天体物理 通信技术 激光 材料等 四 DOE报告 美国能源部出版的报告 报道能源部所属的研究中心 实验室以及合同用户的研究成果 内容包括能源保护 矿物燃料 化学化工 风能 核能 太阳能与低热 环境与安全与地球科学等 会议文献 conferencepaper 是指在各种学术会议上交流的学术论文 特点 内容新颖 专业性和针对性强 传递信息迅速 能及时反映科学技术中的新发现 新成果 新成就以及学科发展趋向 识别会议文献的主要依据有 会议名称 会址 会期 主办单位 会议录的出版单位等会前文献 会议论文预印本 会议论文摘要会后文献 是会后经整理出版的文献 如会议录 Proceedings 会议论文集 Symposium 会议论文汇编 Transactions 会议丛刊 丛书万方数据库可以检索国内会议论文ISTP是专门检索国际会议的数据库 专利文献 PatentLiterature 是实行专利制度的国家 在接受申请和审批发明过程中形成的有关出版物的总称 包括专利说明书 专利公报 专利分类表 专利检索工具以及与相关的法律性文件 其特点 1 内容新颖 出版迅速 2 涉及技术领域广泛 实用性强 3 具有法律效力 4 重复量大中文专利文献检索可以检索 国家知识产权局 标准文献 StandardLiterature 是经过公认的权威机构批准的以特定的文件形式出现的标准化工作成果 特点 是对标准化对象描述详细 完整 内容可靠 实用 有法律约束力 适用范围明确 是从事生产 设计 管理 产品检验 商品流通 科学研究的共同依据 也是执行技术政策所必需的工具 基础标准产品标准方法标准安全卫生标准 法定标准推荐标准试行标准 国际标准ISO3297 1986区域标准国家标准GB18187 2000行业标准企业标准 识别标准文献的主要依据有 标准级别 标准名称 标准号 审批机构 颁布时间 实施时间万方数据库可以检索并下载国内标准的全文 学位论文 Thesis Dissertation 是指高等学校或研究机构的学生为取得某种学位 在导师的指导下撰写并提交的学术论文 识别学位论文的主要依据有 学位名称 导师姓名 学位授予机构收集与利用不如其它类型的文献方便 中国科技信息研究所是国家法定的学位论文收藏单位 UniversityMicrofilmsInternational UMI 负责收藏和报道全美的博士 硕士论文 并收集报道其他国家的学位论文 中国期刊网和万方数据库都收录国内学位论文 研究生毕业都要向图书馆或档案馆提交其学位论文 政府出版物 GovernmentPublication 是指各国政府部门及其所属机构出版的文献 又称官方出版物 行政性文献 包括立法 司法文献 主要有政府法令 方针政策 规章制度 决议 指示 统计资料等 主要涉及政治 法律 经济等方面 科技文献主要是政府部门的研究报告 标准 专利文献 科技政策文件 公开后的科技档案等 特点 内容范围广泛 具有权威性 一些非正式出版的文献不易收集用途 对了解各国的方针政策 经济状况及科技水平 有较高的参考价值 产品资料 ProductLiterature 是厂商为推销产品而印发的介绍产品情况的文献 包括产品样本 产品说明书 产品目录 厂商介绍等 特点 反映的技术比较成熟 数据也较为可靠 内容具体 通俗易懂 常附较多的外观照片和结构简图 形象 直观 但产品样本的时间性强 使用寿命较短 且多不提供详细数据和理论依据 用途 1 作为技术人员设计 制造新产品的一种有价值的参考资料 2 了解各厂商出厂产品现状 掌握产品市场情况及发展动向 科技档案 TechnicalRecords 是指在自然科学研究 生产技术等活动中所形成的应当归档保存的科技文件 如课题任务书 计划 大纲 合同 试验记录 研究总结 工艺规程 工程设计图纸 施工记录 交接验收文件等 特点 内容真实 详尽 具体 准确可靠 保密性强 保存期长久 是科研和生产建设工作的重要依据 具有很大参考价值 用途 了解生产领域和科学实践中的经验和技术窍门通常保存在各类档案部门 文献类型识别 文献类型的识别是获取原始文献的重要依据 请看以下文后参考文献 Aoki J Hatanaka Y ApplPhysLett 2000 76 22 3257 3258 Mixed typeopticalfibercurrentsensor ProceedingsofSPIE V 1572 p497 507 1991WeinsteinL DigitalFiltersandTheirApplications London England AcademicPress 1978 p472 481 图书 文献标识 M 著录格式 主要责任者 书名 版本 M 出版地 出版社 出版年 页码如 刘少奇 论共产党员的修养 修订2版 M 北京 人民出版社 1962 76页 WeinsteinL DigitalFiltersandTheirApplications M London England AcademicPress 1978 p472 481 没有文献标识代码的看出版社和出版地 期刊 文献标识码 J 主要著录格式 作者 文章题名 J 刊名 年 卷 期 页码如 邹振扬 郑绎根 纳米TiO2的光化学特性及其在环境科学中的应用 J 工学材料导报 2000 14 6 35 39TeraokaK NonamiT YokogawaY TaodaHandKameyamaT PreparationofTi02 coatedhydroxyapatitesinglecrystals J JournalofMaterialResearch 2000 15 6 1243 1244 Aoki Hatanaka Y ApplPhysLett J 2000 76 22 3257 3258 没有文献标识代码的看刊名信息和卷期信息 会议文献 文献标识码 C 著录格式 作者 论文题目 C 会议名称 卷 页码 年 如 MeowD Mixed typeopticalfibercurrentsensor C ProceedingsofSPIE V 1572 p497 507 1991SPIE InternationalSocietyforOpticalEngineering 国际光学工程师学会 没有文献标识代码的看会议名称 专利文献 文献标识码 P 著录格式 专利权人 专利名称 专利号 如 刘加林 多功能一次性压舌板 中国 92214985 2 P 1993 04 14 没有文献标识代码的看专利号 学位论文 文献标识码 D 主要特征 1 学位和学位论文名称如PhD Dissertation MasterThesis2 授予学位的大学名称 地点及授予年份等 如 高连生 公路联网收费关键性技术的研究 D 北京工业大学 北京 2002CALMSRB Infraredspectroscopicstudiesonsolidoxygen D Berkeley Univ ofCalifor nia 1965 没有文献标识代码的看学位授予单位 常用文献类型代码表 国家标准GB T7714 2005文后参考文献著录规则 对中文文章文后的参考文献的著录格式要求作了严格规范的规定 国际上不同的刊物文后参考文献不同的刊物有不同的要求 三文献检索检索原理检索手段检索工具检索途径计算机检索检索步骤原文获取 主题概念 文献标识 主题概念 检索表达式 文献 主题分析 检索工具 系统 用检索语言对文献进行描述 检索需求 主题分析 用检索语言对文献进行描述 是否匹配 否 输出结果为零 得到检索结果 是 检索原理图 情报工作人员 检索者 提问标识 文献存储过程 检索过程 检索手段 手工检索与计算机检索 各自的适用范围 检索工具的职能1存贮职能 管理文献 使大量毫无规律 分散的一次文献成为有序的集合体 文献库 即把所有有关文献的外部特征记录下来 并按规定的格式把这些特征组成一条条文献线索 然后选择某一特征项 例如著者 分类号 主题词等 等作为标识 将这些线索有系统地排列起来 形成一个有机的整体 2检索职能 即利用检索工具检索文献 3报道和浏览职能 检索工具以简洁的文字报道大量的文献 并能揭示文献的外表特征和内容特征 使人们花费较少的时间和精力就能了解到某一时间 某一专业学科发展的水平 成就 从而分析该学科或研究领域的发展趋势 检索工具 检索工具的类型一 手工检索工具计算机检索工具二 只能查找出版物的检索工具 OPAC 联合目录等 可查找文章的检索工具 题录与文摘数据库 目录 题录 文摘 索引三 只可以检索文章线索的数据库可以直接下载全文的数据库 一 目录型检索工具目录是图书 期刊等出版物外表特征的揭示和报道 它以完整的出版物 如一本书 一种期刊 作为著录的基本单位 所以也可以说它是按某种顺序编排的文献清单 是指导阅读和科学管理文献的重要手段 目录的著录对象一般是整本书或整种刊物 全国总书目 揭示每年国内图书出版情况每个图书馆的OPAC 在线公共目录 揭示该馆的管藏联合目录揭示许多家图书馆出版物收藏情况 二 题录型检索工具题录的含义题录是描述文献外部特征的文献条目 文献的外部特征包括题名 著者 出处 卷期 页码 时间 文献类型 语种等著录项目 题录的著录对象一般是单篇文献 三文摘型检索工具文摘的定义我国国家标准GB3468 1983 检索期刊编辑总则 说明定义 除题录部分外还对文献内容作实质性描述的文献条目称之为文摘 文摘是文献原文浓缩后的产物 是忠实于原文内容的简要记录单元 揭示文献的内容特征 在文摘的编写中不能加入编写人员的主观见解和任何解释性说明 也不能对原文作任何修改 文摘型检索工具的特点与作用 对文摘的阅读 在一定程度上起到代替原文作用 科技人员阅谈了著录较为详细的文摘之后 大体上就掌握了原文内容要点 不必再阅读原文了 这一点 对于那些难索取到原文的 难得文献 尤为重要 也大大节省了科技人员查找和阅读文献的时间 确定相关性 即帮助读者判断所检索到的文献是否合乎需要 从而决定原始文献的取舍 帮助读者克服语言上的障碍 因为在一种检索工具中 无论原始文献是什么语种 其文摘都被译为统一的一种语言 一般为英语 四索引型检索工具索引是将图书 期刊等文献中的一些重要的 有检索价值的知识单元根据需要一一分析摘录出来 并注明它们所在文献的页码和文献号 再按一定的顺序编排组织起来 构成检索的种种途径 这种检索工具称之为索引 索引的作用 为查找特定的文献或事实提供多种检索途径 揭示事物之间的联系 揭示出容易被人们忽略的内容 为读者了解某一学科或领域的全面文献信息提供了捷径 手工检索工具索引 将文献中具有检索意义的事项 可以是人名 地名 词语 概念 或其他事项 按照一定方式有序编排起来 以供检索的检索工具 相对于目录 题录 文摘等类型的检索工具 索引深入到文献的细节 涉及到具体的知识点 常用的印刷版的工具书都有索引 以便检索 其他类型的手工检索工具 工具书年鉴 查找事实或统计数据百科全书 查找不熟悉的知识手册 成熟稳定的知识 查找参数 公式等辞书 词典或辞典 查找科技词汇的解释 或汉外对照辞典 缩略语辞典 还有大量的专门性辞典 年表 查找一些历史大事记录 检索途经 文献分类法与文献主题法 标引文献与揭示文献内容的两种基本方法 分类法 按照文献资料的学科属性 分类法最有利于查全 分类法的特征在于知识的系统性 不仅揭示图书的学科知识内容 而且把有关同一学科内容的文献资料集中在一起 使学科临近的文献排在相近的位置 根据各类图书之间的亲疏关系将藏书组织成一个系统 主题法 按照所论述的事物将文献所论述的事物按照规范化的语言 主题词 的字顺进行排检 从本质上讲 是用词语来揭示文献所阐释或研究的对象 事物和问题 与分类法相比 从不同角度来揭示文献 其他途经 如作者 号码等 分类法组织与检索知识的优点 1 分类法具有较强的系统性 分类法采用划分范畴的树状结构按事物或学科分类组织网上信息资源 具有层次清晰 体系稳定 2 分类法便于浏览检索 分类法的等级结构便于用户在查找时进行浏览 当用户的检索目的不明确或检索词不确定时 分类浏览方式更有效率 它引导着用户按照初始的目标一步一步接近需求的信息 能保障查全率 3 分类法提供对非文本信息的组织 当前 网络信息资源中非文本信息占的比重越来越大 如 图形 图像 声音 动画等 分类法独有的聚类功能和代码标识在组织和揭示多媒体信息中占有极大的优势 4 检索语言的通用性 分类法以知识分类为基础 以符号为标识 具备成为不同语言转换中介的条件 分类法 世界上有代表性的分类法 1 杜威十进制分类法 DeweyDecimalClassificationandRelativeIndex简称DDC 2 国际十进制法 UniversalDecimalClassification 简称UDC 被广泛应用于科学论文的分类 3 美国国会图书馆图书分类法 LibraryofCongressClassification 简称 国会法 或LC 目前广泛应用于北美大中型图书馆 特别是大学等学术性图书馆 4 中国图书馆分类法 中图法 介绍 中图法 中国图书馆分类法 以学科来组织知识 将全部知识领域划分为5个基本部类 22大类 五大部类分别为 马列主义 毛泽东思想 哲学 社会科学 自然科学 综合性图书 22大类分别为 马列主义 列宁主义 毛泽东思想 邓小平理论 哲学 宗教 社会科学总论D政治 法律 军事 经济 文化 科学 体育 教育 语言 文字 文学 艺术 历史 地理N自然科学总论 数理科学和化学P天文学 地球科学 生物科学 医药 卫生 农业科学 工业技术 交通运输 航空 航天 环境科学 安全科学 综合性图书 T类又可分为以下几类TB一般工业技术TD矿业技术TE石油 天然气工业TF冶金工业TG金属学 金属工艺TH机械 仪表工艺TJ武器工业TK动力工程TL原子能技术TM电工技术TN无线电电子学 电信技术TP自动化技术 计算机技术TQ化学工业TS轻工业 手工业TU建筑科学TV水利工程 中图法 从大类到小类 层层展开 不断细分 形成完整的知识体系 例如 关于红楼梦研究资料的分类为I207 411I文学I2中国文学I207文学评论和研究I207 4小说研究I207 41古代小说研究I207 411 红楼梦 研究与评论 有关互联网的知识分类为TP393 4T工业技术TP自动化技术计算机技术TP3计算机技术TP39计算机的应用TP393计算机网络TP393 4国际互联网 主题法自然语言 非规范语言 信息检索系统中使用的标引词直接来自文献和用户提问而不加控制的一类检索语言 主要有关键词语言 自然语言的应用以计算机为前提 否则 自然语言检索将难以实现受控语言 规范语言或人工语言 标引词来自文献或者用户 并受到信息检索系统的控制的一类检索语言的总称 又叫规范化语言 受控语言包括分类语言和主题语言 受控词在检索实践中具体体现为词表 词表在网络检索工具中的应用主要体现在辅助选词以及检索式的扩展 汉语主题词表 汉语主题词表 是我国第一部大型综合性主题词表 1979年出版 自然科学部分 年修订 收录正式主题词91158条 非正式主题词17410条 全表共分3卷10分册 由主表 词族索引 范畴索引 英汉对照索引等组成 是我国应用最广的一部主题标引和检索的工具 其款目 条目 格式如下 下一页 主题词汉语拼音 Xianxiangguan主题词 显像管 E56 范畴号主题词英译名 kinescopePicturetubeY显像管D电视显像管监视管F彩色显像管固体显像管黑白显像管S电子束管Z电子管C显示管指示管 注释 Y用项符号 表示该主题是正式主题词D代项符号 表示该主题是非正式主题词F分项符号 表示该主题是 显像管 的分主题词 即下位词S属项符号 表示该主题是 显像管 的上位主题词Z族项符号 表示该主题是 显像管 的族首词 大主题词 C参项符号 表示该主题是 显像管 的相关主题词 用项Y正式主题词等同关系 代项D非正式主题词 分项F下位类主题词分属关系 属项S上位类主题词族项Z族首词相关关系 参项C相关词 其他词表中国期刊网 扩展 功能EI的序词表美国医学图书馆编篡的大型医学专业叙词表 医学主题词表 MeSH 其它途径 作者 外文检索注意作者姓名的拼写 作者单位 分清楚作者单位和地址的关系 号码 ISSNISBN专利号标准号等 计算机检索相关概念字段 field 如在数据库中题名 作者 作者单位 期刊名 摘要 全文等等均是字段 一条记录由多个字段值组成 对计算机检索来说字段相当于检索入口 记录 Record 由若干字段组成的文献单元 在全文数据库中 一条记录相当于一篇完整的文献 在数目数据库中 一条记录相当于一条文摘或题录 文档 File 由若干个逻辑记录构成的信息集合 是数据库的基本内容 分为顺排文档和倒排文档 顺排文挡是数据库的主体内容 倒排文档是将记录中的一切可检字段或属性值提取出来 按某种顺序重新加以组织所得到的文档 顺排文档 记录 倒排文档 索引 数据库 database 由计算机进行处理的一定数量同类信息的有序集合 是用来存储和查找文献信息的电子化检索工具 TI Newantibioticsmiyakamidesproducedbyafungus AU Shiomi K Hatae K Yamaguchi Y SO J Antibiot Tokyo 2002Nov 55 11 952 61ISSN 0021 8820PY 2002LA EnglishAB Newantibiotics PT Journal Article 字段举例 数据库的类型按照国际上通用的分类方法 参考数据库 referencedatabase 如书目数据库 文摘数据库 获得的数据为reference源数据库 sourcedatabase 如全文数据库 数值型数据库 可直接获得原如资料或数据混合数据库 mixeddatabase 兼有以上二者 计算机检索技术 布尔检索截词检索限制检索位置检索 布尔检索 布尔运算符 逻辑 与 AND 表示为AandB或A B逻辑 或 OR 表示为AorB或A B逻辑 非 NOT 表示为AnotB或A B布尔逻辑算符检索优先级为not and or注 英文数据库通常用字母 中文数据库要用符号 逻辑 与 AND 表示检出的记录必须同时包含所有的检索词 可以缩小检索范围 减少命中文献量 提高查准率 A B 图中阴影部分表示 概念Aand概念B 的命中结果 逻辑 或 OR 表示检出的记录中至少含有多个检索词中的任何一个 可以扩大检索范围 增加命中文献量 防止漏检 常用于连接同义词 相关词等 A B 上图阴影部分表示 概念Aor概念B 的命中结果 逻辑 非 NOT 表示检索结果中排除含有某些词的记录 可以缩小检索范围 减少文献输出量 但并不一定能提高查准率 A B 图中阴影部分表示 概念Anot概念B 的命中结果 截词符 通配符 提高查全率 防止漏检的有力手段 也可以简化输入 包括有限截词和无限截词 常用的截词符有 有限截词 放在词中间或末尾 一个符号表示一个字母如 SDOS wom n可检索出 woman women 中间截断 chip 可检索出 chips 右截断 无限截词 放在词的末尾 一个符号表示任意多个字母如 SDOS comput 可检出 compute Computer computers computing Computerize 等 注 不同的数据库所用的截词符不一样 使用应先查一下各数据库的帮助加以确认 限制检索泛指检索系统中提供的缩小或约束检索结果的检索方法 主要有以下方式 字段检索 利用字段进行限制 如题名 摘要 全文等通常的字段限制范围的大小顺序是 题名 关键词 摘要 全文二次检索 在前一次检索的结果中进行另一概念的检索 位置检索 邻接检索 常用的位置算符有 W nW N nN 等 W W的含义为with 表示其两侧的检索词必须紧密相连 除空格和标点之外 不得插入其他词或字母 两词的词序不可颠倒 如输入communication W satellite时 系统只检出含有communicationsatellite的记录 nW 这里W的意思是word 允许两个检索词之间插入最多n个词 词序不变 如输communication 2W satellite系统将会检出communicationsatellite communicationthoughsatellite communicationonthesatellite N N的含义为Near 表示两个检索词必须紧密相连 空格标点除外 词序可以颠倒 nN 两个检索词之间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论