文献信息检索与科技论文写作_第1页
文献信息检索与科技论文写作_第2页
文献信息检索与科技论文写作_第3页
文献信息检索与科技论文写作_第4页
文献信息检索与科技论文写作_第5页
已阅读5页,还剩386页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/17,1,文献信息检索与科技论文写作,2020/7/17,2,2 科技论文的基本内容,2.1 标题及层次标题 2.2 署名及作者单位 2.3 摘要 2.4 关键词 2.5 中图分类号 2.6 前(引)言(概述) 2.7 正文 2.8 结论和建议 2.9 致谢 2.10 参考文献 2.11 附录、注释,2020/7/17,3,2.1 标题及层次标题,标题,又称文题、题目、总标题(以区别层次标题),是论文的总纲,是能反映论文最重要的特定内容的最恰当、最简明的词语的逻辑组合。,2020/7/17,4,2.1.1 标题的一般要求,准确得体 标题应准确表达论文的中心内容,恰如其分地反映论文

2、涉及的范围和深度,不应使用笼统、泛指性很强的词语和华而不实的辞藻。 常见的问题: 题目过大 过于一般化,不能充分反映论文内容的特点 (题目过大必然一般化。应尽量反映论文的特点,如新理论、新方(算)法、新设备、新工艺等。 人为拔高:慎用“机理、规律”等。,2020/7/17,5,1)题目过大 * 计算机应用 * 计算机在工程中的应用 * 计算机在桥梁工程中的应用 * 计算机在桥梁设计中的应用 * 计算机在铁路桥梁设计中的应用 * autocad在铁路桥梁设计中的应用 * autocad在铁路桥梁设计中的应用,2020/7/17,6,2)简短精练 gb771387规定,题名“一般不超过20字”。一

3、般情况下,这是上限,在准确反映“最主要的特定内容”的前提下,字数越少越好。 的研究“的研究”可删除 分析研究“分析”与“研究”重复 删除不必要的“的” 必要时可加副标题(英文论文和社科类论文较常见),但应避免滥用。 例:(i)理论分析 (ii)试验研究 (iii)应用实例,2020/7/17,7,3)便于检索 题名中应有尽量多的关键词。这与题名应避免笼统和空泛是相辅相成的。 4)容易认读 避免使用非公知公用的略缩语、缩写、符号、代号等。,2020/7/17,8,2.1.2 标题的文字要求,在文字表达上,题目比正文的要求更高,需更加仔细推敲,使其符合现代汉语的语法、修辞和逻辑规则,避免语病和歧义

4、。 研究新方法 新方法研究 (用偏正结构,不用动宾结构。但中心动词有状语时可用动宾结构,如:用研究 ) 拱坝的应力特点和分布规律 拱坝应力的特点和分布规律 例,2020/7/17,9,2.1.3 层次标题,格式: 用阿拉伯数字连续编码,不同层次的2个数字之间用下圆点隔开,末位数字后不加任何符号。 0 前(引)言(“0” 和“前言”等往往不写出) 1 1.1 1.2 1.2.1 1.2.2 1.3 2 3 ,2020/7/17,10,不同层次的问题不能用相同层次标题,同一层次的问题应用相同层次的标题。 (此类问题较常见) 例:的研制 概述 1 理论分析 2 的研制 (一级标题与总标题重复) 3

5、结论 也有层次标题之间互相混淆的情况,2020/7/17,11,避免将层次标题与要点混淆(一般用带括号的编号或字母等表示要点)。 层次标题必须按要求格式编写。要点可单独占行,也可与下文接排。 层次标题不应过细。很多情况下可去掉,或改成要点。 同一级层次标题尽量采用排比。一级标题难以做到,二级及以下级别标题应尽量做到。 结构相同或相似 意义相关 语气一致,2020/7/17,12,3 署名及作者单位,论文署名只限于直接参与课题研究、论文撰写,能对内容负责,并对论文具有答辩能力的人员。 作者单位需尽量详细(不能用简称、缩写等),大学应写出院(系、所),英文翻译应准确、统一。 各单位应重视本单位名称

6、的统一英(外)文译名。 (southwest jiaotong university swjtu) 有的期刊要求提供作者简介、照片。,2020/7/17,13,摘要是对论文内容不加注释和评论的简要陈述。 作用: 使读者尽快了解论文的主要内容,补充题目的不足。 为科技信息检索机构提供方便。,4 摘要,2020/7/17,14,分类 报道性摘要:提供论文中全部创新内容和尽可能多的定量或定性的信息。学术性期刊一般采用此类摘要。 一般200300字。英文摘要可适当详细一些。 一般包括研究工作的 “目的、方法、结果和结论。” 指示性摘要:简要介绍研究的目的和方法等。50100字。 报道-指示性摘要:介于

7、上述2者之间。重要的部分按报道性摘要写,其它部分按指示性摘要写。100200字。,2020/7/17,15,摘要的写作要求 用第三人称:不用我(们)、笔者等作主语。一般也不用“作者”。 一般不用“本文”:“本文研究(对进行了试验,认为,提出)了”逻辑上不通。“本文介绍(报道)”,逻辑上没问题,但不必要。 简短精练,明确具体,准确反映论文主要内容(重要内容不漏掉,也不超出论文内容)。 不应出现类似课题鉴定的自我评价,如“具有意义”、“填补了空白”,等。 采用规范术语,一般不用数学公式和化学结构式。除非要反驳某篇论文(观点),一般不出现参考文献。不应简单重复标题内容,也不应罗列层次标题。,2020

8、/7/17,16,5 关键词,为满足文献标引或检索的需要从论文中选出的词或词组。 尽量选用主题词,也可用自由词。主题词是经过规范化的词,如汉语主题词表中收录的词,国内期刊以此为主。自由词则是还未规范化的词(未收入主题词表)。 数量为38个。 *由于主题词的选取比较复杂,一般编辑需根据作者提供的关键词进行加工。因此作者最好能根据汉语主题词表查出主题词,必要时可稍多,供编辑参考。,2020/7/17,17,6 中图分类号,根据中国图书资料分类法(图书馆、各院系资料室和学报编辑部有)。 由于涉及的学科比较复杂,作者最好能提供准确定分类号。,2020/7/17,18,7 前(引)言(概论、概述),一般

9、可包括如下内容: 研究或论文写作的目的和背景。 理论依据、试验或研究方法。 预期的结果以及本研究成果的地位、作用和意义。 * 1)和2)两点类似于“综述”,应对相关的研究前沿进行评述,以说明作者开展的研究的必要性。,2020/7/17,19,前言的写作要求: 言简意赅,突出重点。 开门见山,不饶圈子。 尊重科学,不落俗套。 “限于时间和水平”、“不足之处在所难免”,等都是不负责任的说法,而不是客套。 如实评述,避免吹嘘自己的或贬低别人的成果。 *前言虽然不是最重要的部分,但一定要特别重视。,2020/7/17,20,7 正文,提出论点,通过论据(事实或数据、已有的理论等)对论点加以论证。 常见

10、的论证方法: 举例 用具体事实(包括数据)证明论点。属归纳推理。 事理引伸 用已知的道理为论据证明论点。属演绎推理。 类比 将a事物与b事物对比,以b事物的正确与否证明a事物的正确与否。属类比推理。,2020/7/17,21,反证 如数学上的反证法。属演绎推理。 对比 将截然相反的情况作对比,形成鲜明的对照,从而证实(明)一种事物的存在或正确。属类比推理。 因果互证 通过事理分析,揭示论点与论据之间的因果关系,以证明论点的正确性。属归纳推理。 归谬法 先假定某论点正确,然后以此为前提,导出一个显然荒谬的结论,从而证明假定的论点是错的。此方法只适用于驳论。属演绎反驳推理。,2020/7/17,2

11、2,常见的问题: 主题不明确。 加入无关的内容。 * 学位论文要能反映作者的工作,但在期刊上发表的论文则不能这样写。 过多引用、重复已有的成果,冲淡了作者本人的工作。 * 在研究生的论文中较多,往往由于作者缺乏自信,或研究工作还没有实质性的成果。 过多采用承上启下的句子。一般来讲,此类句子是没有必要的。 “下面讨论” 没有按规范标注参考文献,使读者难以分清哪些是作者的工作,哪些是引用的成果。,2020/7/17,23,8 结论(和建议)(结束语),一般可包括如下内容: 本研究成果得出了什么规律性的东西,解决了什么问题,提出了什么理论。 对前人的有关本问题的看法作了哪些检验,哪些与本研究结果一致

12、,哪些不一致,作者作了哪些修正、补充、发展或否定。 本文所报道的研究的不足之处或遗留问题。 * 1)是必需的,2)和3)视论文具体内容可有可无;有的论文不能得出明确结论,也可没有结论而只进行讨论。,2020/7/17,24,结论的写作要求 概括准确,措词严谨。避免使用“可能”、“大概”等模能两可的词。 明确具体,简短精练。结论有相对独立性,专业读者和情报人员可只看摘要和(或)结论就能对论文有大致的了解。结论中不再作讨论。“通过,得出如下结论”及类似的行文都应删除。 不作自我评价。但对研究成果应用的范围可给出说明(但必须是经过论证的)。,2020/7/17,25,9 致谢,对研究工作和论文写作给

13、予指导、帮助,或提出过建议等的相关的人或机构表示谢意。 不是必须的项目,2020/7/17,26,10 参考文献,参考文献著录的目的和作用 反映作者的科学态度和论文具有广泛的科学依据,也反映出论文的起点和深度。 区别作者本人的成果和已有的成果。尊重他人成果,免除抄袭、剽窃嫌疑。 索引作用。便于读者对有关问题有更深入的了解。 节省论文篇幅。 科技情报人员进行研究和文献计量学研究。,2020/7/17,27,参考文献著录的原则 只著录最必要、最新的文献。 只著录公开发表的文献。 必须按有关标准,采用规范的著录格式。 * 作者应保证著录项目齐全(格式可由编辑统一处理)。 * 我国科技期刊采用“顺序编

14、码制”。国外有的期刊采用“著者-出版年”制。 * 按文献在正文(含前言)中出现的顺序编码,编码的数字置于方括号内。需读出的编码按正常行文编排,不读出的编码用上标。,2020/7/17,28,11 附录和注释,一般有关的注释、说明都在正文中解决了,因此没有此2项。如认为必须采用,最好与编辑部协商。,2020/7/17,29,教学目的,文献检索课程是培养学生的情报意识,掌握用手工方式和计算机方式从文献中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。,2020/7/17,30,教学要求,本课程的任务是使学生了解本专业及相关专业文献的基本知识,学会常用手工检索工具、计算

15、机检索工具的使用方法,懂得如何获得与利用文献情报,增强自学能力和研究能力。初步掌握科技论文的写作。,2020/7/17,31,教学参考资料,1 陈雅芝等编著,信息检索,清华大学出版社,2006年1月 2 王细荣,韩玲,张勤编著,文献信息检索与论文写作,上海交通大学出版社,2006年8月 3 章云兰,万跃华,舒炎祥编著,数字资源检索教程,科学出版社,2006年7月 4 张海涛等编著,信息检索,机械工业出版社,2006年8月 5internet,2020/7/17,32,学科领域,信息检索同时被情报科学领域和计算机科学领域所使用。,信息检索,2020/7/17,33,内 容 提 要 原理篇,第一讲

16、 信息检索概述 第二讲 信息检索模型 第三讲 信息检索系统的结构与评价 第四讲 文本操作技术 第五讲 搜索引擎 第六讲 web检索技术,2020/7/17,34,内 容 提 要 应用篇,第七讲 图书及其检索 第八讲 学术、学位论文及其检索 第九讲 会议文献、科技报告及其检索 第十讲 专利及其检索 第十一讲 三大检索刊物及其检索 第十二讲 中国综合数据库及其检索 第十三讲 网络信息及其检索 第十四、十五讲 信息检索实训 第十六讲 信息检索的现状与未来,2020/7/17,35,内 容 提 要 原理篇,第一讲 信息检索概述 学科领域 信息检索的概念 信息检索的意义 信息检索的基本流程 信息检索的基

17、本方法 信息检索的关键技术 信息检索的应用领域,2020/7/17,36,与信息检索相关的学科(1/3),信息检索是一门多学科交叉的应用技术学科。,自然语言处理:自然语言处理是利用计算机技术处理语言信息的科学,其目标是让计算机能够“理解”人类的语言自然语言。对于信息检索来说,仅仅停留在处理表层文本信息是远远不够的,字符层面的匹配与相似度计算并不能帮助计算机理解待检索文本的“含义”,也不能深入理解用户的检索意图,检索出的结果非常有可能偏离用户的需求。要提高检索系统自身的智能化水平,以及检索系统人机交互界面的自然度,就需要不断地将自然语言处理结合到文本信息检索中来。,分布式计算:面对巨大的文本数据

18、、大量的检索请求和用户对于检索时间的苛刻要求,信息检索的效率成为一个亟待解决的问题,依靠单台计算机不可能完成这样的任务,必须依靠分布式信息检索技术才能解决。事实上,几乎所有实用的大型搜索系统都采用了分布式的体系结构来解决信息检索中的效率问题。,2020/7/17,37,与信息检索相关的学科(2/3),数据库:数据库和信息检索俨然一对姐妹。与信息检索不同,数据库的处理对象是结构化信息。数据库技术已经有比较完备的理论基础,而信息检索技术的经验性比较强,理论基础相对薄弱,需要进一步借鉴数据库中的一些成熟理论。信息检索中的信息抽取技术旨在把非结构化数据转化为结构化数据,以数据库形式存放,这样,一些信息

19、检索问题就可以转化为数据库查询问题了。,数据挖掘:数据挖掘一般是针对数据库进行的,借鉴到信息检索中就成为文本挖掘。面向非结构化数据的文本挖掘,将帮助用户对internet上庞杂的信息进行综合分析,找出这些信息背后所蕴含的规律和趋势,找出事情的本质,提升搜索技术的内涵。此外,对用户日志进行数据挖掘能够从总体上观察分析用户的行为,也能够针对每个个体用户的需求提供个性化服务。,2020/7/17,38,与信息检索相关的学科(3/3),情报学:情报学是研究情报的产生、传递、利用规律和用现代化信息技术与手段,使情报流通过程、情报系统保持最佳效能状态的一门科学。它帮助人们充分利用信息技术和手段,提高情报产

20、生、加工、存储、流通、利用的效率。信息检索和情报学有紧密的历史渊源,情报学的理论对信息检索系统的设计仍有指导意义。,社会学:社会学研究社会发展中的现象和规律。随着搜索引擎技术的使用越来越广泛,社会学家通过对众多用户使用搜索引擎的行为(比如浏览了哪些网页,输入了哪些查询词等)进行分析和统计来研究社会心理和行为的状态和趋势,比如时尚流行、语言变化、使用习惯等。,2020/7/17,39,39,内 容 提 要,第一讲 信息检索概述 学科领域 信息检索的概念 信息检索的意义 信息检索的基本流程 信息检索的基本方法 信息检索的关键技术 信息检索的应用领域,原理篇,2020/7/17,40,第一章 信息检

21、索原理,第一节 信息与信息源第二节 信息检索原理第三节 检索工具第四节 信息检索的方法与程序,2020/7/17,41,第一节 信息与信息源,一、信息概述,信息的含义 文献的定义:以各种技术手段,把一定的信息内容记录到一定的载体上形成的存储型传递媒介。“文献”一词出自于“论语。最初,“文”与“献”是两个词,“文”,指有关典章制度的文字资料;“献”,指多闻熟悉掌故的人。后来融合为一,泛指有史料价值的文章和图书。 信息的特征,二、信息源,信息的载体形式 信息的级别 信息级别示意图 信息的出版形式,return,2020/7/17,42,普遍认同的一个定义 信息普遍存在于自然界、人类社会和思维领域中

22、,它是客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。 信息的特性 可识别性。信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。 可存储性。信息是可以通过各种方法存储的。 可扩充性。信息随着时间的变化,将不断扩充。 可压缩性。人们对信息进行加工、整理、概括、归纳就可使之精练,从而浓缩。 可传递性。信息的可传递性是信息的本质特征。 可转换性。信息可以由一种形态转换成另一种形态。 特定范围有效性。信息在特定的范围内是有效的,否则是无效的。,什么是信

23、息,2020/7/17,43,2020/7/17,44,信息资源的类型(2/2),按信息内容的保密程度划分 有公开信息源、半公开信息源和非公开信息源。 按信息内容的应用范围划分 分为科技信息源、经济信息源、管理信息源及生活信息源。 按载体形式划分 印刷型(以纸张为介质, 以铅印、油印、胶印、复印等手段记录信息的载体)、缩微型(以感光材料为介质,以缩微照相为手段记录信息的载体)、机读型(以磁性材料为载体,通过编码和程序设计,由计算机输入和输出的信息)、声像型(以电磁材料为载体,借助特殊设备,直接将声音和图像等信息记录下来的一种动态信息),2020/7/17,45,信息资源的类型(2/2),按信息

24、传输形式划分 网络信息源(各种网络上的信息集合),非网络信息源(不用通信设施就能获得的信息集合),2020/7/17,46,一、信息检索的含义 二、信息检索原理 信息检索原理图 三、信息检索类型,以检索内容划分 以信息存储和检索的方式和技术划分,四、信息检索的意义,return,第二节 信息检索原理,2020/7/17,47,2020/7/17,48,信息检索的概念(1/6),信息检索(information retrieval, ir)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。 狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程

25、,也就是我们常说的信息查寻(information search 或information seek)。,2020/7/17,49,信息检索的概念(1/6),ir不仅仅是查询,ir系统也不仅仅是搜索引擎。 例1:返回与信息检索相关的网页搜索引擎(search engine, se) 例2:毛主席的生日是哪天? 问答系统(question answering, qa) 例3:返回联想pc的型号、配置、价格等信息信息抽取(information extraction, ie) 例4:订阅有关nba的新闻信息过滤(information filtering)、信息推荐(information rec

26、ommending),2020/7/17,50,信息检索的概念(2/6),也可以这样说,狭义的ir通常是指information search,而广义的ir包含非常多的内容(se, qa, ie, )。 用户需求(user need, un):用户需要获得的信息 严格地说,un只存在于用户的内心,但是通常用文本来描述,如查找与2010世界杯相关的新闻,有时也称为主题(topic) un提交给检索系统时,称为查询式(query)。 如2010 世界杯,对同一个un,不同人不同时候可以构造出不同的query 上述需求还可表示成2010 世界杯新闻 query在ir系统中往往还有内部表示,2020/

27、7/17,51,信息检索的概念(3/6),文档(document):检索的对象 可以是文本,也可以是图像、视频、语音等多媒体文档,text retrieval/image retrieval/video retrieval/speech retrieval/multimedia retrieval 可以是无格式、半格式、有格式的 文档集合(collection):所有待检索的文档构成的集合 也称为repository,corpus,2020/7/17,52,信息检索的概念(4/6),相关(relevant、相关度relevance) 相关取决于用户的判断,是一个主观概念 不同用户做出的判断很难

28、保证一致 即使是同一用户在不同时期、不同环境下做出的判断也不尽相同,2020/7/17,53,信息检索的概念(5/6),定义“相关性”的两个角度 系统角度:系统输出结果,用户是信息的接受者。这种理解置用户于被动的地位,基于这种理解,研究的重心落在系统本身。主题相关性:检索系统检出的文档的主题即核心内容与用户的信息需求相匹配。系统角度相关并不和用户脱节。系统角度定义的相关简单可以计算。 用户角度:观察用户对检索结果的反应,是系统输出向用户需求的投射。相关性被认为是用户方面的属性。用户角度定义的相关目前仍然难以计算。 现代信息检索研究中仍然主要采用系统角度定义的主题相关性概念,当然也强调考虑用户的

29、认知因素。,2020/7/17,54,信息检索的概念(6/6),形式上说,信息检索中的相关度是一个函数r,输入是查询q、文档d和文档集合c,返回的是一个实数值 r=f(q,d,c) 信息检索就是给定一个查询q,从文档集合c中计算每篇文档d与q的相关度并排序(ranking)。 相关度通常只有相对意义,对一个q,不同文档的相关度可以比较,而对于不同的q的相关度不便比较,2020/7/17,55,信息检索的概念(6/6),相关度的输入信息可以更多,比如用户的背景信息、用户的查询历史等等 现代信息检索中相关度不是唯一度量,还有重要度、权威度、新颖度等度量。或者说这些因子都影响“相关度”。 googl

30、e中据说用了上百种排名因子,2020/7/17,56,信息检索的研究范围,信息检索作为一门学科, 有它自己的研究范围和对象, 也有自己的理论、方法和技术。 信息检索的研究范围包括 一切与信息存储与检索有关的系统、过程、理论和方法。 一切可供存储和检索利用的信息类型,如文献、数据、事实、知识、声音、图形等;各种信息检索系统及其运行过程,如信息采集、标引、组织、存贮、处理、匹配、传送等各种过程中使用的方法;以及在信息检索实践和研究的基础上形成的各种理论和假设, 均包括在这个范围内。信息类型侧重于文本。,2020/7/17,57,信息检索的研究对象(1/3),信息检索理论 主要包括检索语言与标引理论

31、、信息检索的数学模型、知识表示理论、相关性理论等。 信息检索系统 它是实现信息检索的物质基础,是现实的研究对象, 主要研究它的结构、功能、演变,它的设计开发技术、管理维护技术和评价技术,还研究它与其他信息系统乃至整个外部世界的关系。 其中, 数据库是信息检索系统的核心部分之一。数据库的建造和维护是一类非常重要的信息技术。数据库的质量直接影响信息检索系统的功能和效率。,2020/7/17,58,信息检索的研究对象(2/3),计算机信息检索 它涉及到许多计算机设备、软件技术、存储技术、检索技术、系统管理和经营知识、市场营销技术等, 是一门综合性很强的技术。 检索策略与方法 它是用户从信息检索系统中

32、获取有关信息所必需的。好的检索策略是检索成功的必要前提,计算机的应用为检索策略和方法的发展提供了有力的支持。,2020/7/17,59,信息检索的研究对象(2/3),检索策略与方法 近30 年来,涌现了许多新颖而有效的检索技术和方法,如布尔检索、位置检索、截词检索、加权检索、聚类检索、全文检索、超文本检索、超媒体检索、智能检索、知识检索等。 人们利用、研究、评价和完善现有的各种检索策略和方法,研究开发新的更有效的策略和方法。,2020/7/17,60,信息检索的研究对象(3/3),用户研究与培训 用户是信息检索系统的生命,无论是系统的研制开发、管理维护、功能和服务的扩展,还是系统评价,都离不开

33、用户研究工作。 用户培训是用户研究的继续,是与用户建立紧密联系和发展新用户的一种非常有效的措施。,2020/7/17,61,第一章 文献信息源,1 文献的特点 2 文献的类型 3 文献信息服务系统,高洪民,2020/7/17,62,大家的风采,李政道教授曾经在一次科学演讲的开场白中这样说道:“到昨天晚上11点30分为止,世界物理学前沿的发展情况是这样的:”。 借助现代信息技术,我们也可以做到这一点。,2020/7/17,63,63,内 容 提 要,第一讲 信息检索概述 学科领域 信息检索的概念 信息检索的意义 信息检索的基本流程 信息检索的基本方法 信息检索的关键技术 信息检索的应用领域,原理

34、篇,2020/7/17,64,信息的表现形式,大多数信息都是文本形式的,没有预先定义的格式。 有人统计认为80%的信息是非结构化的 什么是“非结构化信息”呢? 一篇新闻是一条非结构化信息,新闻中会出现一些人名、地名、机构名称等实体,以及这些实体之间的关系(比如某人是某地区某机关的负责人),还有这些实体相关的事件(比如某人访问了某地)。 但是这些人、事、物、关系和事件并不像关系数据库的二维表中存放的信息那样,被精确地分割并严格地存放在合适的字段或记录中。这种在现实世界中自然存在的模糊而带有歧义且没有经过规格化的信息被称为“非结构化的”信息。 非结构化信息的类型:文本信息(网页,邮件,博客,论坛上

35、的帖子,聊天记录,短信等)及图像、图形、语音、视频等多媒体信息。,2020/7/17,65,网络信息的发展趋势,大量的数据(非结构化)向ir技术提出挑战 以前认为几百兆的数据就是大数据集,现在一个单独的数据库就能够处理10-50g以上的数据,全球网页服务器数 (1996.12010.4),2020/7/17,66,中国互联网发展趋势(1/3),截至2010年6月,总体网民规模达到4.2亿,突破了4亿关口。,2020/7/17,67,中国互联网发展趋势(2/3),自2002年1.6亿个网页开始,中国的网页规模一直保持高速增长,2009年网页数达到336亿个。,2020/7/17,68,中国互联网

36、发展趋势(3/3),中国分类域名数(截止2010年7月),2020/7/17,69,信息过载,“全世界每年产生1到2 eb信息,相当于地球上每个人大概产生250mb信息。其中纸质信息仅占所有信息的0.03%.”(lyman 能够识别多种类型与格式的潜在信息源;知道获取信息的费用以及产生的效益;具备对所需信息内容与范围进行重新评价的能力。 标准2 ,高效地获取所需信息。具体指标包括:选择合适的调查方法或信息检索系统,以获取所需信息;构建与实施有效的检索策略;利用联机检索终端或亲自使用一组方法检索所需信息;必要时改进检索策略;获取、记录、管理信息与信息源。,2020/7/17,79,标准3 ,能客

37、观、审慎地评估信息与信息源,并将其纳入信息库与评价系统。具体指标包括:具有从获取信息中提炼信息主题的能力;为评估信息与信息源形成最初的标准;复合主题概念以形成新的概念;能通过对新旧的知识的比较而确定信息的增加值;能确定新的知识对个人价值体系的影响,并使其融合于个人的价值体系中;能通过与个人、领域专家及其他人员的交流,对信息的理解与解释的有效性加以判断;决定是否有必要修订初始的查询。 标准4 ,个人或作为群体的一员能有效地利用信息以完成特定的任务。具体指标包括:能够利用各种可获得的信息以完成计划,以及产生特定的信息产品或成果;修订产生信息产品或成果的过程;有效地将信息产品、成果与他人交流。,20

38、20/7/17,80,标准5 ,理解有关信息使用的经济、法律以及社会因素,获取与使用信息要符合道德与法律规范。 具体指标包括:了解信息与信息技术使用的相关法律、道德伦理以及社会经济问题;在存取、使用信息资源时能够遵守法律、法规、信息资源提供的规定以及约定俗成的一些规则;对引用的成果表示致谢。 以上的信息素质评价标准,涵盖了信息意识、信息能力与信息道德三个方面的内容,有较强的可操作性,可以作为我们进行研究生信息素质教育的参考和借鉴。,2020/7/17,81,本课程学习目的,培养和强化学生的信息素养,即信息意识、信息技能和信息道德。 八个方面的信息能力 (1)运用信息工具的能力 (2)获取信息工

39、具的能力 (3)处理信息的能力 (4)创造信息的能力 (5)表达信息的能力 (6)发挥信息作用的能力 (7)信息协作意识与能力 (8)信息免疫能力,2020/7/17,82,课程学习内容文献和信息检索基础知识计算机信息检索知识中外文网络数据库的使用因特网上信息资源特征及检索利用特种文献数据库的检索利用工具书的使用原始文献的获取文献信息综合利用与论文写作。,2020/7/17,83,参考书: 1. 徐庆宁等.信息检索与利用.上海:华东理工大学出版社,2006,2020/7/17,84,2020/7/17,85,3. 符绍宏等.因特网信息资源检索与利用. 北京:清华大学出版社,2002,2020/

40、7/17,86,2020/7/17,87,成绩评定办法:1. 上课考勤占10%2. 检索作业占40%3. 检索报告和文献综述占50%,实习课:自行解决 图书馆,教室,宿舍,2020/7/17,88,第一章 信息检索绪论,第一节 信息素质与信息利用 第二节 基本概念 第三节 信息资源的类型和特点 第四节 信息资源评价,2020/7/17,89,第一节 信息素质与信息利用,一、信息素质 二、信息检索与利用教学内容 三 、信息素质、信息检索与利用的意义,2020/7/17,90,一、信息素质,关于信息素质的研究是从20世纪70年代开始的,对信息素质的认识经历了一个渐进的过程,信息素质可以概括为个体在

41、现实需求的驱动下,能有效地发现、获取、评价和利用信息。它包含四个层面的含义: 第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。 第二,掌握了主要的信息源和信息工具的知识及技能。 第三,能够分析评价选择相关信息。 第四,利用信息的目的是为了有效地解决具体问题。信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。,2020/7/17,91,(一)信息意识,所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。而信息意识的强烈与

42、否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。 同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。,2020/7/17,92,(二)信息知识,是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。其中信息方法是指如何以信息的观点来分析和解决人们在工作和生活中遇到的问题的方法,把无序而良莠不齐的信息转化为有效信息加以利用,创造出新的价值。信息技术是关于信息提取、检测、处理、转换、传递、控制等技术,如计算机技术、数据库技术、通信技术、网络技术等。,2020/7/17,93,(三)信息能

43、力,大学期间,信息能力具体表现为以下6种能力: 明确任务(task definition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急; 信息查询策略(information seeking strategies):了解各种信息源,能够作出评价并确定优先查找的次序; 查找和检索(location and access):确定信息藏址,从信息源中找出信息; 信息利用(use of information):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值; 信息综合(synthesis):能够组织信息,提供信息产品(论文、报告等); 信息评价(evaluation)

44、:评价查找结果和解决问题的过程(效率)。,2020/7/17,94,(四)信息道德,是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。具体有遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。在日趋繁杂的信息环境中,自觉而良好的信息道德,是信息素质中不可忽略的一部分。在信息素质四个方面的内容中,信息意识是前提,信息知识是基础,信息能力是核心,信息道德是准则,它们的有机结合构成信息素质整体。,2020/7/17,95,二、信息检索与利用课

45、的教学内容,信息检索与利用是大学生信息素质教育课程体系中一门最重要基础课,它围绕相关信息的科学查询及利用这个核心,介绍信息检索与利用的基本概念、基本理论和基本方法、并结合各学科的实际问题讲解和剖析了检索、分析、评价和利用。通过学习能使学生具备最基本的信息素质。,2020/7/17,96,三 、信息素质、信息检索与利用的意义,世界上的文献信息已经汇集成一个巨大的知识宝库,其数量庞大、增长迅速、类型繁多、文种多样、新陈代谢频繁。信息检索是帮助人们打开知识宝库的钥匙,是开发人类智力资源的有效手段。面对人类浩瀚的知识海洋,只有具有良好的信息素质,才能迅速而全面地获得所需的信息,并通过各种处理而有效地利

46、用信息。切实地掌握并有效地利用各种信息资源,不但可以更新知识、开拓视野、启迪思维、激发创造力,而且可以增强竞争力,提高各种效益。,2020/7/17,97,1信息素质与综合素质的关系 信息素质是综合素质的重要组成因素,二者相辅相成,良好的信息素质可以极大地提高综合素质,而良好的综合素质也直接影响信息素质的提高。,2020/7/17,98,2信息素质与学习、创新能力 没有知识就不能创新这是大家的共识。而人们的知识一方面来自自己对客观世界的观察与认识,另一方面则来自对其他个体(包括前人)的吸收与继承。人们的知识创新与技术创新需要大量的有关信息。今天的世界并不缺乏创新所需的信息,而在于知识的存贮过于

47、庞大和无序,信息存贮的无序化以及过多的老化信息和伪信息加剧了“信息污染”的程度。今天的社会没有良好的信息素质是很难全面、系统、及时地掌握创新所需的信息的。可以这样的认为,信息素质是学习、创新能力的重要因素,良好的学习、创新能力依赖于优秀的信息素质。,2020/7/17,99,3.信息利用与事业进步,信息是生命、是财富、是力量、是事业核心竞争力的重要组成因素。 具体体现在以下几个方面: 1不断更新知识,增强生存能力 2节省时间,提高效率 3避免重复研究和劳动、防止浪费。 4帮助制定高明谋略 5有助于人们占领科技制高点。,2020/7/17,100,第二节基本概念,一、信息 二、知识 三、情报 四

48、、文献 五、信息资源,2020/7/17,101,2020/7/17,102,2020/7/17,103,2020/7/17,104,十大文献信息资源 科技图书 科技期刊 特种文献( 科技报告 政府出版物 会议文献 标准文献 专利文献 科技档案 学位论文 产品样本 ),本章学习要点:信息检索一四十,2020/7/17,105,一、信息,信息,最初的含义是指音信和消息,南唐李中暮春怀故人诗“梦断美人沉信息,目穿长路倚楼台”及宋代陈亮梅花诗“欲传春信息,不怕雪埋藏”中的信息就是这个概念。随着社会的进步和科技的发展,信息远远超出了原先的含义 ,是指通过各种手段传递的一切符号,它已经成为我们使用频率最

49、高的词汇之一。,2020/7/17,106,信息(information)一词在日常生活中,常被人们理解为以口头、书面或其他方式传递的消息。就信息的基本内涵来讲,信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物的存在方式和运动状态的表达。信息不是物质本身,而是物质的一种基本属性。信息与客观事物一样,无处不在,无时不在。该课所指的信息,是指经过采集、处理、记录并以可检索的形式存储的数据,属于信息资源管理学范畴对信息的描述。人类认识世界的过程,实际上就是不断从外界获取信息、加工信息和传递信息的过程。在当今信息社会中,竞争性信息已成为企业的第四竞争力。,2020/7/17,107,信息

50、概述,2020/7/17,108,信息的结构,精炼的知识,记录下来的知识,对信息的理解与认识,有组织的数据,信息的原材料,智慧,文献,知识,信息,数据,客观事物本身的运动,2020/7/17,109,信息,数据,客观事物的运动,客观事物的运动,2020/7/17,110,信息、知识与文献,数据:是对客观事物本身运动的记录,是信息的原材料。 信息:是有组织的数据,是对数据整理提炼出来的消息,是知识得以形成和传播的中介,而不是知识本身。 知识:是对信息的理解与认识。知识是经过精心研究、领会后的有用信息,是人类对信息加工处理后的产物。获得知识有赖于获得信息;,2020/7/17,111,信息、知识与

51、文献,传递运用后,2020/7/17,112,二、知识,知识(knowledge)是人类社会实践的总结,是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人脑通过思维重新组合的系统化的信息集合。 信息通过人脑的接收、选择、整理和提炼等过程,形成各种各样的知识。知识的产生离不开信息和信息传递,它是信息的一个重要组成部分。,2020/7/17,113,第一节四次文献和十大文献信息源,2020/7/17,114,2020/7/17,115,2020/7/17,116,2020/7/17,117,2020/7/17,118,1.信息、知识、情报和文献的关系; 2.科技文献的分类(加

52、工深度,补充:出版形式,符号如isbn);,2020/7/17,119,信息是事物属性的再现。信息不是事物本身,而是由事物发出的消息、指令、数据等所包及的内容。,2020/7/17,120,普遍性 多样性 时效性 传递性 共享性,2020/7/17,121,情报是指人们在一定时间内为一定目的而传递的有使用价值的知识或信息。,2020/7/17,122,文献是记录有知识的一切载体。,知识,载体,记录,文献基本要素,2020/7/17,123,信息是产生知识的基础,知识是信息核心,情报是被激活的知识,知识记录在一定形式的载体上即为文献。,2020/7/17,124,2020/7/17,125,20

53、20/7/17,126,2020/7/17,127,2020/7/17,128,2020/7/17,129,2020/7/17,130,2020/7/17,131,2020/7/17,132,2020/7/17,133,2020/7/17,134,2020/7/17,135,2020/7/17,136,2020/7/17,137,2020/7/17,138,2020/7/17,139,2020/7/17,140,2020/7/17,141,2020/7/17,142,2020/7/17,143,2020/7/17,144,2020/7/17,145,2020/7/17,146,2020/7/1

54、7,147,2020/7/17,148,2020/7/17,149,零次文献 按对文献 一次文献 信息内容 二次文献 加工深浅 三次文献 科技图书 按文献的 科技期刊 出版形式 特种文献 划分,四次文献,十大文献信息源,2020/7/17,150,文献信息,零次文献:普通网页,电子邮件等 一次文献:正式在期刊上发表的论文等 二次文献:数据库中的题录、目录等 三次文献:文献综述、进展报告等,2020/7/17,151,2020/7/17,152,2020/7/17,153,2020/7/17,154,零次文献,指未经公开发表或未交流的文献。 如实验记录、文章草稿、私人日记、笔记、书信、设计草图、

55、内部报告、技术档案等。,2020/7/17,155,2020/7/17,156,2020/7/17,157,零次文献的特点,数量多,内容新,更具有启发性; 信息反馈迅速、及时、准确; 具有高度选择性和针对性; 有限性和不可靠性,要特别提防虚假信息。 例如:清华女生朱令的铊中毒病因确诊,就是应用零次文献成功的范例。,2020/7/17,158,2020/7/17,159,(2)一次文献(primary document),2020/7/17,160,2020/7/17,161,2020/7/17,162,2020/7/17,163,2020/7/17,164,2020/7/17,165,一次文献

56、的特点,内容比较具体、丰富,具有新颖性、创造性、系统性等特点; 经过权威机构筛选,科学性基本有保证; 可以回溯检索,不像新闻那样有时效性; 由于数量巨大,往往检索困难。一般都是首先检索二次文献后,再去查阅一次文献。另外网上一次文献资源相对较少。,2020/7/17,166,确定一篇文献是否为一次文献,应根据文献的内容,而不是其形式。如,在科技期刊上发表的论文,很有可能是三次文献。一次文献是文献的主体,是最基本的情报源,是文献检索最终查找的对象。,一次文献(primary document),2020/7/17,167,2020/7/17,168,2020/7/17,169,(3)二次文献(se

57、condary document),2020/7/17,170,2020/7/17,171,2020/7/17,172,什么是目录?,目录是指对产品或图书的简要介绍。当然,也可以是对一本书内容的简要描述。 世界上第一个目录诞生于15世纪的欧洲,是一个关于书籍的目录。在美国,本富兰克林(ben franklin)于1744年印制了美国第一份目录,其中列出了数百本图书。,2020/7/17,173,什么是题录?,题录是二次文献中的一种,通俗地说,是指文献工作者对大量的原始文献的题名、作者及刊登(发表)的处所进行著录,并有序排列供人们了解查找原始文献的一种工具。实际上,题录就是计算机数据库中的一条条

58、记录。,2020/7/17,174,按中图法著录的图书在版编目,2020/7/17,175,2020/7/17,176,清华库中的期刊论文题录格式,2020/7/17,177,什么是索引?,索引是将图书、报刊等文献资料中具有检索意义的信息,如字词、语句、主题、人名、地名、物名、书名、篇名、名词术语、引用文献名等,分类摘录,标明出处,页码,并按照一定次序加以编排,指引读者据此查寻原始文献的检索工具。 索引的印刷型载体是一本书或期刊,电子型载体则是索引数据库。搜索引擎之所以能实现快速检索,就是靠索引数据库的支持。,2020/7/17,178,清华库中关于flash的索引,2020/7/17,179

59、,清华库中某篇文献的题录,2020/7/17,180,什么是文摘?,文摘(abstract),又分为报道性文摘、指示性文摘、报道指示性文摘、评述性文摘、模块式文摘、专用文摘等几种,它是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述。这种二次文献意义上的文摘,是索引形式的发展。,2020/7/17,181,清华库中某篇文献的文摘,2020/7/17,182,该文献的原文 ?次文献,2020/7/17,183,二次文献的特点,具有浓缩性、汇集性、有序性等特点,检索方便,网上二次文献资源丰富; 除网上图书馆目录可以免费获取外,大型国际联机数据库的检索一般均须付费; 受加工和出版周期的影响,一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论