版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、人文社科文献检索课第五章第1页,共23页,2022年,5月20日,11点23分,星期日 5.1 网络信息资源一、什么是网络信息资源?广义:网络信息资源是在网上以各种方式存在并传播的信息集合。 具体表现:网上计算机中的无数信息、网上的各种信息工具以及网络通信渠道。 网上信息:计算机中的数据库、电子出版物、网页、软件以及各种文件所包含的信息。信息工具:FTP,Telnet,e-mail,WWW浏览器,搜索引擎等。网络通讯渠道:网络提供的信息交流渠道。第2页,共23页,2022年,5月20日,11点23分,星期日狭义概念:网络信息资源通常只指公网上的信息资源,即访问不受任何限制的信息资源,它不包含使
2、用权受IP、用户名及其密码限制的资源。商业性数据库因可以通过网络加以使用,将它们归入网络信息资源是可以的,但由于这些数据库的使用或者受IP限制,或者要求用户名和密码,是不能归入公网信息资源范畴的。(本章将要介绍的内容仅限于狭义的网络信息资源,不包括使用权有限制的网上信息资源。)第3页,共23页,2022年,5月20日,11点23分,星期日二、网络信息资源的特点数量庞大,增长迅速(网页增长)整体无序,局部有序(无序性特征)更新频繁,变化无常(网页寿命)多维显示,交互方便(载体类型/通讯方式)良莠混杂,参差不一第4页,共23页,2022年,5月20日,11点23分,星期日三、网络学术信息资源类型定
3、义:与学术研究有关的网络资源。A. 按内容区分:1. 网上传播的学术机构信息 2. 学术任务信息 3. 科研信息 4. 科研成果信息B. 按出版类型区分:网上学术信息资源有着和纸质型出版物类似的对应信息,但这种对应关系并非一一对应的。第5页,共23页,2022年,5月20日,11点23分,星期日C. 按照是否具有原创性区分: 1. 一次资源(原创性) 2. 二次资源(转载或提取)D. 按照是否经过审核: 1. 正式出版物(ISBN/ISSN,学术价值相对较高) 2. 非正式出版物(学术价值变化较大)E. 按照是否属于搜索引擎范围:(400:1) 1. 不可见资源 2.可见资源第6页,共23页,
4、2022年,5月20日,11点23分,星期日网络学术信息资源网上商用数据库网上公开资源一次资源二次资源一次资源二次资源全文期刊数据库全文图书数据库其他全文数据库期刊文摘数据库会议文摘数据库其他文摘数据库学术机构网站个人学术网站其他学术网站iPAC数据库搜索引擎数据库虚拟图书馆网络导航其他网络二次资源网上商用数据库第7页,共23页,2022年,5月20日,11点23分,星期日四. 人文社会科学学术网站网页、网站和主页的概念 网页:学名HTML文件,是一种可以在互联网上传输,并被浏览器认识、翻译成页面显示出来的文件。 网站:有独立域名,由若干相关网页组成的一个站点。(一般每个网站都有一个主页Hom
5、epage) 主页:用户通过超链接访问其他网页或服务器的起始点,用于引导访问者浏览网站。人文社会科学学术网站的类型 网络学术信息资源的主要来源:学术网站 第8页,共23页,2022年,5月20日,11点23分,星期日学术网站的分类:1. 按内容特征 综合性社会科学学术网站 专科性社会科学学术网站2. 按主办机构 个人网站 杂志社网站 科研机构网站3.按网站功能 学科门户网站 学科资源网站 学科性论坛博客网站第9页,共23页,2022年,5月20日,11点23分,星期日4.学术网站的判断方法 a. 网站和网页的区别,主要依据显示网页的结构和内容。 b. 学术和非学术网站的区别主要依据网站本身的主
6、旨介绍。第10页,共23页,2022年,5月20日,11点23分,星期日5.2 网络信息检索工具和检索方法 一、相关概念IP地址和域名 IP地址:因特网协议(Internet Protocol)地址, 类似于计算机在信息高速公路上的门牌号码。由四段数字组成,中间用圆点隔开,例如 域名:Domain Name,简称DN。一般由代表通讯协议、主机名、机构性质域名四段字母组成,类似于服务器在信息告诉公路上的门牌号码,例如。 主机(host):又名服务器名称,通常是使用机构的简称。 第11页,共23页,2022年,5月20日,11点23分,星期日2. IP地址和域名的关系及常见域名关系:域名只有作为服
7、务器的计算机必须,域名和IP地 址间有对应互换的关系,域名更方便记忆。常见域名及其含义: .ac academic.co commercial .com educational .gov governmental .net Internet service provide国家、地区域名:.ca Canada .cn China .de G International .gb Great Britain .uk United Kingdom第12页,共23页,2022年,5月20日,11点23分,星期日3. 网址 定义:又称统一资源定位器(Uni
8、form Resource Locator,简称URL),代表了网上一切资源,包括上网计算机及其各种文件的地址。网址是由域名加文件地址构成的。 作用:指明信息资源所在的目录和文件名,还指明信息文件存在于网络的那个计算机上,以及可以访问的方式等。4. 网上常见文件格式和后缀名bmp. Windows位图 jpg. Jpg静态图形swf. 动画 asf. 流媒体 rm. Real Video 第13页,共23页,2022年,5月20日,11点23分,星期日二、搜索引擎的基本概念搜索引擎的定义:Search Engines是网上信息搜索工具的通称。可以是一个独立的每户网站,也可以是附在其他类型网站或
9、主页上的一个搜索工具。搜索引擎的类型 (1)按工作方式区分,分为主题引擎、目录引擎和多元引擎。可分为主题引擎、目录引擎和多元引擎。 a. 主题引擎一般由搜索软件(spider、robot、crawler),索引软件(它的任务是建立索引)和检索软件三部分组成。它的优点是信息量大、更新及时、无需人工干预 第14页,共23页,2022年,5月20日,11点23分,星期日 缺点是返回信息中常有很多无关信息,身子有一定比例的死链接,用户必须从结果中进行筛选。 b.目录引擎又称目录指南性搜索引擎。这种引擎的信息收集和处理有人工干预过程,信息处理的层席位网站,检索所得结果的网页中不一定含有检索词。 目录引擎
10、的用户界面基本上都为分级结构。 它与主题引擎的主要区别是由于目录引擎旨在数据库保存的编辑人员对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来。 c.多元引擎又称圆搜索引擎。它本身没有存放网页信息的数据库,当用户查询一个关键词是,它把请求转换成其他数个搜索引擎能够接受的命令格式,并行地活着有选择性的访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户。多元引擎的服务方式为面向网页的检索。但是严格来说,它只算是一个用户代理。第15页,共23页,2022年,5月20日,11点23分,星期日 (2). 按照工作语种区分,可分为中文搜索引擎和外文搜索引擎。
11、(3). 按照搜索内容区分,可分为门户索索引擎和垂直搜索引擎。提供综合性信息服务的搜索引擎称之为门户搜索引擎(如搜狐),而垂直引擎目前最普遍的是博客引擎。 它们的主要区别是: a. 门户引擎内容信息范围要比处置引擎的来得广; b. 门户网站信息内容的实效性相对新一些; c. 垂直引擎在信息的深度上往往比门户引擎优越一些。第16页,共23页,2022年,5月20日,11点23分,星期日三、几个重要的引擎的使用方法1. 百度 输入的检索词可以使研究的主题、网站、新 闻等任何内容,形式可以使中文英文,数字或者中英数字的混合体;并且它不区分字母大小写;它没有模糊检索和截词检索功能。 它可以使用两个以上
12、检索词的检索逻辑。 字段检索。 标题检索。 在url中搜索。 特色功能:百度快照,相关检索,专门内容检索。第17页,共23页,2022年,5月20日,11点23分,星期日2.谷歌(Google)它是优点是网址数量大,检索语种多,响应速度快,它页提供“网页快照”功能,但是这只限国外站点,点击Cached链接即可。谷歌检索文本框中可以任意输入中英文检索词,故宫不支持借此福,但有默认的截词功能。检索与反方面,检索多个检索词时。3.Dogpile 它是个多元引擎,而且是目前性能比较好的一个并行式元搜索引擎。它可同时调用25个网页引擎、新闻组引擎和ftp引擎等。 它的输入框下方可选查Web, Usene
13、t, ftp等。 特色: a. 采用独特的并行和串行相结合的查询方式。 b. 可使用布尔算符合模糊查询。第18页,共23页,2022年,5月20日,11点23分,星期日1. 选择适合的检索词 a. 切分检索提问。 b. 检索提问具体化。 c. 使用搜索引擎要注意不能写错别字,还应该尽量使用比较常用的词语。 d. 避免使用禁用词作为检索词。2.小时网页和网站信息的获取方法 有时由于网站整理、文件被重新命名引起的,有时是由于更换服务器引起的“404-Not Found”的错误信息。此时,我们可以用网址回溯法,还可以用字段检索法,或者服务器缓存法。3.检索策略的调整,即增减检索同义词、近义词等,或者
14、使用逻辑与或者字段限制等策略。四、用搜索引擎学院注意的问题和搜索引擎检索策略实例第19页,共23页,2022年,5月20日,11点23分,星期日五、虚拟图书馆和网络资源导航1. 虚拟图书馆的出现时为了减少信息选择的难度。 较早提出该概念的人是美国人卡耶(Gapen D Kaye)。2. 何时使用虚拟图书馆: a.当时间短促,不允许浏览有搜索引擎查得的巨量的信息时; b.当希望看到比较可靠的网络信息; c.当希望对某个领域有个整体的、较全面的了解时;第20页,共23页,2022年,5月20日,11点23分,星期日5.3 学术网站的评价方法一、客观评价方法(根据人工干预程度,进行优选有3种方法)1. 网站排名法 网站排名法是以客观方法评价一个常用方法。某些排名网站通过定期自动统计网站的访问量,分析网站的状态和地位。 Alexa是当前拥有排名网址数量较大、信息发布较详细的一个排名网站。2. 链接分析法 它是利用某些搜索引擎提供的Link命令,检查评价对象网站的被他人连接的情况也是评价网站的一个常用的客观方法。3. 专家分析法 它是指利用网站组织的专家或者资源人员对网站做出的人工评价结果来评价网站。第21页,共23页,2022年,5月20日,11点23分,星期日二、主观评价方法1.内容评价法 从内容角度对网站提供的信息进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 按时归还债务承诺书8篇
- 跨文化交流有效协调承诺书8篇
- 传媒行业新媒体营销与广告创意方案
- 本册综合教学设计小学劳动四年级北师大·深圳报业版《劳动实践指导手册》(主编:韩震)
- 本册综合教学设计小学信息技术(信息科技)五年级下册鲁教版(信息科技)
- 2026年幼儿园热身活动
- 风险管理流程及应对措施清单
- 你会感谢现在努力的自己 (教学设计)2025-2026学年初三下学期教育主题班会
- 2026年幼儿园向日葵上课
- 第19课 清朝前期社会经济的发展 教学设计-2025-2026学年统编版七年级历史下册
- 室内装修拆除施工方案 最终
- 鲁班奖机电安装工程实施手册
- 教育培训合作项目策划书范文
- 舞蹈团财务管理制度内容
- 职业卫生与职业医学 教案
- 机械识图全套课件
- 2025年江苏省南通市中考生物试卷(含答案解析)
- GB/T 3487-2024乘用车轮辋规格系列
- 管理心理学 权利与政治
- 2020国家工程设计收费标准
- 油漆作业风险和隐患辨识、评估分级与控制措施一览表
评论
0/150
提交评论