




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、报告名称:专业:信息管理与信息系统学号:068105023姓名:陆莹1 引言网络信息资源是集文字、图像、声音、视频于一体的多媒体信息。随着网络化的发展各种网络信息纷繁复杂,因此,网络信息的分类被提到重要的位置,不同于传统文献的分类方法,建立相对统一的标准化网络体系是解决网络信息分类问题的关键所在。2 网络信息分类的要求2.1 揭示类目之间的多维联系网络信息分类不同于传统分类法采用的单线型结构,而是采用超文本连接的方式,根据知识门类之间的联系和使用需要,通过链接的方式在相应的类目下重复反映,充分揭示类目之间的多维联系。2.2 多重属性列类的描述知识门类的属性具有多样化,当依据属性对事物进行归类时
2、就要涉及与相关上位关系属性的匹配,往往是一个下位类同时与几个上位类的某种属性相匹配。对此分类法的解决办法是适当采用多重列类。网络分类利用链接技术,可同时选择性地建立多个次序的类目体系,提供更多的描述信息主题因素的类目,满足用户需求。2.3 信息组织灵活网络信息分类,可以灵活使用镜像技术,突出反映重点类目或热点类目,使分类法具有较强的适用性,对类目联系的揭示的范围扩大。且具有很大的灵活性.可以随时进行结构调整和类目增删变更,并能根据网络的需要作较大的改造。2.4 符合检索习惯由于网络信息分类法采用划分范畴的树状结构组织与揭示信息、提供按学科专业或范畴领域检索信息资源的途径,因此具有很好的系统稳定
3、性,符合了人们的检索习惯。随着多媒体技术更进一步的发展。随着网络信息的增多,以重构的分类法组织网络信息的前景被人们看好关于网络信息分类法与传统文献分类法的比较研究众多学者善于采用比较分析法来研究网络信息分类问题,因此涉及这方面的研究性文章还是比较多的。据笔者粗略统计,至少有24篇以上。其中代表作有:文献4、文献5、文献6、文献7等。其研究内容主要集中在立类、序类、类目划分、类目关系、类目注释、类目命名、检索效率、用户满意度等方面。多数学者比较分析后发现:网络信息分类法是以主题立类为主,突出反映生活性类目,以类目的使用频率、重要性和字顺来排列类目,在同一个划分等级上采用了多种标准,采取重复列类和
4、多重列类法来显示类目之间的关系,很少使用说明和注释,类名措词多使用自然语言,设置多个分类体系和镜像类目,检索途径多,效率高,多数能做到及时维护,得到广大用户的青睐,满意度高;而传统的文献分类法则是以学科立类为主,突出反映学科性类目,以类目之间的逻辑关系为序类原则,在同一个划分等级上基本上只采用一种标准,采用“参见”和“宜人”的方式来显示类目之间的关系,使用说明和注释较多,类名措词多使用人工语言,只有一种分类体系并且为单线排列,检索途径少,更新周期长。总之,二者存在着简单与复杂、灵活与死板、新颖与陈化、非线性与线性、不规范与规范、多媒体与单媒体、动态与静态、开放与封闭、网民使用与标引人员使用等的
5、区别。其主要原因就在于二者所处理的分类对象、所处的技术环境、面对的用户、编辑人员等的不同。这些研究成果为我们借鉴二者各自的特点、编表的理论、方法和技术提供了便利,从而为编制高质量的网络信息分类法打下了理论基础。传统分类法在网络环境中的局限性1.1 学科分类的逻辑基础传统的文献分类法以学科分类和逻辑划分为基础。是严密而深细的分类体系。其中隐含的关系和限定贯穿始终。而广大的网络信息用户由于职业、专业不同,受教育程度不同。用户个体的认知特征和知识储备各不相同,对知识体系的了解也各不相同。因而各种用户上网的目的和利用信息的行为存在明显差异。所以,复杂的、专业性较强的文献分类法对广大的网络用户缺少方便性
6、、易用性。1.2 信息分类的一维性传统分类法的一维性与网络信息的多维性相冲突。传统分类法是为了满足文献排架的需要.采用顺序的、单维的、固定的组织:式,不利于充分揭示和反映多维性的知识空间,与多元性的、交互性的、动态的网络环境不相适应。传统分类法在类目表达、主题之间的关系方面采用参见、组配、注释等方式,比较适应传统文献主题单一、学科分野相对清晰的特点,但要客观而充分地揭示知识空间的立体联系.反映那些学科分野较模糊的边缘学科、交叉学科就不适合了,更何况反映复杂的网络信息。1.3 分类法的严谨性1.4 分类法的组织特征2网络环境下文献检索语言分类系统构成2. 1分类语言分类语言属于人工语言,有严格的
7、使用规则。分类语言在网络信息资源的管理、组织及检索中得到了广泛的应用。网络信息检索系统使用的分类语言类型基本可划分为两种:一是采用文献信息工作中常用的分类语言,二是各检索系统依据自身的特点自行编制2. 2主题语言2. 2. 1主题语言的特征主题语言是从文献的特性入手,反映事物的主题概念,同时它不受词表结构的限制,随时可以增添新词。但是主题词由于是在标记使用前就已规范、整理、组织、排列好的“规范词”,其词汇控制严格,文献标引需要在概念分析的基础上进行,标引规则较复杂,标引难度大、速度慢。在检索时要先查词族表、范畴表,然后再查词表,因此在使用主题词查找文献时,主题词的选取和确定过程繁琐,给一般用户
8、检索带来不便。由此不难看出,主题语言限制了用户在检索中的主动参与,无法将其拥有的专业知识融入检索活动中,它的很强的专业性要求使不少检索者望而却步。2. 2. 2主题语言的分类在现阶段,按照选词方式划分,主要有4种:标题词法、单元词法、叙词法和关键词法。标题词法是主题词法中最早出现的一种方法,它以严格规范化的先组式的标题词作为信息的主题标识。与标题词法相比较,单元词只是构成标题词的构件,它们本身绝大部分都不是具体的标题,至于组配,可以说体现了单元词法的突出特点。叙词法通过概念组配来表达信息单元的主题,目的是使检索达到更高的专指度。关键词法将描述主题内容的关键词抽出,不加或加以少量规范处理,按字的
9、笔顺排列提供检索。2. 3代码语言代码语言是一种人工语言,是对事物的某方面特征,用某种代码系统(字母、符号、数字、图形等来表达和排列事物概念(根据需要其中可以添加“- ”、核对字母等其他符号 ,从而提供检索的检索语言。目前常见主要有以下几种。2.3. 1以数字结合字母(包括希腊字母表示的代码语言2. 3. 2数字组合的代码语言2. 3. 3字母组合代码语言字母组合的内容比较丰富,当然这些字母组合的检索语言同时可以利用其中文关键词进行检索结论与建议文献信息检索中现代化信息环境以及信息载体的变革直接影响文献检索的方式和技术。以自然语言为标识的检索语言目前最能够与现代科学技术发展相适应。人工检索语言
10、之间的融合,以及人工检索语言与自然语言的和谐统一应当是检索语言变化趋势。同时,在网络信息时代将文献检索语言分为3个类型比较科学合理;其中代码语言内容丰富而杂乱,发展势头较快,应该加强研究。例如,分类语言与代码语言的区别与联系有哪些,如何利用软件识别代码语言(特别是图形语言等,都是文献信息工作者应该重视,并加以研究的课题。一网络信息分类需要标准化目前,在网络环境中分类目录主要应用于浏览检索,许多站点都提供分类目录以供用户查询信息。网络分类目录往往是一种浏览型目录,使用自然语言作标识,是由专家从茫茫网海中挑选出质量较高的网页,依照某种分类法进行组织,并和检索法集成在一起的辅助信息查询方式1。网络分
11、类目录在使用分类法时有两种方式:一是权且使用已有的文献分类法;二是自行设计所谓的分类法(表。无论哪一种都存在一些不尽人意的地方。前者由于网络环境、信息特点、服务对象都与图书馆差异很大,因而使用文献分类法来类分网络信息,存在类目设置或太繁或太简或没有,使得有的类目下集中大量信息难以细分,有的类目形同虚设而无信息归入,有的类目划分标准与实际信息不符或与用户的检索习惯相悖,由此所建的网络信息分类系统虽知识体系建构完整,但实用性较弱。后者虽以网上信息属性和普通用户需求为依据,其设计的分类体系体现了鲜明的网络环境特点,具有较好的实用性。但其弱点是缺乏严谨的科学分类和知识分类的理论基础,存在分类体系不严密
12、、类目设置不合理、类目划分标准模糊、类目间的横向关系揭示不清楚、类名不准确和不规范等问题,逻辑性和完整性较差,在知识体系的建构和展示方面存在不少缺陷,质量难以保证。由于复杂的网上信息没有使用适合的、统一的信息分类法,分类标准不统一,给开发计算机的搜索工具造成需要针对不同的分类方法制作不同的搜索工具的混乱局面,不利于用户使用,在一定程度上影响信息资源的开发和共享。回顾文献分类所走过的道路,不难发现各种检索语言工具兼容仍还是一个艰巨的任务。中图法、科图法、人大法等至今都难统一,原因主要是原已分编的大量藏书的改编工作令人望而生畏。我国网络信息资源分类才刚刚起步,前车之鉴,从现在起就应建立统一的网络信
13、息分类体系,迫切需要有关部门将此纳入议事日程,能尽快组织人力编制一部专门供网上使用的信息分类法。1 悄然崛起的自由分类法Web1.0 时代, 网络用户通过网络浏览器浏览HTML 网页, 获取所需的互联网资源。面对海量无序、动态性极强的网络信息, 以搜索引擎为主要代表的网络信息组织与搜索工具, 构筑了与传统分类法迥然不同的, 由类目、子类目组成的可供浏览的分类体系, 方便了网络用户在类目与子类目之间进行跳转和检索。搜索引擎在给用户带来极大便利的同时,缺点也逐渐暴露出来, 如不同搜索引擎的类目、类名差异较大, 导致分类导航的整体效果下降, 给用户的理解与应用造成困难; 搜索引擎无论是机器自动搜索、
14、标引, 还是人工标引, 都难以完全、准确概括信息内容创建者的思想, 难以与信息内容创建者形成互动; 网络用户只能使用事先设计好的分类体系, 无法修改分类体系, 等等。Web2.0 的初露端倪, 促进了信息分类组织方法的进一步发展。以博客、SNS、RSS 等为代表的Web2.0 更注重网络用户的交互作用, 网络用户既是网络内容的消费者( 浏览者 , 也是网络内容的制造者, “全民织网”是互联网的下一步目标。网络用户在制造、浏览、共享信息内容的同时, 也开始了信息分类组织的新的尝试, 自由分类法由此应运而生。自由分类法是2005 年初兴起, 并受到热捧的网络信息组织方式。自由分类法由网络用户自发对
15、感兴趣的资料用Tag( 标签 对网络信息进行标识或修改, 形成标签总图, 最后将代表大多数用户共性的、点击频次较高的标签字号变大, 成为自由分类法的类目。用户主导、简单易用、用Tag 作类目标识是自由分类法的三大亮点。自由分类法是网络用户直接参与网络信息分类组织的首次尝试, 为网络信息分类组织注入了新的生机和活力。2 自由分类法对网络信息分类组织的启示2.1 分类理念: 在复杂与简单之间寻求最佳契合点自由分类法之所以受到网络用户的热捧, 一个重要原因是简单易用, 成本较低。而由分类专家构建的“知识之树”分类结构难以在网络信息分类组织中推广使用, 原因之一就在于其繁琐、复杂, 成本较高。随着时间
16、的推移和分类实践的深入, 网络用户的信息需求正从信息单元向知识单元转变。为此在网络的分类与组织中寻找复杂与简单之间的最佳契合点, 已成为网络分类的一个基本理念。2.2 分类主体: 由网站设计者独立承担转向由分类专家、网站设计者和网络用户共同承担Web2.0 的特征是互动性, 强调个性化与网络用户的集体参与。自由分类法提出了基于大众互动的信息架构, 这对传统纸质时代由分类专家主导、Web1.0 时代由网站设计者自主编辑的分类组织模式提出了挑战。汇聚广大网络用户的集体智慧, 分类专家从后台加强分类语义控制与关联, 网站设计者致力于提升界面的个性化显示与超链接技术, 是未来网络信息分类体系构建的新方
17、法、新思路。2.3 分类语词: 实现自然语言、人工语言有机结合自由分类法采用Tag 作为类目, Tag 可以是网络信息内容的关键词, 也可以是网络信息内容创建者或浏览者对网络信息内容的概括与分析, 较之于现有网络分类法的关键词标引, Tag 已经向语义标引方向迈出了一步, 这种标引有利于用户定位符合语义信息的节点。但随着Tag 数量的逐渐庞大, 如果同义词与反义词得不到控制, 词间关系得不到揭示, 势必影响到检索效果。而自然语言与人工语言的有机配合, 才能使自由标引更具价值。3 构建多层次的、相互兼容的网络信息分类体系著名情报学家张琪玉曾经说过: 信息资源的类型、信息用户的类型与信息分类法的类
18、型应协调一致, 才能获得最佳的效果。这就是分类法的文献依据和用户依据原理。依据这一原理, 针对目前网络信息分类现状, 适应网络用户信息检索的多样化和个性化需求, 在优化现有网络分类法的进程中, 要逐步实现网络分类法的集成与整合。3.1 面向博客等用户发展和完善自由分类法目前, 自由分类法的应用仅仅局限于博客、BBS等空间, 为少数网络用户所熟悉和参与。有人认为, 少量的信息, 分类法已经足够; 对于海量的且无序的信息, 关键词是现阶段应用最广泛且被普遍接受的组织方式; 而对于足够大, 有更高系统化要求和精确度要求的信息群而言, Tag 也许是最佳的选择。这种看法虽然有失偏颇, 但从一个侧面肯定
19、了网络用户在标引海量网络信息中的巨大作用, 与元数据创建者的初衷不谋而合。这就是: ( 1 采取各种措施与方法, 吸引更多网络用户的参与, 充分发挥网络用户的聪明才智;( 2 对网络用户标引的自然语言词汇进行动态研究,充实词库; ( 3 从后台加强引导和控制, 提高检索效果; ( 4 及时跟踪自由分类法的发展动态, 为网络信息分类组织的更好发展汲取更多的营养。3.2 面向普通用户优化现有网络分类法互联网上综合性信息检索服务网站都是由商业机构创办经营, 以赢利为目的, 商业性、竞争性促使网站建设朝个性化方向发展, 为此统一现有网络分类法需要一个漫长的过程。优化现有网络分类法, 在个性化中体现标准
20、化, 是目前较为可行的策略。具体可借鉴中文新闻信息分类法的做法, 本着求大同存小异的原则, 形成现有网络分类法集成版, 办法是: ( 1 集中现有网络分类法的类目、子类目, 将其分成若干类组, 形成分类框架; ( 2 每一类组下充实类名词汇, 供网站选择使用; ( 3 允许网站自主使用35 个热门类目或临时类目; ( 4 动态维护分类体系, 与网络信息资源发展同步; ( 5 设立类目索引, 分类导航。3.3 面向学术用户, 研制中图法搜索引擎版互联网上存在着数量较多的学术信息资源, 被少数学术用户所使用。因用户少, 现有网络分类法弱化了这一部分学术性类目的设置。为适应数字图书馆、学科门户网站等
21、对这一部分信息分类组织的需要, 应积极研制中图法搜索引擎版。应充分发挥中图法涵盖知识领域全、学科覆盖面广的优势, 将网络信息资源划分为若干类, 采用交叉列类、多重列类、系统列类、突出列类等方法和技术, 并利用超文本链接, 在类与类、类与信息之间建立动态链接, 使整个类目体系形成一个多角度展开, 有多重入口的网状结构。中图法搜索引擎版的研制应由分类专家、网站设计者、网络用户、计算机专家组成智囊团, 融专业、经验、技术为一炉, 集成现有网络分类法的长处,并适当改造现有网络分类法逻辑性、严密性、完整性、规范性不足的缺点, 汇聚自由分类法的Tag 用语, 丰富后控制词表的词库, 充分利用中国分类主题词
22、表的成果, 构建知识的语义网络, 为从关键词检索迈向概念检索奠定基础, 并最终形成网络信息分类组织的公共交换平台。2 当前网络信息资源分类现状及问题2.1 在类目体系方面目前大多数网络搜索引擎均在不同程度上采用了主题对象与学科相结合的设类方式。对于综合性网络信息分类系统来说,它们的处理对象是大体上相当的,在基本大类的设置上应该是趋于相同的,但实际上大类的划分的区别是相当大的,类目划分不统一,知识体系还很不完整。一些搜索引擎在划分类目时往往只从商业角度考虑如何吸引用户,并未真正从知识领域、知识体系的角度来分类,因而使得分类体系漏掉了许多重要的知识领域,同时又有重复列类的现象。体系的系统性和完整性
23、受到很大的影响。类目的排列是指同位类类目的排列次序,其目的是使类目的排列能体现类目之间的联系,类目的排列直接影响到分类体系的检索效率。目前常见的排列方式有三种:按字顺排序,按检索频率排序和按系统性排序,但是不少类目同位类的展开是多元的,往往采用多个标准,每一种标准使用时又并不完整设类,有时还同时列出不同等级的类目。使得同位类的设置缺乏必要的规律性。根据知识之间的联系,合理确定类目之间的归属,是建立分类体系的基本要求。网络分类法归类不合理的现象主要有三种:一是类表在确定类目的下位类时,相关类收入范畴太宽二是相关类收录范围太窄三是多重列类时存在列类随意、逻辑隶属关系混乱的现象。由于分类法的类型和语
24、言表达的丰富性,类名缺少统一的规范,因而不同分类系统的相对主题,在选用类名时会出现不一致的现象,这种概念内涵的巨大差异为用户检索人为地制造了不必要的障碍。网络分类体系在类目级数的划分上差别很大,有的只有三级,而有的却多达十几级。级数过少,会造成检索到的内容专指性差,需进一步检索。级数过大,则要链接多个页面,费时费力。2.2 在搜索功能方面分类法和主题法的结合是提高检准率的重要手段,但是目前由于分类体系不统一,类目划分标准模糊,因而搜索引擎主要是以关键词作为检索入口,在进行语词检索时只提供信息类型的限定,而没有提供信息内容范围的限定。这种检索仅仅是基于关键词的物理属性和语法属性,而不涉及关键词的
25、语义信息。同一语词用在不同的领域有不同的涵义,如果输入一个关键词进行检索,就不能确定用户需要的是关键词在哪方面的应用,所以就会出现许多干扰。信息。3 网络信息分类法的构建原则3.1 规范性原则在网络环境中人们更注重的是对知识内容的管理和利用,因此要求传统分类法中的类目要能灵活机动地协调。较贴切地反映主题文献。规范类目的名称、类目的分类级别,类目的排列次序等。避免因强调特色而产生的同类文献标引不一致、分类号标引不规范、类目类名不确切等现象。一般来讲。网络分类法大类的数量通常以lO一2O个为宜.类目层级以3-6级比较适中,而类目的名称要做到准确、通用和精练。3.2 易用性原则提高网络分类法的易用性
26、可以采取如下方法:第一。多维揭示。即根据知识内容的特征和用户检索需求特征进行具体地分析,学科、专业、体裁、时间、形态等都可以成为分类标准。第二。降低分类难度。突出重点类目。其一.将一些重要的二、三级类目列为一级类目,以增加其易用性。其二。采用粗分类的原则,因为网上信息不仅有文本信息。还包括非文本信息,与传统文献相比其可标引的内容更加丰富,如果类目设置过于专业化。一般用户很难找准检索途径和检索入口。再加上网络信息资源的日新月异。学科分支越来越细,新的学科不断出现。有必要对传统的分类法进行调整.而粗分原则可适应这一发展趋势。另外,为突出易用性,类目的排列应有规律可循。一个类下的子类或信息的排列.要向用户提供最便于浏览的次序、最便于判断需求的次序。3-3 实用性原则实用性原则一方面就是要求类目设置不仅讲究全面,更重要的是精而有用。但是,对于一些需要从各个角度、 各个方面多维反映的类目就应充分利用网状结构通过 各个节点链接相关信息。增强整个类目体系的整体性和有序性。在需要适度细分 而又不会减少用户使用兴趣的情况下,也可适当细分。使得信息更具有专指度。 网络分类体系还应增加直观性,通过科学的标记制度与标记方法将类名、类表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《唐代诗歌鉴赏方法与技巧的教学教案》
- 《物理力学基础概念:初二物理力学入门教案》
- 《中华文学经典:《红楼梦》文学赏析教学》
- 值得七年级作文600字7篇范文
- 青春词与古文风:高中文言文教学对比教案
- 摄影比赛活动方案
- 以核心素养为导向的初中历史故事讲解教案
- 公交公司筹款活动方案
- 钻孔桩劳务分包合同
- 公众号开业活动方案
- 2025年教育公平与社会分层考试试题及答案
- T/CHES 113-2023生产建设项目水土保持监测无人机应用技术导则
- 广东省珠海市文园中学2025届七下数学期末质量跟踪监视试题含解析
- 高二日语考试试卷及答案
- 钢结构安装施工记录 - 副本
- 超市食品安全管理制度手册
- 海鲜水饺供货合同协议
- 非财务人员的财务管理方法与案例
- 《肺结核的诊断与治疗》课件
- AI驱动的智能汽车故障诊断系统
- 2024北京西城区初一(下)期末英语试题和答案
评论
0/150
提交评论