




已阅读5页,还剩76页未读, 继续免费阅读
(计算机应用技术专业论文)基于文献关系模型的个性化文献管理方法的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学位论文数据集 【y 18 7 7 1j j i f i j f f f 中图分类号 t n 3 3 9 学科分类号 5 2 0 6 0 9 9 论文编号 1 0 0 1 0 2 0 1 1 1 3 0 2 密级 公开 学位授予单位代码 l o o l o 学位授予单位名称北京化工大学 作者姓名王炜学号 2 0 0 7 0 0 1 3 0 2 获学位专业名称计算机应用技术获学位专业代码 0 8 1 2 0 3 课题来源自选项目研究方向文献管理、s n a 论文题目基于文献关系模型的个性化文献管理方法的研究与设计 关键词文献管理软件,量化关系,文献关系模型,文献管理系统 论文答辩日期 2 0 1 1 5 2 6论文类型 发开研究 学位论文评阅及答辩委员会情况 姓名 职称 工作单位学科专长 指导教师1许南山副教授北京化工大学 网络数据库 指导教师2卢罡讲师北京化工大学s n a ,复杂网络 评阅人1山岚研究员北京化工大学 网络信息检索 评阅人2张杰副教授北京化工大学结构计算 答辩委员蝴 答辩委员1赵英教授 北京化工大学 计算机网络 答辩委员2山岚副教授北京化工大学 网络信息检索 答辩委员3彭四伟副教授北京化工大学软件开发 答辩委员4张杰副教授北京化工大学结构计算 答辩委员5聂伟副教授北京化工大学计算机硬件 注:一论文类型:1 基础研究2 应用研究3 开发研究4 其它 二中图分类号在中国图书资料分类法查询 三学科分类号在中华人民共和国国家标准( g b t1 3 7 4 5 9 ) 学科分类与代码中查 询 四论文编号由单位代码和年份及学号的后四位组成 的研究与实现 信息呈现几何级数 。在文献管理方面, 如何能够快速准确的对文献信息进行收集和管理成为学术界不容忽 视的重要课题。针对文献管理方法的研究就是在这样的背景下孕育而 生。 个性化文献管理的研究与设计面临的主要问题是如何准确定位 文献与其固有属性间的关系。其次,如何根据这种关系找到量化各文 献之间关系的标准。为了解决这个问题,本文提出了基于文献关系模 型的两个数学模型。通过此计算方法,可以的得到任意两篇文献之间 的关联值。在文献数量一定的情况下,即可构建出一个文献关系网络。 为了揭示文献关系网络中某一块区域内的“核心 文献,本文给出了 文献影响力的计算方法。并根据文献关系模型的数学模型,设计和实 现了基于文献关系模型的个性化文献管理系统的核心功能。 本文的主要章节内容分为以下几个部分: 首先,本文介绍了课题研究背景,列举了目前比较知名的文献研 究方法,接着介绍了目前主流的文献管理软件的优缺点。 其次,运用数学语言介绍了本文的创新点:文献繁衍关系模型、 文献关联距离模型的主要内容,同时提出了文献影响力的概念和计算 方式。 i 北京化工人学硕士学位论文 最后,根据上文提出的数学模型设计并实现了基于文献关系模型 的个性化文献管理系统核心功能,并根据实验结果对该模型进行有效 性证明。 关键词:文献管理软件,量化关系,文献关系模型,文献管理系统 i i a b s t r a ct e d o d a st h ei n t e m e th a sr 印i dd e v e l o p e do fw _ e bi n f o m l a t i o np r e s e n t e di n t h ec a s eo fg e o m e t r i cg r o 、玑h ,t h eh u m a ns o u r c e so fi n f o m a t i o nh a sb e e n g r e a t l ye i l r i c h e d ,a c c e s st h o s ei n f i o m a t i o nf a s ta n da c c u r a t ew i l lb ea n i m p o r t a n ta c a d e m i ct o p i ca sw e l la st h em a n a g e m e n to ft h ei n f o m a t i o n t h er e s e a r c hr e g a a 订i n gm a n a g e m e n tm e t h o d sa r ec a r 咖n go u t p e r s o n a l i z e dl i t e r a t u r em a n a g e m e n ti nt h er e s e a r c ha n dd e s i g no ft h e m a i n p r o b l e mf a c i n g i sh o wa c c u r a t e p o s i t i o n i n g d o c u m e n tt h e r e l a t i o n s h i pb e 帆e e nt h e i rn a t u r a la t t 曲u t e s s e c o n d l y ,a c c o r d i n gt ot h e r e l a t i o n s h i p b e t w e e nv a r i o u sl i t e r a t u r e sf i n d q u a n t i t a t i v e r e l a t i o n s h i p s t a n d a r d s i no r d e rt os o l v em i sp r o b l e m ,t h i sp 印e rp r o p o s e s “,oo n l i t e m t l l r er e l a t i o nm o d e lm a t l l e m a t i c a lm o d e l 1 、h r o u g ht h i sc a l c u l a t i o n m e t h o d ,c a ng e t 砒哕伽ol i t e r a t u r ca s s o c i a t i o nb 酿) l ,e e nt h ev a l u e s i nt h e l i t e r i l t u i en u n l b e rc e r t a i nc a nc o n s t m c tal i t e r a t i l r i ei - e l a t i o nn e 觚o f k i l l o r d e rt or e v e a lap i e c eo fl i t e r a t i l r er e l a t i o nn e t 、) l r o r kw i t h i nt h er e g i o n ”c o r e ”d o c u m e n t s ,t h i sp a p e rg i v e sm ec a l c u l a t i o nm e t h o do fl i t e r a t u r e m 北京化工人学硕上学位论文 i n f l u e n c e a n d a c c o r d i n g t ot h el i t e r a t u r er e l a t i o nm o d e lo fm e m a t h e m a t i c a lm o d e l ,t h ed e s i g na n dr e a l i z e db a s e do nl i t e r a t u r er e l a t i o n m o d e lo fp e r s o n a l i z e dc o r e 向n c t i o n a l i t yl i t e r a m r em a n a g e m e n ts y s t e m t h ec o n t e n t so ft h i sr e s e a r c hw i l lb ed i v i d e di n t ot h ef o l l o w i n g s e v e r a lp a n so fc h a 却e r s : f i r s t l y ,t h ep a p e ri n t r o d u c e st h er e s e a r c hb a c k g r o u n d ,e n u m e r a t e d t h er e l a t i v e l yf a m o u sl i t e 咖r er e s e a r c hm e t h o d s ,a n dt h e ni n t r o d u c e st h e p r e s e n t m a i n s 仃e a ml i t e r a t u r e m a n a g e m e ms o r w a r ea d v a n t a g e s a n d d i s a d v a n t a g e s s e c o n d l y ,u s i n gm a t h e m a t i c a l l a n g u a g e ,i i 衄o d u c e si t si 皿o v a t i o n s : m e1 i t e r a m r eb r e e d i n gr e l a t i o nm o d e l ,l i t e r a t u r ea s s o c i a t i o n ,t h em a i n c o n t e n tf r o mm o d e la l s op u t sf o 唧a mt h ec o n c 印to fl i t e r a m r ea n d c a l c u l a t i o nw a yo fi n n u e n c e f i n a l l 弘p u tf o 聊a r da c c o r d i n gt ot h ea b o v ed e s i g na i l di m p l e m e n t t h em a t h e m a t i c a lm o d e lb a s e do nt h el i t e 枷r er e l a t i o nm o d e lo f p e r s o n a l i z e dl “e 胁r em a n a g e m e n ts y s t e mc o r e 如n c t i o n s ,a n da c c o r d i n g t ot h ee x p e r i m e n t a lr e s u l t so fm em o d e le 虢c t i v e n e s sp r o o k e yw o r d s :d o c u m e n tm a n a g e m e n ts o r w a r e ,q u a l l t i t a t i v er e l a t i o n s , l “e r a t u r er e l a t i o n a lm o d e l ,d o c u m e n tm a n a g e m e n ts y s t e m 1 2 文献关系研究的主要方法和常用文献管理软件的简介2 1 2 1 引文分析法2 1 2 2 内容分析法3 1 2 3 文献合著分析法3 1 2 4 国内外流行的文献管理软件简介3 1 3 国内外研究现状与进展4 1 3 1 国外研究现状4 1 3 2 国内研究现状5 1 4 课题研究的方法和内容;5 1 4 1 课题研究的方法5 1 4 2 课题研究的内容6 1 5 论文组织结构6 第二章文献关系模型研究与建立9 2 1 文献繁衍深度关系模型9 2 2 文献关联距离模型1 2 2 3 文献关联距离算法1 7 2 4 一个文献关系模型例证1 8 2 4 1 例证中文献材料1 8 2 4 2 文献关系分析1 9 2 4 3 计算文献关联距离2 0 2 4 4 由文献关联距离得出结论2 1 2 5 文献关系网络文献节点影响力计算2 l 2 6 本章小结2 4 第三章文献管理系统的设计与实现2 5 v 北京化_ t 大学硕 学位论文 3 1 文献管理系统设计需求分析2 5 3 2 系统框架设计2 5 3 3 系统功能模块设计2 6 3 3 1 检索功能2 6 3 3 2 用户自定义2 7 3 4 系统数据库设计2 8 3 4 1 数据库概念设计2 8 3 4 2 数据库逻辑结构设计2 9 3 4 3 数据库表3 l 3 5 文献管理系统核心功能测试3 8 3 5 1 系统实现及运行环境3 8 3 5 2 软件实现流程图3 9 3 5 3 文献常规管理4 1 3 5 4 文献关系检索4 3 3 5 5 标注检索4 6 3 6 本章小结4 8 第四章总结和展望4 9 4 1 已完成的工作4 9 4 2 不足之处4 9 参考文献5 1 附录文献管理原型系统核心部分代码5 5 致谢6 3 研究成果及发表的学术论文6 5 作者和导师简介6 7 1 :z 1 2 1c i t a t i o na n a l v s i s 2 1 2 2c o n t e n ta n a l v s i s 3 1 2 3c i o c 啪e n ta n a l v s i s 3 1 2 4d o c 啪e n tm a n a g e m e n ts o f t w a r e ,p o p u l a ra tl l o m ea r l da _ b r o a di n 仃o d u c t i o n 3 1 3r e s e a r c hs t a t u sa n dp r o 罟乒e s s 4 1 3 1o v e r s e a sr e s e a r c h 4 1 3 2d o m e s t i cr e s e a rc :h 5 1 :4t h ec o n t e n t sa r l dm e m o d so f r e s e a r c h 5 1 4 1n l ec o n t e n to fr e s e a i c h 5 1 4 2m er e s e a r c _ hm e t l l o d s 6 1 5t h e s i so r g 锄j z a t i o n 。6 c h a p t e r 2l i t e r a t u r es t u d 【ya n de s t a b l i s h m e n to ft h er e l a t i o n a l l 】咀i ,d e l 9 2 1m 1 1 1 t i p l yt l l ed e p mo f 廿l er c l a t i o 砌m o d e ll i t e f 砸鹏9 2 2r e l a t e de i o c 哪a n t s 矗o mm em o d e l 12 2 3r e l a t o dd o c u i n e n t s 丘o mt h ea 1 9 0 r i t h m 17 2 4t h er e l a t i o n a l 瑚l o d e le x a m p l eo fal i t e 船n l f e 18 2 4 1e x a m p l e si i lt l l ed o c 啪e n t a r ym 删a l l8 2 4 2r e la _ t i o n s l l i pb e 呐e e nd o c u n k :n t s 1 9 2 4 3ca | l c u l a t i o no f t l l el i t e r a t l h ea s s o c i a t e dw i n lm ed i s 切n c e 一2 0 2 4 4c o n c l u d e dm a tm e1 i t e r a t l l r ea s s o c i a t e dw i t h 廿l ed i s t a n c e 2l 2 5l i t c r a t u r el i t a 眨曲r en e t w o r ko f c o r 印u t i l l gn o d e si l l n u e l l c c 2 1 2 6c h a p t e rs 1 1 】【1 1 i n a r ) 7 。2 4 c h a p t e r3d o c u m e n tm a n a g e m e n ts y s t e md e s i g na n d v 北京化工大学硕十学位论文 i m p l e m e n t a t i o n 2 5 3 1d o c l l m e l l tm 觚a g e i l l e n ts y s t 咖r e q u i m m e n t sa n a l y s i s 。2 5 3 2s v s t e mf r a m e w o r k 2 5 3 3s y s t 锄f e a t l l r e sm o d u l a rd e s i g n 2 6 3 3 1s e a r c hf l m c t i o n 2 6 3 3 2u s e r - d e 矗n e d 2 7 3 4d a t a b a s ed e s i 盟2 8 3 4 1d a t a b a s ed e s i g np r i n c i p l e s 2 8 3 4 2c 0 n c 印td e s i g nd a t a b a s e 2 9 3 4 3l o 西c a ld a t a b a s ed e s i g n 3l 3 5r e 衔e i l c em a n a g 啪e n ts y s t 唧t e s t i n gt h ec o r e c t i o n a l i t y 3 8 3 5 1s y s t e md e v e l o p m e n ta i l dr u n t i m ee n v i r o n m e n t 3 8 3 5 2s o f i 、a r ef l o wc h a r t 3 9 3 5 3g e i l e r a lm a n a g 锄e n tl i t e i a 1 u r e 4 l 3 5 4r e l a t i o n sl i t e 】旧t l l r es e a r c h 4 3 3 5 5l a b e ls e a r c h 一4 6 3 6c h 印t e rs u 锄a 巧4 8 c h a p t e r4s u m i n a r ya n d o u t l o o k 。”4 9 4 1c o m p l e t e dw o r k 4 9 4 2n e x tw or :k 4 9 r e f b r e n c e dt l o c u m e n t 。 5 1 a p p e n d i x 。”5 5 a c k n o w l e d g e m e n t 。一6 3 r e s e a r c hr e s u l t sa n dp u b h s h e d p a p e r s 。6 5 a u t h o ra n dm e n t o ri n n o d u c t i o n 。 v i 6 7 第一章绪论 1 1 问题的提出 第一章绪论 科学研究一般分为以下几个过程: ( 1 ) 确认研究方向和题目; ( 2 ) 检索与课题相关的文献信息,了解目前国内外的研究成果; ( 3 ) 比较分析前人所使用的研究方法和得出的研究成果,确定自己的课题 的创新点; ( 4 ) 设计科学的理论模型和实验系统,取得科学的有效数据验证方法; ( 5 ) 拟写科研论文,发表科研成果。 从以上的几个研究过程中可以看出,检索文献和阅读文献几乎涵盖了科学研 究的全部过程。一项科学研究无论是在开题确立研究方向时,还是在研究过程中 攻克难点和疑点,甚至在最后展现科研成果成文成册时,都需要查阅大量的相关 文献信息。从中即借鉴前人的研究方法,也可以学习文章的拟写方式,集百家之 长补己家之短。由此可见,做好相关文献的管理工作在科学研究中占有不可忽视 的作用。随着社会的进步和科技手段的不断提高,在如今的信息社会里,人们在 面对众多文献信息时往往会出现两难的地步。其一,由于科研人员对目标词语理 解方式不齐,并且在检索时采用不同的方式等等差异性,会造成检索后获取的文 献信息过于广泛,虽然收集大量文献信息对本身的研究和查阅有所帮助,但是涉 及的文献数量特别巨大时,文献信息较难在较短时间内被“消化 ,不利于提高 科研效率。其二,目前各个学科之间相互交叉融合的领域越来越多,以某一个关 键信息检索文献后,会有大量无用信息接踵而至,让人们“迷失,在海量文献信 息中。 在这种情况下,如果能把文献之间的“相似程度 ,以定量的方式展现给用 户,而用户根据自己的需求来查阅收集的文献信息,这无疑会对科学研究工作带 来效率上的提高,同时也减小了用户对有效信息的筛选工作。有鉴于此,本课题 的研究方向即合理科学的构建一套文献关系模型,并且定量的给出之间的关联 值。 北京化工大学硕十学位论文 1 2 文献关系研究的主要方法和常用文献管理软件的简介 1 2 1 引文分析法 文献引文分析法是对科学期刊、论文、著者等分析对象的引用和被引用现象 进行分析的一种方法,他利用数学和统计学的方法来对文献进行比较、归纳、抽 象、概括等操作,达到揭示其数量特征和内在规律的一种信息计量研究方法n 1 。 从引证的关联程度看,分为自引分析、双引分析、三引分析的类型。从引文分析 的出发点和内容上看,主要分为引文数量分析,引文网状分析和引文链状分析拉1 。 引文之间的关系从另外一个角度看也揭示了知识的流动性和参透性,同时折 射出学术共同体的研究边界,反映了期刊类群的影响力和在知识网络中的显示度 3 】 o 引文分析法的优点主要有: ( 1 ) 广泛适用性:据统计,全世界9 0 以上的文献都有引文,平均每篇文献的 引文数量是1 5 篇左右。我国的此类数据是8 8 和8 9 篇;可以说绝大部分文献 都有引文,那么引文分析法在几乎所有的领域都具有广泛的适用性。 ( 2 ) 简便易用性:引文分析法的使用限制比较少,因为他不需要过多的前提条 件和分析算法,使用者可以根据自己的研究深度和广度来对文献进行引文分析。 ( 3 ) 功能特异性:由于前两点特性的缘故,一般研究人员只要通过不太复杂的 统计和分析,就可以得到分析对象的诸如:文献老化规律、学科研究结构和用户 信息特点等多方面的分析结果,实用性比较大h 1 。 然而引文分析法也存在“致命硬伤 嘲: ( 1 ) 对文献之间关系的分析仅仅限于文献之间引用和被引用关系,并没有考虑 到其他的文献关系。 ( 2 ) 被引用的文献的重要性并不等同,相互之间被“一视同仁化。 ( 3 ) 引文分析收到获取文献信息量大小的影响。 ( 4 ) 引用关系存在假联系。 引文分析方法是就文献的参考文献,通过各种手段和方法利用已有的思想体 系进行研究。其优势在于,可以更深刻和清晰的揭示文献内部之间的引用关系, 通过揭示这种关系,得到其他的有用信息。然而文献之间关系的构建仅仅利用引 文这一“先天缺点 ,会在文献之间关联关系的研究上产生考虑不周全的问题, 以至于研究结果有所偏差。 2 第一章绪论 1 2 2 内容分析法 内容分析法是指对获取的文献信息进行分析与综合的一种分析方法。它是根 据特定的需要,对文献信息进行定向选择和科学抽象的一种研究活动。其目的是 从繁杂而无序的原始文献信息中获得研究人员需要的某种规律,进而为下一步的 研究打下理论依据嗍1 1 1 1 。因此内容分析法是一个由多到少、由粗到精、由现象到 本质的信息提炼过程。此种方法一般分为以下几个步骤: ( 1 ) 课题的选择; ( 2 ) 搜集相关的文献信息; ( 3 ) 对搜集的文献信息进行筛选,去掉无用的信息,留下研究人认为比较 有价值的部分; ( 4 ) 分门别类。对筛选的信息进行形式上和内容上的归类; ( 5 ) 利用整理后的信息进性分析研究; ( 6 ) 最后得出研究结果,根据需求拟写综述和研究报告等等。 内容分析法的优点是一种较为客观的研究方法,他不太容易受主观者态度的 影响,同时他可以给我定性与定量相互结合的分析结果。然而内容分析法也存在 问题,即研究的结果受研究材料的选取范围的限制,而且主要是描述的语言,不 利于解释。同时,整个分析过程比较复杂,对使用者的要求比较高n 幻n 。 1 2 3 文献合著分析法 合著分析方法是把文献的合著作者作为一个关联网络加以研究并得出作者 之间关系的研究方法。合著的形式主要是通过科学研究人员在学术期刊上通过共 同署名的方式来体现,利用文献数据库可以找到并分析作者与作者之间的合作交 流情况,从分析的数据中找到隐藏在合著关系网络中暗含的合作关系n 钔n 射。 这种方法的缺点是只单独考虑作者与作者之间的合作关系,并没有把文献的 主要拟写内容和科研方向作为研究的对象加以分析。会造成分析文献关系的片面 局限性。 1 2 4 国内外流行的文献管理软件简介 参考文献管理软件是一种帮助科研人员收集、管理与自身工作相关文献的软 件管理程序。它可以为用户提供个人数据库来存储文献,并帮助用户拟写论文。 国外的文献管理软件常见的有汤森路透公司的e n d n o t e , r e f e r e n c e 衄n a g e r 1 刀,p r o c i t e 1 8 1 以及基于网络的r e f w o r k s 例。其中e n d n o t e 是 3 北京化工大学硕t :学位论文 最受欢迎使用最多的软件,r e f e r e n c em a n a g e r 提供网络功能可同时读写数据库, p r o c i t e 提供弹性的群组参考及可建立主题书目,r e f w o r k s 让国内用户可以使用 清华大学的服务器来存储数据,不占用电脑空间和资源,用户可以随时会随地访 问个人的文献书目数据库。 中文文献管理软件中,有n o t e e x p r e s s 呦3 、文献之星乜、医学文献王心2 1 等优 秀软件,其中n o t e e x p r e s s 是目前较好的中文文献管理软件。文献之星和医学文 献王主要为医学科研人员建立和管理医学文献信息而设计的。 然而纵观此类文献管理软件,目前都还是处于一种“被动式”的管理模式。 虽然用户对文献操作拥有非常高的自由度,但是软件整个操作过程中并没有揭示 文献之间内涵的关联关系,而仅仅单纯的对文献进行简单操作。如果可以构建并 利用了文献之间的关联关系进行管理,用户就可以变“被动 为“主动 ,大大 提高用户的使用便捷性。 1 3 国内外研究现状与进展 1 3 1 国外研究现状 世界上最早研究文献之间关系的是美国学者s h e p a r d 。他于1 8 7 3 年拟写了 谢泼德引文( s h e p a r d sc i t a t i o n ) ,在他研究的基础上建立了相关的引文索 引,这一成果为早期的引文分析方法做好了准备口扣。 1 9 2 7 年p l k g r o s s 等人统计了某些化学专业期刊文献的参考文献,利用 统计结果进行了分析,得出了化学教育方面的核心期刊目录。这是文献学历史上 第一次利用引文分析的例子乜4 1 。 1 9 4 8 年,英国人s c b r a d f o r d 在其专著文献工作中提出可定量描述文 献序性结构的经验定律,奠定了核心期刊与非核心期刊之间区分的思想,同时也 对科学的引文分析提出了更高层次的要求盟朝。 近年来美国学者m m k e s s l e r ,提出了文献耦合( b i b l i o g r a p h i cc o u p l i n g ) 的概念殴引。 美国情报学家h e n r y s i i l a l l 和俄罗斯女情报学家i v m a r s h a k o v a 共同提出 了同被引( c o c i t a t i o n ) 的概念矧。这个概念是指如果两篇以上的文献被同一 篇文献引用,则这两篇文献就有“同被引 的关系。他们的研究成果在一定程度 上指出了文献的学科内容相似性。 美国康奈尔大学应用数学中心的纽曼对自然科学领域的合著网络进行了分 析研究,指出了不同学科合著类型之间的差异啪1 。 4 第一章绪论 美国洛斯阿拉莫斯国家实验室( l o sa l 硼o sn a t i o n a ll a b o r a t o r y ) 研究图书 馆的刘小明等人应用社会网络分析方法对数字图书馆领域合著现象进行了分析 和研究,并且使用a u t h o rr a n k 方法分析合著现象的网络模型嘲 1 3 2 国内研究现状 上世纪9 0 年代以来我国对引文分析的研究主要表现在以下几个方面埘1 : ( 1 ) 探索其发展历史和趋势,对引文分析法不断提高认识。 ( 2 ) 研究本方法的使用条件和研究范围。 ( 3 ) 翻译国外的新方法和新技术,对国内外的方法和技术进行比较。 ( 4 ) 引文排序法和计算机分析法等的研究。 ( 5 ) 引文分析计算机处理的研究等。 总体上来说,国内研究多倾向于介绍和了解国外的研究和技术,本国的新研 究和新技术比较少。 在合著研究方面,深圳图书馆的李亮和南京大学朱庆华利用社会网络分析方 法对我国情报学领域的合著现象进行分析,为分析合著情况提供了一个全新的研 究视角m 1 。 武汉大学信息管理学院的荣先乾和覃桃等人对图书馆学和情报学领域的作 者合著网络进行了分析,并与国外其他学科的合著网络进行比较,同时,还对该 领域核心作者的合著网络和w e b 合著网络进行了简单的比较分析呻1 。 1 4 课题研究的方法和内容 1 4 1 课题研究的方法 针对本课题的研究,本文采用了引文分析法、社会网络分析法和加权欧式距 离等方法对文献以及其属性关系进行分析和研究。以期望获得一套比较科学合理 的文献关系模型。下面简要介绍一下主要涉及的研究方法: ( 1 ) 引文分析法 利用矩阵论的方法重新编排文献与其各个属性的关系,运用引文分析法来定 义和构建文献的繁衍关联距离模型。 ( 2 ) 社会网络分析法口h 妇 在构建的文献关系网络中运用社会网络分析法计算本网络中的“核心 文献。 ( 3 ) 加权欧氏距离北卅 运用加权欧式距离的优点,根据不同侧重点检索文献,从而找到所需的文献 北京化t 大学硕士学位论文 信息。 1 4 2 课题研究的内容 课题研究内容分为以下几个部分: ( 1 ) 分析目前文献关系研究的优缺点; ( 2 ) 建立文献的繁衍关系模型; ( 3 ) 合理划分文献属性,利用文献属性之间的关联值得到文献之间的关联距 离模型; ( 4 ) 构建文献关系网络,找到其“核心”文献的计算方法; ( 5 ) 针对个性化文献管理方法的研究设计文献管理数据库; ( 6 ) 实现该管理软件的核心功能并做相关数据测试,得出结果并分析之。 1 5 论文组织结构 本文的其他章节安排如下: 第二章:运用第一章所介绍的方法和理论,由文献之间引文关系的特殊性, 详细介绍了繁衍关系模型的设计和定义过程。按照文献内不同属性与属性之间可 构成关系的情况,划分了文献属性。并在建立了可构成关系属性之间的关系,通 过这些属性关系利用加权欧式距离的计算方式确定文献之间的关联距离。在得到 文献之间关联距离模型后,引入文献关系网络概念,在此网络中给出了文献节点 的影响力计算方法。 第三章:根据前章的数学模型,设计文献管理软件的数据库和管理功能模块, 并实现了文献管理的核心功能。得出实验结果并分析了结果的正确性,同时验证 了数学模型的有效性。 第四章:对全文工作做出总结,并对今后在基于文献关系模型的个性化文献 管理方法的研究与设计实现方面需要进一步开展的主要工作进行展望。 6 第一章绪论 图1 1 论文研究框架图 7 北京化工人学硕上学位论文 8 第二章文献关系模型研究与建芷 第二章文献关系模型研究与建立 通过第一章的介绍,目前对文献之间关系的研究仅仅是就某一个属性利用概 率论方法和统计学方法进行研究,文献的检索也处在通过关键字的匹配度来查找 文献信息阶段。并没有从文献整体以及从文献与文献之间关系的角度去分析和查 找文献。本章将采用形式化言语来描述构建这种关系,用定量计算的方式给出文 献之间的关联距离计算公式。 2 1 文献繁衍深度关系模型 文献之间最重要的关系之一,就是文献的引用关系。这种引用关系可以反映 出某研究内容的发展过程,也可以通过文献被引次数等情况,反映出文献重要程 度。这里,通过定义文献繁衍深度,来反映文献之间的关联程度。 为了更清晰的表示文献之间引用与被引用的关系,这里采用数学和物理学中 向量的形式来表示他们。一篇文献可以看作是一个含有多重维度的向量。他的每 一个维度代表一个文献属性,下面给出其定义: 定义1 一篇文献z 为一所维的向量: ,= 【a l ,a 2 ,a ( 。- 1 ) ,a m j 式( 2 1 ) 其中,【a i l ,a i 2 ,a 岫- 1 ) ,a i m j 为文献的m 个属性分量。 从上面的定义可以推知,每一篇具体的文献可由不同的属性分量值组成的向 量来表示,不同的属性分量代表了不同的向量,也即表示为了不同的文献信息。 属性分量值的信息来源于文献中的属性值。那么对于一个文献集合而言,就可以 用矩阵的形式来表示。下面给出定义2 ,这里用矩阵的方式来描述一组文献集合。 定义2 对于一个文献的集合l = 五,乞,厶) ,可用一个刀聊矩阵m 工表示如 下: m l = 厶 : 厶 a 1 1 a 1 2 a l ( m 1 ) a l m a 2 l a 2 2 a 2 ( m 1 ) ,a 2 m a n 1 ) l ,a ( n 1 ) 2 a ( n 1 ) ( m 1 ) ,a ( n 1 ) m a n l a 弹2 a 再( m 1 ) a 姗 式( 2 2 ) 其中,每一行表示一篇文献的属性组,每一列表示文献的一种属性。这么定 义的用途在于用严谨合理的数学化语言把单篇文献的信息和一组文献的信息都 表示出来,为后续的文献繁衍关系的构建打下基础。 9 北京化r 丁大学硕士学位论文 在繁衍关系的定义中,一篇文献往往具有不止一篇的参考文献。同时,引用 某篇文献作为参考文献的文献也往往有多篇。下面根据前面定义的文献向量和文 献集合矩阵方式来定义两个对文献的操作。定义3 是取文献的参考文献集合的操 作,定义4 是获取引用此篇文献的文献集合操作。 定义3定义操作r e 坟z ) ,以获取文献z 的所有参考文献集合。则有 r e f i z ) = 瓴,眨,) ,其中i ,扣1 ,2 ,为文献,的参考文献。 定义4定义操作a 胞( z ) ,以获取所有引用文献z 的文献集合。则有 a 纪( ,) = c l ,c 2 ,巳) ,其中q ,江1 ,2 ,z ”为引用文献,的文献。 此时,通过r e f i ,) 和c f 据( z ) 操作得到了由一篇文献向量而映射出来的一个文 献集合。这里仅为一次操作,可以想象如果存在文献,f 属于对文献,进行两次操 作后得到的文献集合,那么文献即为文献,的二代参考或者引用文献。下面给 出其定义: 定义5 设文献、乞和毛,若有如r e 她) ,且厶r e 鹏) ,则定义 厶i 沁f 2 ( 厶) ,表示厶为厶的参考文献的参考文献,称厶为的“二代参考文献”。 同理,p r e f “( 乞) 表示,p 为乇的“n 代参考文献 。 定义6 设文献、乞和厶,若有乞a 绝( ) ,且c f 钯( 乞) ,则定义 厶a 纪2 ( 厶) ,表示厶为厶引用文献的引用文献,称厶为厶的“二代引用文献 。同 理,p a 矽( 乞) 表示为乇的“n 代引用文献 图2 1 文献繁衍关系二代图( 引用和参考) f i g 2 一ls e c o n d - 誉m 训o nm a p 北p r o d l l c 石o nr e l a t i o n sl i t e r a h l r e 根据上面的定义,从“二代文献 推广开来即可以得到以下“参考繁衍关系 序列 和“引用繁衍关系序列 定义: 1 0 文献 卜 文献l ( n ) l ( n 1 ) 图2 - 2 文献繁衍关系n 代图 f 追2 - 2n b e h a l fo ft h em 印d o c 啪锄tr 印r o d u c t i r e l 撕o n s h i p 到定义7 为止给出了关于文献繁衍关系的详细体系结构,然而在该结构中还 有两个“端点 未有明确定义。一种情况是文献自身对自身的繁衍深度,另外一 个情况是若两篇文献没有任何“繁衍”关系时的繁衍深度。为了完整的定义文献 繁衍深度概念,下面给出定义8 : 定义8 文献对其自身的繁衍深度定义为0 ;两篇无繁衍关系的文献其繁衍深 度定义为+ 。 图2 - 3 零代文献繁衍关系图 f i g 2 - 3z e r og e m t i o nl i t e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 混凝土施工作业指导书
- 安全施工教育培训方案课件
- 安全施工培训收获课件
- 琦君的桂花雨全文课件
- 富民消防工程方案(3篇)
- 法兰泄露工程措施方案(3篇)
- 理想为主题的课件
- 电力工程考核方案(3篇)
- 安全文明出午课件
- 平南县同和镇力成养殖场扩建项目环评报告
- 2025年职业卫生标准试题及答案
- 创新社区治理新路径
- 2025-2030中国智慧城市建设项目投资规模与运营效益评估报告
- 校园常见传染病防控知识课件
- 2025部编版八年级历史上册 第二单元 早期现代化的初步探索和民族危机加剧(大单元教学设计)
- 药械知识培训计划课件
- 百师联盟2025-2026学年高三上学期开学摸底联考化学试卷
- 短波无线电通信原理课件
- 2025贵阳市菜篮子集团有限公司招聘11人笔试备考题库及答案解析
- 2023年度中国人民抗日战争纪念馆招聘4人笔试备考题库及答案解析
- 风电工程电气监理细则资料
评论
0/150
提交评论