




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Bibexcel 进行文献计量分析指南进行文献计量分析指南 分析文本数据(中医方剂和药物分析)分析文本数据(中医方剂和药物分析) 一、软件简介一、软件简介 Bibexcel 是一个用于文献计量分析、特别是引文分析的完美工具。用户 可以在 www.umu.se/inforsk 网站上获得最新版本(据本人验证,应该是 http:/www8.umu.se/inforsk/Bibexcel/这个网站)。其安装也十分简单,只需要 把文件拷贝到硬盘的目录下即可。记住,要把帮助文档即: 也放在同一个目录下(在 bibexcel 打开的情况下, 按下 F1 即可出现帮助系统的内容,不过是全英文的)。如果本指南不能满足你 的需求请到该网站上浏览网页。 Bibexcel 因其灵活性而十分强大,但过于灵活会在刚开始使用的时候会 带来一点点困惑,有的时候好几件事情通过一个步骤就完成了,有的时候需要 把几种不同数据集结合在一起来处理文件。使用 Bibexcel 过程中需要帮助的时 候可以按 F1 获得帮助,但是这个帮助往往是面向比较熟练的用户,老用户明确 自己要做什么因而需要略加指点后在 Bibexcel 下完成的任务。幸运的是还有一 些笔记来填充教程和快速指南留下的空缺。 二、原理介绍二、原理介绍 Bibexcel 软件的核心原理是“共词分析法”。该方法最早起源于 20 世纪 70 年代中后期,属于内容分析法的一种。该方法主要统计一组词中两两之间同 时出现于一篇文献的次数,以这种“共现”次数反映这些词之间的关联程度, 然后借助聚类方法可分析学科的主题结构。 共词分析法的原理可描述为:两个词的“共词强度” (指两个词同时出现 于一篇论文中的次数)越高,则这两个词之间的关联越紧密。 1 1 定义定义 共词分析(Co-word Analysis)是通过对反映文献主题内容的关键词进行统 计分析,研究文献内在联系和科学结构。 2 2 流程流程 2.12.1 确定分析问题确定分析问题 2.22.2 确定分析单元确定分析单元 一种是从关键词列表、标题、摘要等进行提取;另一种数据收集方式则是 利用专门的语词提取软件直接从全文抽取。(本文讲的方法与此有相似之处) 2.32.3 高频词的选定高频词的选定 高频词的确定主要有两种方法:一种是结合研究者的经验在选词个数和词 频高度上平衡,该方法具有一定的主观性;另一种是结合齐普夫第二定律辅助 判定高频词的界限。(齐普夫定律是美国学者 G.K.齐普夫于本世纪 40 年代提 出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次 统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些 词编上等级序号,即频次最高的词等级为 1,频次次之的等级为 2,频次 最小的词等级为。若用 f 表示频次,r 表示等级序号,则有 frC(C 为常数)。 人们称该式为齐普夫定律。)(但是齐普夫的表达仅适宜于中频词的情况,高 频与低频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研 究。) 2.42.4 计算共词频率,得到共词矩阵计算共词频率,得到共词矩阵 在共词分析中,为方便词对共现频率的运算。设计共词矩阵,对于 N 个高 频词的共词分析中,便形成一个 N-N 的共词矩阵。共词矩阵的计算方法有如下 几种:包容指数法、临近指数法、相互包容系数法。 2.52.5 对共词矩阵进行处理,揭示共词信息对共词矩阵进行处理,揭示共词信息 常用的分析方法如下。常用的分析方法如下。 (1 1)共词聚类分析法)共词聚类分析法 借助数据挖掘中的聚类分析法,对共词关系网络中的词与词之同的距离进 行数学运算分析,将距离较近的主题词聚集起来,形成一个个概念相对独立的 类团。类团分析是共词聚类分析的核心内容。 (2 2)共词关联分析法)共词关联分析法 在共词关联分析的过程,涉及到 4 个重要的概念:支持度、置信度、期望 可信度、作用度。 (3 3)共词词频分析法)共词词频分析法 词频分析法是利用能够揭示或表达文献核心内容的关键主题词在某一研究 领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法, 是定性分析法的一种。 (4 4)突发词监测法)突发词监测法 突发词监测是 Kleinberg 于 2002 年提出话题的突发监测(Brust detection)算法,它关注焦点词一相对增长率突然增长的词。基于单个词的词 频增长率变化更有可能涉及到领域局部热点的变化。 3 3 应用领域应用领域 (1)揭示特定领域内的研究主题及其层次之间的关系,以及其对应的研究 方向间的关系,划分科学子研究领域并确定其研究结构; (2)从横向和纵向角度揭示特定领域内研究主题之间以及同其他研究主题 之间的关系; (3)考察特定研究领域内研究主题发展的历史脉络及其子领域的演进态势; (4)通过词间关系的数据挖掘达到学科主题知识发现的目的。 三、软件操作三、软件操作以分析文本文档为例以分析文本文档为例 由于 Bibexcel 设计之初是专门用于文献计量分析、特别是引文分析的工具, 该软件用于对文献的关键词、标题、摘要、期刊等进行提取和分析。所以,在 进行介绍本文的用 bibexcel 软件进行中医药方剂和药物分析的方法之前,先大 概介绍一下 bibexcel 软件正统的用法和意义。两种用法的差别在于,用于 bibexcel 分析的起始文本文档不同,其他的后续分析的操作方法,均一样。 (有点长,着急者,可以略过不看,不影响使用本软件) Bibexcel 是瑞典科学家佩尔松(persson)开发的文献计量学研究软件, Bibexcel 用于帮助用户分析文献数据或者是文本类型格式的数据,实现引文分 析。Bibexcel 处理的数据来自集成在 ISIWeb of Knowledge 平台上的数据库, 包括 Web of Science 数据库、DerwentInnovation Index 数据库和 Medline 数 据库等。Bibexcel 除了对来源于上述数据库中数据的相关知识单元(作者、关 键词、参考文献等)做频次分析和排序外,还实现了知识单元的共现关系矩阵。 将产生的共现数据存入 excel 表格中,借助 Ucinet、Netdraw 可视化软件,做 进一步的可视化分析。 在 WOS(Web of Science),下载前需要对要下载的记录进行标记。然后 开始下载所选择的论文,保证下载项目中包括论文的引文。可以通过 “download for future analysis(为进一步分析而下载)”或者通过电子邮 件发给自己,两种方式都生成纯文本文件。 这个纯文本文件是 bibexcel 进行分析的本体资料的开始。这个文本文档在 Bibexcel 或者文本编辑器中打开的原始数据文件应该是下面这个样子: FN ISI Export Format VR 1.0 PT Journal AU Brown, S Blackmon, K TI Aligning manufacturing strategy and business-level competitive strategy in new competitive environments: The case for strategic resonance SO JOURNAL OF MANAGEMENT STUDIES NR 190 CR 1998, IND WEEK 1207, V247, P22 YOUNDT MA, 1996, ACAD MANAGE J, V39, P836 ZAJAC EJ, 2000, STRATEGIC MANAGE J, V21, P429 ZAJAC EJ, 1989, STRATEGIC MANAGE J, V10, P413 BP 793 EP 815 PG 23 JI J. Manage. Stud. PY 2005 PD JUN VL 42 IS 4 GA 929TJ J9 J MANAGE STUD-OXFORD UT ISI:000229369000004 ER PT Journal AU Brown, S Cousins, PD TI Supply and operations: Parallel paths and integrated strategies SO BRITISH JOURNAL OF MANAGEMENT NR 105 CR ANDERSON JC, 1991, INT J OPER PROD MAN, V11, P86 BADRI MA, 2000, OMEGA, V2, P155 BEACH R, 2000, INT J OPER PROD MAN, V20, P7 WOMACK J, 1996, LEAN THINKING WOMACK J, 1990, MACHINE CHANGED WORL ZAIRI M, 1992, INT J OPER PROD MAN, V12, P34 BP 303 EP 320 PG 18 JI BRIT. J. MANAGE. PY 2004 PD DEC VL 15 IS 4 GA 874LZ J9 BRIT J MANAGE UT ISI:000225353200002 ER PT Journal AU Laycock, M TI Transforming Rover, renewal against the odds 1981-1994 - Pilkington,A SO LONG RANGE PLANNING NR 1 CR PILKINGTON A, 1994, T ROVER RENEWAL ODDS BP 738 EP 739 PG 2 JI Long Range Plan. PY 1996 PD OCT VL 29 IS 5 GA VW288 J9 LONG RANGE PLANN UT ISI:A1996VW28800021 ER 现在,你可以开始使用 Bibexcel 了. 注:注:每一个文档都必须有个固定的开头即: FN ISI Export Format VR 1.0 每条记录以 ER 结束,所以上面这个文档有三条完整的记录。实际的文献 量远不止这些,可以是几百条记录。其中 PT,AU,SO,CD, PY 等为标签,可 以要也可以不要,视自己的所需而定,这些缩写词具体所指如下: AU,author,【来源作者】 TI,title,【来源篇名】/【来源文献】 SO,source,【期刊】/【来源期刊】 DE,description,【标引词】 C1,unit,【机构名称】/【作者机构】 CR,reference NR,cout PY,year,【年代卷期】 等等。上面的文本文档需要进行一定的处理,然后才能生成 bibexcel 可识 别的文本文件。(如果是正统的用法,如进行引文分析之类的,则转换格式这 方面内容在 Bibexcel 的帮助文件中有很多介绍,运行 Bibexcel 时按下 F1 进入 帮助系统,查询索引和条目,如下载、转换到 dialog 和数据准备 (downloading, convert to dialog, preparing the data)。在阅读分析 步骤之前阅读介绍部分有益无害。) 让你的数据变成 Bibexcel 的正确格式的第一步是选择好你的数据文件然后 点击“Misc Convert to dialogconvert from Web of Science”菜单。 如果没有这样处理过文件,则需要通过在左上角选择原始数据(使用 view file 查看文件按钮来检查),然后利用菜单命令:MiscConvert to dialog- convert from Web of Science。最后会得到一个.doc 文件(与你原始文件同文件 名,只不过是以.doc 结尾)。 在抽取出你要进一步分析的字段之前,选择和查看这个文件,比如在每一 行的开头是否有完好的标签(PT-, AU-, SO-, CD-, PY-等),这些标签表明记录的 内容,是否有干净的行结束标识“|”和记录结束标志“ER |”。注意 Bibexcel 如何把分号作为的字段中多个条目的分隔符,比如作者和引文。这些分隔符会 有助于以后分析中把各个条目分割开来。转换结果如下: PT- Journal| AU- Brown S; Blackmon K| TI- Aligning manufacturing strategy and business-level competitive strategy in new competitive environments: The case for strategic resonance| SO- JOURNAL OF MANAGEMENT STUDIES| NR- 190| CD- 1998, IND WEEK 1207, P22, V247; YOUNDT MA, 1996, V39, P836, ACAD MANAGE J; ZAJAC EJ, 2000, V21, P429, STRATEGIC MANAGE J; ZAJAC EJ, 1989, V10, P413, STRATEGIC MANAGE J| BP- 793| EP- 815| PG- 23| JI- J. Manage. Stud| PY- 2005| PD- JUN| VL- 42| IS- 4| GA- 929TJ| J9- J MANAGE STUD-OXFORD| JN- JOURNAL OF MANAGEMENT STUDIES, 2005, V42, N4, P793-815| UT- ISI:000229369000004 ER| PT- Journal| AU- Brown S; Cousins PD| TI- Supply and operations: Parallel paths and integrated strategies| SO- BRITISH JOURNAL OF MANAGEMENT| NR- 105| CD- ANDERSON JC, 1991, V11, P86, INT J OPER PROD MAN; BADRI MA, 2000, V2, P155, OMEGA; BEACH R, 2000, V20, P7, INT J OPER PROD MAN; WOMACK J, 1996, LEAN THINKING; WOMACK J, 1990, MACHINE CHANGED WORL; ZAIRI M, 1992, V12, P34, INT J OPER PROD MAN| BP- 303| EP- 320| PG- 18| JI- BRIT. J. MANAGE| PY- 2004| PD- DEC| VL- 15| IS- 4| GA- 874LZ| J9- BRIT J MANAGE| JN- BRITISH JOURNAL OF MANAGEMENT, 2004, V15, N4, P303-320| UT- ISI:000225353200002 ER| PT- Journal| AU- Laycock M| TI- Transforming Rover renewal against the odds 1981-1994 -Pilkington,A| SO- LONG RANGE PLANNING| NR- 1| CD- PILKINGTON A, 1994, T ROVER RENEWAL ODDS| BP- 738| EP- 739| PG- 2| JI- Long Range Plan| PY- 1996| PD- OCT| VL- 29| IS- 5| GA- VW288| J9- LONG RANGE PLANN| JN- LONG RANGE PLANNING, 1996, V29, N5, P738-739| UT- ISI:A1996VW28800021 ER| 上面是 bibexcel 用于 Web of Science 之类文献分析的文档的转换。 据本人的试验,可被 bibexcel 识别的原始数据文件只要包括下面红线的三 个部分即可,即:文档开头、来源文献和结束标志。其他标签代号,可有可无。 下面则介绍如何生成一个可以被 bibexcel 识别的中医方剂药物的文本文档。 1. 将数据转换成将数据转换成 TXT 格式格式 将数据输入成如下的格式,如图: 其中“TI-”是标签,本义是“标题”(也就是文章的篇名),在本方法中, 此标签并无实际意义,只是作为一个标识符而已,相当于是一个伪冒的“标题” 。“TI-”后面跟一个空格,然后输入具体药名,每个药名之间也用一个空格分 开。(上面说的空格是英文的空格,即一个字符串,不是汉语的空格两个字符 串)每一首方剂的最后一味药物后面跟一个“|”标记,表示该方剂结束。(也 就是该行结束),然后摁回车键,另起下一行。此处仅举几例,实际上可以分 析几百首以上的方剂。 2. 抽取抽取“TI-”字段的内容字段的内容生成生成.out 文件文件 在完成上述格式转换后,我们就可以创建 OUT 文件了。创建 OUT 文件是 我们使用 Bibexcel 软件进行文献计量学分析的第一步。 第一步:在文件管理系统中选择上面的实例文本文档“新建文本文档. txt”,点击“view file”查看该文档。如图: 第二步:在“Old tag”文本框中键入字段标识符“TI” 标签。 第三步:在“Select field to be analysed”下拉框中,选择正确的数据格式 (blank separated field to treat each word alone,字段由空格分隔使每 一个单元独立计数)。 第四步:点击“prep”按钮,在出现的一系列对话框中,按下图所示选择 各个提示框,完成 OUT 文件的创建,即:“确定”“否”“否”。 生成的.out 文件(即将方剂中的每一味药单独提取出来,以便统计分析)。 第一列的数字表示来源的方剂序号。 此处可按下 F1 查看进一步操作这个.out 文件的数据的帮助内容(英文的) 。 附:各标签代号的对话框选择(了解一下,以便日后备用)附:各标签代号的对话框选择(了解一下,以便日后备用) 根据你要分析的知识单元,在 Old Tag 中填写相应的标签代号。 作者、关键词、机构、参考文献、被引期刊的标签依次为 AU、DE、C1、CD、CD。输入相应的标签后,在 Select field to be analysed 下 拉列表框中选择“Any ; separated field”; 如果要分析标题,在输入 TI 标签后,在 Select field to be analysed 下拉 列表框中选择“blank separated field to treat each word alone”; 如果要分析被引期刊,在输入 CD 标签后,在 Select field to be analysed 下拉列表框中选择“JN-Journal”。 然后点 Prep,在弹出的对话框中,点击“确定”,生成后缀名为.out 文件。 与此对应的是:不同标签代号生成与此对应的是:不同标签代号生成 cit 文件的对话框选择(后面详述)文件的对话框选择(后面详述) 选中.out,在 Frequency distribution(频率分布)下拉列表框中选择相应的 分析对象, 分析作者共现,选择“Author” 分析关键词共现,选择“whole string” 分析机构共现,选择“whole string” 分析参考文献共现,选中“Cited Reference” 分析被引期刊共现,选择“whole string”。 分析标题词共现,选择“whole string” 选择相应的分析单元后,在下面的复选框中选择“Sorted descending(降序 排列)”,点击 Start 按钮,在弹出的窗口中,点击“确定”,生成后缀名为. cit 文件。 当然,你还可以用来自其他数据源(如数据库或者当然,你还可以用来自其他数据源(如数据库或者 excelexcel)生成自己的生成自己的. . outout 文件文件,然后用,然后用 BibexcelBibexcel 执行下面分析步骤。只要保证是同一格式并且是纯执行下面分析步骤。只要保证是同一格式并且是纯 文本。文本。 3. 计算频率分布计算频率分布生成生成.cit 文件文件 第一步:在文件管理系统中选择 OUT 文件。 第二步:在“Select type of Unit”下拉框中,选择计数单位,如“whole strings”。并在在下方的多选框中,选择排序方式,如选择“Sort descending”,即按降序排列。 第三步:点击“Start”按钮。在出现的对话框中,按下图所示选择提示框, 完成*.cit 文件的创建,即:“确定”。 生成的*.cit 文件,显示各味药物在方剂中出现的频次,按降序排列,可以 看出:生姜出现 5 次,甘草出现 5 次,半夏 5 次,防风 4 次。如图: 附注:在下方的多选框中,选择计算方法,默认的计算方法是“whole counts”,可以改变为“fractional counts”。(不过本人没有试验过) 4. 共现分析共现分析生成生成. COC 文件文件 了解了来源文献或者引文中的各个字段的频数之后,有一种有意义的探索 即:“共现和网络”,该法是了解引文或者字词之间的关系和网络/地图。这种 探索在 Bibexcel 中叫做共现,在帮助文件的生成矩阵部分有介绍。可以用你需 要的任何数据建立共现矩阵。 下面说明如何利用 Bibexcel 软件进行最基本的文献计量学分析。Analyze 菜单包括一系列特殊功能,使我们可以完成引文网络分析,以及其他共现分析。 书目记录中的一个共现关系意味着两个单元共同出现在同一个元数据字段 中。很明显,两个单元只有一个共现关系是没有意义的,但如果两个单元的共 现关系频繁出现在一定量的记录中,就是很有趣的了。 创建 COC 文件的步骤: 第一步:在“Select file here”中选中 CIT 文件,点击“View file”查看文 档。 在“The List”框中显示 cit 文件的内容(选中与显示,两者有别,详后)。 第二步:从 cit 文件列表中标记将要分析的单元。 选择将要分析的单元,将要分析的单元在主窗口中涂蓝,加亮。 从菜单条中选择“AnalyzeCo-occurrenceSelect units via listbox” 本案例,对频次在 2 以上的药物做一共现分析,作为示例,如上图。 在“Select file here”中选中 OUT 文件文件。 注意:不要在 The List 中显示 OUT 文件,即不要查看该文件(即不要点击 “View file”按钮,)。因为,你要保持你刚刚选择的单元涂蓝,加亮中。 第三步:从菜单中选择“AnalyzeCo-occurrenceMake pairs via listbox” 这个过程将会生成 coc 文件。 在出现的一系列对话框中,按下图所示选择各个提示框,完成 coc 文件的 创建,即:“否”“确定”。 生成的 coc 文件(即将方剂中的每两味药进行共现分析),里面包含共现 频次以及配对的两个项目。第一列的数字表示某两味药共现的频次。其中, 半夏和生姜共现的次数是 5 次,甘草和枳壳共现的次数是 5 次,茯苓和生 姜共现的次数是 5 次,等等。如图: 在在.coc.coc 文件上可供执行的操作有:文件上可供执行的操作有: 1. 聚类分析(使用 Persson Party Clustering 算法,算法原理不详) 2. 生成可供进行 MDS 分析的矩阵。 在.coc 文件中生成共现数据,然后这个文件可以转换成为类似 excel 四 格表的矩阵,其中单元格的数字是行和列标题的频数。 如同上面所说的,两个单元只有一个共现关系是没有意义的,只有当两个 单元的共现关系频繁出现在一定量的记录中,才有意义。所以,为了保证分析 的共现关系有意义,以及节省分析时间,要选取出现一定频次的药物进行共现 分析。(当然,这个分析时间是相当快的。还有,也可以对所有药物进行共现 分析,那就不需要这一步操作,直接进入第三步操作。) 对于一定频次的界定,也即“高频词的选定”有两种方法,上文已论。复 述如下:结合研究者的经验在选词个数和词频高度上平衡,该方法具有一定 的主观性;结合齐普夫第二定律辅助判定高频词的界限,该方法仅适宜于中 频词的情况,高频与低频词与该表述偏差较大。作为用来辅助中医的工具,高 频词的选定应该以中医的医理为主。 5. 进行进行 MDS 矩阵分析矩阵分析生成生成. ma2 文件文件 该操作有两种方法。 第一种方法第一种方法:(来自本文后面所附) 第一步:在“Select file here”中选中.cit 文件,点击“view file”。 附:该法也可以在 The List 显示窗口中选择频次较高的前多少位分析对象, 然后点击“Analyze-co-occurrence-select units via listbox”。 第二步:选中.coc 文件,点击“Analyzemake a matrix for MDS etc” 在 对话框依次选择“确定”“否”“是”“否”“是”“确定”。 生成 ma2 文件,得到矩阵,(可选择生成方阵,还是下三角矩阵)如图: 第三步:生成的共现矩阵文件名为.ma2,将其打开, 另存为后缀名为.xls 文件。 第二种方法第二种方法:分为两步,先生成.ccc 文件,再生成.ma2 文件。(来自 “bibexcel_操作步骤”一文) 第一步:在“Select file here”中选中.coc 文件, 再选择工具栏“AnalyzeList units in pairs”,得到后缀名为.ccc 的文件。 在出现的对话框中选择“确定” 生成的 ccc 文件,如图: 第二步:在“Select file here”中选中.ccc 文件,并查看,并在文件列表中 单击文件“关键词.coc”(只选中,不查看), 再选择工具栏“AnalyzeMake a matrix for MDS etc”,即得到共词矩阵。 在对话框依次选择“确定”“否”“是”“否”“是”“确定” 即生成 ma2 文件,得到矩阵,如图: 不过,似乎这两种方法做出来的结果不一样。不过,似乎这两种方法做出来的结果不一样。 (本人认为还是以第一种方法为主)(本人认为还是以第一种方法为主) 一般用户都需要一个含有.coc 文件中项目的正方形矩阵。为了把.coc 文件 中数据列表转换为矩阵,像从前那样选择同样的单词加亮它们:使用“analyse: coocurrance: select units via listbox”,然后选择你的.cit 文件,操作“analyse: make a matrix”,生成一个.ma2 结果矩阵文件,由于它仍然是纯文本文件,可 以用于其他程序中。 将这些矩阵文件输入到 UCINET 等其他程序中的一个问题是,矩阵中只有 每一列的顶部带有标签而侧面行则没有,解决问题的办法就是重新构建矩阵。 这就需要先把.ma2 文件转换并且保存为到 excel 文件。即打开该 excel 文件,先 插入一个新的空列,再把顶部第一行拷贝下来,然后选择“edit(编辑): paste special(选择性粘贴): transpose(转置)”,点击“确定”后就把标签加到每 一行的前面了。这就生成了一个带有完整标签的正方共现矩阵,更像一个四格 表可以输入到 SPSS 中进行因子分析,对项目进行统计分组。 至此,文献数据知识单元共现关系矩阵构建完毕。至此,文献数据知识单元共现关系矩阵构建完毕。 我个人一般使用像 UCINET 之类的程序对这些数据进行进一步的网络分析, 因为.coc 文件与带有标记的.DL 格式数据文件类似,但是把频数放在最左边而 不是右边的一列,把数据转移到 UCINET 相对容易。如果你也想做这些分析,请 阅读 UCINET 的帮助文件了解如何把数据输入到分析软件中去。 我采用的步骤包括把.coc 文件输入到 excel 中去,剪切左侧一列的频数 并复制到右边,把所有三列剪切粘贴到一个文本编辑器,给文件添加标题使其 具有 DL 格式,比如: 从 UCINET 中获得的结果往往会提供有关数据矩阵状态的清晰视图,如下 图,并且可以使用更多的分析工具。 Pilkington 个体网的作者同被引图 6. 创建供创建供 pajek 软件使用的文件软件使用的文件生成生成 net、vec 和和 c lu 文件文件 1. 创建 net 文件 第一步 选择*.coc 文件。 第二步 从菜单条中选择 MappingCreate net-file for pakek. 这个过程将会生成 net 文件。 2. 创建 vec 文件 3. 创建 clu 文件 在创建 clu 文件之前,首先要执行聚类分析,聚类分析的过程会产生 *.per、*.pe2 和*.pe3 等三种类型文件。创建 clu 文件依赖的是*.pe2 文件。 第一步 选择*.pe2 文件。 第二步 从菜单条中选择 MappingCreate clu-file 这个过程将会生成 clu 文件。 引文耦合引文耦合 对于引文共现和同被引分析在描绘文献之间关系上还有一些争议,有人推 荐使用引文耦合(bibliometric coupling,书目对)。引文耦合不是分析不同 被引文献之间的联系,而是显示和分析来源文献之间的联系,不用说,使用 Bibexcel 中的共现单元方法也可以实现这种分析。 Alan Pilkington 9.1.06 10 AlanAlan PilkingtonPilkington 【a.pilkingtonrhul.ac.uka.pilkingtonrhul.ac.uk】 【翻译:】 【中医方剂药物分析方法编辑:雨岩旧客、309300772】 扩展阅读扩展阅读bibexcel 传统用法传统用法 引文共现与分析软件引文共现与分析软件 BibexcelBibexcel 瑞典科学家佩尔松(persson)开发的文献计量学研究软件 Bibexcel7用于 帮助用户分析文献数据或者是文本类型格式的数据,实现引文分析。Bibexcel 处理的数据来自集成在 ISI Web of Knowledge 平台上的数据库,包括 Web of Science 数据库、Derwent Innovation Index 数据库和 Medline 数据库等。Bibexcel 除了对来源于上述数据库中数据的相关知识单元(作者、关键词、参考文献等) 做频次分析和排序外,还实现了知识单元的共现关系矩阵。将产生的共现数据 存入 excel 表格中,借助 Ucinet、Netdraw 可视化软件,做进一步的可视化分析。 Bibexcel 界面如图 1 所示。 Bibexcel 构建知识单元共现关系矩阵处理流程如下:构建知识单元共现关系矩阵处理流程如下: Step1:打开 Bibexcel,出现上图所示的操作界面,在 select file here 这个框 口中选择数据源所在的文件夹,右边的窗口会显示出这个文件夹中的所有文件。 选中合并后的文本文档,先点击“Edit doc file-Repalce line feed with carriage return”点击“Misc-convert to diologe format-convert from web of science”, 会弹出一个对话框,点击“确定”,就会生成一个后缀名为.doc 的文件; Step2:选中.doc 文件,点击 View file 按钮,The list 窗口就会显示这个文件 的内容。根据你要分析的知识单元,在 Old Tag 中填写相应的标签代号。作者、 关键词、机构、参考文献、被引期刊的标签依次为 AU、DE、C1、CD、CD。 输入相应的标签后,在 Select field to be analysed 下拉列表框中选择“Any ; separated field”;如果要分析被引期刊,在输入 CD 标签后,在 Select field to be analysed 下拉列表框中选择“JN-Journal”,然后点 Prep 按钮,在弹出的对 话框中,点击“确定”,生成后缀名为.out 文件; Step3:选中.out, 在 Frequency distribution(频率分布)下拉列表框中选择 相应的分析对象,如果分析作者共现,选择如果分析作者共现,选择“Author”;如果分析关键词共现,;如果分析关键词共现, 选择选择“whole string”;如果分析机构共现,选择;如果分析机构共现,选择“whole string”;如果分析参;如果分析参 考文献共现,选中考文献共现,选中“Cited Reference”; 如果分析被引期刊共现,选择如果分析被引期刊共现,选择 “whole string”;选择相应的分析单元后,在下面的复选框中选择“Sorted descending(降序排列)”,点击 Start 按钮,在弹出的窗口中,点击“确定”, 生成后缀名为.cit 文件; Step4:选中.out 文件,在 Frequency distribution 下面的复选框中选择 “remove duplicate(取消复制)”和“make new out-file(生成新的 out 文件)” ,点击 Start 按钮,在弹出的窗口中,点击“确定”,生成后缀名为.oux 文件; Step5:选中.cit 文件,点击“view file”, 在 The List 显示窗口中选择频次 较高的前多少位分析对象,然后点击“Analyze-co-occurrence-select units via listbox”,然后选中.oux 文件, 点击“Analyze-co-occurrence-make pairs via listbox”,在弹出的窗口中,点击“否”,此时生成后缀名为.coc 文件; Step6:选中.cit 文件,同样点击“view file”, 在 The List 显示窗口中选择 频次较高的前多少位分析对象,然后点击“Analyze-co-occurrence-select units via listbox”,然后选中.coc 文件,点击“Analyze-make a matrix for MDS etc”, 在弹出的对话框中,按照提示,点“是”还是“否”,选择生成方阵 还是下三角矩阵,生成的共现矩阵文件名为.ma2,将其打开,另存为后缀名为. xls 文件。 一般用户都需要一个含有.coc 文件中项目的正方形矩阵。为了把.coc 文 件中数据列表转换为矩阵,像从前那样选择同样的单元加亮它们:使用 “analyse: coocurrance: select units via listbox”,然后选择你的.cit 文件,操作“analyse: make a matrix”,生成一个.ma2 结果矩阵文件,由于 它仍然是纯文本文件,可以用于其他程序中。 将这些矩阵文件输入到 UCINET 等其他程序中的一个问题是,矩阵中只有 每一列的顶部带有标签而侧面行则没有,解决问题的办法就是重新构建矩阵。 这就需要先把.ma2 文件转换并且保存为到 excel 文件。即打开该 excel 文件, 先插入一个新的空列,再把顶部第一行拷贝下来,然后选择“edit(编辑): paste special(选择性粘贴): transpose(转置)”,点击“确定”后就把 标签加到每一行的前面了。这就生成了一个带有完整标签的正方共现矩阵,更 像一个四格表可以输入到 SPSS 中进行因子分析,对项目进行统计分组。 至此,文献数据知识单元共现关系矩阵构建完毕。Bibexcel 可以构建作者共 现矩阵、关键词共现矩阵、机构共现矩阵、参考文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025姐弟车辆财产赠与合同
- 2025租赁承包合同范本
- 2025短期劳动合同范本【标准】
- 2025年门面租赁合同书范本
- 2025解除合同的劳动合同法规定
- 2025电梯租赁合同
- 《银屑病样皮炎》课件
- 《直肠癌护理》课件
- 《中国心理咨询发展史》课件
- 婴儿及儿童期癫痫及癫痫综合征的临床护理
- 2025年中国铜铝复合母线行业市场运行现状及投资战略研究报告
- (高清版)DB1331∕T 072-2024 《雄安新区高品质饮用水工程技术规程》
- 2025年金丽衢十二校高三语文第二次模拟联考试卷附答案解析
- 广东省深圳市福田区2023-2024学年六年级下学期英语期中试卷(含答案)
- 2023-2024学年广东省广州七中七年级(下)期中数学试卷(含答案)
- 2025年北京城市排水集团有限责任公司招聘笔试参考题库含答案解析
- 课件-2025年春季学期 形势与政策 第一讲-加快建设社会主义文化强国
- 2025年山东惠民县农业投资发展限公司招聘10人历年高频重点提升(共500题)附带答案详解
- 大学美育知到智慧树章节测试课后答案2024年秋长春工业大学
- 《基于嵌入式Linux的农业信息采集系统设计与研究》
- 外科创伤处理-清创术(外科课件)
评论
0/150
提交评论