




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第29卷第1期 2011年1月 Vol 29 No 1 January 2011 收稿日期 2010 04 08 作者简介 周金侠 1965 女 大学本科 馆员 主要从事图书馆工作与文献计量学研究 1引言 所谓信息可视化 Information Visualization 是指 利用计算机实现对抽象数据的交互式可视表示 来 增强人们对这些抽象信息的认知 1 信息可视化有 助于人们通过视觉的通道快速地观察 认知 加工有 关信息 以利于分析数据 发现规律和制定决策 信 息可视化可以揭示出信息之间的关系和信息中隐藏 的本质规律 信息可视化 这一术语最早出现在1989年G Robertson S Card与J Mackinlay的论文中 2 虽然 还处于发展时期 但它方法技术的研究和应用正在 日益成熟 也给信息资源管理科学带来了根本性的 变革 为了厘清信息可视化研究的发展脉络 把握该 领域的研究热点 笔者拟用国际信息计量学中最先 进的软件Citespace II对Web of Science中有关信 息可视化研究的数据进行可视化分析 以期有益于 我国信息可视化的研究工作 2数据来源与可视化工具 2 1数据来源 本文以SCI Thomson ISI 网络版 web of Sci ence中的科学引文索引扩展版 Science Citation In 基于 Citespace II 的信息可视化文献的量化分析 周金侠 河北科技师范学院 图书馆 河北 昌黎066600 摘要 利用当前最著名的信息可视化分析软件Citespace II对从SCI Thomson ISI 网络版 web of Science中的科学引文索引扩展版 中下载的1998 2009年间信息可视化研究文献做了详细的可 视化分析 厘清了信息可视化研究的演进轨迹 揭示了研究热点 探讨了此项研究的国家与研究机 构分布情况 关键词 信息可视化 Citespace II 共引网络图谱 中图分类号 G350文献标识码 A文章编号 1007 7634 2011 01 0098 04 Documents Visibilization Analysis of Information Visibilization Based on the Citespace II ZHOU Jin xia Library of Hebei Normal University of Science citespace II atlas of cocitation network 情报科学 1期基于Citespace II的信息可视化文献的量化分析99 dex Expanded 数据库为数据来源 检索方法选定为 高级检索 检索式为 TS Information visualization 检索年限设定为1998 2009 其中文献类型设定为 article 共计4025条记录符合条件 数据下载的方 式设定为 全纪录并且包含所引用的参考文献 数 据下载结束的时间为2010年1月29日 2 2可视化工具 引文分析可视化是信息可视化的重要分支 其 首先处理海量的引文数据 之后利用信息可视化技 术使人们更容易地观察 浏览和理解信息 进而找到 数据中隐藏的规律和模式 3 不过当前对此分析的 作者 多应用统计学中的一些工具 如SPSS Pajek 等 但是其可视化的效果不仅单调 而且分析解读比 较烦琐 4 本文使用的引文分析可视化工具是基于JAVA 平台的CiteSpace II版本号为2 2 R5 是由美国费城 德雷克塞尔大学 Drexe1 信息科学与技术学院陈超 美博士开发 他是国际上信息可视化领域的权威专 家 多年致力于信息可视化方法及相关算法研究 Citespace II可用于探测和分析学科研究前沿的变 化趋势以及研究前沿与其知识基础之间 不同研究 前沿之间的相互关系 通过对文献信息的可视化 能 够较为直观地识别学科前沿的演进路径及学科领域 的经典基础文献 同时 选择机构共现分析 可得到 基于研究机构共现网络的机构合作网络图谱 实现 对某技术研究领域中研究机构合作情况的可视化分 析 5 CiteSpace II可以在其主页 http cluster cis dre xe1 edu cchen citespaee 上自由下载 免费使用 3结果分析 将下载的相关数据全部录入Citespace II软件 中 然后进行相关选项的设定 首先设置时间 由于 本文检索年限为1998 2009共计12年 所以设定 时间跨度为1年 这样就形成12个时间段 其次设 定c cc ccv 其中c为文献被引频次 cc为两篇文献 的共引频次 ccv为文献的共引系数 的阈值分别为 3 2 20 4 3 20 和 5 3 20 选定路径搜索 pathfinder 算法 最后依据分析内容的不同 选定 相应的网络节点 如 作者 关键词 机构 国家等等 3 1关键节点文献分析 进行主题分析 需要将网络节点设定为参考文 献 reference 和主题词 将主题词来源设定为文献 标题 文摘 描述符 descriptor 三种 由于Citespace II软件中主题词又包括名词短语 noun phrase 与 涌现 词 burst terms 两种 我们先将主题词设定为 涌现 词 然后运行Citespace II 即可得出输出网 络所涵盖的节点 Nodes 269 与连接线 Links 472 数 同时也绘制出了信息可视化研究领域的文献共 引网络图谱 见图1 图1信息可视化研究的文献共引网络图谱 从图1中可以看出网络中有七个关键节点 关 键节点是共引网络中连接两个以上聚类群组且具有 中介作用的节点 一般而言 关键节点的点度中心 性比较高 在整个网络中所起的桥梁作用也很大 从 知识理论的角度看 关键节点文献通常是在该领域 中提出重大理论或是创新概念的文献 也是最容易 引起新的研究前沿热点的关键文献 6 本文关键节 点文献的相关信息见表1 表1关键节点文献的综合信息表 为验证关键节点文献的重要性 笔者利用 Google Scholar对表1中按中心度的排序的文献做 了进一步的检索 发现中心度最大的文献是美国耶 鲁大学教授爱德华 塔夫特 Edward Tufte 于1983 序 号 作者 出版 年 文献名称 中心 度 半衰 期 被引 频次 1 TUFTE ER1983 VISUAL DISPLAY QUANT 0 441537 2 ALTSCHUL SF 1997 NUCLEIC ACIDS RES0 38350 3 ROBERTSON GG 1991 P ACM C HUM FACT COM 0 33927 4 KOHONEN T1997 SELF ORG MAPS0 28614 5 CARD SK1999 READINGS INFORMATION 0 22122 6 AHLBERG C1994 P CHI 940 17721 7 MORI S1999 ANN NEUROL0 12416 100情报科学29卷 年出版的著作 The Visual Display of Quantitative Information 中 提出了数据图形学的理论 强调有用 信息密度的最大化问题 后来塔夫特的这些理论在 众多的领域当中变得闻名遐迩 且富于影响力 从而 使得信息可视化发展成为了一门学科 其次是美国 国家生物技术中心的著名学者Altschul SF 他于 1997年在 Nucleic Acids Research 上发表的论文 Gapped BLAST and PSI BLAST a new generation of protein database search programs 中提出了数据库 搜索程序迭代算法也广泛引用 在一定程度上推动 了信息可视化这门科学的发展 排在第三位的乔治 罗伯逊 George G Robertson 是美国信息可视化专 家和高级研究员 可视化和交互 VIBE 研究小组成 员 他发明了多种信息可视化技术 1989年他与斯 图尔特 卡德 Stuart K Card 和约克 麦金利 Jock D Mackinlay 一起创立了信息可视化的英文术 语 information visualization 第 四 位Teuvo Kohonen是芬兰赫尔辛基大学神经网络研究中心的 著名教授 也是芬兰最杰出的科学家 曾经担任欧洲 神经网络学会主席等职务 其在学习矢量量化算法 基本理论的分布式联想记忆和优化的联想映射等方 面都有卓越建树 其最突出的贡献就是发明了神经 网络地图 又称作 Kohonen地图 第五位斯图尔 特 卡德是美国Xerox PARC的一位高级研究员 也 是率先在人机交互方面运用人员因素的开拓者之 一 他与托马斯 莫阑 Thomas P Moran 和艾伦 纽 威尔 Allen Newell 合著的 人机交互心理学 The Psychology of Human Computer Interaction 已经成 为该领域极富影响力的经典著作 第六位克里斯托 弗 阿尔贝格 Christopher Ahlberg 是瑞典马里兰大 学计算机教授 人机交互研究中心研究员 因其突出 的学术贡献 被选入2002全球技术新锐TR100 最 后一位Susumu Mori是美国约翰霍普金斯大学巴尔 的摩医学院核磁共振造影领域的专家 他用实验证 明了大脑与复杂行为之间的神经网络控制关系 提 出了全新的神经网络可视化观点 以上检索结果再 次证明了表1中所列学者及其文献在信息可视化研 究领域中的重要作用 3 2研究热点的演进分析 科学文献在发表之后 随着时间的推移 相对于 科学技术的迅猛发展 其内容会逐渐变得陈旧过时 而研究内容的陈旧过时 具体体现在代表该研究内 容的词汇或短语出现的次数的变化 4 由于CiteS pace 软件所调用的主题词 Terms 全部来源于 SCI E数据库中的题名 Titles 摘要 Abstracts 标 识符 identifier 和描述符 descriptor 其完全可以用 于表征该文献的内容 因此 笔者将网络节点设定为 主题词 Terms 结合软件自带的涌现检测算法 burst detection algorithm 然后运行Citespace II 绘 制出1998 2009各年度的研究主题变化的时区视 图谱 见图2 图2信息可视化研究热点时区分布图 在此基础上 使用CiteSpace 自带的聚类软件 对全部主题词进行Expectation Maximization简称 EM 聚类 最后得到了全部主题词的年度变化分布 表 限于篇幅 这里只给出比较重要的部分 在表2 中详细列出了1998 2009各年度重要主题词变化 的详细信息 如主题词 词频 涌现值与中心度等关 键指标的数值 由于表2列出的是1998 2008各年度中涌现 值 词频均很高的重要词汇 因此这些主题词的变 化 十分准确地反映了信息可视化研究领域中研究 热点的演进情况 从表2可以看出1998年的研究热 点主要是医学信息的可视化与信息检索的可视化 1999年研究热点是虚拟现实技术 2000与2001年 研究热点则是在医学信息的基础上增加了多媒体信 息的可视化 2002年研究热点为人类大脑可视化与 视觉数据挖掘 2004 2007年研究热点表现为生物 学信息的可视化 如基因图谱 蛋白质图谱等 另外 在表2中也给出2008 2009这两年中的其它高频 主题词 虽然他们不属于 涌现 词 但从被引频次上 看 这些主题词 诸如视觉分析 visual analytics 知识 knowledge 信息检索 information retrieval 神经网络 neural networks 图像检索 image re trieval 数据分析 data analysis 元数据 metadata 等等在一定程度也代表了本研究领域的研究热点 它们与近几年的 涌现 词一起共同构成了目前信息 可视化研究领域的研究热点 这种演变过程与图2 所显示的结果可以相互印证 表2各年度研究主题变化表 3 3各国研究实力与机构分析 在进行数据分析的过程中 我们将网络节点分 别设置成 Country 然后运行CiteSpace 得到有关 国家研究实力分布图谱 见图3 图3研究人员所在国家分布图 从图3中可以清晰地看出在信息可视化研究领 域中 美国具有绝对的优势 居于世界首位 独占第 一集团 德国虽然远逊于美国 但明显超出其它国家 很多 独占第二集团 第三集团由日本与英国构成 略强于第四集团 第三集团相互之间差距不太大 它 们是中国 法国 加拿大 荷兰与意大利 由此可见 虽然我国在信息可视化研究领域起步较晚 但经过 科研人员的不懈努力 已经使我国在此研究领域中 排名第五 居第四集团之首 见表3 表3各国在信息可视化研究领域科研实力分布表 为了探究研究机构的分布情况 笔者将网络节 点分别设置成 Institution 然后运行CiteSpace 得出从事信息可视化研究的机构分布表 由于得到 的研究机构很多 限于篇幅 在表4中只列出前20 个研究机构 表4信息可视化研究机构分布表 从表4可以看出 被引频次最高的是美国的哈 佛大学 Harvard Univ 他也是美国最古老 最著名 的大学 第二是美国的马里兰大学 Univ Maryland 美国的德克萨斯大学 Univ Texas 与北卡罗来纳大 学 Univ N Carolina 并列第三 在排名前20的研究 机构中美国拥有16个 独占3 4 德国有两个 分别 是 慕尼黑大学 Univ Munich 与慕尼黑理工大学 Tech Univ Munich 英国不列颠哥伦比亚大学 Univ British Columbia 俄罗斯科学院 Russian A cad Sci 占一个席位 我国香港理工大学 Hong Kong Polytech Univ 与香港中文大学 Chinese Univ Hong Kong 排第54 60位 西安交通大学 Xian Jiaotong Univ 排在第71位 另外 从科研机构的性 质来看 大学是信息可视化研究的重要力量 推动着 信息可视化研究的向前发展 下转第112页 序号研究机构频次 序号研究机构频次 1Harvard Univ4811Univ Munich25 2Univ Maryland3912Penn State Univ24 3Univ Texas3513Johns Hopkins Univ22 4Univ N Carolina3514Univ Calif Los Angeles22 5Stanford Univ3415Georgia Inst Technol21 6Univ Wisconsin3316Russian Acad Sci21 7Univ Arizona3017Univ Minnesota21 8Univ Illinois2918Ohio State Univ20 9Univ Calif San Diego2719Tech Univ Munich20 10Purdue Univ2620Univ British Columbia20 主题词年度 中心 度 涌现 值 词 频 主题词年度 中心 度 涌现 值 词 频 ultrasound1998 0 02 4 47 60genes200503 39 16 information 1998 0 023 4160biology200505 625 information 1998 0 023 4160genes200503 39 16 virtual reality1999 0 02 3 64 34proteomics200702 67 23 ultrasonog raphy 2000 0 01 6 13 43 visual analytics 200805 62 19 management 2000 0 013 451knowledge2008028 multimedia 200003 39 11 information retrieval 2008016 pathways200102 79 30 image retrieval 2008011 human brain 200203 14 26 data analysis 2008011 visual data mining 200202 969genomes2008010 extraction200302 820metadata2008010 living cells 200302 64 15 optimization 2009022 ontology200404 59 25mechanism2009017 biology200505 625density2009016 序 号 国家频次 涌现值 序 号 国家频次 涌现值 1USA149313AUSTRALIA81 2GERMANY53414AUSTRIA70 3JAPAN24015SWEDEN69 4ENGLAND21616TAIWAN66 5PEOPLES R CHINA16617RUSSIA473 46 6FRANCE16318DENMARK45 7CANADA16219BELGIUM42 8NETHERLANDS13920FINLAND402 98 9ITALY11321INDIA383 67 10SPAIN9222ISRAEL36 11SOUTH KOREA9123BRAZIL36 12SWITZERLAND8724GREECE352 92 1期基于Citespace II的信息可视化文献的量化分析101 责任编辑 徐波 责任编辑 徐波 上接第101页 4讨论 1 我国信息可视化研究工作起步比较晚 与国 际先进水平还有一定的差距 虽然在国家的综合排 名中比较靠前 但从研究机构排名情况来看 还没有 一个国内研究机构能够形成实力强大的研究团队而 进入世界前列 虽然中科院与清华大学 北京大学 大连理工大学等单位都开展了该领域的相关研究 但总体上还没有形成一定的规模 与国外先进水平 还有较大的差距 7 2 在使用CiteSpace 进行研究之前 笔者曾 利用百度与谷歌对文献计量学研究中常用的可视化 工具软件做了详细的了解 发现了一个很有趣的现 象 国外学者研制的信息可视化工具软件除了极个 别大型商业化软件之外 绝大多数通过互联网都可 以免费下载使用 而国内学者研制的工具软件一般 都 紧锁在深闺 更何谈自由下载与免费使用 这种 差异的思想缘由无从探讨 但其结果必然是免费软 件性能越加强大 普及面更广泛 而 深闺 软件则昙 花一现 自生自灭 像CiteSpace 这样世界著名的 信息可视化工具软件都可以免费 这难道不值得我 们深思么 3 通过对信息可视化领域研究热点的演进分 析 凸显了信息检索是信息可视化研究的一个重要 发展方向 检索手段正在向可视化检索 图像检索 的演变 这也正是图书情报工作者需要密切关注的 参考文献 1 Bederson B Shneiderman B The craft of information visual ization readings and reflections M San Francisco Morgan Kaufmann Publishers 2003 1 2 G G Roberson S K Card J D Mackinlay The cognitive co processor for interactive user interfaces Proceedings of UIS 89 ACM Symposiom on use interface and software and technology C New York USA ACM Press 1989 3李运景 侯汉青 引文分析可视化研究 J 情报学报 2007 26 2 30l 308 4高继平 丁堃 专利研究文献的可视化分析 J 情报杂志 2009 28 7 12 16 5C Chen CiteSpace II Detecting and Visualizing Eme ing Trends and TrarLsient Patterns in Scientific Literature J Journal of the American Society for Information Science and Technology 2005 57 3 359 377 6侯剑华 陈悦 王贤文 基于信息可视化的组织行为领域 前沿演进分析 J 情报学报 2009 28 3 422一430 7栾春娟 赵呈刚 基于SCI的基因操作技术国际前沿分析 J 技术与创新管理 2009 30 1 11 13 112情报科学29卷 4 Lee Hyoung Yong Ahn Hyunchul Han Ingoo VCR Virtual Community Recommender Using the Technology Acceptance Model and the User s Needs Type J Expert Systems with Applications 2007 33 4 984 995 5 Lin Hsiu Fen The Role of Online and Offline Features in Sustaining Virtual Communities An Empirical Study J In ternet Research 2007 17 2 119 119 6 HSU Meng Hsiang JU Teresa L YEN Chia Hui CHANG Chun Ming Knowledge Sharing Behavior in Virtual Com munities The Relationship Between Trust Self efficacy and Outcome Expectations J International Journal of Hu man Computer Studies 2007 65 2 153 169 7Davies John Duke Alistair Sure York OntoShare An Ontology based Knowledge Sharing System for Virtual Com munities of Practice J Journal of Universal Computer Sci ence 2004 10 3 262 283 8 Gloor A Peter Zhao Yan Analyzing Actors and Their Dis cussion Topics by Semantic
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财务信息保密及第三方审计协议
- 智能办公系统与办公室装修一体化项目合同
- 收养协议书范本范文
- 卖公司协议书范本
- 研发中心场地租赁保证金技术转移转化协议
- 创业公司财务总监股权分配及风险控制聘用合同
- 河道渣土清运协议书范本
- 美国出口货物货运代理合同范本
- 机场扩建征地拆迁补偿协议书
- 企业并购重组税务处理与咨询服务合同
- 中国传统礼仪全课件
- 新北师大版七年级下册生物教案全册
- 馈线自动化-集中型馈线自动化(配电自动化)
- 《胆肠吻合技术》课件
- 围手术期患者疼痛管理课件
- 2024年度-2025年度XX村第三轮土地延包工作总结
- 2025年江苏新海连发展集团有限公司招聘笔试参考题库含答案解析
- 低碳航空器结构设计-深度研究
- 双重预防机制建设方案
- 2025山东产权交易中心招聘21人易考易错模拟试题(共500题)试卷后附参考答案
- 《煤矿运输系统课件》课件
评论
0/150
提交评论