



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
收稿日期 2013 04 08 作者简介 刘玉博 1983 男 博士 馆员 0引言 随着社会信息化的推进和网络应用的日益广 泛 信息源越来越庞大 人们对于大型数据甚至海量 数据的存储 传输 检索及分类等需求日益迫切 在 激增的数据背后 隐藏着许多重要的信息 人们希望 能够对其进行更高层次的分析 以便更好地利用这 些数据 对科学学科本身进行可视化研究属于科学 计量学的一个重要研究范畴 科学计量学的研究方 法是对科学学科进行定量研究的最基本 最成熟的 方法 1 科学知识图谱是在信息技术的推动下 新近 发展起来的一个新领域 当前已经成为科学计量学 的一个新热点 借助科学知识图谱 人们可以透视庞 大的知识体系中各个领域的结构 理顺当代知识大 爆炸形成的复杂知识网络 预测科学技术知识前沿 发展的最新态势 2 植物科学是一门基础理论学科 它的任务是研 究植物客观存在的自然规律 早在17世纪初期对植 物的研究就已经形成了比较系统的理论与学说 20 世纪特别是50年代以来 植物科学又有了飞速发 展 主要是植物生理学 生物化学和遗传学等的成 就 使植物科学在经济上更为重要 成为农业 园艺 学和环境科学的重要理论基础 美国的 植物细胞 The Plant Cell 杂志是由美 国植物生物学家学会出版的生命科学领域著名学术 刊物 在SCI植物类非评论性杂志中排名第一 植 物细胞 创刊于1989年 其文章主要集中在植物激 素 植物抗逆 植物发育及信号转导等方面 引领着 植物分子生物学的研究方向 本文利用科学可视化图谱分析软件CiteSpace II对 植物细胞 杂志历年来发表的文献进行处理和 分析 绘制出知识图谱 并对知识图谱所显示的演化 路径和研究前沿进行解读 旨在全面把握植物科学 领域发展的动态过程 特点和规律 1研究方法及数据来源 1 1研究方法 知识图谱 Mapping Knowledge Domain 是一种 新近兴起的 将科学计量学 统计学 机器学习 计算 机图形学等综合起来的科学研究方法 它把科学文 献之间的关系建立在统计学基础之上 然后以可视 化的图形直观地反映出来 对于发现和解释科学文 献中潜在的和隐藏的规律或学科演化路径发挥了重 要作用 3 基于 CiteSpace II 的植物科学 知识图谱可视化分析 刘玉博 山东农业大学图书馆山东泰安271018 摘要 以Web of Science数据库中 植物细胞 杂志自1989年创刊号到2012年底的所有文献作为研究对象 运用CiteS pace II软件进行文献共引分析和共词分析 以知识可视化图谱方式展现20多年来植物科学领域的研究机构 知识基础 研究热 点及研究前沿 关键词 植物细胞 科学知识图谱 可视化分析 CiteSpace II 中图分类号 G250 252文献标识码 Adoi 10 3969 j issn 1005 8095 2013 11 005 CiteSpace II based Visualized Analysis on Knowledge Mapping of Plant Science Liu Yubo Library of Shandong Agricultural University Tai an Shandong 271018 Abstract The paper takes all documents in the magazine of the Plant Cell in Web of Science database from the initial issue in 1989 to the end of 2012 as the research object and uses CiteSpace II to do co citation analysis and co word analysis to show the re search institutions knowledge foundation research hotspots and frontiers in the fields of biology and plant science in recent over 20 years with knowledge visualization mapping Keywords the Plant Cell scientific knowledge mapping visualized analysis CiteSpace II 2013年11月 NOV 2013 情报探索 Information Research 第11期 总193期 No 11 Serial No 193 17 知识图谱由两个基本且相互关联的方面组成 结构化的建模和图形化的表示 根据不同的原理 有 多种方法可以绘制出科学知识图谱 美籍华裔学者 陈超美博士设计免费的CiteSpace II软件是众多知 识图谱绘制软件中的一种 它把科学文献作为数据 来源 将其转换为几何问题和统计学问题 从而使用 几何图形直观的方法和立足数学的角度 研究其内 在的联系 用来评测某种学科或领域的研究前沿和 研究模式 4 6 1 2数据来源 数据来源为Web of Science http webofknowl Citation Index Expanded SCI EXPANDED 数据库 时间跨度 选择所有年份 输入检索式 SO PLANT CELL 进 行检索 检索出该杂志从1989年创刊到2012年12 月15日共发表文献5477篇 将所有记录每次选择 500条进行输出 全纪录格式并包含引用的参考文 献 另存为纯文本文档 文件命名为download 01 txt download 11 txt备用 下载的数据包括如下字段 author title source citedreferences keywords docu ment type abstract等 2结果与分析 2 1年载文量和影响因子分析 期刊载文量是描述期刊生产能力的基本指标之 一 其定义为在给定时间内 期刊发表的全部论文数 量 从图1可以看出 植物细胞 杂志自创刊以来 刊登的文章量总体趋势是持续增长的 从创刊时 1989年的131篇 到20世纪90年代的200篇左 右 再到2010年的300篇左右 近2年的载文量增 长更快 2012年已经接近370篇 这说明植物科学 领域高水平的研究结果越来越多 影响因子是美国ISI 科学信息研究所 的JCR 期刊引证报告 中的一项指标 是一个国际上通行 的期刊评价指标 即某期刊前2年发表的论文在统 计当年的被引用总次数除以该期刊在前2年内发表 的论文总数 植物细胞 杂志在1990年获得了其第 一个影响因子6 734 这对一个创刊仅2年的杂志来 说是非常令人欣慰的 因为 植物细胞 杂志自创刊 伊始 就要求文章必须具有创新性和系统性 审稿人 也异常严谨 之后 植物细胞 的影响因子曲折攀升 1998年达到了最高的11 757 载文量和影响因子同 步上升 这是杂志飞速发展的时期 1999 2005年杂 志的影响因子相对稳定 2006年开始出现下降趋 势 这可能与2004年后载文量明显增加有关 2 2国家和研究机构发文量分析 安装好Java运行环境 启动并运行CiteSpace II 软件 版本号v 2 2 R7 设置好相应的数据来源目录 和项目目录 CiteSpace II可将各国发表的论文数量 及时间以圆圈的大小和颜色直观展示出来 在 CiteSpace II软件界面 网络节点选择国家 Country 和机构 Institution 主题词来源选择文献标题 Ti tle 摘要 Abstract 关键词 Descriptor 和标识符 I dentifiers 数据抽取对象为Top 30 设置时间切片 Years per slice 的值为2 即将1989 2012年分成 12个时段进行处理 运行CiteSpace II 得到 植物细 胞 杂志的国家分布图谱 点击 find cluster 按钮对 国家与研究机构进行聚类分析 图2所示 其中 一 篇 图1载文量和影响因子情况 年份 2013年11月情报探索第11期 总193期 18 个圆圈代表一个节点 也就是一个国家或机构 圆圈 面积代表发文量 细线表示国家或机构间的合作关 系 上方图示不同颜色的色块代表相应的年份 2年 为一个时间切片 从图2各个节点的发文总量来看 美国的文献 贡献率最大 远高于其他国家 占到了总发文量的4 成 其次是德国 英国 日本 法国等 中国排在第6 位 美国发文量如此之高 这与美国雄厚的经济实 力 巨大的科研投入以及高水平的科研人员是分不 开的 其次 欧洲经济发达国家在这一领域的投入和 产出上也是毫不逊色的 尽管中国的产出相对比较 靠前 但是还要继续加强前沿领域的投入 图2中共产生节点100个 连线仅有64条 虽 然生物学的研究近年来合作交流已经非常频繁 但 从整个网络和整个时间跨度来看 美国和德国之间 的连线密切 也就是说两国的合作比较频繁 而其他 国家或研究机构间连线较少 说明绝大部分的Top 30文章都是由同一个国家的作者之间合作完成的 从发文突发性来看 美国和中国是非常突出的 突发性分别达到44 44和41 42 进一步挖掘数据发 现 美国的发文量突增出现在1989 1993年 这是因 为 植物细胞 杂志是由美国植物生物学家学会出版 发行的 杂志创刊初期主要刊载的是美国作者的文 章 而我国的发文突增出现在2007 2012年 说明我 国近5年来在顶尖杂志的发文量出现了迅猛增长 我国的植物科学领域经过一段时间的模仿 学习和 积累后 日前已经进入迅速发展的时期 以同样的方法统计发文机构 由于CiteSpace II 无法识别机构的大小写 对相同机构大小写的数据 进行了手动合并后进行排序 美国的科研机构占了 前10名中的7席 而且全是大学 这说明美国大学 是植物科学研究领域的嚆矢 例如加利福尼亚大学 普渡大学 康奈尔大学等 其他国家英国 中国和法 国各占1席 且都为研究机构 约翰 英纳斯植物科 学研究中心 中国科学院和法国农业科学研究院 中国发文量排在前列的科研机构还有北京大学和中 国农业大学 2 3关键文献分析 共引分析是引文分析的一个重要内容 受到国 内外学者的广泛关注 计算机可视化信息处理软件 是通过直观的动态图像信息处理的方式 显示出专 业领域中出现的交叉学科的复杂现象 从而获得详 尽的前沿科学信息分析结果 这些信息分析的结果 将有助科学家在最短的时间里了解和预测前沿科技 研究动态 有助于在复杂的科研信息中开辟新的未 知领域 提供快速独立科学判断的客观依据 7 绘制共引网络图谱是CiteSpace II展示学科知 识基础与研究前沿的一个重要方法 网络节点选择 文献引用 Cited Reference 其他选择策略不变 运 行CiteSpace II 得到文献共引聚类的合并网络 如 图3所示 点击时间序列 Timeline 按钮并确认 得 到文献的文献时间序列图谱 如图4所示 其中共 有节点178个 连线406条 同时将数据导出 统计 植物细胞 杂志24年来的共引频次 从中可以分析 植物科学领域整个过程中起到关键作用的文献 植物细胞 杂志历年来引用次数最多的文献是 Clough SJ和Bent AF发表在1998年 植物杂志 Plant Journal 上题为 Floral dip a simplified method for Agrobacterium mediated transformation of Ara bidopsis thaliana 的文章 共引用达到696次之多 图2国家与科研机构的聚类图谱 图3文献共引聚类图谱 图4文献时间序列图谱 第11期 总193期 刘玉博 基于CiteSpace II的植物科学知识图谱可视化分析2013年11月 19 这篇文献开创了用农杆菌介导的拟南芥花序浸染法 进行转基因的方法 拟南芥是典型的模式植物 广泛 用于植物遗传学 发育生物学和分子生物学的研究 花序浸染法通过拟南芥的花器官进行转化 通过抗 性筛选可以直接获得转基因种子 不需要经过组织 培养的过程 其优点是育种周期短 操作简单和转化 率高 花序浸染法的发明大大加快了植物分子生物 学的发展 这篇文献可以说是现代植物生物学的奠 基之作 引用频次居次位的是Murashige T和Skoog F 于1962年发表在 植物生理学 Physiol Plantarum 杂志上的题为 A revised medium for rapid growth and bioassays with tobacco cultures 的文章 共引用了 567次 MS培养基是为烟草细胞培养设计的 是较 稳定的离子平衡溶液 而且养分的数量和比例合适 能满足植物细胞的营养和生理需要 因而适用范围 比较广 后来多数植物组织培养快速繁殖用它作为 基本培养基 基于此 这种培养基就用他们俩名字的 首字母组合来命名了 引用434次的是一本题为 Molecular Cloning A Laboratory Manual 的实验手册 由Sambrook J和 Russell DW于1989年合作出版 书中系统介绍了分 子克隆的是实验方法和步骤 以其无可匹敌的声誉 在近20年的时间里一直被作为分子生物学实验的 经典参考书 该书具有先进性 实用性 权威性的特 点 是生命科学实验室内当之无愧的 圣经 Jefferson RA Kavanagh TA和Bevan MW合 作 发表在1987年 欧洲分子生物学学会杂志 EMBO Journal 上的题为 GUS fusions beta glucuronidase as a sensitive and versatile gene fusion marker in higher plants 的文章 被引用了343次 文中介绍了GUS 基因标记技术 其具有简便 实用 快速 准确 原位 直观的特点 后来被广泛地应用于分析高等植物的 基因表达情况 是现代植物生物学的又一篇奠基文 献 2003年发表在国际顶级杂志 科学 Science 上的文章 Genome Wide Insertional Mutagenesis of Arabidopsis thaliana 在短短不到10年的时间里就 被引用了326次 此文由包括Alonso JM在内的近 40名作者共同完成 运用T DNA插入突变技术获 得了模式植物拟南芥的超过225 000种突变体 也 就是大名鼎鼎的SALK突变体库 并无偿提供给全球 的研究者使用 无数拟南芥的基因功能因此被发现 Laemmli UK于1970年发表在国际顶级杂志 自然 Nature 上的文章 Cleavage of Structural Pro teins during the Assembly of the Head of Bacterio phage T4 被引用了297次 文章用凝胶电泳的方 法分离了T4噬菌体头部的蛋白质组成 后来这种方 法被广泛用于分子生物学 遗传学和生物化学等领 域 并为蛋白质组学的发展奠定了基础 2 4前沿文献分析 CiteSpace II可以生成强调研究前沿和其知识 基础间的顺时模式时区视图 时区视图是由一系列 表示时区的条形区域组成 时区按时间顺序从左到 右排列 因而研究前沿指向知识基础 图5右上角显示的是由一组最新热点研究文献 构成的研究前沿 它代表着一个研究领域的思想现 状 从该图可以看到图书馆学最近几年的发展脉络 以及研究前沿与知识基础之间千丝万缕的联系 这 些构成植物科学领域研究前沿的文献节中 最突出 的就是前面介绍过的2003年Alonso JM等人发表 在 自然 上关于拟南芥插入突变体的文章 正是由 于该文的发表 突变体被大量用于拟南芥基因功能 的研究 并获得了很多突破性的研究进展 另一篇突 出的前沿节点文献是由Birnbaum K等人发表在 科 学 上 题为 A gene expression map of the Arabidop sis root 的文章 被引用了51次 文章用基因芯片的 方法分析了拟南芥根部超过22 000个基因的表达 情况 并发现基因的表达模式突破了传统的生理区 域而呈现对多种激素的响应 另一篇文献是Zim mermann P等人发表在2004年 植物生理学 Plant Physiology 上的 GENEVESTIGATOR Arabidopsis Microarray Database and Analysis Toolbox 被引用了 115次 文章介绍了一种集合了大量基因芯片数据 的数据库 并且允许用户在数据库中检索基因在特 定条件下的表达情况 不难发现 这3篇前沿节点文 献都是与基因组学相关的 基因的表达情况被大量 的分析 并为后来的研究者提供了基础和便利 成为 近10年来被引用最频繁的节点文献 2 5研究热点及前沿分析 图5研究前沿的时区视图 2013年11月情报探索第11期 总193期 20 利用文献题录中的关键词 并借助CiteSpace II 软件 来确定文献计量学研究的热点领域 关键词是 作者对于文章核心的概括和精炼 是一篇文章的精 髓 因此对文章的关键词进行分析 频次高的关键词 常被用来确定一个研究领域的热点问题 网络节点 仅选择关键词 Keyword 其他策略不变 CiteSpace II可以通过时区视图来呈现关键词随时间的变化 以此来分析研究热点的变迁 如图6所示 结合统计数据可以看出 植物细胞 杂志中使 用最多的关键词是 拟南芥 在整个网络中出现频 次是850次 突发性也是最高的 足见拟南芥作为 模式植物 对整个植物生物学的巨大贡献 其次是 分别被使用605次和457次的 基因表达 和 蛋白 质 基因和蛋白质水平的研究是现代植物学 也就 是植物分子生物学 的核心 基因和蛋白质的功能揭 示了植物发育的本质 转录因子 作为关键词的使 用也是十分频繁的 突发性也比较高 转录因子与蛋 白质调控基因的表达相关 是前面两个关键词的延 续 信号转导 涉及植物生长发育的各个阶段 近年 来也逐渐成为研究的热点 转基因植物和野生型作 为一对密切相关的关键词 通过转基因植物和野生 型的对照发现基因的功能是植物生物学中最常用的 研究手段 从图6中可以看出 2005年以后 植物细胞 杂 志中许多关键词变得很突出 例如植物发育 转录因 子 基因家族 功能分析 体外 分化等 说明与这些 关键词相关的研究领域变得越来越热门 也是植物 生物学的研究前沿 CiteSpace II软件中提供的突发词探测 burst detection 技术和算法 通过考察词频的时间分布 将 其中频次变化率高的词 burst term 从大量的主题词 中探测出来 依靠词频的变动趋势 而不仅仅是频次 的高低 来确定文献计量学的前沿领域和发展趋势 在CiteSpace II中选择名词短语 no
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年城市地下综合管廊专项债券资金申请项目效益分析报告
- 2025年尾矿综合利用技术突破与生态修复技术合作模式报告
- 2025年工业互联网平台IPv6技术升级智能工厂部署实施报告
- 2025年建筑保温材料行业技术创新与知识产权保护报告
- 2025年多式联运信息平台绿色物流实现路径研究报告
- 人才评鉴考试题及答案
- 社会工程学防范-洞察及研究
- 用户行为分析算法-洞察及研究
- 模特女装买卖合同范本
- 酒水区县发货合同范本
- 中国银行公积金贷款合同
- 高速安全行驶
- 分层审核表-(第一层)
- 二手车评估协议书
- 2025行政执法证考试必考题库(含答案)
- 47届世赛江苏省选拔赛轨道车辆技术项目技术工作文件v1.1
- 全国中小学“学宪法、讲宪法”知识素养竞赛题库及答案
- 2024年秋新冀教版三年级上册英语全册教学课件(新版教材)
- 第1-2课时Listening Speaking Unit 2 Transportation-课件 -【中职专用】高一学年英语同步课堂(高教版2023修订版·基础模块1)
- 十四年抗战史
- CJJT 164-2011 盾构隧道管片质量检测技术标准
评论
0/150
提交评论