信息资源管理共词分析.doc_第1页
信息资源管理共词分析.doc_第2页
信息资源管理共词分析.doc_第3页
信息资源管理共词分析.doc_第4页
信息资源管理共词分析.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我国近年来铁路的发展方向基于共词分析1.实验内容改革开放以来,中国铁路发展取得了巨大成就。2005年中国内地铁路营业里程已经达到7.5万公里,其中复线里程2.5万公里,电气化线路2万公里。随着青藏铁路于2005年10月全线建成,今年7月通车运营,铁路将覆盖全国所有省市自治区。2007年4月18日,中国第六次铁路大提速正式展开,CRH1、CRH2、CRH5动车组大规模上线运行,列车运行时速达200 km/h。选择网络数据总库近一段时间,随着李克强总理出访各国,向各国推荐高铁,中国铁路受到世界瞩目。本次实验具体内容包括:(1)文献资源检索。(2)文献处理。(3)文献挖掘。(4)分析我国近年来天路发展方向。(5)总结本实验研究、分析优缺点。2.文献获取与数据收集本实验采用中国学术期刊网(CNKI)全文数据库并选择网络数据总库,时间是20082015年,指定来源为核心刊物,指定主题为“中国铁路发展”,共搜索到500篇文献信息,搜索过程如图1所示。图1 将搜索到的文献数据以自定义的方式,选择“来源库”、“关键词”、“年”、“提名”、“摘要”、“作者”、“发表时间”、“单位”ISSN项目输出,并导出Excel,以便后续处理。原始数据如图2所示。图23.数据处理1)文献数据初步处理经初步筛选,见关键词缺乏、无作者、摘要内容无关、新闻报告以及其它在萌芽等杂志把标的文章全部剔除,并提出摘要,最终剩余359篇主要文献数据,再将数据进行合并汇总,最终汇总如图3所示。图32)关键词处理(1)关键词结构。运用Excel的数据分析功能分列,见关键词进一步处理,处理结果如图4所示。图4(2)关键词筛选。利用Excel的统计功能将所有关键词进行词频统计,获得原始关键词2396个。选择词频不低于7的关键词,筛选出34个关键词作为高频词。其中,关键词“中国铁路发展”词频170次,为最高频次。但鉴于“中国铁路发展”与本研究内容完全重合,在共此分析中难以发挥作用,予以舍弃。关键词太多,工作量太大,因此得到高频关键词19个,如表1所示。序号关键词词频序号关键词词频1中国铁路发展17011铁道部部长132铁路4612高速铁路建设133铁路运输3313动车组列车134铁路建设2914营业里程125运输能力2715高速铁路126铁路干线1716部长刘志军117客运专线建设1517中国铁路108世界铁路1418铁路跨越式发展109客运专线1419改革1010铁路营业里程13表1(3)关键词共词矩阵由于表1中的这些关键词是有关中国铁路发展文献中出现频次较高的词,它们从较大程度上能代表中国当前中国铁路发展的研究热点。为了进一步了解这些词之间的联系,在建立的数据库中对表1中的高频关键词进行两两共词检索,统计它们在359篇文章中同时出现的频率,建立一个19*19的关键词矩阵。部分共词矩阵数据如图5所示。共词矩阵位对称矩阵,主对角线的数据定义为缺失,非主对角线中单元格的数据为两个关键词共同出现的次数。图5(4)关键词相似矩阵由于将要运用的多元统计方法对矩阵的数据结构有不同的要求,为了统计分析的方便,也为了消除频次悬殊造成的影响,将相关矩阵转化为相似矩阵。共词矩阵转化为相似矩阵的具体方法是用Ochiia系数转化成相似矩阵,即将共词矩阵中的每个数字都除以与之相关的量的关键词总频次开房的成绩。此时对角线上的数据表示该词自身的相似程度,经计算均为1,。利用公式进行计算,得到的部分相似矩阵如图6所示。图6相似距震中的数字表明其对应两个关键词之际,数值越大表明关键词之间的距离越近,相似度越好;反之,数值越小表明关键词之间的距离越远,相似度越差。(5)关键词相异矩阵由于相思局真的0值过多,统计时容易造成误差过大,为了方便进一步处理,用1与全部相似矩阵中的数据相减,得到表示两词间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论