信息可视化在科技监测上的应用.doc_第1页
信息可视化在科技监测上的应用.doc_第2页
信息可视化在科技监测上的应用.doc_第3页
信息可视化在科技监测上的应用.doc_第4页
信息可视化在科技监测上的应用.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息可视化在科技监测上的应用中图分类号:tp3912011年第1期文献标识码:a文章编号:10092552(2011)0l一015003信息可视化在科技监测上的应用李丽萍(邯郸职业技术学院,邯郸056001)摘要:科技监测是科研人员进行科学活动的重要步骤,信息时代的到来,网络科技文献的迅猛增长,庞大的数据量使人们在信息的海洋中迷航.传统的科技监测方法不再能满足新信息时代下科技监测的需要,将信息可视化与科技监测结合起来进行分析研究,探讨传统方法在海量数据的面前地瓶颈问题,从领域研究角度为科研人员提供更好的科技监测方法,使其能够深刻把握海量数据间的内在关联关系.关键词:信息可视化;科技监测;域分析方法applicationofinformationvisualizationintechnologymonitoringliliping(handaninstituteofvocationandtechnology,handan056001,china)abstract:technologymonitoringisthemostimportantpartofdoingscientificresearchforscientists.meanwhile,scientistsfinditishardtogettherightinformationforresearches.thispaperbandstogetherinformationvisualizationandtechnologymonitoringtostudy,tryingtofindabetterideadealingwiththenewproblems.itputsforwordthedomainpointofview,whichoffersanewwaytodowiththetechnologymonitoringinsuchnewcircumstance.thisnewmethodscanhelpreseaehersandscientistsdealwithlargeinformationanddata,andbuildtherelationshipbetweenthem.keywords:informationvisualization;technologymonitoring;domainanalysis1信息可视化和科技监测概述信息可视化(informationvisualization,缩写为infovis或iv),最早出现在1989年美国学会组织的重要国际会议用户界面软件与技术(uist)的报告中,重点研究如何把抽象信息交互地,可视地表示出来.对于信息可视化的概念,众多学者没有一致的说法.通过参考其他学者的观点,作者认为信息可视化的实质是一个从抽象到形象,从一维数据向多维图像的转变过程.所谓科技监测,是指对过去,现在和未来的科学,技术,经济和社会发展所进行的系统研究,在科学技术信息,数据分析的基础上,利用数据挖掘,数据可视化技术,信息萃取,知识发现等信息技术手段,综合国内外各领域专家的战略性智利,对科学技术活动进行动态的监视,测量,分析及评估的方法.把信息可视化技术即:数据获取与数据预处理,一150一数据挖掘与分析,知识展示使用到科技监测上.可以使用搜索技术对sci,spring等数据库,网络知识平台获取各种期刊,专着,专利,报告,专家知识等有益信息,还可附加人工查找的方法到相应机构查询获取数据源.将获取的数据除去无关数据和冗余数据,进行数据清洗,并将过滤后的数据转换成有效形式.选择特定的数据挖掘算法(如技术组自动识别,技术创新指标,自然语言处理和竞争分析,模糊聚类等),在数据库中提取数据模式,并用一定的方法表达成某种易于用户理解的模式.根据某种兴趣度度量,对发现的模式进行价值评定,必要时返回前面处理中的某些步骤以反复提取.将上一阶段所得到的数据集即知识,以可视化的图形或图象展收稿日期:20100926作者简介:李丽萍(1963一),女,教授,工程硕:,现从事科研和教学1:作.示给特定用户,增强视觉感知,用以辅助科学研究,挖掘深层知识.2海量科技文献传统监测方法面临的挑战2.1处理海量的数据能力有限传统的科技监测主要依靠人工统计分析的方法,来挖掘科技文献,数据之间的关系,近年来又有多种第三方软件辅助分析数据,它们在面对海量数据的处理上比较困难.2.2与决策者的交互性不强传统的科技监测方法,所得到的分析结果直接给出决策方案,但是是否真正的满足决策者的需求,这还需要专家人员,系统设计人员和决策者之间不断的反馈与沟通,决策者也应该充分参与到分析与决策的过程中.目前的监测方法多是将决策直接提供给决策者,在专家人员,系统设计人员和决策者之间的交互方面比较困难,使决策者很难理解其所提供的决策.2.3对海量数据间的关联信息揭示有一定困难传统的科技监测方法针对一定量的数据可以揭示其之问的关联信息,但是面对海量的数据信息,对其关联信息的揭示还有一定困难.并且对于数据间的关联信息之间的隐含信息的揭示,传统的科技检测方法就更加困难了.2.4不能很好地满足用户需求传统监测方法的使用者即决策者多为具体领域的专家,但是他们可能对软件本身不甚了解,这样在使用起来用户对决策的认知有一定困难.而且目前用户的信息需求日趋专业化,学科化,期望较为全面的深入了解某一学科领域的多种变化类型,深入获取其内在规律和知识.当然这些无论是传统的人工统计方法还是第三方辅助软件都只是揭示一层表面的数据关系,不能很好满足用户的需求.3信息可视化在科技监测上的应用域分析方法域分析方法以海量科技文献为研究对象,基于信息可视化技术,将海量抽象数据(半结构,非结构化数据)结构化,挖掘和揭示数据之间的各种关联关系,从领域研究角度来揭示数据之问的各种关联关系,从领域研究角度来对海量科技文献进行分析,处理,从而对学科内的科技热点,发展态势进行监测和对未来趋势进行预测.3.1域分析方法的优势(1)能够处理海量文献数据.域分析方法的研究对象即是抽象的海量数据,利用可视化技术能够揭示数据问的内在关系,监测结果更加科学性,客观性.(2)能够挖掘和呈现海量数据内部的隐含信息及相应关联.域分析方法重在研究如何挖掘海量数据间关联关系,以及显性关联关系背后所隐含的相应关联.利用信息可视化映射技术和信息显示技术发现更多不易被人理解的信息.(3)增强交互性和动态性.交互性是信息可视化的基本特性,采用可视化技术建立人机交互界面,增强决策者与系统分析人员,专家人员的沟通.域分析系统可以阶段性的监测学科领域的发展状况,动态地进行科技监测.(4)减弱了传统方法专家主观因素影响.域分析方法在数据采集与预处理,数据挖掘与分析,以及最后的可视化展示每一阶段全部自动化形成,无需专家人员的参与,减弱了专家人员主观因素.(5)对使用者的要求不高.域分析方法最后的知识展现更强调给人以视觉感触,对使用者的计算机技术要求不高.3.2域分析方法的主要步骤根据陈朝美教授多年来对信息可视化域分析的研究成果,可以简要的把域分析方法归为以下9步:(1)识别知识域.尽量广泛的选择词来表示某一个知识域,再从中挑选出特征词即术语,所选择的特征词要可以覆盖这一知识域的所有主要元素.(2)数据采集.用上一步所确定的下的特征词在数据库中检索符合要求的数据,即收集涵盖知识域的数据文献.(3)抽取前沿术语.从上步所收集到的文献,数据中定位所有的特征词,统计特征词在文章的标题,文摘和表述中出现的频率,以来确定哪些词是前沿热点词汇.(4)确定时间片断.进行研究不是针对时间点,应该是某一段时间内的科技动态监测.所以应由用户确定整个时间间隔的范围和单个时间片断的长度.(5)选择起始标准.在可视化的展示知识时允许用户指定特征词的引用数量和共引数量,以及共引文献的数量.它们的起始标准也限定,如citespace2中将指定的限定运用在三个时间片断中,也就是早期片断,中间片断和结束片断.(6)修剪,合并.最后检索统计出来的关联词比较多的时候,根据实际情况删除不必要的词,适当的合并一些关联词.一1l(7)视图呈现.确定最终以怎样的方式来呈现结果.例如citespace2中用了一个标准的图表视图和一个时区视图来显示结果.(8)可视特征检查.就指定知识领域的信息用户可以和可视化系统进行交互,用户可以自主地控制算法和参数,控制可视的特征显示.(9)检验拐点.这是重要的一步,需要学科领域专家对相关度高的特征词即节点或拐点进行分析检验,这个拐点有可能就是这一学科领域的未来研究热点和发展方向,系统应该具备自动统计拐点的值的功能.这一步应该尽可能的反复检验.从目前的研究来看,可视化的数据挖掘域分析方法能够较为满意的解决现在的问题,并且在域分析方面也有了一些可喜的成就,但是笔者在参阅了多方文献后,认为还有以下需解决的问题:第一,可视化对象.系统是否可以处理多种数据格式的能力.vxlnsight,inspire等大多数的系统可以处理txt文本数据和html,xml等数据格式,但是其他的数据格式需要人工转化才可以进行.不仅给研究带来了麻烦,而且限制了部分数据,如图片格式的数据.第二,分析力度不够.很多系统的数据处理对象仅限于引文文献,没有深入文献的内部主题及核心问题,在数据的挖掘深度上还是不够.第三,系统不易学习.现在大部分的域分析系统需学习后才能掌握使用,而且有的系统非常的复杂但又缺少帮助信息,这对于非计算机领域的用户(上接第149页)人为主,凭以往的经验判断往往会走人误区.应该更多的借助仪器仪表的科技手段来分析解决问题.图2小学周边测试频谱(1)使用直放站作为实现小容量,大覆盖目一152一来说,也是一个不小的挑战.因此如何曾强界面的可理解性,友好性,是我们研究人员在研发系统时需要考虑的问题.目前,对于这一领域国外将研究重点深人到采用多种不同的引用模式,例如共着作者关系,作者共引关系,来改进系统对文献之间的关系进行分析.我国在域分析研究方面还处于对国外研究的追踪阶段.希望本文能够引起业内学者的广泛关注,共同探讨域分析领域的问题,推动我国科学研究的进步.参考文献:1soso百科eb/ol.http:/baike.soso.com/v7337339.htm.20091228.2刘凯.信息可视化概念的深入探讨j.情报杂志,2004,12:1.3周宁,张弛,张会平.信息可视化与知识检索系统设计j.情报科学,2006,4:1.4张海营.信息可视化刍议j.科学情报开发与经济,2005,15(8):12.5朱东华,袁军鹏.基于数据挖掘的科技监测方法研究j.管理工程,20o4(4):3.6汪雪峰,朱东华,胡望斌.促进技术监测在政府科研管理中的应用j.科研管理,2006,5:1.7朱东华,袁军鹏.技术监测指标及其实证分析j.科学学研究,2003(8):12.8吴茵茵.文献计量学方法在网络计量学应用中的局限性j.情报资料工作,2004,4:23.9百度百科eb/ol./view/40540.htm?fr=alao一1,2009,4.10刘国栋,罗长坤,吴培红.科学计量学的研究现状及发展趋势j.中华医学科研管理杂志,2005(6):34.责任编辑:刘新影标的必要手段之一,主要是由于使用直放站一是在不增加基站数量的前提下保证网络覆盖,二是其造价远远低于有同样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论