基于时序主题关联演化的科学领域前沿探测研究颜端武_第1页
基于时序主题关联演化的科学领域前沿探测研究颜端武_第2页
基于时序主题关联演化的科学领域前沿探测研究颜端武_第3页
基于时序主题关联演化的科学领域前沿探测研究颜端武_第4页
基于时序主题关联演化的科学领域前沿探测研究颜端武_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于时序主题关联演化的科学领域前沿探测研究颜端武 DOI:10.16353/j.ki.1000-7490.2019.07.025情报理论与实践(ITA欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟)颜端武,苏琼,张馨月(南京理工大学经济管理学院信息管理系,江苏南京210094)基于时序主题关联演化的科学领域前沿探测研究*摘要:目的/意义从时序主题演化的角度,构建探测科学领域研究前沿的途径与方法,为科技创新和科研决策提供有效支撑。 方法/过程提出基于时序主题关联演化的前沿探测三阶段模型。 首先将领域文本集合按照时间窗进行划分,利用LDA主题模型生成各个时间窗的研究主题;再通过相邻时间窗主题之间的相似度建立主题关联,设置主题关联过滤规则并对无效主题关联进行剔除;最后,按主题之间的关联关系构建主题演化路径,根据主题路径变化探测科学领域研究前沿。 结果/结论以石墨烯领域中文科技文献为研究案例,进行时序主题关联演化分析,探测出石墨烯纳米复合材料及其应用、石墨烯电极材料研究以及石墨烯光电性能和应用三大研究前沿,验证了方法模型的有效性。 关键词:时序主题演化;科学前沿;相似度;LDA主题模型esearch onFrontier Detection in ScientificField Basedon SequentialTopic AssociationEvolutionAbstract:Purpose/significanceAording to the sequentialevolution ofresearch topics,methods ofresearch frontierdetec-tioninscientific fieldare constructed,which couldbe helpfulto provideeffective supportfor scientificand technologicalinnovationand scientificresearch decision-making.Method/processA three-stage modelof frontierdetection isproposed basedon sequen-tial topic association evolution.Firstly,the domaintext setis dividedaording tothe timewindows,the researchtopics ineachtime windoware generatedby usingthe LDA topic model;then thetopic associationsare establishedby thesimilarity ofadjacenttime windowstopics,and thetopic associationfiltering rulesare setto eliminatethe invalidtopic associations;finally,the topicevolutionpaths arebuilt aordingtothetopic associationrelationships,and theirchanges canbe usedto detectthe researchfron-tiers inthe scientificfield.esult/conclusionTaking theChinese scientificliterature inthe field of grapheneas aresearch case,the sequential topicassociationanalysis isutilized andthree researchfrontiers havebeen detected,including graphenenanopos-ites andtheir applications,graphene electrodematerials,photoelectric propertiesand applicationsof graphene,which verifiedthevalidity ofthe proposedmodel.Keywords:sequentialtopicevolution;scientific frontier;similarity;LDAtopicmodel*本文为江苏省社会科学基金项目“领域知识分析视角下文献知识关联揭示及应用研究”(项目编号:17TQB009),国家社会科学基金重大项目“面向知识创新服务的数据科学理论与方法研究”(项目编号:16ZDA224)和江苏省xx社会公共安全科技协同创新中心的成果。 科学领域前沿是科学研究中的重点,指引着科学发展的方向1。 准确探测科学领域前沿,一方面有助于科研人员和科研机构及时调整科研方向,抓住科学研究契机,实现科研资源的合理配置与均衡使用;同时,国家和行业可以尽早发现领域发展重心,识别领域发展趋势,为制定科技政策和战略规划提供支持。 在科学领域前沿探测方法中,以引文分析为基础的前沿探测方法具有较高的准确性,但由于引文关系的形成需要一定的时间,所以引文探测法不可避免地存在一定的滞后性,使得领域前沿识别的及时性难以得到保障。 基于内容主题的方法一般通过科技文本的词汇特征分析,构建关键词或主题词集合为实现基础,可解决引文方法存在的时间滞后问题。 其中,关键词分析方法主要以单一或若干高频关键词及其词频变化情况分析科学领域研究热点与前沿,存在一定局限性。 主题演化方法能够发现和描述研究主题的新生、成长、分裂、融合、衰退和消亡等过程现象2。 通过对时间线上科学领域研究文献的主题发现和主题关联测算,可构建形成研究主题的时序演化路径,描述科学领域的研究发展过程,从而识别和探测科学领域研究前沿。 1相关研究回顾1)科学前沿的内涵。 美国学者Price3于1965年提出科学前沿的概念,他将科学前沿定义为某一特定研究领域内被科学家频繁引用并且是近期发表的文献集。 以此为基础,围绕引文的前沿概念界定不断得到优化。 Small4441第42卷2019年第7期欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟信息系统参考Price的定义,提出共被引聚类的研究方法,通过该方法对某一特定领域发表时间早且基础性的核心文章进行分析,并以这些核心文章集作为当前活跃的研究领域或领域结构的表示。 Person5将与高共被引文献簇关联的施引文献群作为研究前沿的定义。 Morris6将研究前沿定义为经常被一组固定的、与时间无关的文章引用的一组文献。 伴随着科学研究活动的发展和推进,新的概念术语、研究主题不断涌现和更迭,以科学文献中的词语或主题进行表征的前沿定义逐渐形成。 陈超美等7以科学文献中文本词汇的时间演变为研究对象,将一组在t时刻与新趋势和突变密切相关的词和短语称为研究前沿术语。 陈仕杰8认为前沿是科学研究中最先进、最新、最有发展潜力的研究主题或研究领域。 黄鲁成等9将某一时间段内,研究内容与反映创新性特征的突现主题词密切相关,且学科交叉属性明显的、最新发表的文献集所反映的研究主题定义为研究前沿。 范少萍等10提出研究前沿是具备时间上的新颖性、内容上的创新性、学科交叉性、高关注度特征的一类知识,特别是创新性,是研究前沿应具有的重要特征。 本文从主题演化的角度出发,将新出现的、有发展潜力的研究主题作为研究前沿。 2)科学领域前沿探测方法。 为进行科学前沿的探测和识别,研究人员提出了各种方法和技术。 大体上,可以划分为基于引文的探测方法和基于内容主题的探测方法两大类。 基于引文的方法按照引用类型的不同可以分为同被引、文献耦合以及直接引用三种。 Morris6利用文献耦合的方法生成文献簇,并以文献簇在时间线视图上的分布及簇之间的引用关系揭示研究前沿的存在。 侯剑华等11使用同被引方法,结合CiteSpace识别了国际图书情报领域的研究前沿及其发展演化。 Garfield12利用直接引文网络进行知识图谱领域的研究历程分析和前沿识别。 近年来,Shibata等的团队研究具有代表性。 xx年,该团队对镓化氮、复杂网络和碳纳米管三个领域进行引文聚类分析,比较分析了三种基于引文的前沿探测方法的探测效果13。 xx年,该团队又以太阳能电池为例,通过比较学术论文和专利文献两种数据源的引文聚类文献簇,探测更具商业价值的研究前沿,为前沿探测提供了新视角14。 此外,基于引文的前沿探测仍在进行新的尝试,如学者LiangGuoqiang等15尝试以引用次数(Usage Count)作为新的探测指标来减小时滞性的影响,结果表明该方法相对传统引文方法的前沿识别具有更高的即时性。 Asatani等16则尝试将表示学习方法应用于引文网络,通过引文网络的增长方向来探测科学领域的研究发展趋势。 基于内容主题的方法以文本词汇特征为依据,主要有基于词频、基于共词和基于主题三种。 Kleinberg17提出突发词检测算法,根据关键词汇的突现来判定新兴研究主题的产生,为基于词频的科学前沿探测方法提供了依据。 Mane等18将该算法用于检测论文集中的高频词,结合共词分析方法识别论文集中的研究前沿。 郑彦宁等19提出研究主题年龄与研究主题关注作者数量两个指标,构建了基于关键词共现的前沿探测方法。 徐路路等20提出基于PLDA概率主题模型和多数据源融合相关性分析的新兴主题探测方法来识别蕴含在多源文本中的新兴前沿,并以石墨烯领域为例进行了实证研究。 总体来看,基于词汇的方法多以单一或若干高频关键词及其词频变化为考察依据,方法实现简便,但其领域主题揭示不够全面,存在主题缺漏的局限。 主题建模方法通过对文档词汇矩阵的语义分解处理,可以更加全面细致地呈现科学领域主题结构和分布情况,从而为前沿探测提供充分依据。 本文从时序主题演化的角度获取领域研究主题并刻画其产生、发展和动态关联的过程,从而实现对前沿主题及其演化路径的探测识别。 3)主题关联方法。 主题关联可以建立起相邻时间窗口中研究主题之间的关联关系,这种关系可用来刻画时间线上的主题演化过程,为前沿探测提供直观依据。 建立主题关联的方法有直接关联法、相似度阈值法、距离阈值法、最大相似度法和主题关联过滤法等21。 楚克明等22通过相似度阈值法关联相邻时间窗的主题来实现演化分析。 胡吉明等23采用距离阈值法,从主题相似度和主题强度两个方面研究主题的演化问题。 以上基于阈值的主题演化研究中,阈值选取对于主题关联建立影响较大,不同阈值所呈现的主题演化结果可能存在较大差异。 秦晓惠等21针对以上不足,提出利用主题关联过滤而非静态阈值设定来确定主题间演化关系,结合肿瘤领域研究文献对该主题关联方法进行了实证检验。 此外,国外学者Jose等24采用相关系数度量主题之间主题强度的相关性,以预测主题演化趋势。 Chen等25用余弦相似度测算主题向量间的相关性,考察了信息检索领域的主题动态演化和主题词汇的语义转移。 本文以上述主题关联方法为基础,对关联过滤规则进行了改进,可实现主题间关联关系更精准的表达。 2基于时序主题关联演化的科学领域前沿探测方法2.1方法流程本文从时序主题演化出发,以时序主题相似度为测算依据,提出基于时序主题关联演化的前沿探测三阶段模型,具体见图1。 541第42卷2019年第7期情报理论与实践(ITA欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟)图1基于时序主题演化的科学领域前沿探测三阶段方法模型阶段一为时序主题生成阶段。 即科技文献数据集的获取与预处理,并利用LDA主题模型对不同时间段(时间窗)文本进行主题生成;阶段二为主题关联过滤阶段,是方法模型的主体部分。 该阶段对生成的时序主题按相似度建立起关联关系,根据关联过滤规则剔除无效主题关联,并将筛选结果以可视化路径的形式进行呈现;阶段三为领域前沿识别阶段。 利用主题演化可视化路径以及领域前沿定义和指标进行前沿探测,识别研究前沿及其内容主题。 2.2建立主题关联1)相似度计算。 要构建不同时间窗口研究主题之间的演化路径,首先需要建立主题之间的关联关系。 通过LDA主题模型生成的不同时间窗口的各个主题相互间独立存在,可通过主题相似度计算形成主题之间的时序关联关系。 本文通过计算相邻时间窗口主题之间的余弦相似度来衡量时序主题间的相似程度:Sim(Tti,Tt+1j)=nk=1p k(Tti)p k(Tt+1j)nk=1p2k(Tti槡)nk=1p2k(Tt+1j槡)其中,Tti为时间窗口t下的主题;Tt+1j为时间窗口t+1下的主题;p(Tti)和p(Tt+1j)分别为Tti和Tt+1j的概率值,在虚线表示所包含的主题不存在图2主题演化关系图主题模型结果中,该概率值即为“主题词”矩阵中的值。 2)建立主题关联。 本文认为主题之间具有前向主题和后向主题两种方向上的关联关系21。 设时间窗口t下的主题为Tti,将时间窗口t+1下的各个主题分别与T ti计算相似度,并按相似度降序排列,将其中相似度最大的某个主题设为Tt+1j,则Tt+1j称为Tti的后向主题,记为:post(Tti)=Tt+1j设时间窗口t+1下的主题为Tt+1j,将时间窗口t下的各个主题分别与Tt+1j计算相似度,并按相似度降序排列,将其中相似度最大的某个主题设为Tti,则Tti称为Tt+1j的前向主题,记为:prior(Tt+1j)=Tti若Tti和Tt+1j存在后向或者前向的关系,则认为Tti和Tt+1j之间可以建立主题关联关系。 2.3主题关联过滤规则在已经建立起的主题关联中,可能存在由于两个主题相似度过低而形成的无效主题关联。 xx年,秦晓慧等21在主题演化研究中提出了剔除无效主题关联的主题关联过滤规则。 本文在上述研究的基础上,对主题关联过滤规则进行了改进,将主题关联的相似度排名做更严格的限定,以进一步精确提炼有效的时序主题关联。 本文采用的关联过滤规则具体如下:1)以上文中所建立起的主题关联为依据,将主题关联的相似度总体均值作为主题关联过滤阈值Y的设定。 如果主题关联的相似度小于阈值Y,那么Tti和Tt+1j之间的主题关联无效;否则,执行规则2)。 2)设时间窗口t下的主题为Tti,时间窗口t+1下的主题为Tt+1j,Tt+1j为Tti的后向主题。 考虑主题之间关系的紧密性与关联强度,当满足以下条件之一,则认为Tti和Tt+1j的关联无效。 将时间窗口t下的主题与主题Tt+1j分别计算相似度并进行排序,Tti排在第S i位,若S i5,即Tti和Tt+1j的相似度排在第5位之后,则T ti和T t+1j之间关联无效。 将时间窗口t下的主题与主题Tt+1j分别计算相似度并进行排序,Tti排在第S i位(2S i5),若存在主题Ttk,其位置S k排在Tti前面,即S kS i,并且Ttk的后向主题不为Tt+1j,则Ttk和Tt+1j之间关联无效。 2.4演化关系判定和前沿探测根据知识进化理论与生命周期理论,主题演化的关系可分为新生、继承、融合、分裂、消亡5种,具体关系见图2。 主题新生即当前主题为新产生的,而在之前的时间窗中并不存在;主题继承即当前主题为上一时间窗对应主题的延续;主题融合即上一时间窗的两个或多个主题合并成当前时间窗的一个新主题;主题分裂即上一时间窗的某个主题在当前时间窗中分裂,形成两个或多个新主题;主题消亡即上一时间窗的某个主题在当前时间窗消失。 本文根据时序主题的演化关系探测研究前沿,将具有新生且连续演化(继承、融合或分裂)关系的主题判定为前沿主题。 641第42卷2019年第7期欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟信息系统3实证研究3.1数据获取与数据预处理3.1.1数据获取本文以石墨烯领域中文科技文献数据进行实证研究。 在KI和万方数据库中,选择高级检索,类型选为期刊,输入检索条件:“主题=石墨烯”,或者“篇名=石墨烯”,或者“关键词=石墨烯”或者“摘要=石墨烯”,剔除报道类、采访类等类别的文章,并删除缺少关键题录信息以及重复的文章,共得到文献5326篇,获取的题录信息包括文献的标题、作者、期刊、年份、关键词、摘要等,年份跨度为xxxx年。 3.1.2数据预处理抽取每篇文档题录信息中的标题、关键词、摘要作为数据清洗的对象。 首先使用HanLP(Han LanguageProcessing,汉语言处理包)中的分词技术进行分词。 并在HanLP内置分词词典的基础上提取每篇文档的关键词作为补充词典,来满足本研究对分词的需求,提高分词效果。 分词之后,根据停用词表过滤掉文本中的标点符号、语气助词、副词、介词或者单汉字等没有实际含义的词汇。 同时,对每个词汇进行词频计算,剔除出现频次小于5的词汇。 为改进以往分词结果中容易失去词汇语义内涵、专业术语识别缺漏的问题,本文还利用术语抽取技术对文本作进一步处理。 专业术语是指由两个或两个以上的单元词组成的专业领域词汇26。 本文利用HanLP工具包提供的基于互信息和左右熵的术语抽取技术实现文本术语抽取,得到专业术语共261个,将这些专业术语一并纳入分词词典,最终得到包含专业术语的实验语料文本分词处理结果。 专业术语抽取的具体过程见图3,考虑专业术语与否的文本分词结果对比见表1。 图3考虑专业术语的文本分词处理过程表1文本分词结果对比(部分)考虑专业术语的分词结果未考虑专业术语的分词结果氧化石墨烯氧化;石墨烯纳米复合材料纳米;复合材料石墨烯薄膜石墨烯;薄膜石墨烯衍生物石墨烯;衍生物碳纳米管碳;纳米管3.2国内石墨烯领域前沿探测分析Small4指出,在科学研究推进中,研究前沿可以有两个方向,第一即独立发展,形成一个新的研究领域;第二即在发展中与其他研究领域产生交互,互相关联,为该领域所影响或吸收。 冯佳27在Small的研究基础上,以生命周期理论为指导,将研究前沿分为新生型、生长型、稳定型、衰退型和退出型。 新生型前沿即两个相邻时间窗口下,出现在当前时间窗口而未出现在上一时间窗口的研究主题;生长型前沿表现为主题规模快速增加,是研究领域内最具价值的研究主题;稳定型前沿特征是在相邻时间窗口下,前沿相关文献数量较高且基本不变。 根据Small和冯佳的研究,前沿具有新出现、有发展潜力的特性。 因此,本文在主题演化视角下,将研究前沿定义为新生并且具有连续演化路径的研究主题。 3.2.1时序主题生成本文采用前离散的方式对主题进行演化分析,即先将全部题录数据按照发表年份离散到各个时间窗口,再分别对各个时间窗口的数据进行主题生成。 由于xx年以前的各年数据量较少,所以本文按照相对均衡的原则,将xxxx年之间的数据作为一个总的集合,xx年之后以一年为间隔将数据进行划分,一共得到6个数据集,各数据集分别包含 671、 577、 780、 928、 1068、1302篇文献。 以主题困惑度作为指标,分别进行6个数据集的主题生成预处理,综合主题数量和困惑度,各数据集的主题数为60时主题模型最优。 设置LDA主题模型相关参数,每个主题下的词数设为5个,迭代次数设为150次,Alpha参数设为0.833(即50/K=50/60),Beta参数设为0.01。 分别对6个数据集进行领域主题生成,得到6个时间窗下各60个主题,见表2。 3.2.2时序主题关联建立以xx年时间窗为例,建立该时间窗中研究主题的前后向关联。 分别测算该时间窗中主题与上一时间窗(xxxx年)和下一时间窗(xx年)主题的相似度,取相似度最大的对应主题作为前向主题或后向主题(见表3)。 表3给出了xx年各个主题的前后向关联关系以及对应的相似度。 如topic0,将其与xx年的各个主题计算相似度,得到最大值3.15E-05,对应的topic41即后向主题;将其与xxxx年的各个主题计算相似度,得到最大值2.26E-05,对应的topic43即前向主题。 建立所有时序主题之间的关联关系后,按照给定的过滤规则对无效的主题关联进行过滤。 处理方式如下。 对于规则1),本文将所有主题关联的相似度均值作为主题关联有效性阈值Y。 通过计算,得到平均相似度为1.13E-04,将每对主题关联的相似度与之一一比较,小于该阈值的则剔除。 如xx年的主题关联中,topic0与后向主题topic41的相似度为3.15E-05(见表3),小于有效性741第42卷2019年第7期情报理论与实践(ITA欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟)表2各时间窗主题生成结果展示年份主题xxxx年xx年xx年xx年xx年xx年topic0元素,氢,分解修饰电极,复合膜,电化学反应,负载,还原氧化石墨烯电流,伏安,响应溶剂,功率,单层石墨烯薄膜,纳米材料,纳米topic1合成,膨胀石墨,聚合晶体,产物,水泥传感器,葡萄糖,电化学传感器模型,石墨烯表面,模拟反应,质量,石墨烯复合射线,衍射,形貌Topic2氧化石墨,石墨,原料剥离,放电,结构薄膜,单层石墨烯,太赫兹含量,质量分数,导电含量,有机,颗粒温度,电导率,升高topic3改性,技术,处理材料,硅,对电极荧光,生物,氧化石墨烯反应,场发射,金属薄膜,石墨烯,复合薄膜新型,聚酰亚胺,应用研究topic4纳米,器件,技术SEM,透射,电镜催化剂,催化,Pt结构,三维,类石墨烯催化,反应,氧化化学,生物,有机topic5石墨烯,连续,材料科学石墨烯,石墨烯材料,辐照模型,工艺,动力学还原氧化石墨烯,GO,还原复合材料,混合,GNS石墨烯,生长,衬底注:限于论文篇幅,表中仅显示主题生成部分结果,且用前三个主题词进行主题表征。 表3xx年时间窗中主题关联关系Topic postSim priorSimtopic0topic413.15E-05topic432.26E-05topic1topic521.14E-04topic365.27E-05topic2topic555.23E-05topic352.08E-05topic3topic345.65E-05topic568.83E-05topic4topic511.79E-04topic221.16E-04topic5topic181.32E-04topic32.10E-04注:Topic栏为xx年主题,post栏为xx年主题,prior栏为xxxx年主题,Sim栏为主题相似度。 阈值,则将该主题关联剔除。 在规则1)的过滤基础上继续执行规则2),分别进行两种条件下的规则过滤:对于条件,如xx年topic33,其后向主题为xx年topic18,将topic18与xx年各主题计算相似度,top-ic33排在第6位(见表4),即S335,则判定xx年topic33与xx年topic18的关联关系无效。 表4xx年主题18与xx年各主题相似度排序ank Topic (xx)Similar1topic271.519E-042topic591.517E-043topic371.51E-044topic571.46E-045topic51.32E-046topic331.18E-04对于条件,如xx年topic29,其后向主题为xx年topic39。 经计算排序,得到xx年topic39的前向主题为xx年topic16,说明在xx年的所有主题与xx年topic39的相似度排序中,S16S29,topic29的位置序号大于2,并且xx年topic16的后向主题为xx年的topic40(见表5),不为topic39,则判定xx年topic29与xx年topic39的关联无效。 3.2.3演化路径构建和前沿探测解读经过主题关联过滤,共得到有效主题关联为:xxxx年18对,xx表5部分主题关联关系示例Year Topic Words Topic(post/prior)Words Similarxxtopic16电子,MoS2,空穴topic40(post)石墨烯,sp,热学性能5.17E-04xxtopic29催化剂,催化,合成topic39(post)石墨烯,体系,导电1.77E-04xxtopic39石墨烯,体系,导电topic16(prior)电子,MoS2,空穴4.23E-04年22对,xx年16对,xx年19对,xx年10对。 将主题关联体现的主题演化关系成表格,并转换成软件工具BDP所需的数据格式,绘制出不同时间窗口下主题之间演化路径的桑基图。 利用软件BDP对主题演化路径进行可视化呈现(见图4)。 结合图4中所示的时序主题关联演化,可寻找并最近的三个时间窗中处于新生且连续演化的主题路径有3条。 在这3条演化路径中,共包含了10个主题节点,即可视为国内石墨烯领域的研究前沿,其对应的主题词描述见表6。 这里,重点以第一条演化路径为例进行研究前沿解读。 可以看出,这条演化路径主要涉及石墨烯纳米复合材料及其应用研究。 在演化过程中,xx年时间窗的研究重点为纳米复合材料及其分散性研究;在xx年时间窗中,石墨烯量子点(Graphene QuantumDot,GQDs)作为准零维的纳米材料得到了研究关注,其兼具石墨烯和量子点的性质,具有良好的荧光发光可调和的光学性质,可应用于微纳米电子器件、荧光探针等领域;在xx年时间窗,研究者将纳米材料应用于复合膜的制备,纳米复合膜综合了有机膜与纳米粒子各自的性质优点,可以满足更广泛的需求,成为学者研究的重点。 类似地,第二条演化路径的主要内容为石墨烯作为电极材料的研究。 自xx年起,对石墨烯基复合材料的物理结构和导电性研究使其被当作潜在电极材料; xx、xx年间,石墨烯金属复合材料的制备和电极应用(三841第42卷2019年第7期欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟信息系统图4基于有效主题关联的时序主题演化图表6前沿主题对应的主题描述xxxxxxxxTopic WordsTopic WordsTopicWordsTopic Wordstopic59纳米,纳米复合材料,分散性,杂化材料,化学topic33荧光,量子,石墨烯量子点,分离,GQDstopic45掺杂,分离,复合膜,PVDF,苯topic50性质,石墨烯基,研究石墨烯,方向,光学topic17电极材料,电镜,石墨烯,速率,扫描电镜topic10复合,GO,金属基复合材料,绿色,振荡topic53复合,纳米,TiO2,二氧化钛,三元topic47复合物,TiO2,SEM,XD,XPStopic22电子,显微镜,扫描,透射,SEMtopic55结构,形貌,电池,导电,元素元正极材料)得到了进一步关注。 第三条演化路径的研究主要围绕石墨烯光电性能及应用展开。 xx年和xx年主要涉及二氧化钛等石墨烯基金属氧化物及其光电特性研究,通过SEM(扫描电子显微镜)的应用,进行石墨烯XD(X射线衍射图谱)和XPS(X射线光电子能谱分析)研究;xx年,石墨烯光电性能研究逐步衍生至石墨烯电池,包括结构、形貌等物理性质及导电性能等方面的电池技术研究。 4结论本文以石墨烯领域xxxx年间的中文科技期刊文献数据为研究对象,从时序主题演化的角度,提出了基于时序主题关联演化的科学领域前沿探测三阶段模型。 通过文本数据预处理、主题生成、主题关联建立、主题关联过滤、演化路径构建等步骤,探测出石墨烯领域的10个前沿主题及其形成的3条演化路径。 基于时序主题演化的前沿探测方法可以抽取并较为清晰地描绘科学领域的前沿主题及其在时间线上的动态演化路径,使得探测出的前沿信息更加具有可读性,有助于研究人员对于前沿主题的发展方向与趋势作进一步的解读与判断。 本文不足之处在于所使用的研究数据为石墨烯领域的中文科技文献,未能对该领域外文科技文献进行实证和比较,所得到的结论主要是国内石墨烯研究的前沿主题及其演化。 后续研究中,要对前沿主题及其演化关联测算作进一步优化,同时,可针对石墨烯领域外文文献作进一步实证和国内外比较。 参考文献1冯佳,张云秋.基于LDA和本体的科学前沿识别与分析方法研究J情报理论与实践,xx,40 (8):49-54.2刘自强,岳丽欣,王效岳,白如江.主题演化视角下的国际情报学研究热点与前沿分析J图书馆,xx (3):14-22.3PICE D.Networks ofscientific papersJScience,1965,149:510-515.4SMALL H.Co-citation inthe scientificliterature:a newmeas-ure ofthe relationshipbetween twodocumentsJJournal ofthe American Society for Information Science,1973,24 (4):265-269.5PESSON O.The intellectualbase andresearch frontsof JASIS19861990JJournal ofthe AmericanSociety forinforma-tionScience,1994,45 (1):31-38.6MOIS S.Time linevisualization ofresearch frontsJJournal ofthe AmericanSociety forInformation ScienceandTechnology,xx,54 (5):413-422.7陈超美,陈悦,侯剑华.CiteSpace II:科学文献中新趋势与新动态的识别与可视化J情报学报,xx,28941第42卷2019年第7期情报理论与实践(ITA欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟) (3):401-421.8陈仕吉.科学研究前沿探测方法综述J现代图书情报技术,xx (9):28-33.9吴菲菲,杨梓,黄鲁成.基于创新性和学科交叉性的研究前沿探测模型以智能材料领域研究前沿探测为例J科学学研究,xx,33 (1):11-20.10范少萍,安新颖,倪萍.基于文献的研究前沿特征与识别方法研究J情报工程,xx,3 (1):56-65.11侯剑华,杨秀财,周莉娟,国际图书情报领域研究的前沿主题及其演化趋势分析J图书情报工作,xx,60 (13):82-90.12GAFIELD E.Historiographic mappingof knowledgedomainsliteratureJJournal ofInformation Science(S01655515),xx,30 (2):119-145.13SHIBATA N,KAJIKAWA Y,TAKEDA Y,et alCompara-tive studyon methodsof detectingresearch frontsusing differenttypesof citationJJournal oftheAmericanSocietyforIn-formation Scienceand technology,xx,60 (3):571-580.14SHIBATA N,KAJIKAWA Y,SAKATA I.Detecting potentialtechnologicalfronts byparing scientificpapers andpatentsJForesig

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论