网络舆情危机预警指标体系研究_第1页
网络舆情危机预警指标体系研究_第2页
网络舆情危机预警指标体系研究_第3页
网络舆情危机预警指标体系研究_第4页
网络舆情危机预警指标体系研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络舆情危机预警指标体系研究

0传统舆情危机预警手段的不足,导致政府形象恶化现在是社会的重要阶段。网络上关于人们现实的利益冲突、各种想想观念、社会心理状态和社情民意的讨论最为集中。一些事情,无论大小,只要具有某种敏感特质,均会迅速形成网络舆情,进而产生巨大的舆情影响力。在某些敏感问题上,由于政府应对不及时或者不妥当,往往陷于被动,导致局部问题全局化,简单问题复杂化,严重影响了政府的工作重心,极大地损坏了政府的形象。如厦门PX事件、重庆“钉子户”事件、山西黑砖窑事件、三聚氰胺事件、周老虎事件、乌鲁木齐“7.5”事件、“躲猫猫”事件、杭州飚车案、郭美美事件、“7.23”动车事件等为代表的一系列网络事件,这些事件在真相大白之前,已经造成了恶劣的社会影响。英国著名危机管理专家麦克尔·里杰斯特曾在《危机管理》一书中明确指出,“不管对危机的警戒和准备是自发的,还是法律所要求的,危机管理的关键是危机预防,预防是解决危机最好的方法。”这已被各国处理危机的实践所证明。对于政府来讲,如果因为缺乏必要的网络舆情危机预警手段而任由负面信息的肆意传播,这会影响到政府的公信力和权威性。因此有必要构筑网络舆情危机预警系统,及时捕捉网络舆情危机征兆,并加以分析、处理和公告,制订危机预防措施,以争取最大限度地控制、化解和消除网络舆情危机。1国内外网络舆情预警的研究现状网络舆情危机是针对某一特殊刺激事项所产生的涉及民众利益较深较广的舆情,在相对短时间内生成大量信息,并在一个网络社区或更大范围内民众中掀起范围更大、强度更强的社会反映,最终与事项刺激方或事项本身形成激烈的认识或观点对抗。网络舆情危机预警是指从危机事件的征兆出现到危机开始造成可感知的损失这段时间内,化解和应对危机所采取的必要、有效行动。网络舆情的随机性使其难以被准确预测,但是网络舆情是一种客观的存在,有其酝酿、发展、爆发、变化、消散的规律。同时,信息技术的快速发展和统计理论的不断完善,为人们预测网络舆情危机提供了技术保障,因此,对网络舆情危机做出比较准确的预警是具有现实的可能性的。国外对网络舆情预警的研究比国内早,从1973年开始,欧盟就一直监测其成员国的舆论情况,为其制定决策提供依据。AntioineNaud等人将文本主题聚类算法应用于网络舆情预警过程中的话语倾向性分析;Gil-Garcia利用动态层次文本聚类法挖掘网络舆情预警过程中的热点话题;CarolinKaiser等人将模糊神经网络模型用于公司产品市场销售状态的预警问题,为销售人员处理市场危机问题提供参考意见。总体而言,国外对于网络舆情预警的研究已经比较成熟,许多研究成果已经应用或者进入政府决策参考。国内对网络舆情危机的研究还处于起步阶段,研究的内容主要有网络舆情危机的概念、预警的方法、预警的机制和预警的利用等方面。在网络舆情危机预警方法方面,薛圈圈将标准的BP神经网络模型用于网络舆情危机预警研究;王铁套等用模糊综合评价法量化舆情指标并进行预警;周耀明等基于云模型实现了预警指标到威胁状态的转换,并将当前威胁状态与潜在威胁趋势进行融合评估,得到预警等级;董坚峰将Web挖掘技术引入到突发事件网络舆情预警中,构建了基于Web挖掘的突发事件网络舆情预警系统模型。在网络舆情危机预警机制方面,徐学峰等人利用层次分析法和系统动力学理论建立了网络舆情预警机制的系统动力学模型,从定量和定性两个方面对网络舆情预警机制进行研究;陈晨等人宏观地阐述了网络舆情预警研判机制的工作流程和组成要素,构建了由舆情信息挖掘与处理系统、数据库研判分析系统和预警联控处置系统组成的网络舆情预警研判机制;周小情和张梅贞从网络舆情预警工作的内涵出发,提出网络舆情预警定性和定量两种分级标准以及不同级别的响应机制,并进一步分析了建立网络舆情预警机制五大制度化准则。在网络舆情预警利用方面,靳晓婷受导数原理启发,建立了针对政府的负面网络舆情分阶段演化数学模型,并给出了相应的导控策略;WangZhan-ping等将代理技术和元搜索引擎技术相结合来研究高校网络舆情危机的监控,以便实现对高校网络舆情监控信息的智能化和高效化搜索;李建辉等采用AHP的方法构建了企业网络舆情的测度模型,并确立了舆情信息危机预警尺度表,能够直观的为企业提供网络舆情的测度。综上所述,我国在网络舆情预警方面风生水起,已经形成了一批专业研究机构和专家团队,研究的内容既有基本理论的探索也有支撑技术的开发,理论联系实际,将部分研究成果运用于政府、高校和企业的网络舆情危机预警,取得了比较好的效果。但是在网络舆情危机预警方面还存在着许多问题,例如低水平的重复研究较多,学者之间的合作研究较少,偏重于理论研究,网络舆情危机预警支撑技术自动化水平有待加强等。以“网络舆情+遗传算法+BP神经网络”为关键词在中国知网进行检索,发现基于BP神经网络的网络舆情危机预警的相关论文只有两篇。一篇是薛圈圈的“基于BP神经网络的网络舆情危机预警研究”,另一篇是张华的“基于优化BP神经网络的微博舆情预测模型研究”。前一篇论文使用的是标准的BP神经网络算法,后一篇使用GSA优化BP神经网络算法,且两篇论文都只对一件网络舆情危机事件进行研究,得出来的结论的普遍性有待商榷。遗传BP神经网络算法已经运用于多个领域的研究中,但是运用于网络舆情危机方面的研究还是非常少的,且本文对五件网络舆情事件展开研究,这五件网络舆情危机事件分别属于官员腐败类、司法执法类、公共卫生类、社会经济类和公共安全类。由此可见,本文的研究还是有别于现有研究的。2网络舆情危机预警的指标体系建立科学、系统、可行的预警指标体系是进行网络舆情危机预警的关键。在网络舆情危机监测及预警指标体系的研究过程中,由于学者的专业背景、研究和观察的角度以及内容侧重点各有不同,所以形成了各具特色的预警指标体系。曾润喜(2010)在向专家发放的74份问卷调查的基础上,利用层次分析法构建了警源、警兆、警情三类因素和现象的网络舆情突发事件预警指标体系。兰月新(2011)基于突发事件网络舆情作用机理和演变规律,构建了网民反应、突发事件信息特性、突发事件事态扩散三个维度的突发事件网络舆情安全评估指标体系。刘毅(2012)利用基于三角模糊数的模糊德尔菲法和模糊层次分析法,在对网络舆情预警指标进行初选的基础上,分别对网络舆情指标进行了再次筛选和权重的确定,得到了面向于某一具体公共事务或热点话题的网络舆情预警指标体系。朱辉和骆公志(2013)构建了由舆情要素、舆情热度和舆情活性3个一级指标、7个二级指标以及14个三级指标共同组成的网络舆情评估的EHA三维指标体系。贺恩锋等(2014)从传播媒体、传播范围、传播速度、情绪倾向程度及相关度等方面对舆情潜在影响力进行探索,构建了网络舆情潜在影响力指标体系并设计潜在影响力计算模型,对探讨网络舆论的潜在影响有一定的现实意义。现有的网络舆情危机预警指标体系几乎涵盖了网络舆情危机的各个方面,理论上讲这些预警指标是可以很好地监测网络舆情危机的发展过程,对网络舆情危机预警的进一步研究具有重大意义。但是这些指标体系也存在着以下一些不足之处:a.部分指标难以评估,例如舆情受众心理承受能力这一指标,即使在心理学实验中都难易度量;b.末级指标冗余度较高,由于导致网络舆情危机的因数众多,如果追求指标体系的全面性,则必将导致指标的重叠;c.不适合计算机自动化处理,许多指标的评分必须通过专家的主观打分获得,这就导致每一次预警都离不开专家的参与,不能实现计算机实时监测的功能;d.缺乏实证研究,一些学者仅仅提出了一个指标体系,而没有以实验来验证其指标的有效性,以至于提出的指标缺乏说服力。在充分考虑了网络舆情危机产生、发展、变化的规律及特点的基础上,综合现有指标体系的优缺点,本文构建了3个一级指标和11个二级指标的网络舆情危机预警的指标体系,如图1所示。在构建指标体系的过程中,力求用最少的预警指标,实现最大的预警效益。同时确保了所有11个二级指标都可以量化计算,以便适合计算机自动化处理。末级指标的数据来源于全球最大中文搜索引擎百度旗下的百度指数和全球最大中文微博新浪微博。其中:◆网络搜索量:该指标用百度指数来表示,百度指数用以反映不同关键词在过去一段时间内网络的曝光率及用户关注度,直接、客观地反映社会热点、网民的兴趣和需求。◆原创微博发布量:指新浪微博用户对某个事件所发布的自己的原创微博。◆转发量:指某条微博被其他用户转发的次数,用户转发该条微博即表示赞同该条微博的看法。◆评论量:指某条微博被其他用户评论的次数,如果某条微博被评论的次数较多,代表该条微博具有较强的吸引力。◆观点倾向度:指用户关于某网络舆情事件的态度倾向,如赞同、中立、反对。该指标主要通过负面微博占全部微博的比率来表示。该比率越大,表示发生网络舆情危机的可能性越大。◆舆情真实性:指某个网络舆情事件的真实性,通过新浪认证用户的微博数占全部微博的比率来表示。因为认证用户对自己的言论真实性负责,不会轻易散布虚假舆情。◆内容直观度:通过带有视频和图片的微博占全部微博的比率来表示,因为《2010年中国互联网舆情分析报告》研究发现,带有突发事件相关图片、视频等直观内容的网络舆情信息,传播扩散更为迅速。◆网络搜索量变化率:如果T1时刻的网络搜索量为Q1,T2时刻的网络搜索量为Q2,则网络搜索量变化率为(Q2-Q1)/(T1-T2)。◆原创微博发布量变化率:如果T1时刻的原创微博发布量为Q1,T2时刻的原创微博发布量为Q2,则原创微博发布量变化率为(Q2-Q1)/(T1-T2)。◆转发量变化率:如果T1时刻的某条微博被转发量为Q1,T2时刻的该条微博被转发量为Q2,则转发量变化率为(Q2-Q1)/(T1-T2)。◆评论量变化率:如果T1时刻的某条微博被评论量为Q1,T2时刻的该条微博被评论量为Q2,则评论量变化率为(Q2-Q1)/(T1-T2)。3基于遗传算法的bp神经网络优化算法影响网络舆情危机预警的因素众多,这些因素之间存在着复杂的非线性关系,传统的预警方法擅长处理线性关系,在处理非线性关系上显得力不从心。BP神经网络是由大量的简单处理元件相互构成的高度并行的非线性系统,以处理非线性问题而著称,被广泛应用于公司财务预警、自然灾害预警、安全生产预警等方面。虽然BP神经网络具有很强的自组织、自学习、自适应和非线性映射能力,但是标准的BP神经网络的误差函数是以Sigmoid函数为自变量的非线性函数,由其构成的连接权值空间是一个存在多个局部极小点的超曲面。利用梯度下降方法进行网络训练时可能会产生“局部极小值”的问题。神经网络对初始权值的选取较为敏感,初始值的改变将影响网络的收敛速度和精度,一旦取值不当,就会引起网络的震荡,同时又极易陷入局部最小值。遗传算法是一种基于自然选择和遗传变异等生物机制的全局搜索和优化算法,能够自适应控制搜索过程以求得最优解,具有高效、并行、全局搜索特点。由于遗传算法在学习、训练能力上远不如BP神经网络,因此本文将BP神经网络和遗传算法有机结合起来,利用遗传算法优化BP神经网络的初始权值和阀值,即首先利用遗传算法的全局搜索性能找到问题最优解所在区域,再利用误差反向传播方法找到其最优解。BP算法一般步骤算法如下:设输入向量为X1,X2,X3,…,Xn;对应的期望输出向量为Y1,Y2,Y3,…,Ym;wij和wjk分别为输入层至隐含层的连接权值和隐含层至输出层的连接权值;n和m分别为输出节点数和输出节点数。a.网络初始化。为连接权值wij、wjk及阀值a、b赋予[-1,+1]区间的随机值。b.计算隐含层输出。根据输入向量X,输入层至隐含层的连接权值wij以及隐含层阀值a,计算隐含层输出H。公式中:l为隐含层节点数;f为隐含层激励函数,本文所选函数为f(x)=1/(1+e-x)c.计算输出层输出。根据隐含层输出H,连接权值wjk和阀值b,计算BP神经网络预测输出C。d.计算误差。根据期望输入Y和网络预测输出C,计算网络预测误差e。e.权值更新。根据网络误差e更新网络连接权值wij,wjk。公式中:i=1,2,3,…,n;j=1,2,3,…,l;k=1,2,3,…,m;η为学习速率。f.阀值更新。根据网络预测误差e更新网络节点阀值啊a,b。g.判断全局误差E是否满足精度要求。若满足,则转至(9),否则继续。h.更新网络次数,若学习次数小于规定的次数,返回(2)。i.结束。利用遗传算法优化BP神经网络的具体步骤如下:a.种群初始化。每个个体均为一个二进制串,由输入层与隐含层连接权值、隐含层阀值、隐含层与输出层连接权值、输出层阀值四部分组成,每个权值和阀值使用Q位二进制编码,将所有权值和阀值的编码连接起来即为一个个体的编码。对于一个具有N个输入层,L个隐含层和M个输出层的3层BP神经网络而言,染色体的长度为b.适应度函数。将预测样本的预测值与期望值的误差矩阵的范数作为目标函数的输出,即适应度函数采用排序的适应度函数:FitnV=ranking(obj),其中obj为目标函数的输出。误差的绝对值和越小,表示网络预测能力越好,但是在遗传算法中,适应度值越大越好。因此,将目标函数的倒数作为适应度函数。c.选择、交叉与变异。采用随机遍历抽样的方式进行选择操作;交叉算子采用最常用的单点交叉算子;变异以一定的概率产生变异基因数,用随机方法选出发生变异的基因。如果所选的基因的编码为1,则变为0;反之,则变为1。、d.重复b和c,直到达到进化代数或者满足误差要求。此时,得到通过遗传算法优化过的BP神经网络的连接权值和阀值。e.将优化后的连接权值和阀值作为BP神经网络的初始权值和阀值。f.进行标准的BP神经网络的训练,直到达到最大训练次数或者满足误差要求,此时,保存神经网络的权值和阀值。g.将通过遗传算法优化后的BP神经网络用于网络舆情危机预警。遗传算法优化BP神经网络的本质就是用个体代表网络的初始权值和阀值,把预测样本的BP神经网络的测试误差的范数作为目标函数的输出,进而计算该个体的适应度值,通过遗传操作寻找最优个体,即最优的BP神经网络初始权值和阀值。4网络模型的建立根据上述介绍的遗传BP神经网络算法基本原理,笔者采用MATLABR2009a编制程序,利用MAT-LAB神经网络工具箱建立网络模型,并将建立的网络模型用于网络舆情危机预警研究。4.1网络舆情危机预警层次不同类型的网络舆情危机事件通常遵循着一个特定的生命周期,曾润喜等人将现有的网络舆情传播阶段划分为三阶段、四阶段、五阶段和六阶段模型。本文采取酝酿期①、爆发期②、缓解期③和消退期④的四阶段模型。根据网络舆情事件的不同阶段,抽取一定数量的样本作为遗传BP神经网络的训练和预测样本。目前并没有标准的网络舆情预警分级体系,因此根据《国家突发公共事件总体应急预案》将预警级别划分为四级:I级(特别严重)、II级(严重)、Ⅲ级(较重)和IV级(一般),分别用1000、0100、0010、0001对应输出的四个预警等级状态。将网络舆情危机等级与网络舆情传播阶段相关联而没有与危机大小直接相关联,原因在于网络舆情具有极强的随机性与复杂性,导致不同事件以及同一事件的不同阶段网络舆情危机的大小难以准确量化,而不少学者对网络舆情生命周期进行定性研究认为,舆情酝酿期,负能量不断积聚,引发舆情危机的可能性较大;舆情爆发期,网民的关注度处于最高水平,酝酿期积聚的负能量集中释放,对社会的危害性最强;舆情缓解期,网民关注度下降,但负能量还处于较高水平;消退期,网民关注度较低且负能量基本释放完。因此本文将舆情酝酿期定为较重级,爆发期定为特别严重级,缓解期定为严重级,消退期定为一般级。依据图1所建立的指标体系,从百度指数和新浪微博抓取了“上海法官集体嫖娼事件”“曾成杰被执行死刑”“黄浦江死猪漂浮事件”“农夫山泉‘质量门’事件”“厦门公交大火事件”5个案例的数据,按照网络舆情事件不同生命周期阶段共36个样本。由于末级指标的量纲不一样,为了方便处理和比较,本文将原始数据进行了[0,1]归一化处理(保留4位小数),标准化后的数据如表1所示。4.2基于lengermart的训练算法a.BP神经网络算法:本文采用3层BP神经网络结构,输入节点数为11,输出节点数为4,隐含层节点数为30,隐含层传递函数为S型函数“tansig”,输出层函数为S函数“logsig”,训练算法采用LevenbergMarquart算法,最大训练次数为1000,训练目标误差为0.01,学习速率为0.05,动量因子为0.9。b.遗传算法:种群大小45,最大遗传代数20,变量的二进制位数10,交叉率0.7,变异率0.01,代沟0.95,权值变化范围[-1,1]。4.3遗传算法优化网络舆情危机预警将样本1、4、7、10、13、16、19、22、25、28、31作为BP神经网络的测试样本,其余样本作为BP神经网络的训练样本。首先利用遗传算法优化BP神经网络的初始权值与阀值,由图2可以看出,经过15代的遗传进化后得到了最佳的初始权值与阀值。其次将最佳初始权值与阀值回带入BP神经网络,得出测试样本的预警结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论