(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf_第1页
(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf_第2页
(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf_第3页
(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf_第4页
(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(计算机应用技术专业论文)bbs中的突发舆情分析与预测模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重庞查g 电太堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 夺力涛签字日期:弘唧年尹月2 乙日 学位论文版权使用授权书 本学位论文作者完全了解 重麽自鱼太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权重迭邮鱼太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 筇夕涛 导师签名: 签字日期: ( 听年争月2 2 日签字日期:卯叩年 月二2 日 重庆邮电大学硕士论文摘要 摘要 b b s 是网络舆情产生和传播的主要场所之一,由于手段的匮乏,预测和引导 b b s 舆情的研究工作仍处于探索阶段。现有工作对论坛数据分析不足,已有模型 也仅能从日增回帖数和个人发言数比例这两个重要统计指标中的某一个来试图说 明其模型的有效性,而事实上它们需要同时具备,因此其结果缺乏说服力。 本文对b b s 中的突发舆情的行为进行了分析,并建立了b b s 舆情预测模型。 首先,对从论坛上采集到的热门事件数据进行了详细的数学分析、横向对比, 话题涵盖公共安全、司法事件、经济生活等内容,得到各类事件日增回帖数的变 化规律和个人发言数比例的分布规律。 此外,考虑到网络舆情具有突现性的特点,以突现计算的观点将发帖人抽象 成a g e n t ,根据网民行为特征和计划行为理论,结合已有的研究工作,设定a g e n t 的参数和交互规则,在此基础上利用小世界网络建立了b b s 舆情预测模型。然后, 对论坛中的热点事件进行不同参数组合的仿真实验,以实际参与讨论人数和每日 交互次数为输入,以日增回帖数和个人发言数比例为输出,与实际得到的统计指 标进行相似度比较,计算每组参数组合下的平均相关性,从而构建决策表,再利 用粗糙集理论挖掘出一套b b s 舆情预测模型的参数规则。 最后,通过与已有激励模型的对比实验和对舆情事件帖的预测实验,证明了 模型的合理性和有效性。 关键字:b b s 舆情,突现计算,小世界网络,预测模型 重庆邮电大学硕士论文a b s 仃a c t a b s t r a c t b b s ( b u l l e 血b o a r ds y s t e i n ) i so n eo ft l 圮p r 吼a 巧l o c a t i o n s 、) l j r h e r en e t 、阳r k s e i l t i m e n ti sg e n e r a t e da l l db r o a d c 嬲t e d h p w e v b e c a u s eo fm el a c ko fr e s e 删1 m 毹h o d s ,f e wa c l l i e v 锄锄t sh a v eb e e s 讪l i s h e d 锄dw ea r es t i l l e x p l o i t i n gt l l i s d o m 咖i nm ep r e l i n l i i l a 巧p h a s e a tp r e s 咖,f o n 皿d a 协c o u l d i l tb e 锄p l y a 1 1 a l y z e d , 趿dm ev a l i d 时o ft h em o d e li si l l u m i n a t 。db yt w os t a t i s t i c a lp a r 锄e t e r ss 印a r a t e l y w l l i c ha r e 廿1 ed a i l ya d d e dr 印l yp o s t sa n dm e p e r s o n a lp o s tr a t i o h o w e v m e ys h o u l d w ) r kt o g e t h 盯s o ,m ep r e s e n tr e s u l ti sa l w a y sn o ts op 粥u a d a b l e 。 t u 曲m er e s e 础o f b e h 撕o r si nb b ss 饥t i m e n t ,n l i sp 印e rp r o p o s e sab b s se 咖【i m e n tp r e d i c 惦o nm o d e l f i r s t l y t 1 1 eh o te v 饥t sd a t ac 0 l l e c t e d 鲰肋m en e t 、) l ,o r k a r ea n a l y z e d 觚d c o n 乜镪t e di 1 1d e t a i l ,、) l 恤c hc o m 研s ep u b l i cs e c u r i 坝j u d i c a t l 鹏e v 饥t s ,a l l de c o n o m y a c t i v i t i e se t c a sar e s u l t m ec h a l l 百n gm l eo fd a i l ya d d e dr 印l yp o s t s 觚dm e d i s t r i b u t j n gm l eo f p e 瑙o n a lp o s t 硎ot 0e a c hl 【i n do fe v 朗t sw e r ew o f k e do u t i na d 蛳。玛c o i l s i d 醯l g 锄e r g e n c 骼,p e o p l ep o s ti nn e 呐o r ks 胁t i m e n t 刚db e a :b s t r a c t 嬲a g e n t s w i t l lm ep e r s p e c t i v eo fe m e f g e mc o m p u t a :t i o n a c c o r m n gt 0 p e o p l e sb e h a 、,i o u rc h a r a c t 耐s t i c s 觚dp l a i la c t i o n 廿l e 0 锄dt 1 1 ep r c s e n tr e s e a r c hw o r k 觚dc o n 6 9 嘶n gn l ep 猢e t e r s 锄dc o m m 砌c a t i o nr u l e so fa g e n t ,ab b ss e n t i m e n t p r e d i c t i o nm o d e li sp r e s 耐e db yu s i n gm es m a l l - w o r l dn 咖r km e 0 p l t ) ,o f 瞰“a t i o n a le x p e r i m e n _ t sa r ew o r k e do nm eh o te v e n t sd a t ao f w 池d i 脑e n t p a r a m e t e r sg r o u p t h em l l b e ro fp a i t i e i p a t e dp e r s o n sa n dd a i l yi n t e r a c t i o nf e q u e n c i e s a r ei n p u td a t a 砒l dd a i l ya d d e dr 印1 yp o s t sa n dp e r s o n a lp o s tr a t i oa r e9 0 t 鹬o u t p u td a t a t h e i l t l l e ya r ec o m p a r e dw i n lt 1 1 ea c m a ls t a t i s t i c a li n d e x a n d ,f o re a c hp a r 锄e t e r s 伊o u p ,m em e 趾c 0 仃c - l a t i t ) ri sc o m p u t e dt ob u i l dd e c i s i o nt a b l e a r e rt h a t ,r o u 9 1 1s e t 缸l 。0 r yi su s e dt os e tu pc o n e s p o n m n gp a r a m e t e rn l l e sf o rn l eb b ss e n t i m e i l tp 川i c t i o n n l o d e l f i l l a l l 弘n l 】u 曲c o m p a r i n gw i me x i s 血gm o d e l si l lp r e d i c t i o n so fm es 锄t i m e n t “既t s ,t l l e 姗l t sp r o v em a tm er a _ t i o n a l 毋锄dv a l i d i t yo f 1 cm o d dp r o p o s e di nt h j s p a p 睨 u k e yw o r d s :b b ss 幽e 咄e m e r g e n tc 伽嘶& s m a l l 、釉d dn e 呐。嗽p r e d i c t i o n l n o d e l n i 重庆邮电大学硕士论文目录 目录 摘善墓i a b s t r a c t i i 第一章绪论1 1 1 弓i 言1 1 1 1 什么是网络舆情1 1 1 2b b s 中的舆情特点2 1 2 网络舆情研究背景及意义2 1 3 国内外研究现状3 1 4 本文主要工作及章节安排5 1 4 1 本文主要工作5 1 4 2 章节安排5 第二章网络舆情研究理论基础7 2 1 引言7 2 2 已有的网络舆论激励模型7 2 3 突现计算理论8 2 3 1 突现计算的概念:9 2 3 2 突现计算的特点。9 2 3 3 突现计算模型1 0 2 4 研究方法论1 2 2 5 人类行为研究一1 3 2 6 粗糙集理论一1 4 2 6 1 粗糙集理论简介14 2 6 2 采用粗糙集理论进行数据挖掘的步骤15 2 7 本章小结一1 6 第三章b b s 舆情预测模型研究一1 7 3 1 研究现状分析:17 3 2 本文的工作思路1 7 3 3b b s 数据采集和分析l8 3 3 1b b s 数据采集18 i v 重庆邮电大学硕士论文 目录 3 3 2 数据分析2 l 3 3 3b b s 舆情突现性分析2 5 3 4 建立b b s 舆情预测模型2 5 3 4 1 模型假设与交互规则j 2 5 3 4 2 基于小世界网络的舆情预测算法2 7 3 5 本章小节一2 7 第四章b b s 舆情预测模型参数规则的获取2 8 4 1 引言2 8 4 2 数据源选择以及决策表的建立_ 2 8 4 3 采用粗糙集理论进行规则挖掘31 4 3 1 数据预处理:31 4 3 2 属性约简31 4 3 3 值约简3 2 4 4 本章小结3 5 第五章模型仿真实验与分析3 6 5 1 引言一3 6 5 2b b s 舆情预测模型与已有激励模型的对比实验及分析3 6 5 3b b s 舆情预测模型的预测仿真实验3 7 5 4 本章小结4 7 第六章总结及未来工作4 8 6 1 总结4 8 6 2 未来工作4 8 致谢j 4 9 攻读硕士学位期间从事的主要科研工作及发表的论文5 0 参考文献51 v 重庆邮电大学硕士论文第一章绪论 1 1 引言 第一章绪论 随着互联网的发展,网络媒体被公认为是继报纸、广播、电视之后的“第四 媒体 。媒体是舆情的载体和传播工作,而舆情预警、舆情控制一直是我国政府 关注的重要领域。因此,有关网络舆情的安全性研究成了当前一个热点。 1 1 1 什么是网络舆情 舆情基础理论研究刚刚起步,还很不成熟。综合近年来的研究成果,最具有 代表性的舆情概念可以分为狭义和广义两种。但是以上两种定义各有一定的局限 性。狭义舆情概念定位在民众主体对国家管理者客体的社会政治态度,认为“中 介性社会事项是舆情的刺激物。但是,所谓“中介性社会事项 是否仅仅是舆 情的刺激物? 换言之,舆情客体是否包含“中介性社会事项 ? 引起民众舆情的 社会事项、社会现象并不全是国家管理者权力运行的直接结果( 比如超女、天价 头等引起网上热议的中介事件) 。广义舆情定义注意到以上定义外延过狭的问题, 将舆情扩展到社会客观情况与民众主观意愿,即社情民意。也就是说舆情是情绪、 意见、态度,这是对舆情最基本的认识。 天津社会科学院舆情研究所认为【l 】:舆情是由个人以及各种社会群体构成的公 众,在一定的社会空间内,对自己关心或与自身利益紧密相关的各种公共事务所 持有的多种情绪、态度和意见交错的总和。这一概念的外延相对要宽。公共事务 包括了社会事件、社会热点问题、社会冲突、社会活动,也包括公众人物的所言 所行等等,这些不尽是国家权力运行的直接结果。另外,这一定义界定了舆情与 舆论、民意的主要区别,这是上述两个定义未能做到的,即舆情是多种情绪、态 度和意见交错的总和,往往和某一群体或阶层紧密联系,而并非需要大多数民众 的广泛认同。不过,这种错综复杂很可能会趋向一致,当它被大多数人认同的时 候就会转化成为舆论。 网络舆情的传播是一种通过互联网实现的集体行为,它是依托互联网形成的, 在传播的过程中没有中心控制点,而是由一些感兴趣的网民自发传播,最终形成 网络中的舆情。从目前来看,网络舆情传播的主要途径有电子邮件、新闻组、即 时通讯工具、电子公告板( b b s ) 、博客( b 1 0 蓟和维客( w 越) 等。另外还有一些新的传 播途径走人了人们的视线,例如播客( p o d c a s t ) ,和博客不同,它主要传播的是音频 和视频,可能会在今后形成新的应用热潮。 重庆邮电大学硕士论文第一章绪论 本文将着重针对b b s 中的舆情进行研究,试图揭开其神秘面纱,找到舆情传播 的规律。人际传播或群体传播。 1 1 2b b s 中的舆情特点 突发事件中,在传统的报纸、电视台和通讯社等大众传播媒介进行大规模报 道、直播之前,存在着一个人际传播和群体传播的阶段。一些网民在第一时间通 过即时通讯软件从朋友那里获得的消息或通过浏览别人的个人日志得到的消息转 发在b b s 上,形成最初的议题来源。 媒体间议题设置。媒体间议程设置理论( 砷黝e d i aa g 饥d as e t t i n gt h e o 刚是 d a i l i e l i a n & r c e s e 提出的概念,他们认为,从总体上看来,是印刷媒体引导电视网 的议程,而不是相反。而且“媒介之间议程设置的影响力一般是从纽约时报 流向其它的媒介 。可信度较高的媒介为可信度较低的媒介设置议程,这在传统 媒介之间已是不争的事实。在网络中,这种现象同样存在。随着大众传播媒体大 规模的权威、深度、客观报道的出现,b b s 上的议题的消息来源主要转向传统的报 纸、通讯社或电视台。 b b s 议程设置的一个重要特点就是议题转换迅速,往往一个议题刚开始,就没 有下文了,而另外的议题又迅速出现,甚至有时几个议题同时出现,还有的议题 沉寂了一段时间之后又再次成为讨论的焦点。究其原因有以下几点: 1 事态发生变化:随着事态的发展,问题逐渐清晰,没有新的进展,其中伴 随着讨论焦点由具体到抽象的过程。那些涉及到较抽象的意识形态,意见分歧比 较大的议题往往持续时间比较长。 2 新的事件发生。原有的事件没有新的进展,人们的注意力开始转向新的突 发事件。 3 网络交流缺乏连贯性,信息早到早贴,而不管帖子的指向,使得讨论容易 被打断,除非是热点问题。 1 2 网络舆情研究背景及意义 随着因特网在全球范围内的飞速发展,网络成为反映社会舆情的主要载体之 一。网络环境下的舆情信息的主要来源有:新闻评论、b b s 、聊天室、博客、聚合 新闻( r s s ) ,其中b b s 因其自身特点更成为网络舆情传播的主要集散地。 2 重庆邮电大学硕士论文 第一章绪论 网络的开放性和虚拟性,决定了网络舆情具有以下特点【2 】:1 、直接性,通过 b b s ,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更 加畅通;2 、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种 情绪化的意见,就可以成为点燃一片舆论的导火索;3 、偏差性,由于发言者身份 隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。 在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因 此在网络上更容易出现庸俗、灰色的言论。 与国外相比,我国网络舆情还存在以下特殊情况【2 】:一是由于历史的原因,我 国曾长期处于封闭状态,容易受到外来思想文化的冲击。二是目前我国正处于社 会转型期,不可避免地存在诸多矛盾,容易使一些人出现情绪化冲动,以致不能 明辨是非。三是少数社会管理者对于舆论习惯于回避或堵塞。 因此,网络这把锋利的“双刃剑在提供了下情上达的便捷方式的同时,也 对我国政治安全和文化安全构成了严重威胁,具体表现在以下三个方面:一是西 方国家利用网络对我国进行“西化 、“分化 ,网上思想舆论阵地的争夺战日 趋激烈。二是传统的政治斗争手段,在网上将以更高效的方式实现,利用网络串 联、造谣、煽动将比在现实中容易得多,也隐蔽得多。三是通过网络,西方的观 念、生活方式可以便捷地渗透进来,从而对我国的传统文化造成冲击。 由于网上的信息量十分巨大,仅依靠人工的方法难以应对网上海量信息的收 集和处理,因此,需要加强相关信息技术的研究,形成一套自动化的网络舆情分 析系统,及时应对网络舆情,由被动防堵,化为主动梳理、引导。而在这一过程 中,b b s 成为人们交换信息、热烈讨论的集散地,是舆情产生的主要场所,如最 近国内“奶粉事件”、“哈尔滨警察涉嫌打死人事件”等热点事件在各大b b s 论坛中 都引起了广泛热议。因此,有关b b s 舆情的安全性研究成了当前一个热点。 1 3 国内外研究现状 如何有效地对舆论进行引导? 这是目前网络舆论研究的重点工作。现今,尽 管国内外学者对网络舆情都做了大量研究,但是大部分都是围绕传播学、社会学 以及心理学等角度进行展开,分析手段的限制使得大部分研究仍停留在定性阶段 【卜5 】 o 也有些学者利用某种模型和假设条件来试图模拟舆情产生的过程,如文献 6 针对人际中的舆论传播,利用小世界模型构建人际关系网络拓扑,以此为基础, 通过设计个体的局部相互作用规则,引入个体心理因素和外界媒体影响,提出了 3 重庆邮电大学硕士论文第一章绪论 利用计算机仿真建立舆情传播演化模型的基本思路。他们初步实现了我国某特定 地区舆情传播的模型,并对该模型的构建过程进行了分析,为量化研究舆情传播 这一复杂社会现象提供了有益的探索和思路。这批学者在后续的研究中又分别对 他们的假设条件细化进行深入研究,让我们看到了一个完整的研究思科7 】。其不足 之处是只考虑了传统媒体对舆情的影响,而未考虑网络对舆情的影响,而这一点 是极其重要的。 文献 8 】建立了一个基于元胞自动机的网络舆论激励模型,用于模拟网络舆论 形成过程中个体发表言论数的变化以及个体观点的变化,最后通过日增回帖数来 说明其模型的有效性。该模型将网络空间的个体抽象为以情感描述的元胞,用情 感倾向度和情感倾向度门限来确定元胞发表言论的状态,用情感激励来描述元胞 的移动规则。同时,该模型考虑了个体数量增减和社会突发事件对网络舆论传播 的影响。不足之处是他只针对单个论坛中的已注册用户进行研究,并且不考虑潜 水者对舆情的影响,而这些假设与实际有些脱轨,局限性很大。另外,仅从日增 回帖数来证明其模型有效缺乏说服力。 文献 9 】从统计的角度对b b s 进行了研究,得出个体发言数服从对数正态分布, 并认为个体发帖后再发帖的概率大幅下降,而当所发贴受到回复时则再发帖概率 会有所提高。但其所提出的激励模型也仅能从个人发言数比例来模拟现实情况, 没有应用价值。 文献 1 0 】的研究对象是争论中舆论的形成过程,采用的是两层多智能体模型, 根据的是社会影响理论【l ,其亮点在于引入了突现计算的方法,但他们仅考虑了3 种截然不同的观点,并且考虑的因素太少,不贴近实际,仅能作为理论研究。 另外,目前市场上出现一些相关产品,如方正智思网络舆情分析系统、中讯 数网公司的互联网舆情分析系统以及邦富互联网舆情采集分析系统等,都是基于 文本分析,采用以数学统计为基础的模式识别技术。着眼点是解决信息的智能化 的分类与信息的智能聚类,实现用户的网络舆情监测和新闻专题追踪等信息需求, 形成简报、报告、图表等分析结果,为客户掌握网络舆情动态,做出正确舆论引 导,提供决策分析依据。这种方式仍然属于被动防堵方式,并且愈发庞大的网络 信息量和舆情产生的突现性必将对其性能造成冲击。 由此看出,目前的研究方法无法实现舆情的预测和控制,而突现计算理论的 出现为这一难题的解决带来了希望。突现计算( 又称涌现计算,e m 孵e n t c 伽叩劬g ) 【1 2 。5 】是多a g e n t 系统在处理复杂问题时所展现出来的一种思路逻辑, 通过多个简单模块的相互沟通和协作来突现出更加复杂行为的系统,为复杂网络 动态系统中智能行为的演化提出了一种创新性、前沿解决思路。它的基本思想就 是通过无数个简单行为过程的相互合作来形成更加复杂的过程【1 6 】。b b s 舆情的产生 4 重庆邮电大学硕士论文第一章绪论 过程属于生物的群体行为,它是由无数多个体的态度聚集在一起所构成的一个动 态整体行为,由这种整体行为所表现出来的舆情状况会随环境、时间的变化而变 化,属于突现计算研究的范畴。但是网络舆情的突现现象研究刚刚起步【5 1 ,还存在 很多问题需要我们去深入探讨。 本文将以突现计算的观点对b b s 舆情进行研究,将发帖人抽象成a g 咖,设定 a g e i l t 的参数和交互规则,在此基础上利用小世界网络【l 。攀1 模型建立b b s 舆情预测 模型,试图为b b s 舆情研究开辟新的研究思路。 1 4 本文主要工作及章节安排 1 4 1 本文主要工作 本文的主要工作:一方面抓取论坛数据,对提取到的论坛数据进行数学分析, 得到个人发言数比例和日增回贴数两个重要指标以及各话题的发帖人数等信息; 另一方面对b b s 舆情用突现的观点进行分析,总结其突现特点,然后将发帖人抽 象成a g e n t ,设定a g e n t 的参数和交互规则,在此基础上利用小世界网络建立b b s 舆情预测模型,并利用粗糙集理论挖掘模型中的参数规则,最后对b b s 舆情预测 模型进行了仿真实验,结果表明本文的研究方案是有效可行的。 本论文工作得到9 7 3 计划前期研究专项课题( 2 0 0 8 c b 31 7 1 11 ) 、国家自然科学 基金项目( 6 0 8 7 3 0 7 9 ) 、新世纪优秀人才支持计划、重庆市自然科学基金项目 ( 2 0 0 8 b b 2 2 4 1 ) 资助。本人在该项目中负责对b b s 中的舆情进行分析并建立b b s 舆 情的预测模型等工作。 1 4 2 章节安排 本论文组织结构如下: 第一章:绪论。介绍舆情、网络舆情的内涵、特点和研究现状,以及本文的 研究背景及主要工作。 第二章:主要理论和研究基础。介绍已有的激励模型和突现计算的相关知识; 介绍了研究网络舆情需要的研究方法论和人类行为研究的相关成果;讲述了粗糙 集理论的基本概念以及利用粗糙集理论进行数据挖掘的一般步骤。 第三章:b b s 舆情预测模型研究。主要介绍本人的工作,包括论坛数据的抓取、 分析,预测模型的建立,并给出了预测模型算法及如何利用粗糙集理论来挖掘参 5 重庆邮电大学硕士论文 第一章绪论 数规则。 第四章:仿真实验。对本文提出的舆情预测模型进行2 个仿真实验,一个是与 已有激励模型进行的对比实验,另一个是利用粗糙集挖掘出的参数规则对突发事 件进行预测。 。 第五章:结论及未来工作。对本文进行了总结,提出下一步的研究计划。 6 重庆邮电大学硕士论文第二章网络舆情研究理论基础 第二章网络舆情研究理论基础 2 1 引言 上一章对网络舆情的国内外研究现状进行了综述,指出目前的研究方法无法 实现舆情的预测和控制,需要寻找新的研究方案。本文将以突现计算理论为研究 背景,利用突现计算模型对网络舆情进行建模,然后采用粗糙集理论挖掘模型的 参数规则,从而对网络舆情进行预测。 本章将首先介绍一下已有的网络舆论激励模型,这也是本文的研究基础;然 后,将对定性分析网络舆情时需要的突现计算相关知识以及本文建模将要用到的 突现计算模型进行一个简单的介绍;此外,网络舆情的传播是一个开放的复杂巨 系统,涉及人类的行为,本章也将介绍相关的研究方法论以及人类行为研究的相 关成果,这些将是本文建模时的重要参考;最后,本章将介绍如何利用粗糙集理 论进行规则获取,本文将采用该理论来挖掘所提预测模型的参数规则。 2 2 已有的网络舆论激励模型 文献【8 】建立了一个基于元胞自动机的网络舆论激励模型,表2 1 对其参数进行 了总结和回顾。 表2 1 激励模型参数表 7 重庆邮电大学硕士论文 第二章网络舆情研究理论基础 表2 1 中,情感激励的变化能反映情感倾向度的变化。情感激励越大,情感倾 向越强烈,意志越坚定,受别人影响而改变自己看法的几率越小;而影响别人使 别的个体改变看法的几率却越大;同时其情感倾向度越易于达到情感倾向度门限, 发表言论的可能性也就越大。埘,似定义为: 镌 = i 钙留0 ) 一鹚( 1 一日删( 2 1 ) 如果在,时刻,个体f 的情感激励为聊,渺,则此刻其情感倾向度肥彬为: 倒归熙菘葛滁裂嚣 亿2 , 随着时间的推移,某个事件可能会慢慢停止发展,从而个体对其兴趣也随之 逐渐消失,个体的情感激励相应降低,因此个体情感激励会受时间的影响。另外, 通过网络言论形成的群体,群体成员在心理上有较多的一致性,对生活某些方面 有共同的关注。又因为在互联网帮助下个体可以实现相互间的直接交流,所以群 体中的个体非常容易相互影响,即个体易受邻居状态的影响。 考虑时间和邻居的影响,给出情感激励的变化规则: i 聊f ( f + 1 ) = m f ( f ) 7 + ( 彳l ( f ) 一彳2 ( f ) ) 所f ( f )( 2 3 ) i 聊f o ) 7 = 腕f ( f ) ( 1 一q 码) 由于个体的情感容量各不相同,有可能导致迭代后个体的情感激励聊,超出 其允许范围。因此,在每次迭代之前都对点p ,何做一个判断。如果点p ,俐 l ,则令肥何= 1 。 该文献还提出系统中个体数量的增加是因为话题的热门度厅彬,在仿真时,假 定新增加的个体毋何= o 5 ,情感激励不受时间衰减的影响,但受邻居状态的影响, 定义如下: 朋,o ) = j i z o ) i 彳。l o ) 一彳。2 0 ) i ( 2 4 ) 由所f 似可求得: 珊,书二黢高描涎主裂蒜嵩 亿5 , 不难看出,该激励模型的参数与计划行为理论中的五要素非常类似。在此基 础上该文作者针对某论坛中的一个帖子进行了仿真实验,为了跟真实数据匹配, 仿真过程中对参数进行了处理,最后在日增回帖数上与实际情况基本吻合。 2 3 突现计算理论 突现技术来源于人工智能、数值计算、生物学、物理学、社会学、控制论等 学科的交叉和演化,并逐渐成为一个独立的学科门类,亟待展开理论和应用研究。 8 重庆邮电大学硕士论文第二章网络舆情研究理论基础 目前,这个学科正在逐渐升温,但国外发起专题研究的年限尚浅,国内从事跟踪 研究的人数很少,甚至国内学术界尚未对e m e r g i m tc o m p u t i i l g 的中文正式翻译达 成共识。我们采纳“突现计算 一词,而不是有人曾提出的“涌现计算 ,是认 为它体现了智能出现是从无到有、自底向上的自发过程,而不是“涌现 这个词 所表现的“多”的含义。 突现计算已经和空间探索、未来万维网、智能交通等重大复杂的应用问题关 联,也可望引入网络行为学、应急响应系统等更多涉及复杂群体、复杂动态行为 的应用。万维网作为因特网上的网络社会,已表现出明显的突现行为特征,如网 络舆情的产生和传播。但据文献查阅,以突现计算为数学手段的网络突现智能行 为研究尚未见文献报道,本文提出用突现的观点对b b s 舆情进行研究是一个创新 的研究思路。下面我们来简单介绍一下突现的相关知识,详细内容请参阅项目组 中突现模型小组的论文内容。 2 3 1 突现计算的概念 突现就是一种由系统内部多个独立模块相互协作而自发涌现出来的整体行 为。当在系统微观层面中,模块之间互相合作,并动态构成宏观层面上相对的突 现行为时,这个系统就展现出其突现性,而且所形成的整体行为不能被追溯到个 体模块。图2 1 给出的突现概念图解可更加清楚的了解其含义。 囤 二塑口 图2 1“突现”概念 2 3 2 突现计算的特点 为了更好的了解突现计算技术,以下列出了突现计算的一些重要特征。 1 宏观一微观效应( m a a r o - m i c r oe 侬蛐【1 9 】:此效应涉及特性、行为、结构和模 式,这些都位于较高的宏观层面,且来源于系统较低层面的相互作用。以蚁群为 例,在微观层面,每个蚂蚁观察其自身周围的环境,从而据此来执行相应行动, 9 昌 重庆邮电大学硕士论文第二章网络舆情研究理论基础 但在宏观层面,却把这个蚁群系统看成一个整体。因此这种蚁群构建路径的行为 是一种突现行为,这种行为位于系统的宏观层面,而单一的蚂蚁对这条存在路径 根本就没有任何依据线索。 2 一致性( c 0 h e r e n c e ) 【1 9 】:突现行为看起来就像是整合实体的系统整体在一定 时间里维持某种同一性。这种一致性从较低层面的独立个体实体到高层次的统一 整体都有所关联和体现,即所谓的“组织性封闭( o 穆a 1 1 i z a t i o n a lc 1 0 蛐r e ) 。 3 动态性与非线性( d y n a i i l i c sa n dn o i l l i n e 撕t y ) 【1 9 】:复杂普适计算系统中,突 现现象随着时间而演进。同时,为了维持系统的全局行为,突现行为也是动态的。 突现的发生体现了“小因素,大效果 的原理,而且其产生过程是非线性的,这 使得在宏观层面可能获得一些中级层次的行为效果。 4 。协作性( s y n e 哂s m ) 【2 0 】:突现现象的产生来源于个体实体之间的相互作用和 协作。协作是事物( 如部件,元素,个体等) 共同结合或者共同实施的效果,它可以 发生在事物的任何组织结构层面,并且在任何层面的协作都影响着系统整体行为 的形成。实体相互之间的协作突现系统维持和进化的主要原因。 5 不可约简性( i r r e d u c e b i l i 动2 0 】:由突现所产生的新特性是不能被简化到或推 论到产生这种特性的相互协作的实体层面上的。 6 新颖性( n o v e l t y ) 2 1 】:相互协作的实体在系统较高层面展现出新的突现特性, 这是一种在突现发生之前并不能观察到、并且不存在的特性。 7 向下的因果性( d o w n w a r dc a u s a t i o n ) 【2 1 】:一旦系统中有新的特性被突现出 来,那么这些特性同时也受到系统其他结构的宏观特征影响。如上下层之间的授 权与限制就是系统的局部行为;如果某个部分( 看成是整体或系统自身) 展现出来新 的特性,也可以被看成自顶向下的突现。 8 不可预测性( u n p 川i c t a b i l i 劬口2 】:由突现形成的结果以及发生突现的地点是 完全不能预测的。 除此以外,突现技术还存在着许多新特点,越来越多的研究者开始研究并使 用突现计算技术。 2 3 3 突现计算模型 作为复杂系统重要特征之一,复杂系统中的突现现象被许多的研究者所研究, 其中,最早定义突现系统的科学家之一的崩s t o t l e 【2 3 】认为突现系统是:“可以分解 成许多单一模块的事物,其事物整体并不简单只是所有模块的总和,这只是属于 一种堆积,事实上这个整体除了包括所有模块之外还具备一些其他的东西。 随 着研究者开始借助于其它学科的相关知识来从事此领域的研究,原有的突现模型 逐渐得到演化【2 4 j ,从而形成了更加符合自然特性的突现模型,这些模型有一共同的 1 0 重庆邮电大学硕士论文第二章网络舆情研究理论基础 特点,就是都采用自底向上( b o n o m u p ) 的控制方式。 目前,部分的突现计算模型有:s m 、c a 、w s 、n w 、c n n 、c c m 、d u a l 等等,由于特点不同,它们各自有自己的应用范围。针对b b s 中的舆情研究,我们 着重介绍本文采用的小世界网络模型及其改进型。 1 w s ( 小世界网络模型) 小世界网络是w a t t s 和s 廿0 9 a l z 于1 9 9 8 年提出的一个基于人类社会网络的模型, 如图2 2 所示。 图2 2 小世界网络 该网络既有与规则网络类似的较大的集聚系数,又具有与随机网络类似的较 小的平均距离【l 刀这两种特性综合在一起被称为“小世界效应 。w a t t s 和s 仃o g a t z 同时给出了一种构造小世界网络的方法,简称为w s 模型,其算法如下: 算法2 1 :w s 模型 ( 1 ) 初始为一个排成环形的包含n 个节点的规则网络每个节点的度为k ,即每 个顶点同它的骱邻居相连( 每一侧有耽个连接) ; ( 2 ) 以某个很小的概率p 断开规则网络中的边,并随机选择新的端点重新连接, 排除自环和重连边; ( 3 ) 重复( 2 ) ,直到遍历所有的边。 2 n w ( 改进的小世界网络模型) 1 9 9 9 年,n e w m a i l 和w a :t t s 提出一种改进的生成小世界网络的n w 模型【1 8 】在该 模型中,与w s 模型类似,节点先排布在一个规则环状网上,但是n w 模型不断开 旧的连接,而是以概率p 在节点间增加边,两个节点之间不允许有多重连接,也不 允许节点的自连接。具体算法为: 重庆邮电大学硕士论文第二章网络舆情研究理论基础 算法2 2 :n w 模型 ( 1 ) 初始为一个排成环形的包含个节点的规则网络,每个节点的度为k ,即每 个顶点同它的k 个邻居相连( 每一侧有耽个连接) : ( 2 ) 对规则网络中的节点,以概率p 随机选择新的节点重新连接,排除自环和 重连边: ( 3 ) 重复( 2 ) ,直到遍历所有节点。 w s 模型和n w 模型都在规则网络中增加了“长程 边,它们的另一端节点不 。 是自己的邻居。通过变化概率p ,可以得到从规则网络护o ) 到随机网络胪1 ) 的一 个变化过程。小世界网络模型已经在许多领域得到应用,如互联网控制【2 5 】、传染 病的传播预测【2 6 】等等。 b b s 中的人际关系网络是b b s 中舆情产生的载体,它类似于小世界网络,因 此在研究b b s 中舆情的产生过程中,可以考虑利用小世界网络来模拟b b s 中的人 际关系网络,从而对舆情的传播进行建模。 2 4 研究方法论 2 0 世纪以及近4 0 0 年来的科学研究,研究方法是以“还原论 ( r 。d u c t i o i l i s m ) 为主,其思想是:认识整体必先认识局部,从而约简( r e d | u c e ) 到研究个体【2 7 1 。由前 面的介绍我们知道,网络舆情具有突现性,无法从微观行为预测宏观表现,面对 网络舆情传播这一开放的复杂巨系统【2 引,我们只能采用从定性到定量的综合集成 方法【2 9 】进行研究。 , 从定性到定量的综合集成方法,概括起来具有以下特点: 1 根据开放的复杂巨系统的复杂机制和变量众多的特点,把定性研究和定量 研究有机地结合起来,从多方面的定性认识上升到定量认识。 2 由于系统的复杂性,要把科学理论和经验知识结合起来,把人对客观事物 的星星点点知识综合集中起来,解决问题。 3 根据系统思想,把多种学科结合起来进行研究。 4 根据复杂巨系统的层次结构,把宏观研究和微观研究统一起来。 正是上述这些特点,才使这个方法具有解决开放的复杂巨系统中复杂问题的 能力。 。 该方法的具体步骤可以简单描述为: 1 建模。首先由各方面相关专家依据他们掌握的科学理论、经验知识和对实 际问题的了解,共同对上述系统的运行机制进行讨论和研究,明确问题的症结所 1 2 重庆邮电大学硕士论文第二章网络舆情研究理论基础 在,对解决问题的途径和方法做出定性判断( 经验性假设) ,并从系统思想和观点把 上述问题纳入系统框架,界定系统边界,明确哪些是状态变量、环境变量、控制 变量( 政策变量) 和输出变量( 观测变量) 。这一步对确定系统建模思想、模型要 求和功能具有重要意义。 2 系统仿真和分析。通过系统仿真可以研究系统在不同输入下的反应、系统 的动态特性以及未来行为的预测等等,这就是系统分析。在分析的基础上,进行 系统优化,优化的目的是要找出为使系统具有我们所希望的功能的最优、次优或 满意的政策和策略。 3 经过以上步骤获得的定量结果,再由这些专家共同分析、讨论和判断,这 里包括了理性的、感性的、科学的和经验的知识的相互补充。其结果可能是可信 的,也可能是不可信的。在后一种情况下,还要修正模型和调整参数,重复上述 工作。这样的重复可能有许多次,直到各方面专家都认为这些结果是可信的,再 做出结论和政策建议。这时,既有定性描述,又有数量根据,已不再是先验的判 断和猜想,而是有足够科学根据的结论。 2 5 人类行为研究 之所以网络舆情传播系统是一个开放的复杂巨系统,其最重要原因是网络舆 情的传播是通过为数众多的人的行为来实现的,人的行为是由人脑控制的,而人 脑系统本身便是一个开放的复杂巨系统。针对我们的研究目的,我们有必要对人 的信息传播行为进行研究。这方面的理论主要有计划行为理论理论( 1 1 1 e o 巧o f p l 锄e db e h a v i o r ) 3 0 】和社会影响理论( s o c i a li m p a c tt h c o r y ) 1 1 】。 计划行为理论在国外己被广泛应用于多个行为领域的研究,并被证实能显著 提高研究对人的行为的解释力和预测力【3 1 1 。它是由多属性态度理论( t h e 0 巧o f m u l t ia _ 腼b u t ea t t i 砌e ) 与理性行为理论( t h e 0 珂o fr e 嬲0 n e da 曲o n ) ( a j z c n & f i s h b e i i l ,19 8 0 ;f i s h b e i l l & q z 吼,19 7 5 ) 所结合发展出来的,由于理性行为理论假设行 为的发生,皆能够由个人的意志所控制;可是实际的情况下,个人对行为意志控 制往往受到许多其它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论