(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf_第1页
(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf_第2页
(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf_第3页
(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf_第4页
(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(通信与信息系统专业论文)校园网舆情监测平台与网络群体演化的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:伴随着被称为“第四媒体”的互联网络的发展和应用,大量网络信息相继 涌现,如何对网络进行监测和分析也成为学者们的研究重点之一。校园网络的建 立,产生了信息化校园这种新的校园形态,它的出现为校园文化提供了一种全新 的物质技术环境,网络成为校园文化建设的重要载体,由它所形成的校园网络文 化是校园文化的重要组成部分。师生在校园网络中发表看法和意见、表达态度和 观点,形成了校园网络舆情,从而对学校的文化、建设、发展产生了一定的影响。 因此,对校园网络舆情的监测和科学管理的研究有着重要意义。 本论文以校园网络为基础,重点研究了b b s 论坛和具有评论功能的新闻网站, 应用网络爬虫、网页预处理、自动分类等关键技术,设计了校园网络舆情监测平 台。该平台包括网络爬虫、预处理模块、分词模块、敏感话题模块、热点话题分 析与检测模块、智能预测模块等主要功能。本论文还分析了影响互联网络中用户 群体演化的因素,并且针对网络演化这一因素,利用复杂网络的知识,结合用户 个人影响力因子的推导计算过程,改进了传统的b a 演化模型,提出了基于用户个 人影响力因子( u s e rp e r s o n a li n n u e n c ef a c t o r ,u p i f ) 的网络群体演化模型。该模型在 考虑到节点本身的度对新增用户的影响的基础上,加入了用户本身影响力的因素 对新增用户的影响,比b a 模型更适用于网络中的学生虚拟社区群体,有一定的实 际意义。 本论文的主要工作有以下两个方面: 1 设计了校园网络舆情监测平台; 2 构造了基于用户个人影响力因子( u s e rp e r s o n a l i n n u e n c ef a c t o r ,u p i f ) 的网 络演化模型,对模型中个人影响力因子进行推导计算,进一步提出今后的研究方 向。 关键词:网络舆情;校园;复杂网络;网络群体;演化 分类号:t p 3 9 1 a b s t r a c t a b s t r a c t :l o t so fn e 铆o r ki n f o 肋a t i o ni se m e 哂n g 衄曲tn o w w i m m ed e v e l o p m e n t o fm ei n t 锄e t ,w h i c hi sc a l l e d ”t l l e4 mm e d i a ”h o wt o m o n i t o r ,a n a l y z ea n dm 觚a g e p u b l l co p l m o n sh a sb e c o m eo n eo fm er e s e a r c h e r s m o s ti m p o r t a n tr e s e a r c h a r e a s u 锄p u sl n 士 o m a t l o m z a t i o ni sm en e wf o mo f c 锄p u s i ti sf o 彻e d b ym e e s t a b l l s l l i i l e n to f 。c 锄p u sn e t w o r k t 1 1 ec 锄p u sn 咖r k p r o v i d e san e wm a t 嘶a la n d t e c h n l c a le n v l r o n m e n t ,a n dh a sb e c o m et l l em o s ts i g n i f i c a n tc a r r i e ro f t h ee s t a b l i s l m l e n t c 锄p u sc u l t u r e c u l t u r eo ft h ec 锄p u sn 咖o r ki s o n eo fm em o s t i m p o n 觚t c o l l s n n l e n t so 士c a i 】叩u s c u l t u r e c a l l l p u sp u b l i co p i n i o n ,w h i c hi sg e n e r a t e db yb o m s 伽e n t sa n dt e a c t l e r sp u b l i s h i n gm e i r 叩i 1 1 i o n s0 nt 1 1 e c 锄p u sn e t 、 l ,o r k ,a 虢c t st h e c 锄p u s 7c u l t u _ r e ,c o n s 仃u c t i o na l l dd e v e l o p m 饥t t h e r e f o r e ,i ti ss i 盟i f i c 觚tt or e s e 砌 t h em 砌t o d n ga n ds c i e n t i f i cm a i i a g e i i l e n to f p u b l i c o p i n i o no nc a i l l p u sn e t 、o r k b a s e do nc a m p u sn e t w o r k ,m i sp a p e rs t u d i e db b sf o r u ma i l d n e w sw e b s i t e sw i m c o m m e n t i n gm n c t i o n i td e s i g n e dt h ec a j n p u sp u b l i co p i n i o nm o n i t o r i n gp l a t f b n nb y a p p l y l n gk e yt e c h n i q u e ss u c hl i k ew e bc r a 、v l e r ,w e b p r e t r e a t m e n t a i l da u t o m a t i c c l a s s 磕c a t i o n t h ep l a t f o r mc o n s i s t so fs o m em a j o r 向n c t i o n a l i t i e s ,s u c hl i k e w e b c r a w l e rm o d u l e ,p r e t r e a t m e n t m o d u l e , w o r ds e g m e n t a t i o nm o d u l e , s e n s i t i v et o p i c m o d u l e ,h o tt o p i c sa 1 1 a l y s i sa n dd e t e c t i o nm o d u l e ,a n di n t e l l i g e n tp r e d i c t i o nm o d u l e ,e t c 1 1 1 i sp a p e ra i l a l y z e dt h ef a c t o r s ,w h i c ha 鼠c tt l l eg r o u pe v 0 1 u t i o no fm ei n t 锄e tu s e r g r o u p s ,a n dr a l s e dt h eu s e rp e r s o n a li n n u e n c ef a c t o r ( u p i f ) b a s e dn e t w o r kg r o u p e v o l u t i o nm o d e l t h em o d e la i m st om en e t w o r ke v o l u t i o nf a c t o r ;i t i m p r o v e dt h e t r a d i t i o n a lb ae v o l u t i o nm o d e lb yu s i n gc o m p l e xn e t w o r kk n o w l e d g ea n dc o m b i n e d w l t hc a l c u l a t i o no ni n d i v i d u a lu s e r si n n u e n c e i tn o to n l yt a k e si n t oc o n s i d e r a t i o nt h e i n t l u e n c eo ft h en o d ed e 伊e ei t s e l fo nn e w u s e r s ,b u ta l s op u t si nt h ef a c t o ro fe x i s t u s e r sm t l u e n c eo nn e wu s e r s t 1 1 i sm o d e li sm o r es u i t a b l et h a nt h eb am o d e lf o r s t u d 饥tv i m a ls o c i a lg r o u pi nt h en e t 、o r ki nac e n a i ne x t e n t t h em a j o rw o r k so f t h i sp a p e ra r e m a i n l yi nt h ef o l l o w i n gt w oa s p e c t s : 1 t h i sp a p e rd e s i g n e dt h ep u b l i co p i n i o n m o n i t o r i n gp l a t f o m ; 2 t h i sp a p e re s t a b l i s h e dt h eu s e rp e r s o n a li n n u e n c ef a c t o r ( u p i f ) n e t w o r k g r o u p l v e v 0 1 u t i o nm o d e l ,d e r i v e da n dc a l c u l a t e dm ef a c t o r ,a 1 1 dr a i s e dn e wt l l i n k i n gf o r 如t l l r e w o r l ( s 1 y w o r d s :n e 觚o r kp u b l i co p i i l i o n ;c 锄p u s ;c o n l p l e xn e 时o r k ;n e t w o r kg r o u p ; e v 0 1 u t i o n c l a s s n o :t p 3 9 1 v 致谢 时光飞逝,两年半的研究生学习生活即将结束,回首在计算机网络与信息系 统实验室里的学习时光,心中快乐并且充满着感激。很幸运在2 0 0 9 年的9 月加入 了这个集体,实验室里浓厚的学术氛围、温馨的师生情谊、融洽的同学关系 这些都将成为我人生中最美好的记忆和财富。 首先,在此十分感谢我的导师何德全教授,本论文是在何教授悉心指导下完 成的。能够成为何教授的学生是我极大的幸运,何德全教授学识渊博、平易近人、 待人谦和,是学生们崇敬的榜样。 同时,衷心感谢我的导师刘云教授,刘云教授治学严谨、和蔼可亲,不仅是 我的学习导师,更是我的人生导师。对刘云教授的情感很复杂,是一种对教授的 崇拜,对师长的敬仰,或是一种对亲人的亲近,对朋友的信任。衷心感谢刘云教 授对我长期以来一直的关心、帮助和支持,尤其是在我遇到困难的时候,刘云教 授坚定有力的支持令我终身难忘并感激。本论文从选题到最终的完成,每一步都 是在刘云教授的具体指导下完成的,倾注了刘云教授大量的心血。在此,谨向刘 云教授表示崇高的敬意和衷心的感谢! 其次,感谢实验室的张振江老师,张振江老师无论是在学习还是科研方面都 给了我很多指导和帮助。张振江老师除了严谨治学的精神令人学习外,勤奋踏实 的工作精神同样值得我们学习,最好的教学方法莫过于言传身教,感谢张振江老 师为实验室、为学生们做的一切! 孟嗣仪老师、穆海冰老师、沈波老师虽然不是我的直接导师,但是在科研、 学习、生活中都给与我关心和支持,在此,对老师们表示衷心感谢! 在实验室学习期间,我得到了熊菲、程辉、张彦超、廉捷、程紫尧、程军军 等师兄的指导和帮助。同时,还得到了王源、薛姗、陈曦、张春辉、高炳楠、张 乐等同学在生活中的关心和学习上的帮助。在此,对师兄和同学们表示真诚的感 谢! 祝愿他们学业有成! 前程远大! 感谢母校的培养。在北京交通大学学习、工作的8 年时光,使我从一个青涩 少年蜕变成一个自信的青年。此外,特别感谢北京学科建设研究生教育资助。 衷心感谢默默陪伴支持我的家人,他们的爱和支持,是我勇往直前的动力。 最后,感谢在百忙之中评阅论文的各位专家、老师,感谢所有关心、支持和 帮助过我的人! 祝愿大家身体健康! 万事顺意! 1引言 随着信息技术的蓬勃发展,互联网拉近了人们彼此之间的距离,网络舆情随 即成为大家关注的焦点。网络舆情,是由于各种事件和刺激而产生的通过互联网 传播的人们对于该事件的所有认知、态度、情感和行为的倾向集合【l 】。有关网络舆 情的研究,涉及复杂网络、社会动力学、种群动力学、演化博弈论等多个学科, 其中很多学科均处于科学研究工作的前沿。本章就校园网络舆情监测和群体结构 演化的研究方面的现状、选题背景和意义作了论述,并且介绍了该论文的组织结 构。 1 1研究现状 国内关于网络舆情的研究主要集中在新闻学、传媒学等人文方法的研究领域, 是从定性和调查统计的角度出发,研究网络舆论的宏观特性或意识形态倾向性, 缺乏实证方法,无法对舆论形成的内在机理和趋势做出定量的描述和预测。从国 内实际应用现状看,国内各单位对网上信息采集分析的一个主要途径是使用搜索 引擎( 如g o o g l e 、百度等) 。然而,该途径存在以下问题:时间上的滞后性;搜索 针对性不强;无法对热点、敏感话题发展动态进行预测。此外,目前国内有方正 智思舆情辅助决策支持系纠2 1 、军犬网络舆情监控系鲥3 】等具体的系统和产品。 校园网络舆情方面的研究则多集中在新闻学、传媒学、思想政治教育学等领 域,尚无形成专门面向校园网络、测重用户应用的舆情监测平台,对校园网络进 行舆情信息采集、敏感热点话题分析、话题发展趋势预测等工作。目前还没有专 门针对校园网络舆情的监测平台。 在网络群体结构演化的研究方面,国外学者进行了多方面的探索,基本可以 分为以下两类:一类是根据复杂网络的知识研究虚拟社区网络,研究者发现其结 构直接继承了现实社会网络的基本特征。第二类是根据大部分虚拟社区的网络活 动都可以通过日志记录发生的时间,学者们通过对特定网络的研究,发现某些网 络呈现出来度度负相关,并且负相关的程度随着时间的推移越来越大,然而,在 绝大多数的现实生活中的社会网络是呈现度度正相关的,就此问题一些学者仍在 跟进研究。国内有关互联网络群体结构和演化的研究刚刚起步,其研究方向多数 集中在传播学、新闻学的范畴,在统计与计算机网络方向的分析和预测的有效工 作较少,并且尚未看到专门针对网络群体演化方面的研究。目前,尽管有相当一 部分学者提出了能够适用于某些特定互联网络社区的演化模型,然而,由于不同 类型网络的产生机制和制约因素不同,用户人员的组成不同,因此,适用于所有 互联网络的模型规律也很难找到。 1 2 研究背景和意义 互联网的开放性、多样性和信息的多源性使得网络中的信息纷繁、复杂、多 样,因此,把握网络中信息其中的规律,对互联网络进行监测和分析,加强舆情、 舆论监测等方面的研究,使网络舆情向着良性的方向发展的研究工作具有重要意 义。 校园网络舆情,发生在校园这一特定环境。师生通过校园网络表达自己的观 点和看法,形成了新的校园文化即校园网络文化。校园网络舆情往往有二级传播 理论的效果【4 】:第一级传播是在校园b b s ( 等载体) 上的活跃者群体中进行,属于 人际传播和群体传播的过程;第二级传播是从校园b b s ( 等载体) 到广大学生的 过程,属于大众传播和人际传播的过程。二级传播为少数活跃者群体通过制造校 园舆论影响多数学生提供了条件。因此,加强对校园网络舆情的研究力度,做好 校园网络舆情监测工作,对学校科学管理、丰富校园文化、建设和谐校园有着重 要的意义。 互联网络中的群体随着时间在不断的演化,或产生、或壮大,或缩小,或消 亡。网络用户通过各种网络平台的频繁交互,由兴趣爱好、热点话题、社交网络 等形成的用户群所呈现出的群体特性越来越明显,并且深深影响着周围的用户, 渐渐体现出其研究和商业价值。具体到校园网络中,对学生网络群体演化的研究 可以为学校相关部门就学校建设发展提供思路和依据。因此,对学生网络群体演 化以及学生网络群体舆论预测的相关研究,对学校科学管理等方面有着重要的意 义。 本论文针对校园网络舆情的监测和群体网络的演化研究的需求,设计了校园 网络舆情监测平台,该平台对校园网络进行舆情信息采集、敏感话题提取、热点 话题分析、话题发展趋势预测。依据复杂网络的分析方法,在b a 无标度网络模型 的基础上,提出了基于用户个人影响力因子( u s e rp e r s o n a li n n u e n c ef a c t o r u p i f ) 的 网络群体演化模型。为校园舆情监测工作和学生网络群体结构的演化提供了新的 思路和方法。 1 3论文组织结构 本论文一共分为六章内容,其组织结构如下: 第一章:引言。介绍论文的校园舆情监测平台和网络群体结构演化的研究现 状、选题背景和意义,以及论文的组织结构。 第二章:校园网络舆情及复杂网络的理论知识。介绍了网络舆情的含义及其 特征、学生群体网络舆情的现状和特点,以及复杂网络的基本概念、特征度量, 和基本演化模型。 第三章:校园网络舆情监测平台设计与功能。对系统需求、开发平台、系统 构架、功能模块、以及网络爬虫、网页预处理、自动分类等关键技术进行了阐述。 第四章:校园网络舆情监测平台主要模块实现。对平台中的网络爬虫模块、 预处理模块、分词模块、敏感话题模块、热点话题分析与检测模块、智能预测模 块的实现进行阐述。 第五章:提出了基于用户个人影响力因子( u s e rp e r s o n a li n f l u e n c ef a c t o r u p i f ) 的网络群体演化模型。就互联网络用户群体演化的影响因素、模型设计思想、u p i f 模型以及用户个人影响力因子的推导计算进行了阐述,并且分析了u p i f 模型的实 际意义。 第六章:总结与展望。 2 校园网络舆情及复杂网络的理论知识 2 1网络舆情的含义及其特征 1 网络舆情的含义 舆情,在辞源的定义是:民众的意愿。在新华字典中的解释是:群 众的态度和意见。在网络舆情研究中,作者刘毅对舆情做了这样的定义,舆 情是由个人以及各种社会群体构成的民众,在一定的历史阶段和社会空间内,对 自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、意愿、态度 和意见交错的总和【5 j 。 网络舆情是由于各种事件和刺激而产生的通过互联网传播的人们对于该事件 的所有认知、态度、情感和行为的倾向集合【1 1 。网络舆情的构成要素有:网民、公 共事务( 国家、政府、社会) 、网络舆情空间( 硬空间和软空间) 、情绪、意愿、 态度和意见。其主要传播途径有:电子邮件、新闻组、即时通讯、b b s 论坛、博 客( 包括微型博客) 、播客等。 网络舆情是一个多学科交叉的研究领域,涉及的学科也处于科学研究工作的 前沿,诸如复杂网络、社会动力学、种群动力学、演化博弈论等学科。总体而言, 目前针对网络舆情的研究,主要有以下几类方法:基于物理学的方法、基于微观 经济学的研究方法、基于复杂网络、复杂系统的方法和其他如以细菌生长模型、 细胞扩散模型等生物学理论为基础的研究方法。 2 网络舆情的特征 互联网本身的性质,如虚拟实在性、开放性、及时性、交互性、渗透性、超 时空性等,使得网络舆情呈现出有别于现实舆情的特征【6 】。 网络舆情复杂多样 由于内容的多样化、舆情主体多元化和传播途径的多渠道等特性,造成了网 络舆情的复杂性。从内容上来看,网络舆情涉及到社会事件和社会问题的方方面 面,包罗万象。从“漏油事件”到“苹果公司创始人乔布斯去世”,再到现在公众 所十分关心的“列车安全事件”等,网络舆情涉猎民生、经济、公共管理、司法、 环境等多个领域,内容多,信息量大,参与讨论的网民队伍十分庞大。实践显示, 这些发生于不同时间、不同领域的舆情事件,都能引起民众的广泛关注和讨论, 给负责事件处理的企业、公司、部门以一定压力和一些处理意见。 网络舆情的交互特性 与传统媒体最大不同的是,网络舆情传播渠道并非单向的,它具有双向的交 4 互式的信息传播通道。在互联网中,网民通常表现出较强的参与热情,在对某一 事件进行讨论中,往往会有很多网民积极跟帖、回帖、转发,参与到讨论中来, 形成交流、互动、争论、探讨,最终,达到思想的碰撞与交汇。 网络舆情的即时特性 时间是新闻事件的命脉之一,传统媒体中,新闻大事在发生一段时间后才能 通过传统媒介进行报道。同样,再经过一段时问后,民众才能得到有限的甚至是 经过处理的反馈信息。网络舆情,在重大事件发生后,相关信息会很快被发布到 网络上,网民也在第一时间了解事情的进展情况并且进行评论,发表看法,参与 处置。随着微型博客的应运而生,在汶川地震、7 2 3 甬温动车追尾、上海地铁追 尾等事件的第一条信息都是通过微博发出的,草根民众充当了一线记者。公众可 以及时跟踪了解,做出反馈、实施救援和帮助。网络舆情的及时性,是形成群体 性事件的一个重要因素。 网络舆情难以控制 首先,互联网络的信息传播超越了时间和空间的障碍限制。开放自由的互联 网络导致每一个网民不论身份、职业、年龄、宗教信仰等,无论何时何地,都可 以自由地发表自己的言论,对所发生的事件阐述自己的观点。其次,网络信息繁 杂,在内容上难以甄别控制。网络的开放自由,使之造成网络舆情的失真和失控 成为可能。最后,其传播途径的多样性也是难以控制的一个重要原因。 网络舆情影响广泛 网络舆情信息传播速度快、扩散面大,影响广泛,它可以在很短的时间内将 信息扩散到世界的每一个设有网络的角落和个人,影响人们的思维和对事件的认 识,进而,影响人们的处理方式和方法。 2 2学生群体网络舆情现状及特点 学生是一个相对较为特殊的群体。学生群体具有单纯、是非判别能力弱等特 点,学生群体网络舆情也具有其自身的特征。大量实践事实证明,很多发生于不 同时间、不同领域的舆情事件,很多都能够引起广大在校学生的广泛关注,这无 疑对学生的思想、行为、道德观、世界观、人生观的形成,以及校园文化的建设 产生着重要的影响。本节以参与网络程度最大的学生群体大学生为例,分析 学生群体网络舆情现状的特点。 1 学生群体网络舆情的现状 学生群体是社会群体的一种特殊形式,由于校园的整体环境相对特殊,在具 有社会群体的一般特征外,还具有其自身的特点和时代烙印。学生群体,尤其是 大学生群体,具有文化层次较高,积极向上,熟悉并且依赖网络,然而思维单一 活跃、愿意表达自己的想法,涉世未深、容易冲动等特点。随着互联网技术的发 展,大学生群体在网络上表达意见和兴趣的现象越来越多,参与的程度也越来越 深入。不论是公司、企业还是学校,目前对网络的监测基本上是采用人工浏览的 方式进行的,当然,人工的工作效率和效果是有限的,而且对数据的获取,分类、 分析等方面的工作也是有限的。 根据归纳,现在学生群体网络舆情主要表现出群体极化和“沉默的螺旋”两 种现象【,j 。 群体极化现象 美国哲学家、芝加哥大学法学院教授凯斯桑斯坦提出群体极化的概念。他 指出,一个团体的成员在一开始有着某些偏向,之后经过群体商议,团体成员朝 着偏向的方向移动,最后形成了较为极端的观点。在经过对6 0 个网站的随机研究 后,发现网络上群体的传播确实容易造成极化等现象。网络上,志同道合或者兴 趣相投的团体会彼此进行讨论、沟通,经过一段时间,他们的想法与之前一样, 只是形式上表现得更为极端了。 学生群体网络舆情容易发生极化现象。虽然每个人对网上传播的热点问题都 有着自己的看法,但是多数学生对问题没有进行全面的分析,往往带有群体的盲 从性。学生群体,尤其是大学生群体,具有较高的文化水平,勤于思考、易于怀 疑,在一定程度上脱离社会,消息来源基本趋于相似或者相同的渠道,年龄相仿, 兴趣爱好相近,经历相似,拥有很强的趋同心理。这样,学生往往会在较短的时 间内聚集起来,由最初的个体意见转变为群体行为。 造成学生群体网络舆情群体极化现象的原因有很多,传播学、社会心理学的 学者对其进行了分析,总体而言,有以下两方面原因。首先,网络信息偏好导致 群体的极化。网络可以使人们突破地理的障碍进行交流,然而由于人处理信息的 能力有限,人们往往在接受信息和建立联系的时候表现出一定的偏好,这就应证 了“人以群分,物以类聚”那句俗语。网络舆情群体成员有着相似的立场和观点。 其次,群体认同导致群体极化。一个人作为行动的群体中的一员,即使集体的心 理与他个人的心理有本质的区别,然而,个人也会受到集体的影响。网络技术的 发展使得交流和沟通打破了地理的限制,有利于具有相同兴趣或观点的网民聚集, 并且其中的成员会产生群体认同。 “沉默的螺旋”现象 德国的诺尔诺依曼提出了“沉默的螺旋”的理论假说,他认为,个人意见 的表达是一个社会心理的过程。人作为社会的成员,总是在周围的环境中寻求支 持,避免使自己陷入孤立无援的境地,个人往往会附和多数人的观点。当一个 6 人发现自己的观点受到孤立的时候,很多时候会选择沉默,这样,优势的观点会 越来越强,劣势的观点会越来越弱。网络虽然提供了不同声音发表的平台,削弱 了“沉默的螺旋”现象。但是,很多时候我们会发现校园论坛中关于某一话题的 两种对立的讨论声音刚开始的时候是旗鼓相当的,然而在其中一方显示出优势之 后,经过一段时间的沉淀,另一方的声音会越来越少,甚至消失,其原先的活跃 用户也许只会看帖,很少或者不发回帖,校园网络舆情有时候也会呈现出“沉默 的螺旋”现象。 2 学生群体网络舆情的特点 作为校园网络舆情主体的学生群体, 生群体,具有敏感性、群体性、关联性、 网络舆情具有以下特点【7 】: 扩散快 尤其是参与互联网络最深最广泛的大学 影响力大等特性,从而导致大学生群体 随着互联网技术的不断发展,互联网络基础设施的不断完善,速度越来越快, 接入手段越来越呈现多样化的状态,学生接受和发送信息的方式越来越便捷。某 一话题被关注之后,通过转发、超链接等形式,迅速传遍整个网络。 观点多元化 传统媒体的传播媒介有所限制,其话语权主要有媒体方进行控制,在网络领 域里,不同身份、角色、信仰的人都可以自由的发表观点,每个网民同样可以自 由的接收不同的信息,网络舆情中充满了不同立场和价值观的多元化观点。 言行缺乏理性 学生处在人生的憧憬与梦想阶段,大多心中充满正义感、对生活怀有极大的 热情,强烈希望融入并参与社会,表达自我。然而该群体具有心智尚未完全成熟, 社会阅历少,难以摆脱青春期的冲动与激情等特点,往往会用简单的方式进行价 值的判断,呈现出缺乏理性的状况。 传播性强,较难以控制 网络上信息量大,连接着不同的国家、群体、个人,无法进行统一的管理。 在网络中,每一个网民都有着平等自由的发表意见的权利,现实生活中领袖人物、 权威媒体的话语在相当程度上被消解。网络中的每一个网民都是信息的发布者, 同时也是接受者,舆情信息量大、复杂,因此,网络舆情的控制难度很大。 影响大 学生群体背后是千万个广大社会家庭,同时,学生群体也是同后社会的主导 者,该群体个性张扬,喜欢对社会发展中的种种问题发表自己的看法,并且往往 能在极短时间内达成共识,激发热情。因此,以其作为主体的网络群体较其他群 体拥有更强的辐射力,影响范围更为广泛。 2 3复杂网络相关理论 1 7 3 6 年,德国数学家欧拉对哥斯堡七桥问题进行解决的时候,首次用网络的 观点描述了客观的世界。随着复杂网络研究的深入,研究者们提出了许多概念和 度量方法,用于描述复杂网络的结构特性【引。 复杂网络是对于复杂系统的高度抽象,其中许多性质如小世界性质、无标度 性质以及聚集性质等等已经得到了充分的研究。大量文献表明,复杂网络呈现出 社区结构特性。复杂网络中的节点是复杂系统中的个体,节点之间的边则是系统 中个体之间按照某种规则而自然形成或人为构造的一种关系【9 】。 互联网络中的社交网络显现出来的群体,诸如微博客中的“圈子”,是某种现 实社会网络在互联网络的体现,然而,由于互联网拥有不同于现实社会网络的自 身的特性,建立在互联网基础上的群体的规律,并非是将社交网络完全的“平移”。 研究探索表明【l l 】,该群体具有幂率分布、小的平均距离和大的聚集系数等特征, 符合复杂网络的典型特征。其中,学生网络群体是互联网络群体中的一部分,由 于其群体自身的特点,对校园文化建设有着重要的影响,因此,本文就学生网络 群体为基础,对网络群体演化进行了探索。以下就复杂网络的基本理论做简要介 绍。 2 3 1复杂网络特征度量 网络的特征度量又被称为网络的静态几何量,是考察大规模网络中节点及其 连接的统计特性,这些统计特性的不同, 的不同可能会导致系统功能的差异特性。 量进行介绍【12 1 。 1 度、度分布 意味着网络的内部结构不同,内在结构 本小节就复杂网络研究中的典型特征度 度是对节点相互连接统计特性的最重要的描述,也反映重要的网络演化特征。 度定义为节点的邻边数。节点i 的度忽根据定义,记为: 岛= = jj 平均度定义为网络中所有节点的度的平均数,记为: ( 忌) = ( 砖) = 专军尼,2 专等 ( 2 1 ) ( 2 2 ) 最大度定义为: 尼一= m 瞄砖 ( 2 3 ) 节点度在不同的网络中所代表的含义也不相同,例如,在社会网络中,度可 以从某一方面表示个体的影响力的大小, 力越大。按照节点度的定义,不难理解, 度越大的个体,其在社会网络中的影响 如果一个人的联系度较大,则与其联系 的人越多,同样在这个网络中,他的影响力也就较大。直观上来看,节点的度越 大,其在这一网络中的某种意义也就越重要。 度分布p ( 尼) 定义为任意选一个节点,它的度正好为k 的概率,等于网络中度 为k 的节点的个数占网络中节点总数的比例,同样诠释了这个网络的度的概率分 布。 2 集群系数 集群系数描述的是网络中节点的邻点之间同样互相为邻点的比例,通常也被 称作小集团结构的完美程度。 网络的集群系数记为: c :坐 ; n l ( 2 4 ) 其中,m 表示网络之中三角形( 三环或者三完全图) 的总数,3 表示网络之 中“三元组”( 也就是缺少一边的三角形) 的总数,代表网络邻接矩阵的矩阵元。 a = 勺口膳 ( 2 5 ) 七 j i 3 = ( + 啄+ ) ( 2 - 6 ) i 刁 f 目前,很多人认为邻接矩阵是最好的表示网络统计性质的选择,清晰准确, 便于规范地编程序。 一个节点的集群系数记为: r 一3 m ( z ) 印硝 v ,i - 9 ( 2 7 ) 其中,m ( f ) 代表网络中包含节点f 的三角形的总数,3 ( f ) 表示网络中包含节 点i 的“三元组”的总数。 一个节点的集群系数也记为: m ( f ) = 吩啄口腩 七 j 3 ( f ) = 七 , c ,2 嵩 其中t 表示节点f 的邻点之间的连边数,砖表示f 的节点度。 网络的集群系数同样也可以记为: c = ( g ) = 专莩g ( 2 8 ) ( 2 9 ) ( 2 1 0 ) ( 2 1 1 ) 3 平均路径长度 平均距离定义为网络中所有的节点对它们之间的测地线( 两个节点之间边数 最少的一条路径) 长的平均值。 ( 垆志若办 ( 2 1 2 ) 其中,n 为网络中的节点数。 现实中,网络性能、信息传递的一个重要影响因素即传输迟延,传输迟延的 重要参数就是距离和直径。平均路径长度是复杂网络中的一个全局几何量,描述 了网络的传输效率与性能。 2 3 2复杂网络基本模型 真实网络的特性复杂多样,大量学者们在不断地研究其本质,解释这些真实 网络的形成机理和发展趋势,试图构造与实际网络相近的演化模型,来揭示其中 的规律特性。近年来,研究者们从不同的角度对演化模型的研究有了很多方面的 进展和成就,然而,一些经典的模型是这些研究的基础。本章就已经提出的经典 的模型作一简要介绍瞵j 。 1 规则网络( r e g u l a r n e 觚o r k ) 模型 规则网络节点按照已经规定的规则连接边所得到的网络。常见的两种规则网 络:全局耦合网络、最近邻耦合网络。 全局耦合网络中任意两个节点之间都有一条边与之连接,在相同规模的网络 中,全局耦合网络的最短路径最小l = 1 ,集群系数最大c = 1 。最近邻耦合网络中每 个节点之和他周围最近的k 个节点相连,是高度聚类的。网络的最短路径长度随 着网络的规模呈线性增长的规律。 2 随机网络( m d o mn e t w o r k ) 模型 随机网络节点按照随机方式连接边所得到的网络。e r d o s 和r e n y i 于1 9 5 9 年 提出了经典的随机网络模型e r 模型。e r 模型的构造方式如下:对于给定的 网络节点总数n ,网络中的任意两个节点以一定的概率p 进行连接。当p = l 时, 生成的随机网络中的n 个节点完全连接:当p = 0 时,生成的随机网络中的n 个节 点相互孤立;当p ( o ,1 ) 时,生成的随机网络包括p ( 一1 ) 2 条边【9 】。 随机网络都分布是泊松的,平均度与n 正比,平均集群系数与n 成反比, 平均距离与m 正比,显然与规则网络十分不同。 3 小世界网络( s m a l l w o r dn e t w o r k ) 模型 1 9 9 8 年,两位年轻的美国物理学家瓦兹( w a t t s ) 和斯绰伽兹( s t r o g a t z ) 在 n a t u r e 上发表了影响很大的论文,提出了“小世界网络”模型,该模型位于规则 与随机之剐9 ,1 0 】。小世界网络是对现实世界的抽象而成的,现实世界中,很多网络 都具有小世界网络的特征。例如:互联网络、演员网络等。 小世界网络模型将规则网络进行了随机化,通过对规则网络中节点之间的连 边进行重新连接,从而增加网络的无规律性。 小世界网络的构造是从规则网络开始,以概率p 随机地“重连”每条边( 任 选此边的一个端点不变,脱开另一端点,随机选择网络中另一节点为端点) ,同时 保证没有自连接合重复边( 即保持为一个简单图) 。这样,当p = o 时,每个节点都 有k 个邻点,完全没有“随机跳跃边”,显示一个规则网模型;而在o p 1 时,随 机重连边的期望值是慨( 专) ,显示一个位于规则与随机之间的模型;当p = 1 时,所有的边都随机重连,模型转化为随机网模型。 图2 1 对规则网络、小世界网络、随机网络的拓扑结构进行了举例。规则网络 聚集系数大、特征路径长;随机网络聚集系数小、特征路径短;小世界网络一般 在两者之问,聚集系数大、特征路径小。 图2 1 规则网络、小世界网络、随机网络示意图 f i g u r e2 1e x a 1 p l e so fr e g l l l a rn e t 、o r k ,s m a l l - w o d dn e 觚o r k ,a i l dr 弛d o mn e 觚o r k 4 无尺度网络【1 3 j ( s c a l e 丘e en e t 、) l ,o r k ) 模型 无尺度网络也称作无标度网络。无尺度网络的度分布符合幂律分布,其中没 有描述问题的特征尺度。幂率曲线下降相对缓慢,研究者可以发现大量度很小的 节点,同样也可以发现少量度很大的节点。图2 2 示意了无尺度网络的结构。 图2 2 无尺度网络不意图 f i g u r e2 2e x 锄p l e so fs c a l e 仔e en e t w o r l ( 无尺度网络是遵循按照偏好依附的原则进行连接的,当网络中出现新的节点 时,倾向于连接已经有很多连接的节点。随着时间的推移,网络演化就趋向于一 种趋势,即原先有较多连接的节点,会有更多的节点与之连接,与“富者愈富” 相符合适应。它具有一般小世界网络的特性,聚集系数大、特征路径小,同时它 的定点分布符合幂律分布的规律。 在介绍这4 种基本模型的基础之上,在复杂网络的研究中,还存在着动态模 型,结合特定的动力学过程,学者们对网络的演化进行研究。一般网络的演化包 含五个事件:加点、加边、重连、去点、去边。本论文第5 章用到的b a 模型就是 复杂网络中的动态模型。b a 无标度网络模型包括两个要素:增长和优选。“增长” 强调复杂网络是一个开放的系统,新的基本单元不断加入,节点总数在不断增加; “优选”强调节点链接新边的概率应该单调依赖于它已有的度,即所谓“富者愈 富”法则。由于在第五章有详细介绍和应用,故不再此赘述。 2 4本章小结 本章介绍了网络舆情的含义和特征,重点概括了学生网络舆情的现状、特征, 指出了校园网络舆情人工监测的不足,介绍了复杂网络概念和基本特征量度,阐 述了规则网络、随机网络、小世界网络和无尺度网络等4 种基本复杂网络模型。 3校园网络舆情监测平台设计与功能 论文第2 章介绍了校园舆情监测现状并且分析了现行措施的人力资源耗费、 效率和准确率比较低、无法对形势进行预测等缺点。本章就如何在纷繁复杂的网 络舆情中提炼出有价值的信息,并且及时有效地进行分析,给相关部门以有用的 参考等问题进行了研究,提出了校园网络舆情监测系统的设计方案。 3 1 系统需求及开发平台 校园网络舆情信息监测系统设计遵循标准化、流程化、模块化的原则,实现 系统的灵活性和扩展性,并根据教师和学生用户的特点,界面依照简单、友善的 风格,进行设计。 校园网络舆情监测系统的需求,是建立在网络舆情监测系统的传统基础上, 结合校园网络、学生群体的特征进行分析的。校园网络舆情监测系统及时采集校 园重点网站、论坛等的最新信息,监测突发、新闻事件在网络上的信息,分析网 络的热点和焦点信息,持续关注热点事件的发展情况,并且给出趋势预测,为相 关部门提供有益分析。校园网络舆情监测系统需求主要包含信息采集、智能分析, 同时,还要求系统具有信息采集全面、存储量大等特剧1 7 】。 1 信息采集 通过对校园网络舆情信息进行采集,使用户及时了解当前网络中用户在说什 么、关注什么、言论信息内容等多方面的信息。采集的内容主要是校园网络论坛 中的讨论话题及回帖。如果有评论,可以就正反方意见进行采集归纳,为后续的 信息智能分析做铺垫。 2 智能分析 校园网络舆情的智能分析处理时系统的核心部分,实现预处理、自动分类、 敏感话题分析、智能预测等功能,为用户提供进一步实施管理的依据。 3 系统特点 校园网络舆情监测系统应具有信息采集全面、存储量大、界面简单易操作等 特点,以适应校园相关部门的工作要求。 该系统平台采用j a v a 为开发语言,选用m y e c l i p s e 5 5 作为开发工具,使用 m y s o l 6 o 数据库,选用t o m c a t 6 o 作为应用服务器,引入a j a x 技术以改善使用 者与系统的交互体验【1 4 】。a j a x 技术的核心是j a v a s 嘶p t 对象x m l h t t p r e q u e s t , x m l h t t p r e q u e s t 处理所有与服务器通信的对象,是一种支持异步请求的技术。 1 4 x m l h t t p r e q u e s t 向服务器提交请求并等待服务器的响应,这个过程中,用户访问 的页面不会被浏览器刷新,直到服务器返回数据,浏览器才刷新页面需要更新的 部分。这个过程即为异步r p c 调用过程。异步请求技术减少了用户不必要的等待 时间,增加了用户的互动体验。 j a v a 作为一门优秀的编程语言,它具有简单、多变、面向对象、不依赖操作 系统等特点,同时,目前存在丰富的j a v a 开源项目,便于以这些开源项目为基础, 根据实际需求开发相应的功能。 前端表示层的开发工具采用g o o 酉e 公司基于j a v a 开发的新一代a j a x 框架 g o o 西e w 曲t o o 瞄t ( g w t ) 【1 5 】。g w t 提高了动态网络应用程序编写效率,解决了 网络浏览器和平台之间的不兼容问题。通过g w t 提供的j a v aa p i 调用页面组 件来进行前端页面的开发,根据需要为组建绑定事件监听器,为对控件的动作做 出反应。使用者无需等待响应结果,可以直接继续在当前页面进行操作,提高 了工作效率。使用者可以整个开发过程完全使用j a v a 语言,经过g w t 编译器 转化为j a v a s 嘶p t 表示的a j a 】【代码。 3 2系统构架 结合校园舆情监测系统需求及学生群体的鲜明特点,本节以舆论传播媒介为 突破点,有针对性地对网络舆论在学生群体中的产生、形成、传播及发展进行研 究,设计出针对学生群体的校园网络舆情监测平台,包括信息收集、自动分类、 智能预测等功能。该平台能够及时的监测校园网络中的舆论信息,发现热点话题、 预测演化趋势,提高网络舆情监测的效率和准确率,实现校园网络舆情监测自动 化。以某校园网络为例,设计系统监测平台,具体校园网络拓扑结构如图3 1 所示。 图3 1 校园网络拓扑结构图 f i g u r e3 - lc a 珈【p u sn e t w o r kt o p 0 1 0 9 yd i a 殍a m 通过分析学生特点、校园网络构成和校园网络舆论监测的需求,某校园网络 舆情监测平台整体架构及功能如下图3 2 所示: 图3 2 校同网络舆情监测平台功能图 f i g u r e3 - 2p l a t f i o mo fm e a s u r i l l gt h en e 咐o r kp u b l i co p i l l i o no fc 锄p u s 缸l c t i o nc h a n 3 3功能模块 校园网络舆情监测平台主要功能包括【16 : 1 信息收集 该模块是系统的基础和数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论