舆情信息的结构分析byZYS.ppt_第1页
舆情信息的结构分析byZYS.ppt_第2页
舆情信息的结构分析byZYS.ppt_第3页
舆情信息的结构分析byZYS.ppt_第4页
舆情信息的结构分析byZYS.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Cxcq,舆情信息的结构分析,by ZYS,P,art,1,舆情网络,舆情网络的构建方法,01,02,基于条目之间内容相似度,基于主题之间的回复或引用关系,将每一个条目对应网络中的一个节点,将条目之间的相似度定义为网络中边的权值。,若主题节点A中主题引用了主题节点B中的主题,或者A中给出了指向B中主题的链接,那么就建立一条从节点B指向节点A的有向边,边的权值表示节点A到B的直接关联度。,P,art,2,分析基础,舆情网络示意图,舆情网络分析基础,01,02,03,节点扩散度,整体扩散能力,聚集性,节点的最大度、节点的平均度和节点的度分布。,网络的平均最短路径、网络的直径和最短路径分布。,在一个

2、网络中,一个节点的两个邻居彼此也有可能有连接。聚集性用于描述这种可能性的程度(即网络连接的聚集程度)。,关键节点,01,02,节点介数,节点的接近中心度,网络中经过此节点的最短路径数目占所有最短路径数目的比例(反映节点在网络中的连接性)。,此节点到其他节点的最短路径的平均值(反映了节点与网络中其他节点的接近程度)。,网络中的关键节点是指在舆情传播过程中起到重要作用的节点。例如,网络中大度节点可以被认为是关键节点,这类节点连接了很多其他节点,通过它很容易将信息传播出去。,P,art,3,社区结构分析,社区结构示意图,常见社区发现方法,01,02,03,迭代二分法(计算机科学),层次聚类法(社会学

3、中分级聚类的思想方法),G-N方法(社会学中分级聚类的思想方法),谱二分法 Kernighan-Lin方法(需要事先知道该网络两个社区大小,难以应用),属于凝聚算法,属于分裂算法,基于节点扩展的社区发现,01,03,05,节点强度,节点i相连所有边权重之和,社区大小,社区C包含的节点数量(需要大于给定的阈值),不重叠社区的划分,社区的粗划分 社区的精化,连接强度,节点i与社区C相连的边的权重之和,模块度,反映社区划分的效果,重叠社区的发现,初始社区的发现 社区扩展,02,04,06,特征降维,01,02,特征选择,特征提取,特征频度、文本频度、特征熵、信息增益和互信息,主成分分析(KL变换)

4、潜在语义分析(奇异值分解) 随机映射(Johnson-Lindenstrauss引理),关键节点,网络中的关键节点是指在舆情传播过程中起到重要作用的节点。,舆情内容特征库,内容特征集族,事件类别,事件,事件子集,舆情文本分类和聚类,01,02,文本分类,文本聚类,将文档流分到已有的类中。 算法思路:计算文档向量Di与事件子集Ej类中心的距离DTij,判断距离Dtij是否小于事件子集Ej的类半径。,根据“物以类聚”原理,将本身没有类别的一组的文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为一个聚类簇。 算法思路:先用粗分类算法进行初聚类,然后用凝聚式层次聚类算法进行再聚类,P,art,4,话题发现,舆论话题发现,01,02,03,热点分析,话题发现,话题跟踪,对于相同主题的话题,转载次数、帖子回复量和相同主题的贴数可以刻画话题热度。,热点词发现(基于词频,只考虑词语的流行性) 热点话题聚类(基于热点事件聚类),识别某个已知话题的新闻报道。 目标:针对不断增长信息流,追踪某个给定事件主题,发现所有有关该主题的信息,P,art,5,情感分析,舆情情感分析,舆情情感分析就是对人类的各种情感表达进行有效的分析与挖掘,识别出其情感趋向高兴、伤悲,或得出其观点是“赞同”还是“反对”,甚至情感随时间的演化规律。 难度大,应用范围相对较局限。,P,art,6,观点挖掘,舆

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论