开题答辩-跨社交媒体数据演化分析.pptx_第1页
开题答辩-跨社交媒体数据演化分析.pptx_第2页
开题答辩-跨社交媒体数据演化分析.pptx_第3页
开题答辩-跨社交媒体数据演化分析.pptx_第4页
开题答辩-跨社交媒体数据演化分析.pptx_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

跨社交媒体事件演化分析,指导老师:学生:学号:11061199答辩时间:3/27/2015,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,内容概要,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,课题背景及意义,Web2.0时代大量由用户主导生成的内容互联网产品、以用户为中心的互动型社区,例如新浪微博、天涯论坛以及一些新闻站点;这类站点往往同时具有社交性质以及媒体传播性质,并且不同平台信息演化机制不同,信息在不同社交媒体平台下会体现出不同形态,在不同时间段也会有不同反映;如果我们仅针对单一社交媒体下的数据进行研究,就无法更好的揭示信息演变过程,更好的利用信息价值。通过跨媒体的信息演化分析,能够更清晰、完整的表现事件脉络,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,国内外研究现状,基于共同用户的跨网络分析方法:利用已知的跨平台共同用户来分析多源数据分析同一用户在不同社交媒体下的用户信息行为,这样可以整合一部分分散在不同社交媒体网络的数据要求:大量已知不同社交平台下关联账户信息的用户在此基础上提出通过采集的共同用户对应关系及其在各网络的异质行为,挖掘多源数据之间的知识层关联主要假设是:如果有大量的用户同时关注平台A的主题(话题)#1和平台B的主题(话题)#2,那么主题#1和主题#2有很大可能是互相关联的。,国内外研究现状,基于共词网络社群的子话题识别(1)在考虑单源数据情形下,分析一个事件的演化时,我们以话题、子话题的形式对其进行研究,这样事件信息的演化过程就可以通过话题讨论的情况来展示;结合社交媒体的文本特征,将共关键词网络泛化为一般共词网络,并以此为基础利用共词网络社群表示子话题,探测和分析子话题演化过程,实现社交媒体话题演化分析。特征词识别利用TF-IDF方法来计算特征词的重要性权重,以此来选取不同话题时间段的话题特征词,国内外研究现状,基于共词网络社群的子话题识别(2)子话题识别据特征词在同一文本窗口中的共现关系,构建共词网络通过挖掘共词网络,发现用于表达同一事件或话题的核心词汇集合社群,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,研究内容和目标,论坛,微博,新闻,时间,对于同一事件,不同时间有a/b/c子话题,a,a,a,a、b,a、b,b、c、d,a、b、c,跨媒体信息演化分析,研究内容和目标,拟采取的方案,拟采取的方案,数据采集利用开源爬虫工具webmagic小组其他数据特征词识别与子话题关联分析TF-IDE、PL、PI结合判断词语重要程度,选择特征词,进而描述子话题对于两个子话题类,如果其交集(特征词)大过一定阈值,可认为是一个事件(合并关系)对于一个话题,其与另一个话题的一部分交集大过一部分,则可认为是其子话题(父子关系),拟采取的方案,话题信息演化分析结合时间信息:已知的文本信息中含时间戳结合平台信息,并进行对比:整合数据同时,标记信息来源话题关注度分析:统计转发数,查看数,回复数等跨媒体用户态度的区别表主观意见、情绪的词语统计需要记录保存话题快照,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,关键技术及难点,关键词提取关键词提取准确度子话题提取子话题提取准确度时间点分析时间点的选取主要子话题的识别和分析信息的不同平台演化及关系,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,课题背景及意义,国内外研究现状,研究内容与拟采取的方案,关键技术及难点,进度安排,主要参考文献,王巍;基于关键词和时间点的网络话题演化分析D;复旦大学硕士毕业论文;2009年陈卓群;基于共词网络的社交媒体话题演化分析J;情报科学;2015年01期冯璐;冷伏海;共词分析方法理论进展J;中国图书馆学报;2006年02期桑基韬;路冬媛;徐常胜;基于共同用户的跨网络分析:社交媒体大数据中的多源问题J;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论