博客广告投放位置的社会网络分析与选择.docx_第1页
博客广告投放位置的社会网络分析与选择.docx_第2页
博客广告投放位置的社会网络分析与选择.docx_第3页
博客广告投放位置的社会网络分析与选择.docx_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博客广告投放位置的社会网络分析与选择 摘要 博客网流量巨大,存在相当大的商业价值,本文从博客广告投放存在的 问题 出发,论述了博客网的 社会 特征、社会 网络 分析 过程,并通过实例说明了博客广告位置选择的一般 方法 。此方法对博客网广告的 发展 具有重要意义,由此可以大大提升博客网的盈利能力。 关键词 社会网络分析 广告投放 博客 一、博客网存在的问题 博客网是指提供博客产品及服务,并依此赢取商业利益的网站,是Web2.0的主要 应用 之一。它分为三种类型:综合服务类,如博客网、 中国 博客网等;门户类,如新浪博客、搜狐博客等;专业服务类,如 企业 博客网等。综合服务类博客网出现时间最早,服务种类最为齐全,对用户的 影响 也最大;门户类博客网依托门户网站,品牌知名度较高,盈利压力较小,发展最为迅速;专业服务类博客网由于只专注于某一特殊行业,博客人数相对较少。 据中国互联网络信息中心公布的2006年中国博客调查报告显示,截至2006年8月底,中国博主规模已达1750万,其中每月更新一次以上的活跃博主接近770万,注册的所有博客空间数接近3400万,博文读者达7500万,其中活跃的博文读者高达5470万。由此可见,中国博客网人流量巨大,存在商业价值,在用户体验、知识传播、网络营销等方面尤为突出。 虽然博客网影响越来越大,但 目前 的盈利模式与盈利能力,却与其地位很不相称,与传统的网络应用相比差距很大。究其原因,主要有这几方面:博客的所有权问题得不到很好解决。博客广告投放的位置问题没有得到解决。“名人博客”和“草根博客”的矛盾没有得到解决。 对以上问题进行分析,不难发现,影响博客广告发展的主要因素在于四个方面,分别是:博客广告应投放到什么位置?投放的博客广告 内容 应是什么?如何投放?投放的收益如何分配?弄清了这四个因素,对博客广告的发展无疑具有重要意义。 四个因素中的关键在于第一个,即寻找合适的博客广告投放位置。注意,这里的合适投放位置不是指名人博客(事实上有时可能是),而是指博客网中的关键结点。寻找到合适的广告投放位置之后,通过分析投放位置处的博客内容,就知道了应该投放的博客广告内容。 二、博客广告择位 1.博客网的社会特征 博客网上聚集了大量的人群,他们撰写各种主题的博文,以发表自己的观点,表达自己的情感等。按博文主题的不同,可以将这些人群分为不同的角色,归属于不同的社交圈。不管属于哪种类型的社交圈,要获得这些信息,都需要对博文内容进行数据挖掘和分析。目前,对博文内容进行数据挖掘的方式主要有以下几种,一是对博文内容进行挖掘,二是对博文结构进行挖掘,三是对博文利用方式进行挖掘。通过对博文内容的挖掘,可以找出博文中有用的信息,如文本、图象、声音、视频等,以便进行资源发现、文档分类与聚合、信息提取等。而博文结构挖掘主要是建立博文与博文间链接的结构模型,以便对网页特别是搜索引擎的结果进行排序,实现类似于Google的PageRank那样的应用。博文利用方式挖掘主要是使用数据挖掘的技术来对一些搜索日志进行挖掘,以便找出有意义的博文阅读模式,以获取博文读者的相关资料。 网络类型,分为三种,分别为随机网络、小世界网络和无刻度的网络。随机网络中,任意两个结点之间,存在连接的概率总是为p,结点具有同源性,没有明显差异,因而不可能形成一个个社交圈;小世界网络,结点差异较大,存在明显的群聚现象;而无刻度网络,大量的结点之间只存在少量的连接,而少数的结点之间却存在大量的连接(这些结点成为了网络中的Hubs结点),网中存在个体差异,也会形成不同的社交圈。 2.社会网络分析与关键结点 社会网络,属于社会 科学 的一个分支,它以社会成员(人)为结点,以人与人之间的关系为连线,构建网络图,以此为模型来 研究 人与人、人与社会群体、社会群体与社会群体之间的互动关系和相互影响。社会网络与随机网络有根本的差别。 社会网络分析(SNA),是指通过对社会网络模型中各社会成员(结点)之间关系和相互交往模式的分析,发现对应的社会网络结构。目前,社会网络分析已广泛用于组织行为分析、组织关系分析、人工智能、数据通信与信息安全等方面。当然,社会网络分析也不是万能的,也存在一些缺陷,如只能对静态数据进行分析,对动态数据分析的能力很弱,无法观察因时间因素和结点互动而造成的圈体演化过程,一些重要的影响因子有时也会被遗漏。 在社会网络模型图中,结点的个数总和称为结点大小(Size),结点与结点之间的连结程度成为密度(Density),每个结点所具有的连线称为度(Degree),结点与结点之间的路径长度称为距离(Distance),网络中所有结点之间的最大路径称为网络直径(Diameter)。社会网络分析的目的,最基本的是要找出网络中的一些关键结点,如Hub结点、Betweenness结点、Closeness结点等,如图1所示。在图1中,Andre与Carol结点之间有交互,但与Ike结点之间没有交互,因此Andre与Carol结点之间用一根直线相连,而与Ike结点之间没有用直线相连。社会网络中,存在三种不同类型的关键结点,即三种类型的中心点,分别为Degree Centrality、Betweenness Centrality、Closeness Centrality。Degree Centrality又称Hub结点,是指具有最大度的结点,如Diane结点,它一般是社交圈中的领导或专家,很多成员需要与他进行联系。Betweenness Centrality又称桥接点,是图中关键路径上的点,一般可连接两个不同的社区,如Heather结点,离开它Ike、Jane结点就不能与圈中的其他成员进行交互,它一般是经纪人。Closeness Centrality是指结点与其他结点的距离总和最短,它虽不处于网络的中心位置,但具有网络中的最佳视野,能够观察到网络中的所有流通的信息。 图1 一个社会网络模型 显而易见,对于博客网,若在这三种类型的关键点上投放广告,要比在其他结点上投放广告,所聚合的受众人数要高得多,同时效率也高得多;再结合分析关键点上的博文内容,也就能掌握社交圈的主题,对提高定向广告的精准性有很大好处。 3.博客广告投放位置的选择 博客网具有社会网络的特征,网上存在不同类型的社交圈,通过数据挖掘和社会网络分析,找出博客网不同社交圈中的三种类型的关键点,作为博客广告的最佳投放位。 三、查找关键结点的一般方法 在博客网上查找关键结点的一般方法,分为四个过程,分别为:搜集博文、对博文内容进行提取、网络分析、可视化输出,如图2。 图2 关键结点查找的过程 1.搜集博文 搜集博文的一般方法是利用网络爬行程序,从相关的博客网上搜集并下载所要的博文。 2.信息提取 在获得博文之后,需要对信息进行提取。由于不同的博主可能使用不同的博文摸板,因此信息提取的过程也比较复杂,需要使用一些诸如模式匹配和实体抽取的技术,实际操作时,可根据具体情况进行简化处理。 3.网络分析 网络分析是发布博文定向广告最重要的环节。网络分析主要集中在三个方面:拓扑分析、关键结点分析和群体分析。 拓扑分析的目的主要是验证博客网,在拓扑分析的过程中,使用了几种统计分析指标,如平均最短路径长度、聚合系数、度的分布。平均最短路径长度反映了网络中各个结点之间的总体最短路径,可用来衡量结点间通信的效率;聚合系数表明了网中结点聚合成群体的可能性大小;度的分布概率P(k)能表明一个结点有k个连接的概率大小。 经过拓扑 分析 之后,接下来就可以利用 社会 网络 分析的 方法 来分析网络社交圈中的各个关键结点。三种类型的关键结点,Degree Centrality结点的degree最高,其活跃程度也最高,是博客网中的Hub结点,也是博客社交圈中的“领导”或“专家”。Betweenness Centrality结点是桥接点,其值也最高,需要经过它才能访问到其他结点,它是博客社交圈中的“经纪人”。Clossness Centrality值最小,表明其在博客网中的视野最好。 若将社交圈看作是一个结点,大型博客网可能存在由不同规模的社区圈构成的泛社交圈。运用BlockModel技术,也可找出泛社区中的关键结点。 4.可视化输出 网络提取与分析的最终结果,需要通过多维缩放(MDS)或图形化的方式展示给人看。当用图形方式展示时,往往将接近度较高的结点靠近显示,而将接近度较低的结点分离显示。 四、一个实例 新浪博客网是在 中国 规模较大,较有 影响 的一家网站。作为 研究 的实例,利用开源的网络爬行程序:Web-Harvest,从新浪博客上随机选择500篇博文,先按博文的用户名将这些博文归类到136个不同的博主下。为了获知这些博主分别属于哪些社交圈,对所有博文进行社会网络分析。为简化分析的过程,分析之前先将新浪博客的社交圈归结为:几种不同的类型;然后对每一种社交圈,分别设置若干种不同的模式匹配关键词,如对财富 金融 社交圈设置模式匹配关键词:行情、港股、美股、新股、权证、大盘、个股、公司、公告、研究、期指等。 思想汇报 接下来,对每一篇博文进行社会网络分析。生成网络图,每个结点对应一个博主。为了简化分析的过程,不进行网络拓扑分析,只对关键结点进行分析,分析时遵循以下规则: 第一,匹配博文 内容 与社交圈关键词,命中时对应结点的相应社交圈可能值加1。 第二,博文中若出现到某个社交圈或好友的链接,则将此博文对应的结点与圈主或好友结点确定为同一个社交圈结点。 第三,博文中若存在到其他博主的链接,则在对应的两个结点间用线相连。 第四,提取每篇博文中博主的特征信息,如性别、年龄、爱好、职业等。 经过上述过程处理之后,对各结点的若干社交圈可能值进行加权排序,以确定各个结点所在的社交圈,最后用可视化的方法进行输出。 五、结束语 以上通过社会化网络分析,获得的三个比较大的社交圈:情感交流、财富金融、文学 艺术 ,基本上与新浪网所设定的社交圈人气指标相一致,结果令人满意。但由于分析之前,人为设定了S集合的内容,同时由于没有对实例中的网络图进行拓扑分析,网络的非随机性没能得到验证,加上社会网络分析存在的固有缺陷,使得结果的真实性还存在一点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论