




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于时序预测和主成分分析的电视剧热度研究基于时序预报和主成分分析的电视剧热度讨论 此时拟合优度增长至0.97,两个拟合系数均通过了0.05显著性水平检测。测试集的真实值为 6.202,6.5,6.681,预报值为6.028,6.265,6.472。经过计算,相关系数到达0.994,均方根误差位0.2363。由此通过对比可以看出,ARMA模型与AR模型相比,在保存数据增长趋势的同时,弱化了异样点带来的影响,得到了更好的拟合结果。 4利用主成分分析建立多因素自定义热度模型4.1确定热度值影响指标在当前“多屏播出的时代,分集播放量、收官前后播放量和收视率都有各自的局限性并且无法反映一部剧集精确的热度
2、,因此我们引出自定义的热度计算方法。具体来说,在我们的模型中主要考察以下几个方面的因素变量:1播放量、收視率:传统的评价指标,衡量了观众观看电视剧这一基本行为的数量。这一节中选用集平均播放量、收视率来作为每一部电视剧的收视评价指标。2豆瓣评论数:包括短评数与剧评数,评论越多代表更多观众观看电视剧后进行了对电视剧的进一步反思。3豆瓣评分、评分人数:衡量了观众对电视剧的主观评价,评分人数代表电视剧受关注程度。4开播前、后一个月搜寻指数:衡量了观众对电视剧的关注度,开播前的搜寻指数受到电视剧的宣扬力度、演员名气等影响;开播后搜寻指数受到电视剧内容、热议程度等影响。5微博粉丝数:包括男女主微博粉丝量及
3、电视剧官微粉丝量,我们认为演员的微博粉丝量衡量了演员的受关注程度,而受关注多的演员,即明星出演的电视剧会受到更多的观众关注。6相关视频数:包括官方公布的预告片、新闻公布会视频,但更多的是网友个人公布的花絮剪辑等,相关视频越多,说明电视剧更具社会影响力,也会吸引更多潜在观众。7周边月销售指数:电视剧制造的商业利润,衡量了观众对电视剧及剧中人物的宠爱程度。月销售指数计算方法如下:月销售指数=商品价格×该商品月销量选取各周边商品月销售指数的最高值代表该电视剧的周边月销售指数。4.2利用主成分分析的方法建立模型这里通过Matlab主成分分析函数princomp实现具体步骤,利用主成分分析的方
4、法,按照以下步骤依次进行计算分析:1计算相关系数矩阵。7个变量两两计算相关系数,一共计算33次,形成 7×7 阶的相关系数矩阵Ar=aij|i1,7,j1,7矩阵中的每个变量代表两个因素数据的相关性。例如 aij 就表示第 i 个因素和第 j 个因素的相关性,相关性的计算方法为:rx,y=Covx,yVarx*Vary相关性可以用excel的correlx,y函数计算。在本章节中,使用matlab编程求解。2计算主成分的累计奉献率。经过计算,前4个主成分的累计奉献率到达89375%,分别是38.34%、20.43%、16.43%和1434%,到达同意范围内。所以以4个主成分为反应热度
5、水平的标准。3计算主成分载荷。通过计算结果反应,四个主成分的主要载荷的指标为:C1主成分在播放量和收视率两个特征上具有较大载荷,说明第一个主成分主要反应的是电视剧在多屏上受关注的程度。C2主成分在豆瓣评论人数、微博粉丝数等相关特征上有较大载荷,说明该主成分主要反映的是电视剧在社交网络上的影响力。C3主成分在搜寻指数和豆瓣评分上具有较大载荷,说明该主成分主要反映出剧集口碑和观众的期盼程度。C4主成分在相关视频和周边月销量指数两个特征上具有较大载荷,说明该主成分主要反映了该电视剧的周边影响力。4得到最终结果。最终,该电视剧的整体影响力由四个主成分确定,权重系数由奉献率确定,即Index=0.383
6、4C1+0.2043C2+0.1644C3+01435C4而每一个主成分的表达式为:C1=0.438x1+0.596x2-0.243x3+0.192x4+0.245x5+0.164x6-0.006x7C2=-0.029x1+0.283x2+0.020x3-0.062x4+0.638x5+0.274x6-0.085x7C3=0.132x1+0.156x2-0.043x3+0.492x4+0.145x5+0.464x6+0.506x7C4=0.138x1+0.231x2+0.133x3-0.093x4+0.143x5+0.064x6-0.167x74.3利用多元热度评价模型进行热度排序由此我们可以
7、给出2021年热度值前十名的电视剧榜单,2021年1-7月电视剧的实际网络总播放量与本文得出榜单对比方表1。通过与2021年电视剧网络总播放量排行榜的对比,从整体上看,本次自定义热度值的效果较为理想,更能够表达出一个电视剧的综合影响力。5结论本文利用自回来模型对收视率进行了时间序列预报,并对自回来模型进行了平滑滤波改良,实现了更好的预报性能。本文还对7个影响电视剧热度的因素进行了综合分析,并利用主成分分析的方法降低维度、最终得到了综合考虑各种因素的热度指标。在后续的讨论中,我们将继续从以下几个方面进行完善:1继续完善模型,在把握更多的数学方法和机器学习理论学问以后,可以尝试应用人工神经网络等非线性拟合方法来预报收视率和播放量的增长趋势。2深入探
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机电工程预算编制试题及答案
- 文化政策对社会发展的推动作用试题及答案
- 2025年北京昌平区兴寿镇招录乡村助理员笔试试卷
- 计算机软件测试在政策评估中的角色试题及答案
- 2025年废旧塑料回收处理技术革新与产业链协同发展研究报告
- 软件设计与用户体验的融合及试题答案
- 软件设计师考试成功在于实践试题及答案
- 2024年黑龙江省外事办公室下属事业单位真题
- 2024年福州市建筑设计院股份有限公司招聘笔试真题
- 四川省中医药管理局所属事业单位选调考试真题2024
- 增材制造简介课件
- 维氏硬度计点检表
- 废弃物分类、清运、处理流程图
- 喷播绿化质量检验评定表
- DB64∕T 1792-2021 羊全混合日粮颗粒饲料加工技术规程
- 北京市专业技术类职业资格培训服务合同
- 唇腭裂儿童的语音干预与治疗
- HY∕T 0289-2020 海水淡化浓盐水排放要求
- 高校基建管理部门组织构成及管理模式研究
- 特种设备检验流程图
- 北京协和医院食物交换表
评论
0/150
提交评论