【《基于文本分析的手机游戏用户情感倾向实证研究》25000字】_第1页
【《基于文本分析的手机游戏用户情感倾向实证研究》25000字】_第2页
【《基于文本分析的手机游戏用户情感倾向实证研究》25000字】_第3页
【《基于文本分析的手机游戏用户情感倾向实证研究》25000字】_第4页
【《基于文本分析的手机游戏用户情感倾向实证研究》25000字】_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于文本分析的手机游戏用户情感倾向实证研究目录第一章绪论 第一章绪论1.1研究背景电子游戏作为高科技技术发展的骨干,是以各种文化元素作为背景,将文化、科技与创新创作融为一体的第三产业产物。电子游戏形成以开发为重要任务、以同人创作为辅助产品、进行多方位人才培养的新型产业链,是现如今第三产业的重要组成部分。相较于2015年,2016年全球游戏市场规模达1011亿美元,增长了91.50亿美元,增幅为9.96%[3]。电子游戏同样是高新技术的推动器,现如今风靡全球的AR(AugmentedReality,增强现实)和VR(VirtualReality,虚拟现实)技术,皆有电子游戏推进而来。2016年,任天堂和宝可梦公司合作研发的《PokemonGo》使人们关注到AR技术,随后,AR技术广泛运用于电子教育、医疗健康、企业培训、零售购物、虚拟试衣、房屋设计中。手机游戏所需求的操作设备较易获取并方便携带,操作层面是更为简单。根据iiMiediaResearch统计数据显示,我国手机游戏市场的规模呈现逐年增长的状态,2020年市场规模达到1850.3亿元,2021年预计会达到2021.1亿元。自然语言处理(NaturalLanguageProcessing,NLP)是研究实现人与计算机进行通信,将人类交流所使用的自然语言翻译成计算机可读并且理解的语言。用自然语言与计算机进行通信,使自然语言通信功能运用到生活的各处,极大地便捷了人类的生活。各种手机的手机助手,如苹果手机的“Siri”,以及各种AI产品,如“天猫精灵”等,在给生活带来方便的同时,也添加了乐趣。文本情感分析是对有情感色彩的文本进行分析和归纳,判断其包含的情感倾向。处理的文本包括互联网上的在线点评和包含个人情感倾向和主观感受的网络评价等。文本内容多包含喜怒哀乐等情感和表扬批评等主观态度,文本情感分析则需要提取文本中的这些倾向性意愿进行分析。本文将以国风角色扮演类武侠手游《剑网3:指尖江湖》和《一梦江湖》的用户群体为研究对象,分析用户对游戏内的玩法属性等方面的评价,寻找用户比较偏爱的方面,并且对评价较低的方面总结研究;运用整理好的评价对游戏的综合属性进行分析,找到游戏运营研发的薄弱环节,给游戏开发者提供意见。1.2研究目的以《剑网3:指尖江湖》和《一梦江湖》为例,采用基于领域词典的在线评论情感分析技术,尝试构建武侠手游情感评价专属词典,并通过情感倾向性分析探究用户情感评价紧密相关的游戏属性是哪些以及它们引发的情感体验特征。对两款游戏所涉及的包括玩法和性能以及配置需求等属性方面,通过情感词库和机器学习文本分析的方法建立模型,分析用户对各方面的满意度,对两款游戏所欠缺的方面整理分析,基于研发者合理的意见。1.3研究意义1.3.1理论意义采用大数据与电子游戏结合的方法,对用户评价进行传统文化渗透剖析和用户满意度分析,可以更加快速的对游戏发展的薄弱问题进行解读,为游戏开发者提供参考,便利了游戏方的运营。1.3.2现实意义关于电子游戏中用户情感体验,可以帮助游戏开发者和研究者更好地将用户喜爱和期待的方面融入到游戏设计中,增加用户对游戏的好感,对游戏优化、用户粘性、以及同类游戏竞争力的提高具有重要意义。1.4本章小结本章描述了现阶段ACG产业、电子游戏以及手游的产值,简单阐述自然语言处理和情感分析的现况,提出研究方向。介绍了文章的研究目的以及研究意义。第二章自然语言处理与文本情感分析相关综述第二章自然语言处理与文本情感分析相关综述2.1自然语言处理与文本情感分析简介自然语言处理(NaturalLanguageProcessing,NLP)简单来说就是用计算机来分析和理解人类的自然语言,并将它运用到实际中。其涉及到的科目包括计算机、语言学、数学、统计学等。自然语言处理的目的是实现人机之间的交互和自然语言通信,即需要计算机充分理解人类的自然文本的意义,并且返回给人类用自然语言表示的需要得到的结果,即分为了自然语言理解和自然语言生成两个部分。早期的自然语言处理仅包括建立词汇、句意分析、问答聊天和机器翻译功能,90年代开始流行的基于统计学的机器学习方法,使自然语言处理有了飞跃性的发展,尤其在机器翻译和搜索引擎等功能上。利用机器学习作为工具,通过确定得到的参数,对输入的数据进行解码并得到相应的输出。2008年后,深度学习在语音和图像方面大展拳脚,自然语言处理随之引入该类方法,而建立起基于神经网络的自然语言处理算法并在机器翻译、问答和阅读理解方面取得不小的进展。[5]文本情感分析是对有情感色彩的文本进行分析和归纳,判断其包含的情感倾向。处理的文本包括互联网上的在线点评和包含个人情感倾向和主观感受的网络评价等。文本内容多包含喜怒哀乐等情感和表扬批评等主观态度,文本情感分析则需要提取文本中的这些倾向性意愿进行分析。[6]2.2国内外文献综述2.2.1国内文献综述朱嫣岚、闵锦、周雅倩(2006)提出了采用知网Hownet的词典对文本进行情感倾向性计算,提出了基于语义相似度和基于语义相关场的倾向性计算方法[7]。娄德成、姚天昉(2006)通过对互联网中文评论进行极性分析,提出计算词语上下极性的算法,并与人工标注的结果进行比较来证明文章的有效性[8]。单晓红、杨柳(2014)通过挖掘产品评论,提取特征来分析消费者和商家的关注点从而提供有价值的信息[9]。陈佳慧(2019)通过实时获取更新网络用语,提出了构建细粒度情感词典的方法[10]。王钟璞(2020)把文本分析与神经网络结合起来进行模型创建[11]。杨经、林世平(2011)主要分析喜怒哀惧四类情感问题,构建相应的情感基准词,挖掘潜在的情感词,再通过机器学习的方法进行特征选择,对句子进行情感识别分类[12]。杜嘉忠、徐健、刘颖(2014)对互联网上的产品评论进行分析,提出基于领域情感专用词典的方法,并与基于Senti-HowNet词典的情感分析进行对比[13]。刘阳、高巍、李大舟(2019)通过分析微博上的200篇文章,根据群众对事件的态度,根据情感词对情感倾向性的影响,设计情感得分的算法[14]。陈海棋(2017)对海量手游评论进行分析,建立专属词典进行情感倾向性分析[15]。陈晓东(2012)对中文微博进行情感倾向性分析,通过分类有情感词的情感分析和无情感词的情感分析,进行情感加权计算[16]。马子洲(2018)对于用户购买手机后的评论作为研究范本,利用改良SO-PMI算法对情感词典进行扩充,再对评论进行正面评论和负面评论的分类[17]。2.2.2国外文献综述Turney等人提出用逐点互信息方法PMI(point-wisemutualinformation)对评论和文本进行分类,提取语句中带有主观意愿的相关词性的词语,再通过计算褒义种子词和贬义种子词的PMI值,再将情感极性相加得到整条评论的情感倾向[18]。Tofiloski(2011)提取了基于词典的情感分析方法,利用SO-CAL建立带有强化情感的词语和否定词的词典[19]。SanjivR.Das、MikeY.Chen(2007)提取了股票留言板中小型投资者的情绪评论,提出了一种误差较低的类贝叶斯分类器,分析股票价值和评论的情感倾向之间的关系[20]。MinxueHuang、RizwanAli、JunyunLiao(2017)通过调查网游玩家的喜爱偏向,研究用户体验和口碑传播,并讨论其实际意义和理论意义[21]。TomioJindo、KiyomiHirasago(1997)采用情感分析对文本进行进行主观评价,再采用多变量分析进行处理[22]2.3本章小结本章对自然语言处理和文本情感分析做了简单的介绍,再列举国内外对于自然语言处理和情感分析的相关文献。第三章相关介绍和理论概述第三章相关介绍和理论概述3.1国风武侠类手机游戏3.1.1武侠手机网络游戏的界定网络游戏(OnlineGame),简称“网游”,是指通过互联网传输的方式,使多位玩家参与的游戏类型。[24]。手机网络游戏即手机上网可以玩的网络游戏。相比于客户端网络游戏,手机网游最大的特点就是便携性和移动性,更能满足用户随时随地玩游戏的需求。相比于早期的单机手游,手机网游的色彩玩法更加丰富、画面更加精美,人物形象建模更加立体饱满。其操作方式包括触屏、感重力感应等,满足玩家多方面的体验。武侠文化则是国内特有的流行文化,即以各式侠客形象作为主角,以各种绚烂神幻的武术技巧作为特点,宣扬惩奸除恶、伸张正义的精神。周武王《剑铭》中:“带之以为服,动必行德,行德则兴,倍德则崩。”《史记-游侠列传》更是记载了各位侠士的逍遥自在,透露着对侠士潇洒意气的赞美。武侠文化从古至今都有着很高的热度。古今文人通过小说话本来宣扬侠义精神,如《水浒传》、《天龙八部》等,近代也不乏有优秀的武侠类影视和游戏作品,如《仙剑奇侠传》、《古剑奇谭》等。武侠文化的主角多拥有不轻言弃、刻苦努力,最终成为一代大侠的经历,而各类作品中的关键人物也多为逍遥自在、武力高强的存在。金庸所写的“侠之大者美国为民”,点燃了无数人的侠心。将这些正面形象融入到现行较为火热的手机网游里,一方面为游戏增添乐趣,同时也更加快捷宣扬了传统的武侠文化。3.1.2武侠手机网络游戏的分类通过游戏方式的不同分为三类。第一类为现下武侠类手机网游多为mmorpg游戏(MassiveMultiplayerOnlineRole-PlayingGame,大型多人在线角色扮演游戏),即玩家通过扮演一个虚拟人物来进行各种游戏内的活动,如《天涯明月刀》、《汉家江湖》等。第二类为棋牌类游戏,如《三国杀》、《英雄杀》,通过将古代历史人物和经典事件带入到游戏中,由此使玩家能了解更多历史。第三类为moba游戏(MultiplayerOnlineBattleArena,多人在线战术竞技游戏),如《王者荣耀》,通过结合历史人物和绚丽的技能以及华美的外观来宣扬武侠文化。武侠类手机游戏通过构建不同的世界观来展示作品宣扬的武侠精神。第一类为历史故事类,如《三国志》等,从人物形象和背景上高度还原历史,使玩家在游戏的同时学习更多历史知识。第二类是以古代王朝作为背景构建虚拟的框架,如《剑网3:指尖江湖》等。第三类为仙侠类,即架空出一个现实中不存在的拥有完整时间线的世界,如《仙剑奇侠传》等。3.1.3武侠网游的发展和武侠手机网络游戏产业现状2000年后网络游戏在国内兴起,武侠文化紧随其后融入到游戏中。但由于玩法单一且韩游火极一时,直到2007年,《魔兽世界》大热,MMO进入全盛时期,国产武侠网游开始繁荣。由搜狐畅游公司《天龙八部》凭借古风韵味十足的画面吸引众多玩家。随后两年,金山西山居旗下的《剑侠情缘网络版》在3D武侠作品上获得骄人的成绩,成为了国产3D武侠网游的常青树。然而到了2015年,随着社会节奏的加快,MMO这种对设备和时间要求较高的游戏模式逐渐衰落,游戏开发者慢慢讲注意力集中于手机游戏中。随后推出的各类武侠手游,不再拘泥于受限的时间和空间,合理利用用户的碎片化时间,将网游便捷化,做到随时随地打开手机就能畅游游戏世界,极大丰富了人们的生活。现如今武侠手游良莠不齐、玩法类似,除去发行较早的《一梦江湖》和由端游衍生的《剑网3:指尖江湖》,同类MMORPG游戏热度并不是很高。而想提升产品热度,首先要做到对症下药,故本文选择此两类游戏进行研究。3.1.4武侠手机网络游戏的文化元素武侠游戏除了有富含传统文化和侠义精神的世界观和人物设定以外,其他如背景音乐和地图构造也融入了传统文化元素,如音乐方面。武侠游戏多运用传统中国乐器,如古筝、编钟等进行谱乐奏乐,给人以身临其境的美妙感觉。《剑网3:指尖江湖》中的文化元素《剑网3:指尖江湖》是西山居于2019年6月12日发行的大型多人3DMMORPG手机游戏,是古风武侠网游《剑网3》的手机版二次创作[24]。游戏以盛唐安史之乱为时代背景,在朝堂混乱、社会动荡不安中各辈侠客行侠仗义、扫奸除恶。其次是游戏的人物设定。除去如安禄山、史思明等以外真实存在的历史人物,游戏还创造了如善于谋略奋勇抗敌的将帅李承恩、巾帼不让须眉睿智过人的道教弟子于睿等。同时,游戏的门派设定和武学设置上结合传统文化与背景以及信仰流派,如融合道家真谛以剑为武器的纯阳宫、信奉佛教以禅杖为武器的少林寺。游戏地图上通过寺庙、宫殿、庭院等建筑,彰显古代匠人精湛技术。结合盔甲、禅衣、道袍以及唐朝流行服饰,人物模型的建立上也传达出文化元素。《一梦江湖》中的文化元素《一梦江湖》是以古龙《楚留香传奇》为游戏背景,由网易游戏研发的武侠RPG手游。[25]不同于《指尖江湖》,《一梦江湖》的世界观沿用了古龙的小说《楚留香传奇》系列小说的故事,从背景上就凸显侠义气氛。正派人物设定或为行侠仗义的侠客,或为德高望重的掌门,又或是智力超群的智者,人物性格突出正派风气。游戏的门派设定相较于《指尖江湖》更为仙侠,如使用灯和铃来进行战斗的云梦、使用铜镜和纸偶来进行战斗的太阴。《一梦江湖》的地图设置更加立体全面,山河湖海、飞檐峭壁的建设更为生动。服饰方面更多采用纱制和飘带,使人物看起来更加仙气。3.1.5武侠手机网络游戏研究中的困难1.中文文本的多样化在游戏评论中,用户可以通过发表内容来描述自己的游戏经历和感受,或者是对某个环节的点评。这些文字多包含各种情感,但用语大多是非书面语,口语化严重,句式结构较为杂乱,利用现有词库进行自然语言处理很难计算出准确的情感得分。2.情感词典的构建中文文字的表达方式千变万化,一个词语在不同情境下包含的情感各有不一。如“厉害”这个词,正常语义解释为“实力高强,能做到别人难以做到的事”,多为褒义词。但放在“能迟到这么久也是厉害”类似的语句中,则表示贬义。语境不同所表示的情感倾向多有差异,给情感倾向的得分计算带来误导。而游戏评论中玩家的发言更为突出,使构造适用于游戏的情感词典成为该研究的一大难点。3.2文本预处理3.2.1中文分词中文分词的意义中华语言博大精深,在互联网发达的今天更是如此。在研究中文文本的自然语言处理时,会遇见很多问题。如何快速准确的进行分词处理是实现文本情感分析的重要步骤。(1)“词”和“词组”的边界模糊外文多以单个词作为单位,中文以每个基础字为单位,但单字很难表达出完整的意思,词语拆分成的单字具有不同的含义。比如说,“我想吃蛋糕”这句话,用英文文本描述为“Iwanttoeatacake”,“cake”作为一个单词,可直接翻译为“蛋糕”,但使用中文时,则可以拆分成“蛋”和“糕”两种食物。(2)语句分割使语义发生变化不同于英文文本中单个词语间有空格分割,中文文本语句连续成体,因此,划分句子方法的不同以及对句子语境理解的不同会得出不一样的情感倾向。如:“这个关卡非常难过”中,“难过”这个词语意为“难以通过”。但在大多语境中,“难过”多作为形容词,表示“沮丧、不开心”。(3)新词层出不穷在信息化发达的今天,网络在线评论表述方式各有不一,新词应接不暇,使现有的情感词典很难准确地判断词语所表达的情感取向。如:“人艰不拆”、“叽叽歪歪”、“避雷”等网络新词。现有分词算法分类根据实现原理和特点的不同,可以将中文分词分为三类:基于字符串匹配的分词算法、基于理解的分词算法和基于统计的分词算法。[26](1)基于字符串匹配的分词算法基于字符串匹配的分词又名为机械分词,是通过匹配文本与设定好的词典中的词条来进行分词,若词典中存在文本中扫描到的词语,则匹配成功。常见的机械分词方法有:正向最大匹配法、逆向最大匹配法、双向最大匹配法。(2)基于理解的分词算法给予理解的分词算法是通过模仿人类的句子理解能力进行分词,即通过句意判断来消除分词中存在的误差,包括分词子系统、句法语义子系统、总控部分三个系统。(3)基于统计的分词算法基于统计的分词方法的主要思想是,将单个字作为最小的单位,联系所有要分析的文本,若相连的字出现在该文本中的次数频率越高,越有可能成为一个词。届时则需要设定一个频率作为相关阈值,用来衡量词组出现的可能性,若出现频率高于该阈值,则可以判断这些字组成一个词。在实际的分词过程中,通常将基于字符串匹配分词算法和基于统计的分词方法结合使用,既可以表现出对于现有词语的匹配速度快的优点,又可以识别新词生词、减少歧义。主要的统计模型有:N元文法模型(N-Gram)、隐马尔科夫模型(HMM)、最大熵模型(ME)、条件随机场(CRF)等。中文分词系统介绍(1)汉语语法分词系统ICTCLASICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem)由中国科学计算技术研究所研究得出,其主要功能包括:中英文混合分词功能、关键词提取功能、新词识别与自适应分词功能、用户专业词典功能。最新研制的ICTCLAS版本为ICTCLAS3.0,分词速度达到单机996KB/s,精度达到98.45%。[27](2)开源中文分词系统HTTPCWSHTTPCWS是授权BSD协议、目前仅支持Linux操作系统、开发语言为C/C++的基于HTTP协议的开源中文分词系统,目前仅支持GBK编码,利用逆向最大匹配法配合自定义词库对使用ICTCLAS的分词结果进行处理。通过测试,局域网内的HTTPCWS接口中文平均的处理速度为0.001秒,每秒可处理5000到20000次requests。[28](3)简易分词系统SCWSSCWS(SimpleChineseWordsSegmentation)是基于词频词典、可将整段中文文本大致准确地切分成词组的机械中文分词引擎,是目前最方便的开源免费的中文分词系统之一,支持GBK、UTF-8、BIG5等汉字编码。SCWS利用自行采集的词频词典,结合部分专有名称、人名地名、数字年份的词语集合,准确率在90%~95%之间。[29](4)轻量级非浸入式PHP应用性能分析器PHPAnalysisPHPAnalysis是现存使用较为广泛的中文分词系统,使用逆向匹配算法配合基于unicode的词库进行分词。[30](5)MMSeg算法中文分词器mmseg4jmmseg4j是基于Chih-HaoTsai的MMSeg算法的中文分词器。MMSeg算法使用UTF-8编码格式,有Simple和Complex两种分词方法,都是使用正向最大匹配法。MMSeg1.6版本开始,在Comples算法的基础上实现了max-word(最多分词)。[31]Python常用中文分词工具介绍(1)jieba分词jieba分词是当前国内使用最普遍的中文分词工具,其支持三种模式:1)精确模式:将橘子进行最精确的切分;2)全模式:扫描文本中所有可以连接成词的词语,速度较快,但不能消除歧义;3)搜索引擎模式:结合精确模式,通过对文本中较长的句子进行切分来提高召回率。[32](2)SnowNLPSnowNLP是受TextBlob启发编写,可以方便处理中文文本的Python类库。不同于使用NLTK的TextBlob,SnowNlp自带已经训练好的词典,且所有算法都是由自身实现。其主要功能包括:中文分词、词性标注、情感分析、文本分类、转换成拼音、繁简转换、关键词和摘要提取、计算文档词频和逆向文档频率、文本相似度计算、Tokenization。[33](3)THULACTHULAC(THULexicalAnalyzerforChinese)是一个高效的中文词法分析工具包,由清华大学自然语言处理和社会人文计算实验室研制,可进行中文分词和词性标注,具有能力强、准确率高、速度快的特点。[34]3.2.2去除停用词停用词是指在信息检索的过程中,进行自然语言处理前后为了提高处理效率会自动过滤掉的部分字或词。停用词是人工输入形成的表,在文本中不显得频率很高且意义不大,多为一些语气助词、连词、副词等,如“的”、“是”等。在分词过程中,若使用太多的停用词,会对有效信息造成干扰,降低分词工作的准确性。Hownet词典中现有停用词为2612个。3.2.3关键字提取关键字提取概述文本以多样的元素表示,如字、词组、短句等。这些元素被称为文本的关键字,代表文本的特性。在进行自然语言处理,通常需要从文本中提取关键字。正确的关键字提取可以减少文本的规模,降低处理难度,有利于改善分析。现有常见的关键字提取的方法有CHI、IG、MI、word2vec、TF-IDF、Textrank。关键字提取常见方法(1)卡方校验CHI卡方校验(chi-squaretest)是数理统计中检验独立性的方法,用来统计实际观测值与理论观测值之间的偏离程度。在文本的特征选择中,卡方校验则用来衡量类别与词组之间的关联度。假设词组与类别间服从自由度为1的卡方分布,则值越大,表示关联度越大,该词组对类别的信息量越多,反之则越少。(2)信息增益IG信息增益(InformationGrain,IG)是根据词组为整个分词系统带来的信息量来判断其重要性后进行筛选。该词的信息量越多,则重要性越大。信息量的多少由信息熵衡量。对于一个词组来说,系统包括该词组时的信息熵与排除该词组后系统的信息熵的差值则为该词组为系统带来的信息量,称为增益。(3)互信息MI互信息(MutualInformation,MI)是两个随机变量的信息量,即两个变量之间的相关性,是自然语言处理常用的方法[35]。其基本思想为当互信息越大时,类别和词组越有可能同时出现。某些训练集中较少可能由于错位分词出现的词组,其互信息值较大,容易被选为特征。而这些词在分类过程中很难匹配到,故造成工作的准确率较低。(4)词向量word2vecword2vec又称为wordembeddings,是用来产生词向量的模型。在使用one-hot(独热编码)的编码形式对文本处理时可得到词向量,但结果存在数据稀疏。word2vec则使用神经网络将one-hot的词向量映射每个词到一个向量来表示词与词之间的关系[36]。(5)词频-逆文档频度TF-IDFTF-IDF其实为TF与IDF的结合。TF(TermFrequency)为词频,表示某一词在文章中出现的次数;IDF(InverseDocumentFrequency)为逆向文件频率,度量某一词在文章中的重要性和普遍性。TF-IDF实则为TF*IDF,故:(3-1)故TF-IDF值与某词在文本中出现的次数为正比,与该词在文本中出现的次数为反比。(6)TextrankTextrank的基本思想是通过构建词语次之间的网络再计算每个点的rank值,排序高低提取关键词。Textrank的迭代公式如下:(3-2)其中,表示结点的rank值,表示结点的前驱结点集合,表示结点的后继节点集合,作为平滑因子,为权重,代表两结点的边连接的不同重要程度。本文运用的提取关键词方法为Textrank法。其算法原理如下:1)将文本按照一定的规矩分割成若干个部分,即(3-3)再对句子进行去除停用词、分词和词性标注的预处理,保留指定词性的词语,即(3-4)其中是经过预处理后保留的候选关键词。2)构建候选关键词图,是候选关键词组成的节点集,通过共现关系来构造边,即当且仅当两个节点对应的词在长度为K的窗口共现时边才会存在,则最多共现K个词。3)迭代传播每个节点的权重直到收敛,对各个权重进行倒序排序选出最高的T个词语作为候选词。4)利用候选词对原文进行标记,若形成相邻词组,则组成新建关键词。3.3本章小结本章介绍了国风武侠类手机游戏的现状和发展,概述了研究涉及到的两款手游,分析当前情感分析中的困难;对文本预处理过程进行简单描述,介绍了几种常用的分词算法、分词系统和分词工具;对关键词选择方法进行简单介绍。第四章问题提出及研究意义第四章问题提出及研究意义4.1问题提出步入21世纪后,人们更加重视对于传统文化的保护和传承。现如今走在街上,琳琅满目的古风元素,时不时还能看到几个身着汉服的路人。游戏同样与时俱进,传统文化游戏广受用户喜爱。不单单是将游戏的大环境设定在古代王朝中,游戏更是会在各个传统节日中开设相应的庆典活动,拿西山居旗下的国风武侠游戏《剑侠情缘网络版3》来说,端午节的划龙舟,重阳节的插茱萸,元宵节的猜灯谜,都是用户津津乐道的地方。同时,这些游戏的地图设计和配乐选择,都极其的复合国人对古风的审美。本文将以国风角色扮演类武侠手游《剑网3:指尖江湖》和《一梦江湖》的用户群体为研究对象,收集手游应用软件APP《Taptap》上的用户评论,分析用户对游戏内的玩法属性等方面的评价,就传统文化方面进行分析,寻找用户比较偏爱的方面,并且对评价较低的方面总结研究;运用整理好的评价对游戏的综合属性进行分析,找到游戏运营研发的薄弱环节,给游戏开发者提供意见。4.2研究框架研究一:以《剑网3:指尖江湖》和《一梦江湖》为例,探究用户对国风角色扮演类武侠手游的情感倾向。从Taptap上爬取两款游戏的在线游戏评论,通过机器学习的方法构建领域专属情感词典和属性词典,并将专属情感词典与现有的基础情感词典组合,形成武侠手游研究情感词典。研究二:对两款游戏的评论按照属性进行分类,计算其情感得分,判断用户对于各类属性的情感倾向,对两款游戏所欠缺的方面进行整理和分析。并通过计算总均分来判断用户对于各方面的满意度,研究用户对于武侠类角色扮演手游的各属性情感特征。4.3研究意义4.3.1理论意义采用大数据与电子游戏结合的方法,对用户评价进行传统文化渗透剖析和用户满意度分析,可以更加快速的对游戏发展的薄弱问题进行解读,为游戏开发者提供参考,便利了游戏方的运营。4.3.2现实意义关于电子游戏中用户情感体验,可以帮助游戏开发者和研究者更好地将用户喜爱和期待的方面融入到游戏设计中,增加用户对游戏的好感,对游戏优化、用户粘性、以及同类游戏竞争力的提高具有重要意义。4.4本章小结本章主要提出主要研究问题,并分析了研究该问题的理论意义和现实意义。第五章武侠手游评论情感词典构建第五章武侠手游评论情感词典构建5.1情感词典相关介绍5.1.1情感词典概述情感是人类对某一事物所持态度和反应,是检验某一事物的存在和事件的发生是否符合人类预期及价值观时而产生的态度体验。[37]情感分析是为了找出说话者或作者在某一话题或针对某一文本的带有情感倾向观点和态度。对于评论而言,用户通过对某一话题、产品或事件发表自己的意见、观点、立场等,来表达内心的情感倾向[38]。情感倾向是人类对于某一事物的主观存在的内心喜恶和内在评价的倾向,由两方面衡量,即情感倾向方向和情感倾向度。情感倾向方向又称为情感极性,通常表现为正面情感、中性情感和负面情感。如“喜欢”和“好看”表示赞扬,是正面情感;“讨厌”和“难看”表示否定,是负面情感;而类似于“看过这部电影”和“去过这个地方”等难以判断情感倾向的词汇和语句则划分为中性情感。情感倾向度是指主体对客体表达正面情感或负面情感的强弱程度,通常表达为不同的情感词或是修饰副词。比如,“喜欢”和“深爱”虽都表示正面情感,但“深爱”比“喜欢”在情感程度上更为强烈。又比如,“一般好看”和“非常好看”对比时,“非常”比“一般”的修饰程度更加强烈。情感词表示包含情感倾向的词汇,分为正面情感词,即积极词,和负面情感词,即消极词,具有较为浓烈的情感色彩。情感词典则是情感词的集合,分为包含正面情感词的积极情感词典和包含负面情感词的消极情感词典。5.1.2情感词典分类基础情感词典(1)知网HowNet情感词典HowNet是中国科学计算机研究所的研究成果。根据德克萨斯大学计算机系知识系统研究小组的评价,HowNet是用于自然语言处理的在线的常识知识库,包含中文词典中概念与概念间的关系,概念的属性与属性间的关系,中文对应的英文概念以及概念的属性间的关系。(2)台湾大学简体中文情感极性词典NTUSD台湾大学NTUSD中文情感极性词典是基于二元划分法的一个中文词库,共计11086个词语,即2810个积极词语和8276个消极词语。(3)其他情感词典清华大学李军中文褒贬义词典共包含5568个褒义词和4470个贬义词。大连理工情感词典将情感分为乐、好、怒、哀、惧、恶、惊七大类和21个小类,并将情感词分为正向、中性和负向三个极性,并具有0到10不同的情感程度。网络情感词典伴随着互联网的普及,网络世界逐渐呈现出年轻化,而网络用语也随之流行。虽然相比于书面语,网络用语更加口语化且表达形式多种多样,但同样多带有感情色彩。有的词可能是现有可在基础词典中找到的词语的缩写,如“yygq(阴阳怪气)”;有的是外文音译来的,如“瑞思拜(respect,尊重)”;有的则是独立创作的不限于汉字表述的用语组成,如“就这”、“666”、“永远滴神”。上述举例的网络用语都带有较为强烈的情感倾向,如“yygq”表示说话讥讽,带有贬义和批评的情感,“就这”表示对实力的失望和不满,也是带有否定情感;而“瑞思拜”表示对某人的尊敬和崇拜,“666”则是对某人行为举止的夸赞和表扬,“永远滴神”表示对某人或某物的高度赞扬,都具有正面情感。网络评论大多为口语化表达,因此针对网络评论来建立网络情感词典尤为重要。本文通过网络搜索总结,与现有基础情感词典结合,形成评论基础情感词典。其中基础词典包含《知网HowNet词典》、《台湾大学NTUSD情感极性词典》、《清华大学李军中文褒贬义词典》和《大连理工情感词典》。表5-1基础情感词典Table3-1Basicemotiondictionary基础词典名称褒义词/个贬义词/个知网HowNet词典45664370台湾大学NTUSD情感极性词典28108276清华大学李军中文褒贬义词典55684470大连理工情感词典1355113916对结合后的词典进行去重后,得到21595个正面情感词和24831个负面情感词。5.2武侠手游专属情感词典5.2.1建立武侠手游专属情感词典的意义基础情感词典包含的情感词都较为书面,不能体现现代中文千奇百怪的表达方式。一些本来不包含情感倾向的词语出现在特定领域则会带有一定的感情色彩,比如“开挂”这个词,表示采取不正当手段修改游戏客户端来使自己游戏获得更多利益,多带有批评和嘲讽意味。收集这样的特定情感词形成专属情感词典,对更准确地判断评论情感倾向有着重要的影响。本文使用的建立武侠手游专属情感词典的方法是先通过TextRank法收集情感种子词,再利用《同义词词林》的方法对情感种子词进行扩展,再以扩展后的情感种子词作为基准,利用基于改进的SO-PMI算法选取扩充词,构建专属情感词典。5.2.2SO-PMI算法SO-PMI(SemanticOrientationPointwiseMutualInformation)算法全称为情感倾向点互信息算法,其由SO-PMI和PMI两部分组成。PMI算法[39]点互信息算法,又称PMI算法,是用来判断某一词与基准词出现的概率。其表达式为:,(5-1)其中为和共现的概率,为出现的概率,为出现的概率,若和相互独立,则,即。则PMI的结果分析如下:(5-2)为了方便编程计算,,,可以表示为(5-3)(5-4)(5-5)其中,为文档总数,为和共现的次数,为出现的次数,为出现的次数。则带入后得:(5-6)SO-PMI算法[16]SO-PMI算法的基本思想是:判断某一未知词汇与种子词的关联程度。若其与积极种子词的关联程度较大,则判定其为积极词;若其与消极种子词的关联程度较大,则判定其为消极词;若其与积极种子词和消极种子词的关联程度相同,则判定其为中性词。SO-PMI的算法表达式如下:(5-7)其中,表示未知词汇和第个积极种子词的关联程度,表示积极种子词的个数,表示未知词汇和第个消极种子词的关联程度,表示消极种子词的个数。则SO-PMI的分析结果如下:(5-8)利用SO-PMI算法可以将文本中的未知词汇判断分为积极词或消极词,并加入相应的情感词典中。5.2.3基于Laplace平滑的改进SO-PMI算法[39]由SO-PMI的表达式我们可以得知,若某词并未在文档中出现,即,则会出现分母为0的情况;且当分子为0时,通过python应用程序进行分析时可能会报错。为了解决上述问题,杜锐、朱艳辉等人(2015)提出在《基于平滑SO-PMI算法的微博情感词典构建方法研究》中提出基于Laplace平滑的SO-PMI算法。Laplace平滑又称加一平滑(add-onesmoothing),由法国科学家拉普拉斯最早提出。在训练集很大的情况下,在避免零概率问题出现的同时,其每个分量的计数加1对结果造成的概率变化可以忽略不计。其表达式为:(5-9)其中,表示所有可能的不同的种子词数量。带入到上述公式中得:(5-10)则PMI值可表示为:。(5-11)SO-PMI可表示为:(5-12)其中,。(5-13)由于在某个固定的待研究文本中,其积极词个数和消极词个数是既定的,即(5-14)故可看做是某一常数。当未知词与积极种子词和消极种子词共现的次数相同,即(5-15)则未知词为中性词,即(5-16)基于Laplace平滑的改进SO-PMI的表达式变为(5-17)当消极种子词个数小于积极种子词个数,即,其SO-PMI值小于0,未知词汇被误判为消极词;当消极词个数大于积极词个数,即,其SO-PMI值大于0,未知词汇被误判为积极词。为了避免带来的判断误差,故将赋予固定值,令。(5-18)则基于Laplace平滑的改进SO-PMI的表达式为:(5-19)5.2.4基于Good-Turing平滑的改进SO-PMI算法[40]Good-Turing平滑又称为图灵估计,用来平滑不常见的词组。其基本思想是通过判断计数的高低,利用出现次数较多的词组去调整出现次数低于他的词组的估计量。其平滑计数为:,(5-20)其中,表示某词组出现的次数,表示出现次数为的词组的个数。姜伶伶、何中市等(2018)在《基于Good-Turing平滑SO-PMI算法构建微博情感词典方法的研究》中,将其引入到SO-PMI算法中,则(5-21)其中,为Good-Turing的平滑计数。(5-22)其中,表示文档中发生次的未知词汇的个数,表示文档中发生次的未知词汇的个数。则PMI可表示为:(5-23)SO-PMI的表达式为:(5-24)其中,。(5-25)将赋值为1,原因见3.2.3。则基于Laplace平滑的改进SO-PMI的表达式为:。(5-26)5.2.5情感词典构建评价指标[40]本文使用准确率(Precision)、召回率(Recall)和F1值作为评价指标。表达式如下:,(5-27),(5-28)。(5-29)其中,准确率precision表示被判为正类()中,被正确识别为正类()所占的比例;召回率recall表示所有真正为正类()中,被识别为正类()所占的比例;F1综合考虑了准确率和召回率,当F1较高时,方法越有效。数据选择本文通过构建由两款游戏评论组合,随机抽取1000条进行分词等规范化处理后作为测试集,再利用Textrank法选取出60个积极种子词和60个消极种子词作为构建领域情感词典的基准词。实验过程与结果本文分别使用SO-PMI算法、基于Laplace平滑的改进SO-PMI算法和基于Good-Turing平滑的改进SO-PMI算法进行领域情感词的识别。其基本步骤流程图如下:图5-1领域情感词典构建示意图Fig5-1Thepictureofbuildingfieldemotiondictionary第一步:利用jieba分词对评论语料进行分词处理。第二步:通过算法提取文本中的候选词,将候选词与已建立的基础情感词典进行匹配,若为已有情感词则忽略,若为未知情感词则保留。第三步:将候选词与积极种子词和消极种子词进行三种SO-PMI算法的计算,获得相应的SO-PMI值,再根据得到的值分析其情感倾向。第四步:根据情感倾向的不同将候选词分入不同的极性情感词典,即情感倾向为积极,则分入积极词典;若情感倾向为消极,则分入消极词典;情感倾向为中性则舍弃[16]。部分输出结果展示见附录Ⅱ。通过SO-PMI算法和两种改进的SO-PMI算法对比,即对比三种方法的准确率(Precision)、召回率(Recall)和F1值。PosP、PosR、PosF1分别表示积极准确率、积极召回率和积极F1值,NegP、NegR、NegF1分别表示消极准确率、消极召回率和消极F1值。对比结果如下所示。表5-1三种SO-PMI算法评价指标Table5-1TheevaluationindicatorsThreealgorithms方法PosPPosRPosF1NegPNegRNegF1SO-PMI58.9%71.1%64.4%70.3%57.5%63.3%Laplace-SO-PMI65.4%78.6%71.4%76.4%67.2%71.5%GoodTuring-SO-PMI79.7%85.3%82.4%78.6%84.2%81.3%图5-2积极词评价指标折线图Fig5-2Thelinechartofevaluationindicatorsofpositivewords图5-3消极词评价指标折线图Fig5-2Thelinechartofevaluationindicatorsofnegativewords观察实验结果得知,基于Good-Turing的改进SO-PMI算法的评价指标高于其他两种方法,故本文使用Good-Turing平滑后的SO-PMI算法得出的结果来构建领域专属情感词典。通过算法收集到270个积极情感词和322个消极情感词,将其与基础情感词典和网络情感词典进行汇总去重后,得到的情感词典结构如下表所示。表5-2武侠手游情感词典Table5-2Theswordsmenmobilegamesemotiondictionary情感极性积极消极情感词个数/个22858261305.3本章小结本章先对情感词典做了简单的介绍,并且列举了几种常见的基础情感词典,利用基础情感词典和网络用语词典构成武侠手游基础情感词典。再通过对比SO-PMI算法和两种改进的SO-PMI算法的评价指标,进行综合比较,择优选用了基于Good-Turing的改进SO-PMI算法进行领域专属情感词典的构建。最后将武侠手游基础情感词典和领域专属情感词典结合去重后,得到武侠手游情感词典。第六章情感倾向性分析第六章情感倾向性分析6.1情感倾向概述如5.1.1中描述,情感倾向是主体对某一客体主观存在的内心喜恶和内在评价的倾向,由两方面衡量,即情感倾向方向和情感倾向度。情感倾向方向又称为情感极性,通常表现为正面情感、中性情感和负面情感,通过语句中的情感词用来表达对某一事物的态度和看法。如下图所示:表6-1三类情感倾向评论示例Table6-1Examplesofthreekindsofemotiontendencycomments情感类型评论示例正面情感(1)我觉得这游戏玩的挺好的,上手挺容易的,玩法新颖。(2)总体还是不错,一星给门派剧情,一星给cv,一星给画质画面(很古风,清雅)一星给轻功。中性情感(1)没玩过剑网三,以前朋友玩过就试下。(2)本人一开始是因为剑网3这个ID吸引过来玩的,刚开始把周围都喜欢玩游戏的朋友拉过来一起玩。负面情感(1)这个游戏,太失望啦,画风一般,没什么特点。(2)除了垃圾想不出别的词来形容,这应该是我玩过的最垃圾的游戏了。上述评论中,“好”、“容易”、“新颖”、“不错”等都是褒义词,包含着正面情感;而“失望”、“垃圾”等是贬义词,包含着负面情感。为了方便研究,本文将褒义词的权重设置为1,将贬义词的2权重设置为-1。受网络语句口语化严重的影响,在线评论在某些情况下并不包含情感词,但表达着浓烈的情感,如“为什么一进战斗区域突然就群殴?”这句评论中,虽然不包含任何情感词,但评论中的“为什么”和“?”带有质疑和责备的意思,故通过语义可以看出这是一条包含负面情感的评论。故在判断评论的情感倾向时,要考虑到句子所带的结尾标点。6.2评论情感分析一个完整的带有情感倾向的句子,不仅包括情感词,更包括修饰词,即程度词和否定词。程度词会强化句子的情感强度。如“背景音乐也太好听了”这句评论中,“好听”作为褒义词表达了正面情感,程度词“太”则使评论者对主体的赞美更为浓烈。程度词多种多样,根据其修饰效果的不同,会给予其不同的权重。带有感叹语气,即“!”的句子也强化了句子的情感,在后续研究中也赋予了一定的权重。句子中的否定词则会使句子的情感倾向发生反转。如“不喜欢这款游戏”中,“喜欢”原本作为褒义词表示对该主题的肯定,但受到“不”字的影响,使其该评论变成包含负面情感的评论。故在进行情感分析时,应给予否定词一定的权重。6.2.1情感词的判定本文使用的方法是基于词典的情感分析方法。首先通过网络下载现有更新较全的Hownet词典,结合通过SO-PMI算法得到的领域情感词典,形成完整的情感词表进行分析。处理方法为扫描整个句子,对句子进行分词处理,将分词好的特征词与情感词表中的词语进行逐个匹配,若匹配成功,则确定其为情感词;若未匹配到,则不认为其为情感词。如此进行,直到此条评论结束。6.2.2否定词的界定“否定”在汉语词典中的相关解释是“表示否认的,反面的”。一个句子中出现类似于“不”、“没有”等词语,可能会改变句子原本的情感倾向。而多次出现类似的否定词,则表达为多重否定。如“这样未尝不是一种好方法”中出现了两个否定词“未尝”和“不是”,则句意未发生改变,表示“可以”;而句子“没有人可以否定这不是个好游戏”中出现了“没有”、“否定”、“不是”三个否定词,表达的意思是“所有人都觉得这不是个好游戏”,实则为否定情感。本文以标点符号作为断点,断点前的否定词个数若为奇数则反转原句的情感倾向,若为偶数则不改变原句的情感倾向。故在进行情感分析时,将否定词的权重设置为-1,与否定词奇偶数相匹配,达到正确判断情感基调的作用[16]。本文运用否定词词典是结合Hownet词典和笔者根据网络热门用语自定义模块共同构建的否定词典,权重为-1,具体如下:表6-2否定词表示例Table6-2Examplesofprivatedictionary否定词示例权重个数不、不是、不会、不要、不能、不想、不可、不曾、不如、不及、不可……-1376.2.3程度副词的界定程度副词是对一个形容词或副词在表达程度上进行修饰的副词。不同的程度副词所表达的语气强弱程度不同。如:“我挺喜欢这件衣服”和“我太喜欢这件衣服”做对比,同样是表示对主体的喜爱,但“太”的语气强烈程度明显高于“挺”,故对于不同的程度副词,在进行情感分析研究时需要进行归类,给予其不同的权重。将程度副词分为“极其/最”、“超”、“很”、“较”、“稍”、“欠”六个阶段,分别给予不同的权重[41],如下图所示:表6-3程度副词词典示例Table6-3Examplesofdegreeadverbwordsdictionary程度副词等级评分权重示例个数极其/最63非常、极其、绝对69超52.5超额、过分、何止30很42不过、格外、很是42较31.5更加、较为、越发37稍21略加、稍微、一点29欠10.5不大、丝毫、相对126.2.4感叹句的界定汉语词典中对感叹句的定义为“带有浓烈情感色彩的句子,在书面上句末使用感叹号”,用来表示喜怒哀乐。在情感倾向性分析中,将感叹句作为情感增强的一种方式,强化其情感程度。在分析过程中,对句子进行倒序扫描,若句子结尾符号为感叹号,则使倒序扫描到的情感词权重增强2倍,如此循环[16]。首先将“!”作为一个特征词,然后对分词后的每条评论进行倒序扫描。若不为“!”,则读取下一个特征词;若为“!”,则向前扫描,找出其前一个情感词,将其情感权重乘以感叹号的情感权重,若前无情感词,则放弃本次请求进行下一次循环。6.2.5疑问句的界定疑问句通常带有“设问”、“疑惑”等感情色彩,在在线评论中,反问句更具有“质疑”的意味,多表示否定情感,以“?”结尾。其在分析过程中的识别方法与感叹句类似,即扫描句子末端是否为问号,设置其权重为-2[16]。在处理过程中,倒序扫描分词后的语料,若找到“?”,则向前寻找语句中是否具有反问词。若具有反问词,则将该评论的反问涉及权重设置为-2;若未扫描到反问词,则舍弃此次请求,继续下一次循环。常用的反问词如下所示:表6-3程度副词词典示例Table6-3Examplesofdegreeadverbwordsdictionary反问词权重个数为什么、凭什么、凭啥、怎么、哪里、莫非、难道、岂非、如何、奈何……-2376.3情感倾向得分计算对于单条评论而言,其可能包括情感主体、情感词,以及修饰情感词的副词、否定词等。本文通过网络收集和文本预处理,构建出武侠手游情感词典、停用词词典、程度副词词典和否定词词典。结合4.2中给予的权重对特征项进行打分处理并求和计算,得到每条评论的情感得分,再通过得分的正负和分数高低判断其情感倾向和强烈程度。假设单条评论可划分为个句子,即,每个句子包含个情感词,即。令程度副词权重或感叹号权重为,否定词权重为,情感词的权重为。当评论中某一情感词被程度副词修饰时,则该部分的情感得分计算公式为:。(6-1)当评论中某一情感词被否定词修饰时,则该部分的情感得分计算公式为:。(6-2)则对于句子而言,该句的情感得分为:。(6-3)对于整条评论,该条评论的情感得分为:。(6-4)通过判断的正负和数值大小,来判断该条评论的情感倾向和情感强度,即:(6-5)越大,则表示情感越为强烈。6.4本章小结本章先是简单介绍了情感倾向,列举分析了进行情感倾向分析时对情感打分其较为重要作用的几种类型的词,并赋予一定的权重。然后对不同类型的句式进行分析给予权重。最后介绍情感打分的规则和结果分析,方便后续实验。第七章实验过程与结果分析第七章实验过程与结果分析7.1研究方法7.1.1数据来源本文选取《剑网3:指尖江湖》和《一梦江湖》作为研究对象,选取原因为两款游戏热度较高,对于现有的武侠类手游具有一定的代表性,且评论较为丰富。评论爬取则是选择手机手游应用软件APP《Taptap》上的用户评论。《Taptap》作为较为出众的手游下载平台,对于评论管理更加严格,且下载量和评论量相较于其他平台更多,爬取也更加便捷。爬取方法为通过八爪鱼采集器软件爬取,通过导入url网址,建立任务,读取网页相关评论进行爬取。7.1.2数据预处理(1)垃圾评论过滤在线评论中包含的内容多种多样,尽管受平台网站限制,但仍会出现部分包含广告、抽奖等垃圾评论。本文利用Excel将包含“Http”、“VX(微信)”、“QQ(扣扣)”等字样的疑似广告评论去除,并过滤部分无意义的评论,最终得到《剑网3:指尖江湖》评论34445条,《一梦江湖》评论40960条。(2)去除停用词、分词与词性标注词语作为情感分析的基础单位,构成了一句话的情感部分。为了使话语更加连贯,词语之间多有停用词进行连接,如“今天的饭菜太好吃了”中的“的”、“了”,而这些词的存在对句子的情感分析毫无益处,甚至会模糊分词的边界,故在进行实验时需将停用词去除。本文选用了网络上较为完善的停用词表,共包含2612个停用词。为方便后续关键词提取,一般需要对句子进行分词和词性标注处理。本文采用Python的Jieba算法进行实验。分词与词性标注示例如下所示:表7-1分词与词性标注示例Table6-3Aexampleofdividingwordsandadverbandthelablesofpropertyofwords评论内容词性与标注玩法、画风、剧情都很不错玩法/n画风/n剧情/n很/d不错/a7.1.3相关词典构建构建词典是情感分析的关键。本文共涉及三种情感词典,如下图所示。武侠手游词典武侠手游词典游戏属性词典情感词典修饰词词典基础情感词典专属情感词典网络情感词典否定词词典程度副词词典图7-1武侠手游情感词典构成Fig7-1Theconstitutionofswordsmenmobilegamesemotiondictionary游戏属性词典为探究两款游戏在各个方面的表现如何,需要提取出游戏的属性词构成词典,如“音乐”、“故事”等令用户产生情感倾向以及进行评价的属性,即将情感倾向性研究的主体从游戏整体划分为各个类别。细分游戏属性类别可以更好地研究用户的喜爱偏向以及产品的问题所在。利用Textrank算法,对两款游戏分别选取出频数最高的60个属性名词,将其按照经验,利用Excel进行人工分类,即分为故事、角色、玩法、经济、性能、交互、社交、场景八大类属性。将两款游戏的属性进行分类后如图所示。表7-2《剑网3:指尖江湖》属性词典Table7-2ThepropertydictionaryofEastwardLegend:theEmpyrean属性内容故事剧情、任务、主线、视频、支线、故事角色角色、人物、画风、动作、模型玩法战斗系统技能、装备、战力、等级、武器角色统计门派、属性、职业材料物品材料、箱子、秘籍、碎片、道具、宝箱游戏模式战场、赛季、心眼、名剑、成就、竞技场、大战外观外显外观、皮肤经济金币、玄晶性能服务器、系统、优化交互感官交互视角、画面、画质、特效、手感、声音、音效游戏交互羁绊、好感、配音社交帮会、亲友、队友、师父、徒弟、团队场景地图、界面、场景、风景表7-3《一梦江湖》属性词典Table7-3ThepropertydictionaryofADreamingRuneScape属性内容故事剧情、任务、主线、故事、视频角色角色、人物、动作、画风玩法战斗系统技能、装备、武器、战力角色统计门派、等级、职业、经验、属性材料物品秘籍、材料、道具、家具游戏模式副本、奇遇、房子、战场、家园、茶馆外观外显衣服、时装、外观、衣柜经济银两、铜币、银票、元宝、铜钱、货币、银子性能系统、服务器交互感官交互画质、特技、画面、特效游戏交互好感、配音、语音社交亲友、情缘、徒弟、师父、好友、帮会、社交、队友场景风景、地图、场景、界面两款游戏的词云图如图所示:图7-2《剑网3:指尖江湖》词云图Fig7-2ThewordscloudofEastwardLegend:theEmpyrean图7-3《一梦江湖》词云图Fig7-3ThewordscloudofADreamingRuneScape情感词典本文使用的情感词典为第三章所建立的情感词典,即结合基础情感词典、网络用语情感词典和领域专属情感词典构建的含有22987个积极词汇和26846个消极词汇的情感词典。修饰词词典本文选用的程度副词词典和否定词典为使用较为广泛的Hownet词典,并对词典进行部分补充,得到包含6大类共219个程度副词的程度副词词典和包含37个否定词的否定词典。7.2具体分析过程第一步:利用Excel的筛选功能将评论按照属性进行分类;第二步:利用6.3所描述的方法对每条评论进行打分;第三步:将输出结果导入Excel中,结果格式为“情感得分+空格+评论内容”,并利用分列功能以空格为标志将得分和内容分离,输出结果示例展示见附录Ⅲ;第四步:利用排序功能将得分进行从高到低的排列,统计出各个属性中积极评论、中性评论和消极评论的条数;第五步:计算各个属性三种情感倾向的评论数的卡方值,判断三种评论条数是否有差异,且差异是否显著;再计算积极评论与消极评论数量卡方值,判断褒贬评论间是否有明显差异;第六步:将各个属性的得分求平均数,得到属性平均分。7.3结果分析7.3.1情感倾向性构成分析将两款游戏收集到的评论分别按照5.2所述方法进行实验,得到的实验结果如下图所示:表7-4《剑网3:指尖江湖》属性评论构成和卡方值Table7-4Theconstitutionofcommentsofeachpropertyandchi-squarevaluesofEastwardLegend:theEmpyrean属性积极中级消极故事15151316157825.45***1.28角色1619988121753.67***4.05*玩法459521243471142.41***156.63***经济42923832855.06***13.48***性能1002921108613.57**3.38交互21139231256110.55***4.60*社交2311990135957.60***50.31***场景19118151129116.36***29.63***注:*p<0.05表示;**表示p<0.01;***表示p<0.001表7-4《一梦江湖》属性评论构成和卡方值Table7-4Theconstitutionofcommentsofeachpropertyandchi-squarevaluesofADreamingRuneScape属性积极中级消极故事19471513172354.53***13.67***角色101945261145.71***23.64***玩法731760156548129.31***42.65***经济848451912169.26***2.33性能1094853119691.01***4.54*交互14291105119944.66***20.13***社交17611564185325.26***2.34场景13761129118124.74***8.07**注:*p<0.05表示;**表示p<0.01;***表示p<0.001表7-5各属性评论数Table7-5Thequantitiesofeachproperty属性剑网3:指尖江湖一梦江湖评论总数故事440951839592角色382420825906玩法101901988030070经济99522113206性能300931436152交互429237338025社交466051789838场景385536867541从评论数量上分析,用户对于属性的关注度从高到低分别为玩法、社交、故事、交互、场景、性能、角色和经济。对于《剑网3:指尖江湖》,其评论占比从高到低依次为玩法、社交、故事、交互、角色、性能、经济;对于《一梦江湖》,其评论数量从高到低依次为玩法:故事、社交、交互、场景、性能、经济、角色。故事属性上,《剑网3:指尖江湖》的三种评论数有差异(=24.45,p<0.001),而积极评论与消极评论数量间对比无明显差异(=1.28,p>0.05);《一梦江湖》的三种评论数有差异(=54.53,p<0.001),积极评论与消极评论数量间有明显差异(=13.67,p<0.001),其中积极评论居多。角色属性上,《剑网3:指尖江湖》的三种评论数有差异(=53.67,p<0.001),积极评论与消极评论数有差异但不显著(=4.05,p<0.05),其中积极评论居多;《一梦江湖》的三种评论数有差异(=45.71,p<0.001),积极评论与消极评论数有明显差异(=23.64,p<0.001),其中积极评论居多。玩法属性上,《剑网3:指尖江湖》的三种评论数有差异(=142.41,p<0.001),积极评论与消极评论数有显著差异(=156.63,p<0.001),其中积极评论居多;《一梦江湖》的三种评论数有差异(=129.31,p<0.001),积极评论与消极评论数有明显差异(=23.64,p<0.001),其中积极评论居多。经济属性上,《剑网3:指尖江湖》的三种评论数有差异(=55.06,p<0.001),积极评论与消极评论数有显著差异(=13.48,p<0.001),其中积极评论居多;《一梦江湖》的三种评论数有差异(=169.26,p<0.001),而积极评论与消极评论数量间对比无明显差异(=2.33,p>0.05)。性能属性上,《剑网3:指尖江湖》的三种评论数有较为显著的差异(=13.57,p<0.01),而积极评论与消极评论数量间无明显差异(=3.38,p>0.05);《一梦江湖》的三种评论数有差异(=91.01,p<0.001),积极评论与消极评论数有差异但不显著(=4.54,p<0.01),消极评论较多。交互属性上,《剑网3:指尖江湖》的三种评论数有差异(=110.55,p<0.001),积极评论与消极评论数有不显著差异(=4.60,p<0.05),其中消极评论居多;《一梦江湖》的三种评论数有差异(=44.66,p<0.001),积极评论与消极评论数有明显差异(=20.13,p<0.001),其中积极评论居多。社交属性上,《剑网3:指尖江湖》的三种评论数有差异(=57.6,p<0.001),积极评论与消极评论数有明显差异(=50.31,p<0.001),其中积极评论居多;《一梦江湖》的三种评论数有差异(=25.26,p<0.001),而积极评论与消极评论数量间对比无明显差异(=2.36,p>0.05)。场景属性上,《剑网3:指尖江湖》的三种评论数有差异(=116.36,p<0.001),积极评论与消极评论数量间有明显差异(=29.63,p<0.001),其中积极评论居多;《一梦江湖》的三种评论数有差异(=24.74,p<0.001),而积极评论与消极评论数有较为显著的差异(=8.07,p<0.01),其中积极评论居多。图7-4《剑网3:指尖江湖》各属性评论分布图Fig7-4ThepictureofpropertycommentsdistributionsofwordscloudofEastwardLegend:theEmpyrean图7-5《一梦江湖》各属性评论分布图Fig7-5ThepictureofpropertycommentsdistributionsofwordscloudofADreamingRuneScape7.3.2属性情感倾向分析假设某一属性的情感总得分为,表示属性的类型。该属性中每条评论的打分为,则:,(7-1)则属性平均分的表达式为:,(7-2)为探究用户对于武侠手游的各个属性的情感体验,本文引入属性总均分。两款游戏的属性总均分为单个属性上两款游戏的情感总得分之和与用户对于两款游戏在该属性上的评论数的比值,即:(7-3)其中,表示《剑网3:指尖江湖》在第类属性上的评论数,表示《一梦江湖》在第类属性上的评论数。表7-6各属性平均分和属性总均分Table7-6Theaveragescoresofeachpropertyandgrandaveragescores属性属性平均分属性总均分剑网3:指尖江湖一梦江湖故事1.020.040.49角色-0.770.43-0.35玩法-1.000.35-0.11经济0.661.030.92性能-0.421.850.73交互0.710.160.47社交-0.19-0.24-0.22场景-0.39-1.42-1.02图7-6各属性平均分和属性总均分柱状图Fig7-6Thehistogramofaveragescoresofeachpropertyandgrandaveragescores对于《剑网3:指尖江湖》而言,其属性平均分从高到低排序依次为:故事、交互、经济、社交、场景、性能、角色、玩法。其中故事和交互的属性平均分为正值,且故事的得分>1,说明用户对于该属性的好评率较高,喜爱程度较强;交互属性平均分为正值,但得分较低,说明用户仅对这两类属性产生积极情感,但并不强烈;在经济、社交、场景、性能、角色和玩法方面的属性平均分为负值,且玩法的得分绝对值>1,说明该属性使玩家的体验较差,甚至让玩家感觉不适;经济、社交、场景、性能和角色方面的得分为负数但介于-1到0之间,说明这几类属性使玩家的游戏体验降低,但从总体上来说并不强烈。对于《一梦江湖》而言,属性平均分从高到低排序依次为:性能、经济、角色、玩法、交互、故事、社交、场景。其中性能、经济、角色、玩法、交互和故事的属性平均分为正值,且性能和经济的得分>1,说明用户对于该两类属性的好评率较高,喜爱程度较强;角色、玩法、交互和故事的平均分为正值,但得分较低,说明用户仅对这两类属性产生积极情感,但并不强烈;在社交和场景方面的属性平均分为负值,且场景的得分绝对值>1,说明该属性使玩家的体验较差,甚至让玩家感觉不适;社交方面的得分为负数但介于-1到0之间,说明这几类属性使玩家的游戏体验降低,但从总体上来说并不强烈。综合而言,两款游戏在故事、经济、交互方面的评分均分为正数,在社交和场景上的评分均分为负数。故事、经济、性能、交互的属性总均分为正数,且均介于0到1之间;角色、玩法、社交、场景的属性总均分为负数,其中场景的均分绝对值>1,其他三类介于-1到0之间。7.4本章小结本章对实验过程进行了详细介绍,并展示了两款游戏的属性词典。接着对实验结果进行分析,得到相应的结论。第八章总结与展望第八章总结与展望8.1结果分析与总结玩法是一款游戏的核心,用户尝试去体验一款游戏,主要是为了体验其玩法。在游戏玩法上的创新会使游戏更加吸引人。《剑网3:指尖江湖》在游戏上的评分较低,说明用户体验价差,究其原因可能是其玩法不够新颖,且游戏内容负重较大,使用户不能以轻松平和的状态参与游戏活动。《一梦江湖》在游戏玩法上较为成功,合理的游戏难度和为用户着想的游戏内数值设置可以更长久地留住用户。不同于单机游戏,网络游戏的亮点之一便是在于社交,在游戏内与队友协同合作,与朋友并肩玩耍,都是在线游戏相较于单机游戏的特色所在。通过属性评分可知,《剑网3:指尖江湖》和《一梦江湖》在社交上的表现都差强人意,其原因可能是随着手机的普及和手机游戏用户素质及水平的良莠不齐,导致其他用户在享受游戏时受到阻碍和干扰。一款游戏的故事是对于整个游戏的基础。游戏的具体活动围绕着游戏的故事内容展开,故事中的任务和主支线活动则是向用户展示游戏故事的具体方式。《剑网3:指尖江湖》的用户对其故事较为喜爱,其原因可能是在真实历史背景下进行再创作的故事更加吸引人,且游戏本身故事较为感人曲折;《一梦江湖》的用户对于该属性的态度虽是积极的,但评分较低,说明用户对故事的态度较为平淡,游戏故事本身并不是很吸引人。本文将交互分为感官交互和游戏交互。感官交互表示用户在体验游戏时感官上的体验,包括对于游戏的手感、对于游戏特效视觉上的冲击和对于音乐等听觉上的体验。游戏交互是指用户在游戏内与NPC(游戏内虚拟人物)的交互,包括与NPC之间的好感度、与NPC对话时的配音等等。《剑网3:指尖江湖》相较于《一梦江湖》在交互上的表现更为出色,其2.5D的平面画面使操作更为便捷,且特效展示更加明显;配乐上《剑网3:指尖江湖》更有意境,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论