【《基于情感文本的游客情感变化分析案例》16000字】_第1页
【《基于情感文本的游客情感变化分析案例》16000字】_第2页
【《基于情感文本的游客情感变化分析案例》16000字】_第3页
【《基于情感文本的游客情感变化分析案例》16000字】_第4页
【《基于情感文本的游客情感变化分析案例》16000字】_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于情感文本的游客情感变化分析案例目录TOC\o"1-3"\h\u14848基于情感文本的游客情感变化分析案例 123431.1模型构建与情感值计算 1234551.1.1情感词典的相关概述 162971.1.2情感词典构建 3102291.1.3情感值计算模型的构建 8155401.1.4情感值的计算 11135521.2时间变化分析 13276541.2.1厦门夜间旅游关注度不同时间尺度变化分析 13240201.2.2厦门夜间旅游游客情感年变化分析 1581711.2.3厦门夜间旅游游客情感月变化分析 16156321.3空间分布分析 18321461.3.1厦门夜间旅游微博发布热点分析 18280781.3.2厦门夜景旅游不同空间场所游客情感分析 22模型构建与情感值计算情感词典的相关概述在基于文本内容的情感倾向分析中,建立匹配度高的情感词典是研究工作的基本。情感词典的精准度,是能否理想分析文本情感倾向的关键。即使在微博上发布的信息和发表的评论和传统文本相似,但是在微博上所发布的内容更随意一些,多数会采用口语化的方式进行表达,如果仅仅利用基础情感词汇进行分析,那么便有可能导致不能摸清文本的特点,最终导致结果不准确,所以陈晓东(2012)和李继东(2018)都利用SO-PMI算法[44][45],扩大传统的基础情感词典的范围,并且对微博评论专门制定了一部情感词典,本研究采用同样的方法,构建一个关于厦门夜间旅游的微博领域情感词典。情感词是具有情感极性的词语,情感词的词性丰富多样,比如形容词、副词等等,它们都能够以情感词进行使用。情感词中会蕴含着丰富的情感色彩,例如正面情绪词开心、高兴等,负面情绪词有难过、沮丧等。情感词主要分为两类,一类是正向的,是积极的,是褒义词;另一类是负向的,是消极的,是贬义词。多数情况下,人们可以直接通过情感词语来感受文所要表达的个人感受,所以,在剖析情感时,情感词是必不可少的要素。情感倾向实际上就是人们对客观事物的感受度的偏倚,在进行文本创作中,情感倾向也能体现出人们对某一观点的偏爱。情感倾向的判断依据有两点:第一点是方向,偏离的方向又分为两类,一类是正向,另一类是负向;第二个是情感倾向程度,表现为倾向不用方向的感受强弱,每个情感词汇体现出来的强弱各有差异。在微博文本中,大多数内容是由常见的文字载体构成,因此,在对微博文本做情感研究时,要格外关注由传统文本为主体的基础词典,具有很大的参考价值。现今,在情感分析方面上情感词典的探索:在国外,哈佛编写了GeneralInquirer[81](GI)词典,在词典中,不仅将每个情感词的义项都列举出来,同时也明确了情感词的性质,在国外很多研究情感分析的都会参考这部词典,影响的范围非常广。国内对于情感的研究同国外相比比较晚,当前对本次研究具有指导意义的有:知网Hownet情感词典[82];台湾大学的中文情感极性词典(NTUSD);大连理工大学徐琳宏、林鸿飞、潘宇[83]等人编著的“情感词汇本体词典”,还有如《褒义词词典》[84]、《贬义词词典》[85]、《学生褒贬义词典》[86]等。其中知网、NTUSD、大连理工词典适用的范围比较大,本研究基于知网Hownet。不仅要考虑传统的情感词汇,同时还要考虑到现今社会所衍生出来的很多新生词汇,在这些词语中,也蕴含着较深的感情色彩,但是新的词语很难找到它的根源,所以本次研究是基于网络情感词汇,形成完善的网络情感词典。微博的高度发展以及其文本的独特性,使微博的新的感情词会逐渐增多,并且新产生的词汇都很难找到它的起源,本次研究是对微博厦门夜间旅游语料库展开深入研究,专门研究制定出一个厦门夜间旅游的微博领域情感词典。由于在微博发表评论时可以使用表情符号,并且这些表情中都蕴含着情感倾向,有些用户所发的微博可以直接看出用户的心情。因此,本论文基于微博表情建立表情情感词典。通过前面的阐述,本研究的微博情感词典的构成如图4.1所示:微博情感词典微博情感词典基础情感词典网络情感词典微博领域情感词典褒义词典贬义词典微博表情情感词典褒义词典贬义词典褒义词典贬义词典褒义词典贬义词典图STYLEREF1\s4.SEQ图\*ARABIC\s11情感词典组成图情感词典构建在基于文本内容的情感倾向分析中,建立一个适用、匹配度高的情感词典是整个研究工作的关键步骤。情感词典的精准度决定了文本情感分析效果的关键。(1)基础情感词典目前国内外通用的词典都是一些基础性的词典,其收录的规模和数量都各不相同。知网(HowNet)是我国董振东教授搭建的较为完备的知识系统,它将汉英词语中所蕴含的含义作为描述的主体,深入挖掘含义与含义之间的区别。在2007年,知网也发表了“情感分析用词语集(beta版)”,其中总共包括12个文件。微博是互联发展过程中产生的产品,它的文本信息表达的方式有很多种,包括发布信息讨论等,因此本研究将对HowNet基础情感词典进行筛选,把罕见的情感词语排除,剩下的情感词具体见表4.1所示:表STYLEREF1\s4.SEQ表\*ARABIC\s11基础情感词典情感层级权值情感词(部分)数量(个)正面情感1称心、称许、称心如意、称叹、表扬、高兴、欢愉、欢快、开心、期待、期盼、惊喜、怡人、舒畅、满心欢喜……4566负面情感-1哀伤、哀痛、懊恼、暴跳如雷、悲戚、悲泣、悲观失望、鄙弃、鄙视、不满、不悦、沉闷……4370本研究中将HowNet词典中的积极的评价性质的词语同正面情感词语总结为HowNet正向词语,并将它的情感倾向值定为“1”;将消极的评价词语同反面情感词语总结成为HowNet反向词语,将它的情感倾向值定为“-1”。(2)网络情感词典互联网发展迅猛,网民数量急剧增长,网络世界丰富多彩,也由此产生了很多新的网络用语。这些网络语言跟传统词语在用法上区别很大,往往都带有明显的感情色彩。还有一些是以前就有的词语,因为某一件事或者某一个热门变成了具有强烈语言色彩的词语,例如“奔驰女”等等。还有一些是新创造出的词语,通过谐音、错别字等等方式形成的,例如:“CP、炮灰、心累……”。这次网络词语虽然在传统的情感词典中不存在的,也无法用传统的语法来判别它们的意思,但是同样带着强烈的感情色彩,在判断情感倾向的时候也会产生重大影响。如果通过人工的方式去网络上进行收集统计,不仅工作量大,还会消耗大量的时间和精力。陈国兰(2016)充分想到了人们在上网时候都会采用搜索引擎,根据用户访问最多的百度以及搜狗中,寻找网络新词,这样有利于信息的搜集以及网络新词情感词典的创建[87]。李继东(2018)在分析中总结出人们在网上进行社交时,一定会借助不同的输入法来交流,输入法会记住用户的习惯并根据输入内容形成用户的词库[44],本研究也将采取同样的方法,选取了当前用户使用量最多的输入法,从这些输入法的词库中整理筛选最常用的网络情感词语。经过收集与整理,本次研究是对最近几年使用次数较多的118个网络词汇进行分类,其中有42个正面词汇,剩下的76个都是负面词汇。表STYLEREF1\s4.SEQ表\*ARABIC\s12部分网络情感词网络情感词情感倾向集美们正面情感因崔斯汀正面情感男友力正面情感一颗赛艇正面情感蓝瘦香菇负面情感蛇精病负面情感溜了溜了负面情感(3)表情词典在处理微博表情时,采用内容分析法。首先将微博文本中每一个表情符号确定为一个分析单元,表情符号既可以将微博用户的情感传递出去,同时还可以通过表情获取到用户的所要表达的情感。在进行表情符号分类的过程中,不仅仅要能够准确的对情感倾向进行划分,同时还有了解每一个表情符号所要表达的情感的深度。本研究将邀请3名程序员对每一个分析单元进行编码,将不同的表情符号归到不同的类目中。最后一步便是计算出表情符号在不同文本内出现的次数,然后将其制作成表情词典。本研究从微博语料库中共收集到微博表情总计56个,确定了正面情感和负面情感两个分类,并且将表情对应到其类别中,如表4.3所示。

表STYLEREF1\s4.SEQ表\*ARABIC\s13微博符号情感词典情感层级权值微博符号情感(部分)数量(个)正面情感1[给力]、[哈哈]、[点赞]、[大笑]、[可爱]、[爱心]、[激动]、[开心]、[鼓掌]、[害羞]、[龇牙]、[调皮]……32负面情感-1[痛哭]、[难过]、[呕吐]、[右哼哼]、[抓狂]、[问号]、[流泪]、[生气]、[衰]、[左哼哼]、[敲打]、[暴躁]……24(4)微博领域情感词典现有的基础情感词典大多是从传统文本内容中统计得到的,而中文的表达方式是多种多样的,相同的语义可以用不同的方式来表达。尤其是微博作为当前重要的社交平台之一,用户在表达的过程中更偏向于口语化,而这样的表达方式往往会产生许多新鲜词汇,包括新的情感词,在现有的情感词典是无法甄别的,但是这些词语又对情感倾向分析极其重要。比如:之前在微博中非常火爆的一个名词“凤姐”,但看这里两个字,平淡无奇,但当我们把这两个字与生活实际联系起来,用到生活中,它就带着嘲讽的韵味。诸如这类词语微博上非常多,为了让人们能更好认识这些新兴词语,提高人们对它的正确认知,就需要建议一个机遇微博标准的情感词典。陈晓东(2012)和李继东(2018)在建立微博领域情感词典的时,为最大程度提高情感倾向分析的准确性,都采用SO-PMI算法对微博领域情感词典进行扩充,本研究也将采用同样的方式来构建关于厦门夜间旅游的微博领域情感词典[44][45]。互信息是很关键的信息度量,进行文本分类研究的过程中,普遍采用的是PMI算法,用它表示两个词语之间的关系,它的主要目的是算出两个词语共同出现的几率,当共同出现的几率越大,就说明两个词语的语义就越相近,关联度就越高。假设有两个词语和,PMI值的计算公式如式4.1所示为: (STYLEREF1\s4.SEQ(式\*ARABIC\s11)公式4.1中,所代表的含义是进行对比的一组词语在相同语境下一起出现的频数,和则分别将两个词语单独出现的频数表示出来,两个单词共同出现的次数越多,PMI分值就越大,同时该数值也代表两个词语的相似度以及词语之间的联系性比较大;相反,则值就越小。运用上述公式4.1计算,可以归纳出三种结果,分别是:当>0时,两个词语相关,且值越大,则表示相关性越高;当=0时,两个词语是彼此独立的;当<0时,两个词语是相互排斥的。将上述公式应用在微博评论研究时,表示两个词语在同一条微博评论同时出现的概率,和分别表示两个词语单独出现在微博评论的概率。在本研究中,、和的值都将通过对语料集的计算得到,其计算方式将采用前文介绍的文档频次法。假设D代表语料集中的文档总数,是代表语料集中词语的文档所出现的次数,即词语在语料集中出现的文档数。那么便可以得出词语在语料集中出现的次数有多少,计算公式如4.2所示: (STYLEREF1\s4.SEQ(式\*ARABIC\s12)同理可得词语在语料集中出现的概率计算公式如式4.3所示: (STYLEREF1\s4.SEQ(式\*ARABIC\s13)假设是词语和词语在语料集中同时出现的文档频数,则相对应的概率计算公式如式4.4所示: (STYLEREF1\s4.SEQ(式\*ARABIC\s14)将公式4.3和公式4.4相结合进行转化,得到: (STYLEREF1\s4.SEQ(式\*ARABIC\s15)通过上面的公式,就可以计算出两个词语的相关性,因此可以将PMI方法融入到计算词语的情感倾向(SemanticOrientation,简称SO)中,紧接着就可以选取出情感词。情感倾向点互信息算法S0-PMI的基本步骤为:首先选取两组词语作为参考的基准词,一组是褒义词,另一组则是贬义词,所选择的情感词必须具有强烈的倾向性和示范性。假设用表示褒义词,用表示贬义词。如果把词语跟的点间互信息同跟的点间互信息相减,便可求得一个数值,通过这个数值就可以确定词语的情感倾向,计算公式如4.6所示: (STYLEREF1\s4.SEQ(式\*ARABIC\s16)通常情况下,把0设置成情感倾向的阈值,根据以上的公式计算会得到三种结果:当>0时,该词语为正向倾向,即为褒义词;当=0时,该词语为中性倾向,即为中性词;当<0时,该词语为负向倾向,即为贬义词。通过SO-PMI算法,可以得到候选词的情感倾向值,然后这个数值作为参照值,将候选的词语融入到微博领域情感词曲的褒义词典和贬义词典中。当前,SO-PMI算法主要的适用范围是英文情感倾向分析,很少会使用在中文的情感倾向分析上,这是由于中英文使用过程中存在的较大差异造成的。中文的表达方式相较英文表达方式而言,更加灵活多变,不同表达者可以用不同的表达方式来表达出相同的意思。如果严格按照PMI算法进行统计,会导致部分具有情感倾向的词语被过滤掉,因此本研究参考其它学者的研究,将引入意思一致的词汇对SO-PMI算法进行词典扩展。通过把基准词意思相同的词语与候选特征词在同一篇微博中出现的频率,将其套进SO-PMI算法中,然后基准词便能在所提供的语料集文本所出现的次数能够扩大到基准词跟与它的同义词在该语料中出现的频率,于是便变成了与与它的同义词共同出现的几率。本次研究主要借鉴了哈工大整理的《同义词词林扩展版》以此为参考对同义词进行扩大。微博领域情感词典的建立分为两步:首先选择基准词,其次对候选词进行情感倾向的确认。本次研究是直接采用的微博语言材料所统计的数据,结合人工的办法选择基准词。其一,挑选出了大约20万条各个方面的微博语音的数据库,其中有旅游、娱乐、美食、时尚、科技等领域的相关话题,将这些内容进行文本预处理,最后采取了词语使用频率的统计方式,并将其进行排列顺序。文献[88]充分证明利用四十对情感词的时候,正确率可以达到81.37%。本研究将采用该理论,选出40对情感基准词语。选取的情感基准词如表4.4所示。表STYLEREF1\s4.SEQ表\*ARABIC\s14情感基准词表基准词类别基准词示例褒义词哈哈、不错、美好、宁静、美丽、宁静、雀跃、嘻嘻、喜欢、点赞、完美贬义词垃圾、无聊、无趣、吐槽、失望、恶心、生气、悲剧微博领域情感词典的生成过程如图4.2所示。图STYLEREF1\s4.SEQ图\*ARABIC\s12微博领域情感词典生成流程图情感值计算模型的构建情感倾向的含义是人们对某一事物的客观感受的偏倚。它可以从三个角度来判定:一是情感倾向方向,二是情感倾向度,三是情感指数。情感倾向方向又称情感极性。在微博的信息中,可以解释成用户流露出对某一个客观事物的情感,在评价的过程中自身具有一定的态度,主要分为三个层面:正面情感倾向、负面情感倾向、中性情感倾向。例如“漂亮”“能干”等词语都是褒义词,是积极的情感,相反“丑陋”“懒惰”都是贬义词,是消极的情感。微博文本的情感极性示例如表4.5所示。表STYLEREF1\s4.SEQ表\*ARABIC\s15不同情感极性的微博文本示例名称微博文本示例正面情感倾向颐和园真爱粉上线啦。雪后的颐和园,处处都是一幅画。在环岛路骑行,真的太舒服了。负面情感倾向1.鼓浪屿真的太无聊了吧。2.环岛路,没有攻略上说的那么好玩。3.黄山一点都不好玩。中性情感倾向夜游环岛路。马上要去故宫了。颐和园的早晨。情感倾向度的含义是将对客观事物的情感通过正面情感的方式表达,情感倾向的偏离度大部分是通过不同的感情词语来表现出来。本文的情感倾向的分析,是为了对情感词的偏离度做划分,给每个情感词不用的系数,在研究中,为了使操作过程简洁,所以将微博情感词典中所有积极地词语的权值设为1,而贬义词则设置为-1。中文语法复杂、句型多样,对微博情感倾向的分析,不能只参考情感词典本身,每个词语的搭配和句型都会对整句话的含义发生改变,随之情感也会发生改变,例如否定词的修饰,就会将整句话的含义改变;或者在句子之前加入反问词,那么相应的情感也会发生变化。因此,在进行微博情感倾向分析时,不能仅仅参考情感词典,应基于词语的自身。微博评论中,程度副词多数用在情感词的前面,使语气增加,这样不会改变情感词语的极性,常被用于修饰或限制形容词与动词,以表示程度或范围。“程度”的含义就是处于不同层次的序列,是对量的层次的表现,微博文本很多都是直接发布的,具有内容较简洁、信息含量广的特点。因此程度副词的使用会对发布者表达情绪产生一定的影响。蔺璜等学术人员研究表明,可以将程度副词划分为极/高/中/低量四个量级,并且基于每个量级,部分情感词二次修饰之后可以对权值再次进行调整。本次研究借鉴了知网的“中文程度级别词语”构建了四个程度级别的程度副词词典,并赋予相应的权值(如表4.6所示)。表STYLEREF1\s4.SEQ表\*ARABIC\s16程度副词词典等级权值程度副词(列举)数量(个)极其/最2极其、非常、极、极度、最、绝对……99很1.75出奇、分外、格外、不少、不过、大为、太、很、特别……42较1.5更、更加、、还、还要、较、较为、足足、进一步……37稍0.5略略、略微、略为、稍稍、稍微、稍许、丝毫……41否定词也包含在副词中,体现出来的是否定意思,当情感词配合否定词一起用词性就会转变为情感极性。如果正面情感的词语配合否定词一起用,那么,词语本身的积极情感倾向则会转为负面情感倾向,反之则相反。比如:“小王很不快乐。”“快乐”原先是正情感倾向,是积极的,但是在该词语的前面加上了否定词语“不”,那么这个词语所表达的情感倾向为消极的,是负面情感倾向。在汉语语法中,存在着多重否定的现象,如果其中出现的否定词是单数,那么词语表示的就是否定的意思;如果出现的否定词语为双数,那么表达的意思就是肯定的。本次研究建构了一个否定词的词典,并且将它的权值设定为-1(如表4.7所示)。表STYLEREF1\s4.SEQ表\*ARABIC\s17否定词词典权值否定词数量(个)-1没、无、無、不、非、莫、勿、毋需、否、别、休、弗、不要、不曾、没有、未必、未曾、难以19在中文微博中,大部分的平台都会提供有趣多样的表情符号以便用户使用。由于图像技术的快速发展,表情符号也变得越来越直观形象,用户可以通过选择恰当的符号表情来直接表露自己的内心感受。在微博文本中,表情符号的适用不仅个性化了文本内容,还可以借助表情符号体现用户的情感偏倚。因此可以研究建立一个以微博符号表情为基础的情感倾向的参照表,并且在其中重点表明出情感的极性及相应系数,将该表作为微博文本情感倾向的参考依据。本研究选取新浪微博平台自带的表情符号,其中32个正面情感,24个负面情感,基于情感偏离度能够将正负面情感表情分成两层,如表4.8。表STYLEREF1\s4.SEQ表\*ARABIC\s18微博符号情感词典情感层级权值微博符号情感(部分)数量(个)正面情感1[给力]、[哈哈]、[点赞]、[大笑]、[可爱]、[爱心]、[激动]、[开心]、[鼓掌]、[害羞]、[龇牙]、[调皮]……32负面情感-1[痛哭]、[难过]、[呕吐]、[右哼哼]、[抓狂]、[问号]、[流泪]、[生气]、[衰]、[左哼哼]、[敲打]……24情感值的计算本研究利用Python中的jieba分词,并结合构建的情感词典和停用词词典对厦门夜间旅游微博评论实行两种处理方式,一个是分词,另外一个是停用词;将分词处理完毕之后,会对其中存在情感词的词性进行特别标注,并且基于评论中所存在的标点符号将其进行拆分;下一步是去基础情感词典、否定词典等词典中去提取信息,这样可以对已经处理好的文本进行情感分数的测评。其中假设为评论中的情感词语,那么其情感倾向所采用的计算公式就是:如果存在程度副词,那么情感倾向的的计算公式如式4.7所示,其中公式4.7中表示的程度副词权值,表示的权值; (式STYLEREF1\s4.SEQ(式\*ARABIC\s17)如果在评价中出现了消极的词语,那么情感倾向计算公式就会发生改变,变为式4.8所示,其中公式(2)中表示的否定词权值; (式STYLEREF1\s4.SEQ(式\*ARABIC\s18)故每个句子的情感倾向得分的计算公式如式4.9所示;QUOTE (式STYLEREF1\s4.SEQ(式\*ARABIC\s19)最后一条微博评论中的情感倾向的总分计算公式如式4.10所示,其中公式4.10中 (式STYLEREF1\s4.SEQ(式\*ARABIC\s110)该公式会一直循环,一直到最后一条微博评论的情感得分计算完。通过以上步骤对厦门夜间旅游的相关微博评论进行情感倾向得分的计算,其中个别评论的情感分析结果示例如表4.9所示:表STYLEREF1\s4.SEQ表\*ARABIC\s19部分微博评论情感分析结果示例表情感倾向微博内容情感值正面情感夜游鹭江,一个字:美不胜收!2负面情感鼓浪屿无聊-1中性情感夜游环岛路0最后,根据所搜索出的微博评论内容深入分析游客的情感,最终得出结果,积极的评价约为88.2%,中性1.8%,负面评价占10%,如图4.3所示。图STYLEREF1\s4.SEQ图\*ARABIC\s13厦门夜间旅游游客情感分布统计图由此可见,大多数游客对厦门夜间旅游的评价与感知是持积极态度的。从微博评论内容上看,游客对厦门夜景旅游的肯定多是对其当地地道的美食、怡人的景色、美丽的海景、舒适的环境以及当地的特色等;对其负面的评论大多是因为人流量多、交通堵塞以及体验感不达预期导致的。根据对计算最终得出的情感值和游客微博评论的内容综合考虑归纳出以下观点,但分析内容是从整体出发,还不够细致。正常情况下,游客会在整个旅游的过程中逐渐建立对厦门夜间旅游的认知,在整个旅游的过程中,必然会产生情绪的变化,进而影响游客的情感变化,该变化的研究可以基于时间和空间两个因素,这样能够通过对比研究出更为准确的影响游客情感变化的原因。首先从时间角度出发,主要分析的数据时间为2010年1月1日至2019年12月31日。对游客情感变化分析的过程中,主要以年和月作为单位,这样能够准确得出游客情感在不同时期的变化情况,根据变化总结出变化特性;基于空间的角度分析,研究游客发布微博时所在的地理位置,进而分析出每个地理位置的分布情况。时间变化分析厦门夜间旅游关注度不同时间尺度变化分析根据前面获取的有关厦门夜间旅游微博评论数据,将其进行数据统计,根据结果可以得出厦门夜间旅游游客的关注度的空间变化。该部分的数据参考依据是微博签到,根据数量的变化能够看出游客对于厦门夜间旅游关注度的变化。图STYLEREF1\s4.SEQ图\*ARABIC\s142011-2019年厦门夜间旅游微博评论数通过对10年来厦门夜间旅游新浪微博发布情况分析得到图4.4,由图反映的厦门夜间旅游网络关注度整体保持平稳,且在2013年至2019年七年间,整体上游客关注度相差无几。但从2011年到2013年三年间,微博发布数量由明显的上升趋势,尤其是在2012年微博数量达到顶峰,呈现出较明显的分水岭。究其原因,第一,厦门市政府大力落实《关于支持福建省加快建设海峡西岸经济区的若干意见》等政策文件,相应出台了《厦门市旅游服务质量大提升三年(2011-2013)行动计划》,明确提出要加快夜间旅游的发展。特别是在2012年相关政策提出以来,厦门市夜间旅游开始呈现出积极发展的好势头,厦门市旅游局讨论了《厦门市旅游业“十二五”空间布局规划》和《厦门夜间休闲旅游发展规划》两项规划,推出了厦门市七大夜间旅游项目,并提出了“一核一带八片区”的口号。正是由于厦门市政府的大力推广与扶持,厦门市夜间旅游也迎来了井喷式的关注和发展契机。其二是因为微博平台自身发展的因素,基于《第28次中国互联网网络发展状况统计报告》相关报告数据显示,在2011年,微博用户急剧增长,六月份以前中国微博用户总数增加了13189万人,在这半年内,增加幅度翻了两倍,在网民中的使用增长了26.4%,手机微博也成为了热门软件,微博的使用情况从2010年年底计算,数量提高了18.5%。《第28次中国互联网网络发展状况统计报告》图STYLEREF1\s4.SEQ图\*ARABIC\s152010年-2019年厦门夜间旅游月度微博数量统计图由于数据只抓取到2020年4月份,基于月份的微博数量发布的统计数据中,2020年数据无法进行完整的对比分析,这里以2010年至2019年为例。根据图4.5可以看出,每年每个月份所发布的微博数量都大致相同,走势也基本相同,数据发布最多的时刻在5月,8月和10月的数据相差较小,在5月和10月达到最大值,呈现“双峰”现象,在达到高点后就回落并趋于平稳。由此可知,厦门夜间旅游游客峰值出现的时间多为“五一”劳动节、“十一”国庆节等假期的前后,市民们趁着放假有充足时间选择出门旅行,再加上从2012年施行的高速公路节假日免费政策,大大推动了自驾游的发展,很多市民都会选择自驾游的方式,传统的出行方式越来越少。除此之外,根据季节这一条件来看,春季和夏季是厦门夜间旅游的旺季,夏季次之,冬季最少。厦门地区位于东南沿海,是亚热带海洋性季风气候,全年气候温和,降雨多,每年的平均降雨量达到1200毫米,雨季集中在5-8月份,但受到太平洋温差气流的影响,厦门每年平均会遭受4次左右的台风,并且台风出现的季节多为7-9月份,因此台风天气常常是影响游客选择在夏季来厦门游玩的的一个重要因素。当然,不同年份厦门夜间旅游的月份时节规律也会受到政府出台政策、各景点等多方面的影响而有所差别。另外,通过运用公式1.2能够准确算出从2010年至今的厦门夜间旅游季节性强度指数T=7.2,该数据体现出每个月的微博发布的数量就可以体现出旅游需求变化的季节性的特点,即使厦门一年四季都十分温暖,冬天不冷,夏天不热,但游客在不同季节在厦门进行夜间游玩活动时体验感也是有所不同的,游客关注度会随着相应的旅游需求而产生变化。厦门夜间旅游游客情感年变化分析根据前文算出的游客情感值,以每年为单位计算出游客每月的情感均值,由此绘制出不同年份情感变化趋势图4.6。图STYLEREF1\s4.SEQ图\*ARABIC\s162010年-2019年厦门夜间旅游年度游客情感变化趋势图由图4.6可知,2010年至2019年游客情感均值呈现总体上升趋势,这也验证了厦门夜间旅游一直处于比较积极健康快速的发展阶段。2014年和2018年情感均值是图中比较明显的两个拐点,2014年是厦门市政府实施《厦门市旅游服务质量大提升三年(2011-2013)行动计划》结束后的第一年,全市的旅游服务标准逐渐完善,并且质量的管理更加严格,同时厦门还在2014年举办展览200场、会议4177场,均比往年有较大增长,这也能从侧面体现出会展经济对旅游业的发展。厦门还在2014年承办亚太经合组织(APEC)海洋部长会议,有四十多个国家和国际组织都纷纷参加,厦门的国际地位逐渐提高,为厦门带来了更多游客。此外,厦门为更好的提高旅游服务质量及游客满意度,对全市的BRT以及公交进行重新安排部署,并且增加运行的次数,确保能够服务业每天十多万的乘客。为了使效率得到提高,使旅客的出行变得更加方便,于是将厦金的“小三通”与五通码头相结合,将逐班通关的方式也进行更改,变为连续通关,这样可以有效的减少航程,同时使出船变得更加有秩序。为了使鼓浪屿的旅游环境以及质量明显提升,做对于航线做出改变,把过去的厦鼓旅游客运的航线转移到东渡和嵩屿,这样能够将游客进行分流,同样能够使客轮得到升级,进而也使鹭江道的交通变得顺畅。2017年金砖会议在厦门的成功举行也为2018年厦门市夜间旅游游客情感值的提升产生了重要影响,在2018年,夜景照明工程达到2038处,其中不乏深受游客欢迎的白鹭洲公园音乐喷泉及环岛路夜景。夜间旅游是日间旅游的延续,日间游客的情感体验同样也会延续到夜间,我们可以看出厦门在推动旅游业的发展中,在保证游客能够得到积极的情感体验上狠下功夫,除了出台政策、加大公共基础设施建设、打造文创街区以外,还举办草莓音乐季、IMF电音节等,并在2019年承办了第28届中国金鸡百花电影节,电影节的成功举办也为厦门夜间旅游的发展打下了良好的契机。厦门夜间旅游游客情感月变化分析基于前文中得出的游客情感值,计算出游客每个月的情感平均值,基于数据绘制出不同年份和月份的情感变化图表,如图4.7。图STYLEREF1\s4.SEQ图\*ARABIC\s172010年-2019年厦门夜间旅游月度游客情感变化趋势图据图4.7可以看出,2010-2019年这九年里,除了一些个别的年份变动比较明显之外,其他年份的情感均值均在3月-10月份之间,数据整体趋于平稳,几乎每一年的4月和9月是最高点,在2、5、7月份是情感均值最低的月份。结合上述内容可以看出,游客情感均值受到季节的影响,季节适合旅游的时候情感均值高,不适合的时候低。结合微博发布数量统计以及游客评论内容分析可知,2月份的厦门虽然还是冬季,但由于冬天的厦门相较于我国大部分地区而言,气候温和适宜,同时又加上2月份一般处于春节期间,随着旅游行业的快速发展和市民传统观念的改变,越来越多市民会选择在春节期间出门旅游,而厦门无疑是一个好的选择,因此会出现2月份厦门游客较多的现象,由此导致游客此时的情绪体验感相对较差,有不少游客抱怨“鼓浪屿人山人海”、“旅游景点很多都宰游客”等内容。5月和10月份恰逢“五一”劳动节和黄金周期间,由于游客人数的大幅度增长,导致厦门各大景点、街区出现拥挤、堵车、景区门票买不到等现象,不少游客同样抱怨“人好多走好远

”、“去鼓浪屿没买到2号的船票”等内容,上述因素使得厦门夜间旅游的网络形象受到破坏,造成了一些不好的影响。到了7月份,炎热的夏天的时候,情感值较低的原因是很多游客在旅游的过程中都受到了暴雨、酷暑等气候因素的影响,从而引起了负面情感,导致情感均值降低。图中,在4月份和9月份数据差异大,这两个月是厦门气候最合适旅游的时期,雨水少气温适中,游客们在夜晚可以选择漫步在厦门的海边吹吹海风,也可以选择在鹭江上乘坐游船欣赏两岸的夜景,沉浸在鹭岛迷人的夜色中。同时,由于4月份和9月份处在“五一”劳动节和“十一”国庆节之前,厦门各大景区都会提前为小长假和黄金周做好相关准备,完善景区设施,不少游客会选择避开节假日旅游旺季,提前做好出游准备。在金秋十月,游客评论时常常提到“太好看了”、“最美的巷子”、“厦门美”、“好吃”等一些积极的词汇出现,超过了游客心理的预估值,进而减少了十一假期因为拥挤而导致消极心理,游客较多的都表现出满意的心理状态;除此之外,厦门会在每年的秋天都举行各种的音乐节、中秋博饼游园等活动,提升了游客参与厦门特色活动的旅游体验感。其中有极个别的年份的情感均值与其他年份存在较大差距,导致该现象的形成多数是因为外界因素,例如在2016年的10月,大量的游客的消极情绪使得游客均出现了“情绪低落”的现象,导致该现象的主要原因一是2016年恰逢厦金“小三通”复航十五周年,厦金“小三通”旅客达到近800万人次,在国庆黄金周更是出现各个景区游客人数爆满,游客点评中写道:“没想到晚上的鼓浪屿人还是那么多”而游客人数的暴增,影响了游客在厦门的旅游体验感;二是厦门受到了七十年来登陆闽南的最强台风“莫兰蒂”的正面袭击,台风的到来使得全城的电力供应停止工作,全城停水,基础设施遭到了严重的破坏,严重影响了10月份游客的旅游体验,由此出现了低谷现象。空间分布分析厦门夜间旅游微博发布热点分析本研究根据游客发布时留下的地理位置信息,结合在抓取数据过程中确定的景区关键词,利用ArcGIS10.0软件将其定位到空间地图上,观察图4.8的绘制结果,在整个厦门市的建成区范围内,关于夜间旅游的微博发布地点在空间上的分布十分不均衡,主要集中在思明区,少部分集中在湖里区和集美区,翔安区和同安区基本没有游客夜游的足迹。思明区是厦门市繁华的区域,该区内的旅游资源相对其它五个区而言比较丰富,包括了著名的鼓浪屿风景区、中山路步行街、沙坡尾、曾厝安、黄厝、环岛路等景区及街道,该区域内存在的各类休闲娱乐设备比较齐全,游客能够在该地区集合,不仅仅是景点吸引的游客,同时还有食品、居住以及文娱等内容,产生“吃、住、行、购、游”的夜间旅游一条完整产业链,推动了该区域经济的飞速发展。结合厦门市行政区域图分析,翔安区和同安区主要为厦门市的工业区,离厦门市中心较远,交通较不方便,是厦门市六个区内尚未开通地铁的两个区域;尽管翔安区和同安区并不缺乏旅游景点,有著名的大嶝小嶝岛、同安影视城、北辰山、方特梦幻王国等景区,但是这些景区目前只在白天开放,游客无法在夜间进行游玩,这也是导致翔安区和同安区夜间游客比较少的重要原因之一。湖里区作为厦门市传统的老区,近几年厦门市政府在湖里区大力建设文创园区,如海峡设计文创园、华美文创园、牛头山文创园等,文创园区除了在设计装修上极具吸引力,还聚集了众多具有特色的餐厅及酒吧,从而吸引了大量的游客在夜间前来享受。而海沧区和集美区则是这几年厦门市政府重点发展的两个区,除了基础配套设施日渐完善以外,区政府还积极打造夜景工程,在海沧湾和杏林湾两岸打造出具有厦门特色的夜景,成为游客夜游的新去处。图STYLEREF1\s4.SEQ图\*ARABIC\s18夜间旅游微博发布热点区域图表STYLEREF1\s4.SEQ表\*ARABIC\s110厦门夜间旅游游客评论内容词频统计表(部分)特征词频次频率(%)特征词频次频率(%)特征词频次频率鼓浪屿32134327.5447环岛路157541.3504海边114930.9852厦门24331820.8566小吃140731.2063一个人111080.9521中山路821627.0427黄厝137921.1822夜游109160.9357沙坡尾534544.5819咖啡125721.0776文艺103760.8894喜欢199331.7086不错123601.0595推荐103110.8838环岛195441.6753好吃120221.0305朋友101910.8735浪漫193921.6622酒店118481.0156曾厝安97840.8387本研究对游客关于对厦门夜间旅游方面的微博评论进行了词频统计,得到表4.10,同时进一步结合词汇自身体现的情感倾向,以及该词汇出现的次数进行划分,统计结果如本表4.11所示,括号里的数量是该词语出现的次数。表STYLEREF1\s4.SEQ表\*ARABIC\s111高频词汇分类统计结果分类高频词数量地名鼓浪屿(321343)、中山路(82162)、沙坡尾(53454)、环岛路(15754)、曾厝安(9784)、步行街(7818)、双子塔(1104)、龙舟池(355)、海边(11493)、鹭江(4923)、黄厝(13792)11餐饮小吃(14073)、咖啡(12572)、奶茶(7667)、美味(2340)、啤酒(1371)、花生汤(5870)、凤梨酥(417)、餐厅(3274)、牛轧糖(3765)9人际关系一个人(11108)、朋友(10191)、同学(3213)、妈妈(2580)、闺蜜(2545)、姐姐(2124)、伙伴(1559)、家人(1428)、老师(1491)、孩子(3329)10娱乐酒吧(5881)、音乐节(670)、逛街(1681)、游船(268)、音乐会(1501)5环境风景(7827)、文化(6651)、夜游(10916)、景色(48)、建筑(8196)、夜景(5963)、安静(4433)、繁华(1983)、环境(3529)、宁静(3348)、热闹(2579)、灯光(1248)12天气天气(4231)、台风(4108)、夏天(3338)、下雨(2019)、空气(1598)、月色(92)、吹风(1417)、月亮(813)、好热(502)、微风(501)10交通公交(3834)、地铁(1492)、拥挤(760)、堵车(469)、人多(1982)5住宿酒店(11848)、民宿(4027)2旅游体验正面形容词:喜欢(19933)、浪漫(19392)、不错(12360)、文艺(10376)、推荐(10311)、好吃(12022)、最美(9362)、美丽(8806)、开心(8462)、感受(6788)、美好(5651)、梦幻(4978)、值得(4334)、漂亮(4074)、好玩(3600)、舒服(3326)、爱你(2529)、打卡(2453)、完美(1366)、嘻嘻(1243)、舒适(1063)、我爱你(673)超美(247)、鼓掌(216)、馋嘴(39)25负面形容词:贵(8304)、可惜(3719)、不好(2995)、遗憾(1995)、不够(1212)、无聊(1153)、陌生(954)、后悔(736)、担心(543)、讨厌(517)、无趣(103)11根据上表的词频统计结果可知:(1)游客们在微博上流露出来是自身的真是感受,根据统计中的数据显示,大部分的游客情感体验都是积极的,从表中可以明显看出,在这些高频词中,描述游客旅游体验的词汇数量相对较多,共有35个,而别的各类词汇数量就寥寥无几,将其与旅游体验的词汇作对照,体现游客正面感情的词汇数远多于负面感情词汇数,并且各个词汇出现的频数也都较多,其中“喜欢”和“浪漫”这两个体现游客正面感受的词频均大于1万,而“贵”这一词汇出现的频率非常高,总计出现了8304次。这个结果能够体现出游客在厦门旅游的过程中更多为积极的情绪,值得关注的是,价格因素对游客在旅游过程中的情感体验也产生了较明显的影响。(2)在微博的文章中所指出的地名充分为本研究中的热点区域定位作证明。在游客进行的评论中,所提到的景区的名字按照出现的频率排名为“鼓浪屿”、“中山路”、“沙坡尾”、“环岛路”、“黄厝”、“曾厝安”等位于思明区的景点,该结果也同样验证了厦门夜间旅游涉及到的街区景点在行政区域上分布不均衡,主要以思明区为中心。(3)游客偏爱厦门美食。从表中可以看出,与美食相关的词汇数量也不少,“花生汤”、“凤梨酥”、和“牛轧糖”等受游客欢迎的厦门美食均被游客多次提到。“奶茶”被列在了高频词汇之内,是由于厦门特殊的地理位置和晴热的天气,厦门跟“美食之都”台湾仅一水相隔,很多台湾的奶茶品牌选择在环境跟气候极其相似的厦门落户发展,这也造成厦门大街小巷遍地都是奶茶店的现状;而厦门作为闽南文化的发源地,闽南酒文化和夜宵经济高度发达,这也是“啤酒”被列在高频词中的主要原因,同时由于这几年精酿啤酒在厦门的盛行,各类精酿啤酒屋现身在厦门街头,越来越多的游客在夜间会选择在精酿啤酒屋内点杯精酿感受一下酒文化。“咖啡”这个高频词也是应该值得高度关注的,厦门市思明区拥有著名的西堤咖啡一条街,沿街两侧全是豪华别墅区,均被打造成中高端咖啡店,很多游客会选择到不同的独立咖啡馆体验不一样的咖啡文化。相关数据表明,厦门地区的咖啡馆密度在我国排名第一位,并且人均消费也是全国最高。如果在地图上输入“咖啡”关键词进行检索,结果显示咖啡馆高达2200以上,其中岛内咖啡馆占了大部分,占比为79.8%。在岛内的咖啡馆分布中,思明区的咖啡馆最多,湖里区排第二。咖啡文化的流行,也是吸引大量游客在夜间进行休闲放松的好体验。(4)人际关系是在进行评价时出现次数相对较多的词语。例如表中所体现的出现频率较多的关于人际关系的词语,包括“一个人”、“朋友”等同伴关系,“妈妈”、“儿子”、“女儿”等家人关系,这些人际关系除了表明游客出游时大多是有组织的结伴而行,它也是影响游客情感的要素,人与人之间的情绪会相互影响。(5)外界环境也会影响游客的情感。表中提到了关于厦门夜间旅游环境的一些高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论