香港科技大学-旅游指数白皮书_第1页
香港科技大学-旅游指数白皮书_第2页
香港科技大学-旅游指数白皮书_第3页
香港科技大学-旅游指数白皮书_第4页
香港科技大学-旅游指数白皮书_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.项目任务介绍 41.1背景介绍 41.2研究目标:慧科-港科大旅游指数 41.3研究团队 42.项目方法论 52.1数据理解和采集 52.2变量设计和提取 72.3数据处理和量化 92.4模型建立 10 3.1预测结果 133.2模型评估 143.3模型解释 153.3.1酒店入住率预测模型 153.3.2到访人数预测模型 173.3.3酒店价格预测模型 203.4慧科-港科大旅游指数 21总结 23占全部访港旅客客最常用的分享和熟的自然语言处商业洞悉重要信数性指关数字和趋势 (如下个月的旅客到访人数等)。慧科-港科大旅游指数的主要受众为政府和酒店等旅游相关商业。对于政府,慧科-港科大旅游指数的预测能力能够协助其调整未来的旅游业相关政策并落相关部门(如入境处等)。对于旅游相关商业,慧科-港科大旅游指数的作完成。领域多元化数据经济学、机器学习和人工智能工具于分析新兴的大数据趋势以产生商业和社会调查和民意调查及分析以提供创新的商业和社会见解。这些见解和建议将有助地区的经济和社会发展。位和分析能够因素名称定义包含内容到访方法旅客到访香港的方式设施景点季节性景点等娱乐活动当地社群访港旅客对香港本地人/社群的观感当地人友好程度附带因素除去上述五大类外,吸引旅客访港的附带因素购买保险等查或专家小组香港旅游业变化。香港旅游携程以及各大旅游论坛。这些线上旅行机构及旅游论坛有专门的目的地版块,社交媒体类型新浪微博旅行论坛及线上旅行机构其他流行社交媒体社交媒体新浪微博小红书,哔哩哔哩,抖音时间范围2018年1月至2023年3月数据总量每日1000万条左右过滤方法关键词/标签过滤版面过滤关键词/标签过滤过滤后数据总量119,391条30,021条34,612条标注表示方法WeiboOTA我们根据上一节中定义的六大旅游因素导出此次项目预测模型的自变量。尽管大因素所包括的细分因素对旅游业的影响不尽相同。例如当地社群因素可以进一步细分为当地社群-正面(友好)以及当地社群-负面(敌视),而这两个细*2=22个自变量。期,细分变量名称细分变量定义细分变量性质到访方法-交通访港旅客到访香港时的交通方式体上与访港交通相关的月度数据量到访方法-签证访港旅客到访香港时的相关签证体上与访港签证相关的月度数据量设施体上与旅游设施相关的月度数据量景点访港旅客在香港到访的景点体上与香港旅游景点相关的月度数据量当地社群-正面访港旅客对香港本地体上对香港本社群的正面观感地社群正面观感的月度数据量当地社群-负面访港旅客对香港本地社群的负面观感体上对香港本地社群负面观感的月度数据量娱乐活动-购物访港旅客在香港的购物活动体上与在港购物相关的月度数据量娱乐活动-运动访港旅客在香港的体育类活动体上与在港体育活动相关的月度数据量娱乐活动-文娱访港旅客在香港的文娱类活动体上与在港文娱相关的月度数据量娱乐活动-展览访港旅客在香港的文化展览类活动体上与展览相关的月度数据量附带因素除去上述10个变量带因素体与其它访港原因相关的月度数据,如注射HPV疫苗、购买保险等外生变量名称外生变量定义外生变量性质公众假期内地公共假期时间01变量,如该月有内地公共假期则为1(5月有五一劳动节公共学生寒暑假期内地学生的寒暑假期01变量,如该月有内地学生寒暑假期则为1(如6月为学生暑假),否则为0港币人民币汇率港币兑人民币月度平均汇率时间变动的月度时间序列香港社会运动-实际发生香港社会运动的实际发生时间01变量,如该月有实际发生香港社会运动则为1(2019年7月),否则为0香港社会运动-内地媒体大量报导内地媒体大量报导香港社会运动的时间01变量,如该月内地媒体有大量报导香港社会运动则为1(2019香港内地通关政策受疫情影响香港内地是否通关01变量,如该月内香港内地由于疫情原因尚未通关则为1,否则气温月度平均气温温随时间变动的月度时间序列环境-空气质量月度平均pm2.5指数净值变量,平均pm2.5指数随时间变动的月度时间序列月份当时月份净值变量科自主研发的自然乐由于量化之后的数据(自变量)都和我们想要预测的旅游业统计数字(因变量)局部解释也可以进行基于全体样本的全局解释。P实时的社交媒体数据。但香港旅游业数字的统计因为存在实际发生-数据生成-数据披 (在X-1月末拿到的)X-2月的数据。所以我们将使用X-1月的社交媒体数据和X-2XX(本月)X-1月X-2月X-1月X-2月X-1月X-2月入住率入住率入住率人数人数访人数价格价格店价格特征影响全局解释主要根据SHAPvalue分析模型中每个特征对模型预测值产对值的平均值求出。下图反映了特征重要性排名和特征对模型预测值的影响正入住率模型中各因子对于预测值的影响入住率模型中各因子对于预测值的影响店入住率模型中各因子对于预测值的影响最重要的特征为OTA社交媒体上对于签证o数模型中各因子对于预测值的影响数模型中各因子对于预测值的影响访人数模型中各因子对于预测值的影响格模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论