版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 题目: 爱知世博会人流量影响因素分析及预测§1、摘要 本论主要探讨了爱知世博会期间人流量的影响因素及预测次日世博会的人流量问题,通过主成分分析法研究影响人流量的主要因子。 第一步,对给出的数据进行分析。用EXECL表格制作每日人流量的散点图,根据问题以及问题二,有针对性的提出主成分分析法,借助SPSS软件予以解答。 关键词:世博会 人流量 主成分分析 §2、问题的提出要解决的问题主要有两个:1. 分析世博会期间影响游客数量的的主要因子;2.解析这些因子对游客数量的影响机制,建立这些因子与一天游客数量的数学关系; §3、问题的分析经过考虑,我们首先应围绕题目寻找相
2、关数据进行统计分析,建立日期与人流量的X-Y散点图。依据题目要求,需要分析影响人流量的主要因子,我们分析人流量的单个因素影响,主要有日期,周双休日,假期,天气等的影响。通过主成分分析法,找出主要的影响成分,分析模型,通过拟合度检验,我们对原有的模型进行进一步的修正。问题二主要基于时间序列分析,通过建立时间序列模型来预测次日人流量。并进行时间平稳检验,对模型进行修正。 §4 模型假设1. 假设爱知世博会期间,没有自然灾害等突发事件发生,天气变化和往年无多大差异。2. 假设爱知世博会期间,交通、通讯设备正常,没有重大事故等突发事件的发生。3. 假设爱知世博会的场馆可以容纳无数的游客。4.
3、 假设爱知世博会期间,没有重大影响游客量的事件发生。 §5 模型的准备选定模型之前,首先对数据进行分析。1、 根据Excel统计日数如流量的散点图。类似于时三次曲线,先将日数的三次方作为一个影响因素录入。2、 从数据中,明显涉及到的因素有日期,星期,天气和节假日四个因素,通过对相关的蚊香的阅读,找出世博会的日访问量与世博会在群众中的知晓度有关,随着时间的推进,将会有越来越多的游客游访世博会。指定S代表世博的阶段,并赋值。符号含义D日期D2日期的平方D3日数的立方S世博阶段W天气F周末T节假日世博前30天,S=1,后30天S=3,中间,S=1天气W 晴时,W=1,多云时,W=0,下雨时
4、 W=-1,只要有雨,都是-1周末 F 工作日周一至周五 F=0,周六,F=2,周日F=1节假日T 假日时 T=1,非假日时,T=0§6 模型的建立与求解(一) 问题一根据问题及我们对相关知识的了解,决定用主成分分析法来解决这个问题。下面进行详细介绍。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。设 是一个p维随机向量,且,协方差矩阵D(X)=V。考虑它的线性变换:
5、如果满足:;则称,是X的第一主成分。是在X的所有线性组合中最能综合P个变量信息的一个特殊的线性组合。如果一个主成分不足以代表原P个变量所包含的信息,就考虑采用。为了最有效地代表原变量的信息,原有的信息就不需要出现在中,即满足,于是求,使其满足。此时的称为是第二主成分。类似可得第三主成分,第四主成分等等。(二) 主成分分析步骤 主成分分析常常通过以下四步来处理:(1)对原P个指标的n×p个原始数据标准化。目的是为了消除变量间在数量级上火量纲上的不同而产生的影响,以使每个变量的平均值为0,方差为1.变换标准化的公式为:其中和分别是第j个变量的平均差和标准差。(2)根据标准化矩阵求出协方差
6、矩阵(与相关阵完全一样)。(3)求出协方差矩阵的特征根和特征向量。(4)确定主成分,结合专业知识给个主成分所蕴藏的信息给予恰当的解释,并利用它们来判断样品的特性。1.通过SOSS软件进行主成分分析图表如下:表1.1 相关统计量表1.2 相关矩阵表1.3 变量的共同度表1.4 解释总方差表1.5 碎石图表1.6因子负荷矩阵表1.7 因子得分系数矩阵2.图形分析 (1)由表1.2可知,各变量之间存在较强的相关关系,因此有必要进行主成分分析。表中的空格表明自身相关的相关系数为1,岂不相关的显著性概率为0,因此不再显示; (2)由表1.3可知,变量的共同度对所有变量都是1,表明模型解释了每一个变量的全
7、部方差,而不需要特殊因子,即特殊因子的方差为0;(3)由表1.4可知,变量相关阵有两个最大特征根,即4.125和1,131,他们一起解释总方差的75.085%(累计贡献率),这说明前两个主成分提供了原始数据的主要信息。基于过程内定取特征值大于1的规定,Factor过程提取了两个主成分;(4)由表可看出第一个主成分与第二个主成分的特征根大于1。,而其他主成分的特征根小于1,可以认为前两个主成分能概括绝大部分信息 ;(5)由表1.7知,第一主成分、第二主成分与原始变量的关系,可用下列线性组合表示:(三) 问题二表2.1引入/删除变量表2.2 模型摘要表2.3 方差分析表2.4 系数表2.5数据分析
8、 (1) 表2.1显示变量引入办法为全部引入法;(2) 表2.2显示了负相关系数R=0.906 可决系数R2 =0.806,估计标准误差S=20020.09;(3) 表2.3显示了方差分析的结果,P=0<0.05,可以认为变量与D ,D2,D3,S,W,F,T之间的线性关系显著;(4) 表2.4显示模型中的回归系数、常熟及t检验的结果,从表中可以看到t检验的P值:D,D2,D3,S和F的回归系数均为0,W的回归系数为0.001,T的回归系数为0.006.表2.2中,R Square 和Adjusted R Square 均超过81%,说明模型拟合平稳性较好。表2.4中,已经可以得到回归方程的系数。Y=-1469.171+2602.968D-30.752D2+0.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 平版印刷员岗前保密意识考核试卷含答案
- 临床试剂工安全知识评优考核试卷含答案
- 钟表部件组件装配工风险评估与管理能力考核试卷含答案
- 机制地毯挡车工安全理论测试考核试卷含答案
- 梳理缝编非织造布制作工安全知识强化考核试卷含答案
- 移栽机操作工岗前常识考核试卷含答案
- 2024年甘肃政法大学辅导员考试笔试真题汇编附答案
- 2024年隆化县幼儿园教师招教考试备考题库附答案
- 2025年三亚辅警协警招聘考试真题附答案
- 2025年电信网络运行维护操作手册
- 《机器学习》课件-第7章 神经网络与深度学习
- 2025年6月浙江省高考物理试卷真题(含答案解析)
- 2025-2030中国智能家居系统配置服务技术人才缺口评估报告
- 护士肺功能室进修汇报
- 物业工程维修培训内容
- 神经外科规培结业考试题库及答案
- 静脉输液十二种并发症及防治措施
- 广东省领航高中联盟2024-2025学年高一下学期第一次联合考试语文试卷(含答案)
- 肺栓塞的急救处理
- T/CCAS 007-2019水泥产能核定标准
- 胰腺炎中医护理方案
评论
0/150
提交评论