




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主要考虑里程数随时间变化的思路及数据分析文献综述:首先,对数据进行描述性统计,如下表: 表1 各个月份里程数的描述统计Statistics一月二月三月四月五月六月NValid666666Missing000000Mean2682.672450.671686.331613.171412.501657.50Median2260.002400.001588.001502.001409.501496.00Std. Deviation827.977564.052256.089338.369162.976437.660Variance685546.667318154.66765581.467114493.76726561.100191545.900Range215611946949874011176Minimum210019301473127312001354Maximum425631242167226016012530Percentiles252220.001930.001521.001443.251251.751411.00502260.002400.001588.001502.001409.501496.00753284.002971.001865.501796.501589.751861.75Statistics七月八月九月十月十一月十二月NValid666666Missing000000Mean1885.171527.831559.331925.171893.502697.83Median1561.001352.001350.001875.501850.002175.00Std. Deviation711.830520.317362.947246.309222.345892.312Variance506702.567270729.767131730.66760668.16749437.500796220.167Range182813978707006102157Minimum139211831280160017002170Maximum322025802150230023104327Percentiles251415.251285.751332.501750.001722.502170.00501561.001352.001350.001875.501850.002175.00752420.501680.001944.502150.002018.253459.25表1和图1、2对数据进行描述。可以看出,1月、2月和12月这三个月的里程数都大于临界值。而从箱线图可以看到个月的里程数大致成U型。因此可以做出初步假设,1、2、12这三个月属于旺季月份。将这三个月份记作“1”,剩余的月份记作“2”,进行方差分析,结果见表2。可以看到结果是西安、厦门是不显著的,而其他城市则较为显著。则可以认为在除西安和厦门外的其他城市,这三个月的确对里程数有影响。所以在做结论时可将这三个月份单独考虑。图1 各个月份里程数的直方图图2 各个月里程数的箱线图表2淡旺季和里程数之间的关系Tests of Between-Subjects EffectsSourceDependent VariableType III Sum of SquaresdfMean SquareFSig.淡旺季 北京680625.0001680625.00017.592.002 上海2040136.11112040136.1116.208.032 西安627000.0281627000.0283.040.112 厦门29013.444129013.444.100.758 广州442446.6941442446.6944.935.051 三亚6575805.44416575805.4449.141.013通过上表可知,对于淡旺季的分类对于大部分城市的数据还是比较显著的,即这些城市的货运量有明显的季节影响则考虑,对淡季和旺季内的城市用同样的租车策略。首先,对于个人和公司两种方式,可以看出租车金额都关于里程数线性增长。进行简单数学运算,找到两种方式的临界点时,个人方式比较好;时,公司方式比较好下面,分别将六个城市的数据合并,对淡季和旺季的货运量作分位数的Bootstrap枢轴量的95%的置信区间,来确定淡季和旺季的里程数与1700的关系,进而对租车策略进行决策。首先,对旺季(1月、11月、12月)进行百分位数区间估计。为了决策,我们要考虑这个时间段中1700以尽可能大的概率被覆盖。因此,对多个分位数进行置信区间的检验,过程如下:peak=c(2260,2960,2100,2260,4256,1921,1700,2310,1800,1900,1730,2170,3170,2180,2170,4327)dull=c(1930,1630,2830,1537,2920,1546,1930,1473,1970,1765,3124,2167,1504,1601,1503,1392,1273,1586,1489,1423,1500,1383,1430,1640,2260,1269,2530,3220,1500,1200,1354,2154,1642,1436,1639,1482,1372,1350,1821,1332,1350,2100,1320,1350,1930,2580,2150,2300,1380,1876,1800,1183,1280,1600)#对数据组中的各分位数进行计算quantile=quantile(peak,seq(0,1,0.05) quantile 0% 5% 10% 15% 20% 25% 30% 35% 40% 1700.00 1722.50 1765.00 1825.00 1900.00 1915.75 2010.50 2117.50 2170.00 45% 50% 55% 60% 65% 70% 75% 80% 85% 2170.00 2175.00 2200.00 2260.00 2260.00 2285.00 2472.50 2960.00 3117.50 90% 95% 100% 3713.00 4273.75 4327.00 #考虑对20%,30%,50%(中位数)进行置信区间的估计#20%百分位数:Quan=quantile(peak,0.2)TBoot1=NULLn=10B=1000SD1.peak=NULLfor(i in 1:B)Sample1=sample(peak,n,T)Tboot1=quantile(Sample1,0.2)TBoot1=c(TBoot1,Tboot1)SD1.peak=c(SD1.peak,sd(TBoot1)TBoot11000Lcl2=2*Quan-quantile(TBoot1,0.975)Ucl2=2*Quan-quantile(TBoot1,0.025)peakPIVOTAL=c(Lcl2,Ucl2)peakPIVOTAL得到1572,2076#30%分位数Quan=quantile(peak,0.3)TBoot1=NULLn=10B=1000SD1.peak=NULLfor(i in 1:B)Sample1=sample(peak,n,T)Tboot1=quantile(Sample1,0.3)TBoot1=c(TBoot1,Tboot1)SD1.peak=c(SD1.peak,sd(TBoot1)TBoot11000Lcl2=2*Quan-quantile(TBoot1,0.975)Ucl2=2*Quan-quantile(TBoot1,0.025)peakPIVOTAL=c(Lcl2,Ucl2)peakPIVOTAL得到1761,2251#中位数Mep=median(peak)TBoot=NULLn=10B=1000SD.peak=NULLfor(i in 1:B)Sample=sample(peak,n,T)Tboot=median(Sample)TBoot=c(TBoot,Tboot)SD.peak=c(SD.peak,sd(TBoot)TBoot1000Lcl1=2*Mep-quantile(TBoot,0.975)Ucl1=2*Mep-quantile(TBoot,0.025)peakPIVOTAL=c(Lcl1,Ucl1)得到置信区间1635.0 ,2439.5由上面的结果,利用bootstrap方法计算的20%50%的百分位数的置信区间都包含了1740,并且区间大部分位于大于1740的位置。故可以认为旺季的大部分里程数是大于1740的,故在旺季的三个月,在六座城市均采用个人方式租车。继续运用上面的方法,对淡季进行估计。首先,对样本进行合并,考虑货运量在不同月份之间的变化有没有趋势。取数据中大于1740的为1,小于的为0,对数据做Cox-Staut趋势性检验。【注:此处在合并数据时,将不同城市同一月份之间的数据放在一起,再将所有数据按照月份排列】for(i in 1:length(dull)if (dulli1740)dulli=1elsedulli=0 dull 1 1 0 1 0 1 0 1 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 037 0 0 1 0 0 1 0 0 1 1 1 1 0 1 1 0 0 0#考虑数据的出现与时间是否有关系(即从文献中获得的信息),这些数据是否是随机分布的,对变化过的数据进行随机游程检验;若拒绝原假设,再考虑与数据显示出的趋势,则需要再进行cox-staut趋势检验。下面进行随机游程检验: run1=as.factor(dull) runs.test(run1) Runs Testdata: run1 Standard Normal = -0.6446, p-value = 0.5192alternative hypothesis: two.sided 可知,并不能拒绝原假设,并不能认为数据的出现不随机,则接下去不进行趋势检验。既然认为数据随机出现,就说明选择哪一种租车方式其实并没有一个明确的指向性。但是,考虑到这种思路只是粗略地对数据进行了淡季、旺季两个分组,并且合并数据时,并没有仔细考虑城市之间的差异。这是因为思路和方法上的缺陷使检验结果不能使人信服。之后的方法与思路会仔细就这一点进行讨论。为了对决策做出一个有力的支持,还是用Bootstrap方法对不同百分位数进行区间估计。结果如下:#淡季数据的分位数:quan=quantile(dull,seq(0,1,0.05) quan 0% 5% 10% 15% 20% 25% 30% 35% 40% 1183.00 1271.60 1323.60 1350.00 1364.80 1385.25 1429.30 1477.95 1500.00 45% 50% 55% 60% 65% 70% 75% 80% 85% 1503.85 1566.00 1605.35 1639.80 1780.75 1881.40 1930.00 2120.00 2171.65 90% 95% 100% 2461.00 2861.50 3220.00依然使用上述Bootstrap方法,分别对10%,20%,30%,40%,50%,60%,70%,80%,90%的百分位数进行枢轴量置信区间的估计。估计结果如下:(代码略)10%20%30%40%1157.905,1448.9001141.4,1460.61216.39,1550.601091.60,1647.6650%60%70%80%1091.95,1746.051099.25,1866.031304.775,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年资产评估行业当前市场规模及未来五到十年发展趋势报告
- 2025年电抗器行业当前发展现状及增长策略研究报告
- 保定市安新县2024-2025学年中考数学模拟试题含解析
- 2025年版《义务教育道德与法治课程标准》试题(含答案)
- 2025年食堂从业人员卫生知识测试试题与答案
- 2025年安全工程师试卷及答案
- (完整)老年痴呆护理培训考试试题及答案
- 摩托驾驶安全知识培训课件
- 2025政府采购评审专家考试试题及答案
- 2025年全国公文写作与处理自考试题及答案解析
- 辽宁中考英语2022-2024真题汇编-教师版-专题05 阅读还原之五选四等
- 钢构彩瓦施工合同范本
- 广东省深圳市2024-2025学年高一上学期期中考试数学试卷(含答案)
- 第6讲立体几何(2022-2023年高考真题)(原卷版)
- 安宁疗护舒适照护
- 幕墙作业安全技术交底
- 中医耳针技术
- 混凝土板底疏松修补方案
- 小型文化传媒公司财务管理制度
- 山东省第二届化学分析检验人员行业职业技能竞赛理论试题库资料(含答案)
- 人教版数学一年级(上册)知识点全
评论
0/150
提交评论