




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京审计大学理学院 1 摘摘 要要本文主要运用谱系聚类分析 灰色预测 主成分分析的思想 运用 SPSS 软件进 行谱系聚类和主成分分析 MATLAB 软件计算相关矩阵 建立了聚类分析模型 GM 1 1 模型和主成分分析模型 分别讨论了 2016 年 1 月 5 月 50 个城市主要食品价格的分类和价 格变动的差异 预测 2016 年 6 月各类食品价格以及通过监测尽量少的食品种类预测计算居 民消费者价格指数变动 针对问题一 首先对涉及的主要食品进行分类 将数据进行处理 然后利用谱系聚类分 析模型 结合系统聚类 采用 SPSS 软件将 27 种食品分为 4 类 利用 EXCEL 分别作出四大 类食品的价格随时间变化的折线图 分析食品价格波动的特点 针对问题二 基于问题一中的食品分类 分别以每类的食品价格为序列建立灰色预测模 型 先进行数据的检验与处理 对原始数据进行一次累加 使数据有较强的规律性 进而建 立灰微分方程 再利用 MATLAB 软件求解模型 并依次进行残差检验及后验查检验 均有 C 0 35 预测精度较好 最后通过函数预测 2016 年 6 月价格走势 针对问题三 我们通过所给数据及查找的数据 利用主成分分析法 分析得出 27 种食 品种类中的主成分分别为芹菜 带鱼 鸡 白条鸡 鸭 大白菜 故得到可以通过检测少 量食品种类 就能相对精确地预测 CPI 数值 经过对地域特点的考察 选取上海和沈阳两 地 通过查找相关 CPI 和食品价格数据 用 spss 软件运用主成分分析法 得出对 CPI 影响 大的几类食品 然后通过 matlab 算法算出权重 再由所得数据和图表的分析比较得到 不 同地区应选取不同的食品种类进行检测 关键词 谱系聚类法 灰色预测 主成分分析 SPSS 软件 MATLAB 软件 南京审计大学理学院 2 一 问题重述一 问题重述 食品价格是居民消费价格指数的重要组成部分 食品价格波动直接影响居民生活成本和 农民收入 是关系国计民生的重要战略问题 2000 年以来 我国城镇居民家庭食品消费支 出占总支出的比重一直维持在 36 以上 在收入增长缓慢的情况下 食品价格上涨将使人 民群众明显感到生活成本增加 特别是食品价格上涨将降低低收入群体的生活质量 居民消费者价格指数 CPI 是根据与居民生活有关的产品及劳务价格统计出来的物价变 动指标 通常作为观察通货膨胀水平的重要指标 根据附件上的信息 并查找上海和沈阳的相关资料 建立数学模型解决以下问题 1 根据附件以及相关统计网站的数据 分析我国食品价格波动的特点 2 对 2016 年 6 月份食品价格走势进行预测 3 目前统计部门需要监测大量食品价格变动情况以计算居民消费者价格指数变动情况 能否仅仅通过监测尽量少的食品种类价格即能相对准确地计算 预测居民消费者价格指数 在同样精度要求下 两个不同地区所选取的食品种类以及种类数目是否一致 二 问题分析二 问题分析 居民消费者价格指数是一个波动的量 它客观地表示了通货膨胀的水平 食品价格是消 费者价格水平的重要组成部分 要解决以上三个问题必须要弄清楚食品价格的变化规律 针对问题一 要求根据已知的统计数据 分析出我国食品价格波动的特点 由此可以看 出食品价格是本题的主要分析研究的对象 但由于已知的食品种类有 27 种 数据量比较庞 大 如果逐个分析每一种食品价格的波动情况 势必导致过程繁琐 因此可以先对 27 种食 品进行分类 分类的依据是各食品价格间的关联程度 由于每一类的食品价格均具有相同的 走势 因此可以逐类分析即可得出我国食品价格的波动情况 针对问题二 要求预测 2016 年 6 月食品价格的走势 可以在问题一的基础上预测每个 大类的食品价格走势 因为每类中各种食品的价格走势大致一样 然后采用 GM 1 1 灰 色预测模型求解预测之后对价格进行预测分析 针对问题三 我们通过所给数据及查找的数据 用 spss 软件利用主成分分析法 分析得出 27 种食品种类中的主成分分 故得到可以通过检测少量食品种类 就能相对精确地预测 CPI 数值 并选取较具特点的两个城市 通过查找相关 CPI 和食品价格数据 进行同样的操作 比较食品种类 数目是否一致 三 模型假设三 模型假设 1 收集到的相关的数据都准确可靠 可信度高 2 食品零售价格每十天的平均价格与食品日平均价格的偏差很小 可以忽略不计 3 食品的分类是按照价格走势来划分的 同一类的食品价格的变化幅度可能有所不同 假设只要满足相同的价格走势即可 4 假设在预测时间段内不存在经济发展状况 突发状况 如自然灾害 等能是食品价格 波动显著的因素 四 四 符号说明符号说明 第 i 种食物在第 j 个时间点的价格 p q 两类间的距离 时间序列的原始数据 对原始数据进行一次累加后的数据 南京审计大学理学院 3 一次累加后的数据估计值与原始数据的一次累加数据的残差的方差 原始数据的方差 五 模型建立与求解五 模型建立与求解 5 15 1 建立建立谱系聚类分析模型谱系聚类分析模型 该问题要求根据已知的统计数据 分析出 50 个城市食品价格波动的特点 因此从题目 的要求中我们可以看到 食品的价格波动是我们要分析研究的对象 但根据附件中的数据可 知食品的种类有 27 种 数据量比较庞大 如果逐个分析每一种食品的价格波动情况 势必 会导致过程繁琐 无概括性和简洁性 因此可以先对 27 种食品进行分类 分类的根据是食 品价格涨幅间的相关程度 由于每一类食品的价格均具有相同的走势 因此可以逐类分析 即可得出 50 个城市食品价格的波动情况并能找出之间的差异性 5 1 1 系统聚类模型 设有 n 个样品 即本题中有 27 个食品种类 每个样品根据时间顺序测得 m 个值 设时 间为指标 得到观测数据 i 1 2 n j 1 2 m 表中数据称为观测数据阵 其数 学表达式为 其中列向量 表示第 j 个变量 j 1 2 m 行向量 1 系统聚类法的基本思想 距离相近的样品 或变量 先聚成类 距离相远的后聚成类 过程一直进行下去 每个 样品 或变量 总能聚到合适的类中 系统聚类过程是 假设总共有 n 个样品 或变量 第一步将每个样品 或变量 独自聚成一类 共有 n 类 第二步据所确定的样品 或变量 距离 公式 把距离较近的两个样品 或变量 聚合成一类 其他的样品 或变量 仍各 自聚为一类 共聚成 n 1 类 第三步将 距离 最近的两个类进一步聚成一类 共聚成 n 2 类 以上步骤一直进行下去 最后将所有的样品 或变量 聚成一类 为了直观地反映 以上的系统聚类过程 可以把整个分类系统地画成一张谱系图 所以有时系统聚类也称为谱 系分析 2 系统聚类法的基本步骤 1 选择聚类方法 类平均法定义类间距离平方为这两类元素两两之间距离平方的平均数 即为 设聚类的某一步将和合并为 则任一类与的距离为 2 系统聚类过程 1 假设总共有 n 个样品 或变量 第一步将每个样品 或变量 独自聚成一类 共有 n 类 南京审计大学理学院 4 2 据所确定的样品 或变量 距离 公式 把距离较近的两个样品 或变量 聚合成一类 其他的样品 或变量 仍各自聚为一类 共聚成 n 1 类 3 将 距离 最近的两个类进一步聚成一类 共聚成 n 2 类 以上步骤一直进行下去 最后将所有的样品 或变量 聚成一类 4 画谱系聚类图 5 决定分类的个数及各类的成员 3 谱系聚类类数的确定 由适当的阀值确定选定聚类方法 按系统聚类的方法并类后 得到一张谱系聚类图 聚 类图只反映样品间的亲疏关系 它本身并没有给出分类 需要给定一个临界相似尺度 用以 分割聚类图而得到样品的分类 如给定临界值 d 那么 当样品间或已并类间距离小于 d 时 认为这些样品和类的关系密切 应当归属一类 5 1 2 50 个城市的食品分类 又上面的谱系聚类法步骤可知 首先确定 50 个城市食品进行分类的指标是同一类食品 应具有相同的跌涨幅 然后根据系统聚类分析模型才用类平均法进行分类 再利用结果确定 分类个数 画出各类食品的价格折线图 由图分析食品价格增长情况 根据附件 1 此资料为 50 个城市在 2016 年 1 月 1 日至 2016 年 5 月 10 日 27 种食物价 格表和涨幅表 利用 spss 软件对涨幅表数据进行系统聚类得出分类结果 1 从谱系图 如图 1 所示 中可以看出 分为 4 类的结果为 如表 1 所示 图 1类平均法谱系聚类图 2 食品分类的最终结果 南京审计大学理学院 5 第一类大白菜 第二类黄瓜 西红柿 第三类豆角 第四类 大米 面粉 富强粉 面粉 标准粉 豆制品 花生油 大豆油 菜籽油 猪肉 后腿肉 猪肉 五花肉 牛肉 羊肉 鸡 白条鸡 鸡 鸡胸肉 鸭 鸡蛋 活鲤鱼 活草鱼 带鱼 油菜 芹菜 土豆 苹果 香蕉 表 1食品分类表 5 1 3 每类食品价格波动特点分析 1 价格走势图 为了进一步说明各种食物归类的合理性以及各类食物的均价走势特点 现结合各类食品 的均价走势图加以更为直观的说明 由于第四类所包含的食品种类相对较多 则选取所有食 品的均价走势作图 而第一类 第三类各自只包含一种食物 故只需做出每种食品的均价走 势图即可 走势图及每类食品的特点如下图 2 所示 南京审计大学理学院 6 图 2食品分类图 2 价格波动特点分析 第一类食品在这段时间内 平均价格在 3 5 附近不停变化 波动幅度大致为 1 5 这类 食物总体价格是呈缓慢上升趋势的 第二类食品在这段时间内 平均价格在 8 附近不停变化 波动幅度大致为 2 这类食物 价格总体是呈下降趋势的 第三类食品在这段时间内 平均价格在 14 附近不停变化 波动幅度大致为 4 中间时 间段有较大幅涨价 这类食物价格不太稳定 第四类食品在这段时间内 平均价格在 18 9 附近不停变化 波动幅度大致为 0 5 价格总 体比较稳定 这类食物价格变化不大 5 25 2 运用灰色预测模型运用灰色预测模型 GMGM 1 11 1 对对 20162016 年年 6 6 月份月份食品价格食品价格走势进行走势进行预测预测 要求预测 2016 年 6 月食品价格的走势 因为每类中各种食物的价格走势大致一样 如 果对 27 种食品中每一种都进行预测 显然过程繁琐 也没有代表性和统一性 而问题一将 27 种食品分成 4 类 所以用每个大类食品价格的走势替代大类中的各种食品价格的走势 运用灰色预测模型 先进行数据的检验与处理 对原始数据进行一次累加 使数据有较强的 规律性 进而建立灰微分方程 再利用 MATLAB 软件求解模型 并依次进行残差检验及后 验查检验 均有 C 0 35 预测精度较好 最后通过函数预测 2016 年 6 月价格走势 5 2 1 建模步骤如下 1 GM 1 1 代表一个白化形式的微分方程 a u 1 1 式中 u a 是需要通过建模来求得的参数 是原始数据的累加生成 AGO 值 2 将同一数据列的前 k 项元素累加后生成新数据列的第 k 项元素 这就是数据处理 表 示为 k n 1 2 不直接采用原始数据建模 而是将原始的 无规律的数据进行加工处理 使之变得较有 规律 然后利用生成后的数据列来分析建模 这正是灰色系统理论的特点之一 3 对 GM 1 1 其数据矩阵为 B 1 3 向量 4 作最小二乘估计 用 matlab 软件求参数 a u 代码见附录 3 BTB 1BTYN 1 4 5 建立时间响应函数 求微分方程 1 1 的解为 1 t 1 X 0 1 1 5 南京审计大学理学院 7 以上这就是要建立的灰色预测模型 5 2 2 模型的求解 以第一类产品白菜为例 对 2016 年 6 月份食品价格走势进行预测 50 个城市白菜平均 价格变动情况如下表 2 所示 数据来自附件 1 时间1 1 1 101 11 1 201 21 1 302 1 2 102 11 2 202 21 2 29 价格2 312 433 22 363 893 74 表 2白菜平均价格变动 1 累加生成 对数列 2 31 2 43 3 20 2 36 3 89 3 74 3 98 4 59 5 13 4 80 3 88 3 43 3 19 进行累加生成 得 2 31 4 74 7 94 10 30 14 19 17 93 21 91 26 60 31 73 36 53 40 41 43 84 47 03 2 构造数据矩阵 B 和数据向量 根据 3 构造矩阵B 3 计算 BTB 1BTYN 将矩阵 B 和向量代入 4 可得 4 得出预测模型 按 1 5 可得到模型 1 知 1 t 1 129 41 127 1 取 t 为应力序数 k 时 由 1 k 1 129 41 127 1 X 0 1 2 31 127 1 即可得到生成累加数列 1 k 1 k 1 2 5 残差检验 1 根据预测公式 计算 1 k 得 1 k 5 55 8 86 12 26 15 75 19 32 22 98 26 74 30 58 34 53 38 57 42 71 46 96 而实际的为 4 74 7 94 10 30 14 19 17 93 21 91 26 60 31 73 36 53 40 41 43 84 47 03 计算出平均相对误差为 0 1 残差的方差 1 741 的方差 17 515 2 预测残差 C 0 0994 b a b 3 3400 6 3400 9 1200 12 2450 16 0600 19 9200 24 2250 29 1650 34 1300 38 4700 42 1250 45 4350 1 00001 00001 00001 00001 00001 00001 0000 1 00001 00001 00001 00001 0000 c b a c 1 0e 03 8 8603 0 2806 0 28060 0120 d inv c d 0 00040 0102 0 01020 3210 e d b e 0 00870 00740 00620 00480 00320 0015 0 0004 0 0025 0 0047 0 0066 0 0081 0 0096 0 28710 25660 22830 19650 15780 11850 0748 0 0245 0 0259 0 0700 0 1072 0 1408 f 2 43003 20002 36003 89003 74003 98004 5900 5 13004 80003 88003 43003 1900 g f g 2 4300 3 2000 2 3600 3 8900 3 7400 3 9800 4 5900 5 1300 4 8000 3 8800 3 4300 3 1900 h e g h 0 0248 3 1393 南京审计大学理学院 15 4 x1 0 23860 0645 0 0528 0 2371 0 08060 0937 0 2450 0 0713 0 1008 0 2493 0 04600 0723 0 2330 0 1000 0 0439 0 2292 0 0882 0 0593 0 2381 0 0413 0 1227 0 1841 0 09490 1328 0 1930 0 1050 0 1197 0 1629 0 09790 3675 0 17970 24300 2235 0 2429 0 1000 0 0202 0 10660 3328 0 2253 0 09940 23790 3687 0 0250 0 1890 0 4256 0 09280 32140 2970 0 08970 32900 2650 0 2333 0 1287 0 0225 0 1242 0 3311 0 0670 0 2080 0 07590 2282 0 2098 0 2050 0 1381 0 2009 0 11980 1263 0 2381 0 0996 0 0089 0 23380 0456 0 0089 0 1591 0 2215 0 2768 0 19680 20120 1843 0 0311 0 3990 0 0806 y1 56 991 20 815 10 542 y1 56 9910 20 8150 10 5420 x1 0 23860 0645 0 0528 0 2371 0 08060 0937 0 24500 0713 0 1008 0 2493 0 04600 0723 0 2330 0 1000 0 0439 0 2292 0 08820 0593 0 23810 0413 0 1227 0 1841 0 09490 1328 0 1930 0 10500 1197 0 1629 0 09790 3675 0 17970 24300 2235 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年地面气象单要素观测仪项目合作计划书
- 2025贵州铜仁职业技术学院引进博士研究生15人考前自测高频考点模拟试题及完整答案详解
- 2025内蒙古精神卫生中心招聘13名急需紧缺合同制人员考前自测高频考点模拟试题及一套完整答案详解
- 2025年核试验反应堆及其配套产品项目合作计划书
- 2025年4月18日四川内江市招聘会岗位考前自测高频考点模拟试题(含答案详解)
- 2025汉中市南郑区投资控股集团有限公司招聘(4人)模拟试卷及答案详解(全优)
- 2025年鹤岗萝北县公开招聘农垦社区工作者26人考前自测高频考点模拟试题及答案详解(全优)
- 2025年浙江大学医学院附属儿童医院招聘眼科劳务派遣特检1人模拟试卷及答案详解(历年真题)
- 股份合同协议书的范本6篇
- 2025黑龙江哈尔滨市五常市万宝学校9大岗位招聘28人考前自测高频考点模拟试题附答案详解
- 煤化学煤焦化技术课件
- 上级迎检管理制度
- 2025年危险货物水路运输从业人员考核试题
- 梯田文化课件七年级
- CJ/T 164-2014节水型生活用水器具
- 固收理财合同协议
- 配送生鲜公司管理制度
- JJF(新) 129-2024 阻容法烟气含湿量测定仪校准规范
- CVC堵管的处理及预防
- 2025高考复习必背译林版高中英语全七册单词表
- 2025年人教新课标高一地理上册月考试卷
评论
0/150
提交评论