数学建模案例分析消费分布规律的分类概率统计方法建模_第1页
数学建模案例分析消费分布规律的分类概率统计方法建模_第2页
数学建模案例分析消费分布规律的分类概率统计方法建模_第3页
数学建模案例分析消费分布规律的分类概率统计方法建模_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、§7 消费分布规律的分类为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类。数据见下表: 指标省份X1 X2 X3 X4 X5 X6 X7 X8 辽宁浙江河南甘肃青海 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29 7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 10.06 28.

2、64 10.52 10.05 16.18 8.39 1.96 10.81其中,X1:人均粮食支出; X2:人均副食品支出; X3:人均烟、酒、茶支出; X4:人均其它副食品支出; X5:人均衣着商品支出; X6:人均日用品支出; X7:人均燃料支出; X8:人均非商品支出。在科学研究、生产实践、社会生活中,经常会遇到分类的问题。例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等。这些问题可以用聚类分析方法来解决。 聚类分析

3、的研究内容包括两个方面,一是对样品进行分类,称为Q型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R型聚类法,使用的统计量是变量间的相似系数。设共有个样品,每个样品有个变量,它们的观测值可以表示为 一、样品间的距离 下面介绍在聚类分析中常用的几种定义样品与样品间的距离。1、 Minkowski 距离 2、绝对值距离 3、欧氏距离 二、变量间的相似系数 相似系数越接近1,说明变量间的关联程度越好。常用的变量间的相似系数有1、 夹角余弦 2、 相关系数 值得注意的是,当指标的测量值相差较大时,直接使用以上各式计算距离或相似系数常使数值较小的变量失去作用,为此需应先对数据进行标准化,然

4、后再用标准化的数据来计算。标准化的具体方法是: 其中 三、类与类之间的距离 用和分别代表两个类,它们所包含的样品个数分别记为和,类和之间的距离记为。下面给出三种最常用的定义方法。1、最短距离 类与类之间的最短距离有如下的递推公式,设为由和合并所得,则与其它类的最短距离为2、最长距离 类与类之间的最长距离有如下的递推公式,设为由和合并所得,则与其它类的最长距离为3、类平均距离 类与类之间的类平均距离有如下的递推公式,设为由和合并所得,则与其它类的类平均距离,其中 。 以上类与类之间的距离,不但适用于Q型聚类,同样也适合于R型聚类,这只要将用变量间的相似系数代替就行了。为简单起见以下均记成。 系统

5、聚类法是目前最流行的方法。有了样品间的距离(或变量间的相似系数)以及类与类之间的距离后,便可进行系统聚类,基本步骤如下:1、个样品(或个变量)一开始看作类(类),计算两两之间的距离(或相似系数),构成一个对称矩阵,此时显然有;2、选择中对角线元素以外的下三角部分中的最小元素(相似系数矩阵则选择对角线元素以外的最大者),设其为,则将和合并为一个新类。在中划去和所对应的两行与两列,并加入由新类与剩下的未聚合的各类之间的距离所组成的一行和一列,得到一个新的矩阵,它是降低了一阶的对称矩阵;3、由出发,重复步骤2得到对称矩阵,依此类推,直到个样品(或个变量)聚为一个大类为止;4、在合并过程中记下两类合并

6、时样品(或变量)的编号以及合并两类时的距离(或相似系数)的大小,并绘成聚类图,然后可根据实际问题的背景和要求选定相应的临界水平以确定类的个数。 上面是一个Q型聚类问题,现在用系统聚类法来解决。将每个省份看成一个样品,并以1,2,3,4,5分别表示辽宁、浙江、河南、甘肃、青海5省,计算样品间的欧氏距离,得到如下的距离矩阵 1 2 3 4 5下面给出采用最短距离法的聚类过程:首先将5个省各看成一类,即令。从可以看出,其中最小的元素是,故将和合并成一类,然后利用递推公式计算与,之间的最短距离。在中划去3,4所对应的行和列,并加上新类3,4到其它类距离作为新的一行一列,得到 3,4 1 2 5重复上面的步骤,依次可得到相应的距离矩阵如下: 3,4,5 1 2 3,4,5 1,2最后将5个省合并为一大类,画出聚类图如下: 辽宁 11.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论