回归分析模型及聚类分析法_第1页
回归分析模型及聚类分析法_第2页
回归分析模型及聚类分析法_第3页
回归分析模型及聚类分析法_第4页
回归分析模型及聚类分析法_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析模型及聚类分析法近年来,随着人们生活水平的提高,居民的消费支出发生了很大变化,以商品为中心发生了多样化的消费支出结构。 居民开始重视医疗、交通通信等服务类支出,本文采用多回归分析的方法,通过聚类分析探讨了经济发展水平与居民消费结构和非商品支出之间是否有密切的关系。【关键词】多元回归分析聚类分析非商品支出1商品支出以外的含义居民消费支出是指城乡居民个人和家庭用于生活消费、集体用于个人消费的一切支出。 商品性支出主要是居民购买商品的支出,非商品性支出主要是居民享受文化服务和生活服务的支出。 非商品支出可以从一个方面反映居民消费结构的变化和经济水平的发展。二元回归分析方法2.1多元回归分析概述回归一词是英国着名统计学家弗朗西斯加尔森在19世纪末研究孩子和父母身高时提出的。 研究中,Galton发现父母身高高,孩子身高高,身高矮的父母孩子身高也低。 但是,他发现这个高大的父母的孩子的身高不像父母那么高,而低大的父母的孩子的身高不像父母那么低,有集中于某个值的倾向,Galton把这个倾向称为回归效果,到现在为止产生了回归这个词。 之后,他发展了研究两个数值变量的方法。 这个方法是最后的回归分析。回归分析是一门基于概率论与数理统计快速发展的应用型较强学科。 目前,回归分析广泛应用于经济研究。 目前的经济研究表明,回归分析通常与聚类分析结合使用,在原始分类学中,根据经验和专业知识进行定性分析,数学工具并不多见,但随着人们对自然和社会的深入理解,应处理的数据变得越来越复杂,相互关系也越来越复杂,分类也越来越细致对数据分类的要求越来越高,在这种情况下,仅凭经验和专业知识分类是不够的,数学被引入到数据分析中,形成了数据分类学。 该方法是对分析对象进行定量研究的方法,由于该方法不仅适用于分类,还适用于其他领域,因此使用“聚类分析”一词比较合适。2.2多元回归分析模型的一般形式回归分析方法根据实际问题在许多相关变量中的要求,考察一个或多个变量与其馀变量的依赖关系。 如果考察某个变量和其馀的多个变量的相互依存关系的话。 我们称之为多元回归问题。2.3阶段回归分析多元回归分析存在的问题是,并非所有参数都对原因变量有显着影响,而是如何选择对原因变量有显着影响的参数。 从20世纪60年代开始,针对回归参数的选择成为数理统计研究热点的问题,提出了比较简便、实用、快速的“最佳”方程式的选择方法。 人们提出的方法各有优缺点,迄今为止绝对没有最佳的方法。 现在常用的方法是“前进法”“后退法”“阶段性回归法”,阶段性回归法得到最高评价。逐步回归的基本思想是“有进取心”。 具体的方法是逐个引入变量,以便引入变量的条件是偏差f或t统计量是有意义的。 也就是说,每次引入参数时,都会逐一验证已经选择的变量,如果原来引入的变量因为后面的变量的引入而变得不明显的话,将其排除。 引入一个变量,或者从回归公式中除去一个变量,作为阶段性回归的一步,各个步骤进行偏差f检验或者t检验(两者相等),使得每次引入新的变量时回归公式中只包含有意义的变量。 该过程反复进行,直到有效参数被选为回归公式,也从回归公式中除去有效参数。 这确保最终获得的回归子集是“最佳”回归子集。在递阶回归方法中应当注意,参数的有效性水平应该不同,通常需要参数的有效性水平1小于参数的有效性水平2,否则可能发生“死循环”。3聚类分析方法3.1聚类分析概述聚类分析是统计学研究的“物以类聚”问题的多元统计分析方法。 聚类分析广泛应用于统计分析的应用领域。聚类分析是将物理或抽象对象集合分成多个类的分析过程,其中每一个类包括相似的对象。 这是重要的人类行为。 聚类分析的目标是在相似的基础上收集和分类数据。 聚类产生于数学、计算机科学、统计学、生物学和经济学等诸多领域。 在各种应用领域,发展了许多聚类技术,这些技术方法记述数据,测量不同数据源之间的相似性,将数据源分类为不同的聚类。3.2 Q型聚类分析q聚类是将样本聚类,收集具有相似特征的样本,以分离具有较大差异的样本。 分类结果直观,比传统分类方法细致、全面、合理。3.3系统聚类法的基本思想和基本步骤设置n个样品,每个样品测定m个指标。 系统聚类方法的基本思路是首先定义样本之间的距离(或类似系数)和类别与类别之间的距离。 如果首先将n个采样视为n类(每个类包含一个采样),则类之间的距离等于采样之间的距离,然后将最近的两个类合并为新类,计算新类与其他类之间的类距离,并按照最小距离标准排列类。 这样一种一种地缩小,可以看出所有的样品都是一种。出于以上系统聚类法的基本思想,其基本步骤如下(0)数据变换:数据变换的目的是为了使比较和计算变得容易,或者改变数据的构造。 定义样本之间的距离以及类和类之间的距离。 (1)计算两个n个样本之间的距离,以获得样本之间的距离矩阵D(0),其中,前n个样本中的每一个样本构成一种。 (2)找到距离的最小要素作为Dpq,将Gp、Gq合并到新的类别中,记为Gr。 (3)根据等级和等级之间的距离计算新等级和其他等级之间的距离,重复步骤(2)和(3),如果发现等级的总数为1,就转移到步骤(4)。 (4)绘制光谱类聚类图。 (五)确定分类的个数和各级成员;【参考文献】1高惠璇.应用多元统计分析M .北京:北京大学出版社,20052雪薇.统计分析和SPSS的应用M.2版.北京:中国人民大学出版社,20083金玉国.计量经济学M .北京:经济科学出版社,20064何晓群.多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论