




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归分析模型及聚类分析法 【摘 要】近年来,随着人民生活水平的提高,居民的消费支出有了很大的变化,逐步从以商品为主向多元化的消费支出结构转变。居民开始重视医疗保健、交通通讯等服务类项目的支出,本文运用多元回归分析的方法,通过聚类分析探究经济发展水平与居民消费结构和非商品支出之间是否处在密切的关系。 【关键词】多元回归分析;聚类分析;非商品支出 1 非商品支出的含义 居民消费支出是指城乡居民个人和家庭用于生活消费以及集体用于个人消费的全部支出。商品性支出主要是居民用于购买商品的支出,非商品性支出主要就是指居民享受文化服务和生活服务的支出。非商品支出能从一个侧面反映居民消费结构的变化和经济水平的发展。 2 多元回归分析方法 2.1 多元回归分析的概述 回归这个词最早是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。在研究时,Galton发现父母的身材高,他们的孩子身材也高,身材矮的父母孩子身材也矮。但是,他发现,该身材父母的孩子的身高并不像他们父母那般高,而身材矮的父母的孩子的身高并不像他们父母那样矮,而是集中的趋向于某一值,Galton把这种趋势称为回归效应,至此回归一词产生。后来,他发展研究两个数值变量,这种方法也就是后来的回归分析。 回归分析是以概率论与数理统计为基础迅速发展起来的一种应用型较强的学科。现在,回归分析被广泛的应用于经济方面的研究。在现在的经济研究中,回归分析通常可以与聚类分析一起使用,在原始的分类学中,人们是根据经验和专业知识来进行定性分析,很少使用数学工具,但是随着人们不断深入的去了解自然和社会,要处理的数据原来越复杂,相互关系越来越复杂,分类也越来越细,对数据分类的要求也变得越来越高,这时仅仅依靠经验和专业知识进行分类是不够的,这时数学便引入到数据分析中,便形成了数据分类学。这种方法是对分析对象进行定量的研究,由于这种方法不仅能够用于分类,还能应用于其他领域,于是人们认为用“聚类分析”这个词更为合适。 2.2 多元回归分析模型的一般形式 回归分析方法是在众多相关变量中,根据实际问题的要求,考察其中一个或几个变量与其余变量的依赖关系。如果只要考察某一个变量与其余多个变量的相互依赖关系。我们称为多元回归问题。 2.3 逐步回归分析 在多元线性回归分析中,并不是所有的自变量都对因变量都有显著地影响,这就存在着如何挑选出对因变量有显著影响的自变量问题。从20世纪60年代开始,关于回归自变量的选择成为数理统计中研究的热点问题,人们提出了一些较为简便、实用、快速的选择“最优”方程的方法。人们所给出的方法各有优缺点,至今还没有绝对最优的方法,目前常用的方法有“前进法”、“后退法”、“逐步回归法”,而逐步回归法最受推崇。 逐步回归的基本思想是“有进有出”。具体做法是将变量一个一个引入,引入变量的条件是其偏F统计量或t统计量经检验是显著的。即每引入一个自变量后,对已经被选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不在显著时,要将其剔除。引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行偏F检验或t检验(二者等价),以确保每次引入新的变量之前回归方程中只包含显著的变量。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。这样就保证了最后所得的回归子集是“最优”回归子集。 在逐步回归法中需要注意的是引入和剔除自变量的显著性水平应该有所不同,一般要求引入自变量的显著性水平1小于剔除自变量的显著性水平2,否则可能产生“死循环”的现象。 3 聚类分析方法 3.1 聚类分析的概述 聚类分析是统计学中研究的“物以类聚”问题的多元统计分析方法。聚类分析在统计分析的应用领域中已经得到了广泛的应用。 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 3.2 Q型聚类分析 Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来。分类的结果是直观的,且比传统分类方法更细致、全面、合理。 3.3 系统聚类法的基本思想和基本步骤 设有n个样品,每个样品测得m项指标。系统聚类方法的基本思想是:首先定义样品间的距离(或相似系数)和类与类之间的距离。初始将n个样本看成n类(每一类包含一个样品),这时类间的距离与样品间的距离是等价的;然后将距离最近的两类合并成为新类,并计算新类与其他类的类间距离,再按最小距离准则并类。这样每次缩小一类,知道所有的样品都聚成一类为止。 由以上系统聚类法的基本思想,即可得出它的基本步骤如下: (0)数据变换:数据变换的目的是为了便于比较和计算,或改变数据的结构。定义样品间的距离和类与类之间的距离。(1)计算n个样品两两间的距离,得样品间的距离矩阵D(0),初始的n个样品各自构成一类。(2)找出距离最小元素,设为Dpq,即将Gp、Gq合并为一新类,记为Gr。(3)按类与类之间的距离计算新类与其他类的距离,重复步骤(2)和(3),知道类的总个数为1时转到步骤(4)。(4)画谱系聚类图。(5)决定分类的个数及各类的成员。 【参考文献】 1高惠璇.应用多元统计分析M.北京:北京大学出版社,2005. 2薛薇.统计分析与SPSS的应用M.2版.北京:中国人民大学出版社,2008. 3金玉国.计量经济学M.北京:经济科学出版社,2006. 4何晓群.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老年护理的核心目标
- 脊柱性关节炎研究进展与诊疗规范
- 流动人口工作计划锦集(15篇)
- 不在厨房玩耍安全教育
- 东西方传染病预防措施制作指南
- 抽血个案护理标准化流程
- 甲亢术后护理措施
- 内镜中心人文护理体系构建
- 心动过缓护理
- 员工消防考试题目及答案
- 矿石加工中的化学工艺安全技术考核试卷
- 中国共产主义青年团纪律处分条例试行解读学习
- 网络钓鱼攻击防范-第1篇-全面剖析
- 《环境设计中的天人合一》教学课件-2024-2025学年人美版(北京)(2024)初中美术七年级下册
- 三方水泥合同协议
- 采矿管理协议书范本
- 广西壮族自治区2025年4月高三毕业班诊断学考试数学试卷及答案(广西三模)
- 安徽中医药大学专职辅导员招聘笔试真题2024
- 研学部管理制度
- 2025年03月山东省环科院及权属企业校园公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2024北京海淀区三年级(下)期末语文试题及答案
评论
0/150
提交评论