怎样分析变量间的关系.doc_第1页
怎样分析变量间的关系.doc_第2页
怎样分析变量间的关系.doc_第3页
怎样分析变量间的关系.doc_第4页
怎样分析变量间的关系.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变量间的相关关系一、变量间关系的度量1.变量间的关系:函数关系:(1)是一一对应的确定关系 (2)设有两个变量相关关系:(1)变量间关系不能用函数关系精确表达 (2)变量间存在着一定的客观规律二、相关的种类1完全相关、不完全相关、不相关2正相关与负相关3线性相关与非线性相关4单相关与复相关三、用图形来显示变量间的关系做散点图四、测度变量间的关系强度-计算相关系数1 相关系数的概念是在线性相关的情况下,用来说明相关关系密切程度的统计分析指标。2 相关系数的计算:3 根据相关系数判断相关的程度相关系数的取值是在+1和-1之间,即。若,表示X与Y之间存在正的相关关系,若,表示X与Y之间存在负的相关关系;若r-+1,表示X、Y之间为完全正相关关系,若r=-1,表示X与Y之间为完全负相关关系,当r=0时,表示Y的取值与X无关,即二者之间不存在线性相关关系,但不能说明两者之间没有任何关系。它们可能会存在非线性相关关系。五、总体中也存在这样的关系吗?-假设检验1 为什么要对相关系数进行显著性检验?因为两个变量之间存在相关关系是根据样本计算出来得出的结论,这一结论是否正确还吸引仅仅系检验,相关系数是一个随机变量,由于是随机的,所以具有一定的偶然性,两个不相关的变量,其相关系数也可能较高,要从样本相关系数判断总体中是否也有这样的关系,则需要对相关系数进行显著性检验后才能下结论。2显著性检验的步骤:第一步,提出假设第二步,计算检验的统计量第三步,进行决策。 六、建立变量间的数学关系式1回归模型:2回归方程:3估计回归方程:用最小平方法求参数。用Excel计算统计量的方法。见教材。七、回归效果的度量SST总平方和,反映因变量取值的总的波动状况。SSR-回归平方和,反映有自变量X的变化引起Y的变化。SSE残差平方和,反映除了X对Y的影响之外的其它因素的影响。三者的关系:SST=SSR+SSE回归平方和占总平方和的比例称为判定系数:其实际意义是:在因变量取值的总变差中可以由自变量X取值所解释的比例。八、检验数学关系式的可信程度1 为什么要对回归方程进行显著性检验?回归方程通常是根据样本数据建立,建立回归方程有很多假定,如假定因变量与自变量之间有线性关系,对回归模型中的误差项也有许多假定。这些假定是否成立,只有在方程通过显著性检验后才能回答,所以要对回归方程进行显著性检验。2 回归方程显著性检验包括哪些内容?包括两方面的内容:一是线性关系的检验,也称为总体的显著性检验,用于检验因变量与自变量之间是否存在线性关系;二是回归系数的检验,检验自变量对因变量的影响是否显著。在一元回归分析中,两种检验是等价的。3进行线性关系显著性检验的步骤:第一步,提出假设第二步,计算统计量F第三步,作出统计决策。当时,拒绝原假设。更简单的办法:见教材144页。九、用自变量来估计因变量1点估计-是根据建立的回归方程,对于自变量的一个特定值X求出因变量Y的一个估计值。2区间估计-利用估计的回归方程,对于x的与个特定值,求出Y的一个估计值的区间就是 区间估计。置信区间估计:它是对x的一个给定值,求出y的平均值的估计区间。预测区间估计:它是对x的一个给定值,求出y的个别值的估计区间。名词解释1相关系数:是在线性相关的情况下,用来说明相关关系密切程度的统计分析指标。2总变差平方和:SST总平方和,反映因变量取值的总的波动状况。3回归平方和:SSR-回归平方和,反映有自变量X的变化引起Y的变化。4残差平方和:SSE残差平方和,反映除了X对Y的影响之外的其它因素的影响。5判定系数:回归平方和占总平方和的比例称为判定系数:其实际意义是:在因变量取值的总变差中可以由自变量X取值所解释的比例。6点估计:是根据建立的回归方程,对于自变量的一个特定值X求出因变量Y的一个估计值。7区间估计:利用估计的回归方程,对于x的与个特定值,求出Y的一个估计值的区间就是 区间估计。思考题1.解释相关关系的含义变量之间确实存在着数量上的依存关系;变量之间数量上的关系是不确定、不严格的依存关系。2.相关分析主要解决哪些问题?变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?3.相关分析中有哪些基本假定?在进行相关分析时,对总体主要有以下两个假定:两个变量之间是线性关系;两个变量都是随机变量。4.简述相关系数的性质。相关系数的性质:r的取值范围是-1,1,r为正表示正相关,r为负表示负相关,r绝对值的大小表示相关程度的高低;对称性:X与Y的相关系数xyr和Y与X之间的相关系数yxr相等;相关系数与原点和尺度无关;相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;相关系数只是两个变量之间线性关联的一个度量,却不一定意味两个变量之间有因果关系;若X与Y统计上独立,则它们之间的相关系数为零;但r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性。5.为什么要对相关系数进行显著性检验?在实际的客观现象分析研究中,相关系数一般都是利用样本数据计算的,因而带有一定的随机性。样本容量越小,其可信程度就越差,抽取的样本不同,r的取值也会不同,因此r是一个随机变量。能否用样本相关系数来反映总体的相关程度,需要考察样本相关系数的可靠性,因此要进行显著性检验。6.简述相关系数显著性检验的步骤。相关系数显著性检验的步骤:提出假设;计算检验统计量t值;在给定的显著性水平a和自由度,查t分布表中相应的临界值,作出决策。7.解释回归模型、回归方程、估计的回归方程的含义。回归模型是对统计关系进行定量描述的一种数学模型,例如:对于具有线性关系的两个变量,可以有一元线性方程来描述它们之间的关系,描述因变量y如何依赖自变量x和误差项e的方程称为回归模型。8.一元线性回归模型中有哪些基本假定?一元线性回归模型通常有以下几条基本的假定:变量之间存在线性关系;在重复抽样中,自变量x的取值是固定的;误差项是一个期望为零的随机变量;)对于所有的x值,误差项e的方差2s都相同;误差项e是一个服从正态分布的随机变量,且相互独立。即2(0,)Nes:。9.简述参数最小二乘孤寂的基本原理。参数最小二乘法的基本原理是:因变量的观测值与估计值之间的离差平方和最小。10.解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。总平方和指n次观测值的的离差平方和,衡量的是被解释变量y波动的程度或不确定性的程度。回归平方和反映y的总变差中由于x与y之间的线性关系引起的y的变化部分,这是可以由回归直线来解释的部分,衡量的是被解释变量y不确定性程度中能被解释变量x解释的部分。残差平方和是除了x对y的线性影响之外的其他因素引起的y的变化部分,是不能由回归直线来解释的部分。它们之间的关系是: 总平方和=回归平方和 + 残差平方和。11.简述判定系数的含义和作用。回归平方和占总平方和的比例称为判定系数。判定系数测量了回归直线对观测数据的拟合程度。12.在回归分析中,f检验和t检验各有什么作用?在回归分析中,F检验是为检验自变量和因变量之间的线性关系是否显著,通过均方回归与均方残差之比,构造F检验统计量,提出假设,根据显著性水平,作出判断。 t检验是回归系数的显著性检验,要检验自变量对因变量的影响是否显著,通过构造t检验统计量,提出假设,根据显著性水平,作出判断。13.简述线性关系检验和回归系数检验的具体步骤。14.怎样评价回归分析的结果回归分析结果的评价可以从以下几个方面:回归系数的符号是否与理论或事先预期相一致;自变量与因变量之间的线性关系,在统计上是否显著;根据判定系数的大小,判断回归模型解释因变量取值差异的程度;误差项的正态假定是否成立。15.什么是置信区间估计和预测区间估计?二者有何区别置信区间估计是对x的一个给定值0x,求出y的平均值的区间估计。预测区间估计是对x的一个给定值0x,求出y的一个个别值的区间估计。二者的区别是:置信区间估计的区间长度通常较短,而预测区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论