社会统计学(卢淑华),第十二章_第1页
已阅读1页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十二讲 回归不相关,第一节 回归研究的对象,1、研究定距变量与定距变量之间的非确定关系 相关关系: 1)变量之间存在关系,2)这种关系是非确定性的,两个变量x和y,当x变化时会引起y相应变化,但 他们之间的变化关系是不确定的。如果当x取任何,一可能值xi y相应地服从一定的概率分布,则,称随机变量yx之间存在着相关。,2、散点图,x y, ,x1 y1,x y,2 2,x3 y3,xn yn,y,x1,x, ,3、回归方程与线性回归方程 1)回归方程 e yi f xi 自变量不同取值时,因变量y平均值的变化。 2)线性回归方程(一元) 当因变量y的平均值与自变量x呈线性关系时 ey x,问

2、题:用 y x 这个方程表示的回归线性 方程应该在坐标图上的哪一个位置,才使预 测时所犯错误最小?,第二节 回归直线的建立不最小二乘法, ,1、直线回归方程的建立 通过样本值作散布图,由散布图估计出 总体回归直线的系数 、 ,建立直线 回归方程。 但:抽样误差存在,样本均值并不等于 总体均值,要获得一条最佳的估计直 线,用最小二乘法。, ,它是总体线性回归方程 y x 的最佳 估计方程,2、最小二乘法 设总体中抽取一样本,围绕n个观测点画 一条直线 y a bx ,与各点都比较接近 的直线为最佳。要求:各点到待估直线 的铅直距离之和为最小。利用微分学中,lxy lxx,求极值的原理,求得: a

3、 y bx b 将a、b代入线性回归方程: y a bx,例,:妇女受教育的年限不家务劳劢时间调查资料,第三节 回归方程的假定不检验, ,一、线性回归模型基本假定的界定 1、自变量x可以是随机变量,也可以是 非随机变量,x值可以认为是无误差的。 2、由于x和y之间存在非确定性的相关关 系,因此要求y的所有子总体的方差都相 等:dy1 dy1 dy2 dyi dyn 3、y的所有子总体,其均值都在一条直 线上,称做线性假定。 eyi xi 4、要求随机变量 yi 是统计独立的,e i 0 d i , ,5、处于检验的需要,要求y值的每一个子 总体都满足正态分布。,d,以上假定用两组数据结构来表达

4、: 1)随机变量 yi 是独立的,且有: 均值:e yi xi 方差: yi 2 2)yi 与 xi 有如下关系: yi xi i i 是随机变量,它们相互独立,且有 2, ,二、回归方程的检验 1、原假设:x与y不存在线性关系, ,h h,0 1,: 0 : 0,yi y ,tss ,2,1i yi, ,2、线性回归的平方和分解 1)总偏差平方和:反映观察值 yi 围绕均 值 y 的总分散程度。 n i 1,y ,1 n n,tss e1 ,不知x与y有关系时估计y的总 误差。,ess ,yi yi , ,2)剩余平方和:反映观测值 yi 偏离回 归线 y i 的程度。,n i 1,2,y

5、i 由回归直线 y a bx 确定 ess e2 ,知道x与y有关后,估计y所产 生的误差,rss ,yi y ,3)回归平方和:通过回归直线解释 掉的误差。,n i 1,2,n 2,x n 1,x 1,x n 2,3、统计量:, f 1, n 2,rss ess,f ,tss 2,2,rss 2,2,ess 2,2,如果 f f 拒绝 h 0 。,例:统计某城市家具销售额y(万元)与 新建住宅面积x(千平方米),得如下资 料:,年次,91,92,93,94,95,96,97,98,x y,116 129 137 146 144 165 182 198 104 115 124 131 132

6、145 158 172,建立回归方程,并进行f检验 0.05, x x y, y ,covx, y ,第四节 相关, ,一、相关系数 (线性相关) 1、协方差: i i n 1 表示x与y两变量观测值相对其各自均值 所造成的共同平均偏差。协方差的数量 可以作为变量线性相关程度的度量。, xi x yi y ,2、相关系数, ,相关系数就是标准化了的协方差,取值 范围:1,1 3、相关系数具有pre的性质, xi x yi y 2 2, ,pre ,tss ess rss, x x y y , x x y y ,2,l xx l yy,tss tss 2 2,i i,i i,e1 ( yi y

7、)2 tss e 2 ( yi y ) ess 2, ,r为相关系数;pre( r2)系数为判定系数。 主意二者的区别?,1 ,4、相关系数的检验, ,h 1,h 0:p 0,: p 0,n 2 2,t ,tn 2,用 进行直接检验: 1)根据 公式计算样本的 值 2)给出显著性水平 和k=n-2,按附表查出相 应的临界相关系数 3)比较 与 的大小 如果 ,则x与y之间存在线性相关关系, 在显著性水平 下显著,例:以下是子代和父代受教育年限的抽 样调查:,求:回归直线、相关系数,是否有推论 意义? 0.05,父代 子代,2 4,4 5,6 8,8 7,10 9,r n 2,1 r, ,5、相

8、关系数 的检验与回归系数 的 检验的关系: 如果通过了 的检验也必然导致 (f检 验)检验的通过。实际上,f公式与 r 公式有对应关系:,2,2,f ,f 1, n 2,r ,即:rss r tss,r tss,(1 r )tss,r,rss tss,2,2,2,2,2,(n 2),2 1 r,n 2,n 2,tss ess ess,f , ,6、相关与回归的比较 1)相同点:都是研究变量之间的非确定 性关系,而且都是研究其中的线性关 系。 2)不同点: 回归是研究变量之间的因果关系,但 相关不一定具有因果关系。 相关系数是双向对称的,回归直线是 非对称的。,第五节 用回归方程迚行预测,求y的区间估计值,e2,y2 a x2 ,yn a xn en,e1 , e2 en 相互独立。都服从相同的正态分 布 n 0, 2 ,则随机变量y的标准化:,y y s y,tn 2 服从自由度为n-2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论