版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章回归与相关分析学习目标1.变量间的相关关系与相关系数的计算2.总体回归函数与样本回归函数3.线性回归的基本假定4.简单线性回归参数的估计与检验实例1:
中国妇女生育水平的决定因素是什么?妇女生育水平除了受计划生育政策影响以外,还可能与社会、经济、文化等多种因素有关。1.影响中国妇女生育率变动的因素有哪些?2.各种因素对生育率的作用方向和作用程度如何?3.哪些因素是影响妇女生育率主要的决定性因素?4.如何评价计划生育政策在生育水平变动中的作用?5.计划生育政策与经济因素比较,什么是影响生育率的决定因素?6.如果某些地区的计划生育政策及社会、经济、文化等因素发生重大变化,预期对这些地区的妇女生育水平会产生怎样的影响?
据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占2200万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的“专利”,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。
(引自《光明日报)问题:
肥胖症和体重超常与死亡人数真有显著的数量关系吗?这些类型的问题可以运用相关分析与回归分析的方法去解决。实例2:全球吃死的人比饿死的人多?第一节相关与回归的基本概念一、变量间的相互关系二、相关关系的类型三、相关分析与回归分析
一、变量间的相互关系
◆确定性的函数关系Y=f(X)◆不确定性的统计关系—相关关系
Y=f(X)+ε(ε为随机变量)◆没有关系
变量间关系的图形描述:坐标图(散点图)
相关关系的类型●
从涉及的变量数量看
简单相关多重相关(复相关)●
从变量相关关系的表现形式看
线性相关——散布图接近一条直线(左图)非线性相关——散布图接近一条曲线(右图)●
从变量相关关系变化的方向看正相关——变量同方向变化A
同增同减(A)负相关——变量反方向变化一增一减(B)B●从变量相关的程度看
完全相关(B)不完全相关(A)C
不相关(C)相关关系的类型相关分析与回归分析回归的古典意义:
高尔顿遗传学的回归概念
父母身高与子女身高的关系:
无论高个子或低个子的子女都有向人的平均身高回归的趋势回归:退回regression平均身高1877年弗朗西斯•高尔顿爵士遗传学研究回归线回归分析法产生的历史父亲们的身高与儿子们的身高之间
关系的研究1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图(略图)160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。后人将此种方法普遍用于寻找变量之间的规律回归的现代意义一个因变量对若干解释变量依存关系的研究回归的目的(实质):
由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值相关分析与回归分析的联系●共同的研究对象:都是对变量间相关关系的分析。●只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。●相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析。●相关分析中相关系数的确定建立在回归分析的基础上。第二节简单线性相关与回归分析一、简单线性相关系数及检验二、总体回归函数与样本回归函数三、回归系数的估计四、简单线性回归模型的检验
五、简单线性回归模型预测一、简单线性相关系数及检验
●总体相关系数
对于所研究的总体,表示两个相互联系变量相关程度的总体相关系数为:
总体相关系数反映总体两个变量X和Y的线性相关程度。
特点:对于特定的总体来说,X和Y的数值是既定的总体相关系数是客观存在的特定数值。●
样本相关系数
通过X和Y的样本观测值去估计样本相关系数变量X和Y的样本相关系数通常用表示特点:样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。相关系数的特点:
相关系数的取值在-1与1之间。当r=0时,表明X与Y没有线性相关关系。当
时,表明X与Y存在一定的线性相关关系:若
表明X与Y为正相关;若表明X与Y为负相关。当时,表明X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。使用相关系数的注意事项:▲X和Y都是相互对称的随机变量,所以▲相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。▲相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。相关系数的检验
为什么要检验?
样本相关系数是随抽样而变动的随机变量,相关系数的统计显著性还有待检验。检验的依据:
如果X和Y都服从正态分布,在总体相关系数的假设下,与样本相关系数r有关的t统计量服从自由度为n-2的t分布:
相关系数的检验方法给定显著性水平,查自由度为n-2的临界值若,表明相关系数r在统计上是显著的,应否定而接受的假设;反之,若,应接受的假设。
二、总体回归函数与样本回归函数
若干基本概念●
Y的条件分布:Y在X取某固定值条件下的分布。●对于X的每一个取值,都有Y的条件期望与之对应,在坐标图上Y的条件期望的点随X而变化的轨迹所形成的直线或曲线,称为回归线。●如果把Y的条件期望表示为X的某种函数:,这个函数称为回归函数。●如果其函数形式是只有一个自变量的线性函数,如,称为简单线性回归函数。总体回归函数(PRF)
概念:将总体因变量Y的条件均值表现为自变量X的某种函数,这个函数称为总体回归函数(简记为PRF)。表现形式:(1)条件均值表现形式(2)个别值表现形式(随机设定形式)样本回归函数(SRF)概念:
●Y的样本观测值的条件均值随自变量X而变动的轨迹,称为样本回归线。
●如果把因变量Y的样本条件均值表示为自变量X的某种函数,这个函数称为样本回归函数(简记为SRF)。表现形式:线性样本回归函数可表示为或者
样本回归函数与总体回归函数的关系
——相互联系
●样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。●和是对总体回归函数参数的估计。●是对总体条件期望的估计●残差e在概念上类似总体回归函数中的随机误差u。回归分析的目的:用样本回归函数去估计总体回归函数。样本回归函数与总体回归函数的关系
——相互区别
●总体回归函数虽然未知,但它是确定的;样本回归线随抽样波动而变化,可以有许多条。●样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。●总体回归函数的参数虽未知,但是确定的常数;样本回归函数的参数可估计,但是随抽样而变化的随机变量。●总体回归函数中的是不可直接观测的;而样本回归函数中的是只要估计出样本回归的参数就可以计算的数值。
三、回归系数的估计回归系数估计的思想:为什么只能对未知参数作估计?
参数是未知的、不可直接观测的、不能精确计算的
能够得到的只是变量的样本观测值结论:只能通过变量样本观测值选择适当方法去近似地估计回归系数。前提:
u是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。原则:
使参数估计值“尽可能地接近”总体参数真实值。简单线性回归的基本假定假定1:零均值假定。假定2:同方差假定。
假定3:无自相关假定。
假定4:随机扰动与自变量不相关。假定5:正态性假定回归系数的最小二乘估计基本思想:
希望所估计的偏离实际观测值的残差越小越好。可以取残差平方和作为衡量与偏离程度的标准——最小二乘准则。估计式:
最小二乘估计的性质
——高斯—马尔可夫定理
前提:
在基本假定满足时最小二乘估计是因变量的线性函数
最小二乘估计是无偏估计,即
在所有的线性无偏估计中,回归系数的最小二乘估计的方差最小。结论:回归系数的最小二乘估计是最佳线性无偏估计最小二乘估计的概率分布性质
和都是服从正态分布的随机变量,其期望为方差和标准误差为
结论:
的无偏估计
为什么要估计?
确定所估计参数的方差需要由于不能直接观测,也是未知的对的数值只能通过样本信息去估计。怎样估计?可以证明的无偏估计为:拟合优度的度量
基本思想:样本回归直线是对样本数据的一种拟合,不同估计方法可拟合出不同的回归线。样本回归拟合优度的度量建立在对因变量总离差平方和分解的基础上
总离差平方和
回归平方和残差平方和
可决系数定义:
对可决系数的理解
可决系数的特点
可决系数是非负的统计量;可决系数取值范围:可决系数是样本观测值的函数,可决系数是随抽样而变动的随机变量;在一元线性回归中,可决系数在数值上是简单线性相关系数的平方:,
回归系数显著性的t检验目
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025下半年广东揭阳市市直卫生健康事业单位赴外地院校招聘工作人员27人备考笔试题库及答案解析
- 2025年甘肃省甘南州碌曲县选调工作人员和项目人员26人择优入编考试考试参考试题及答案解析
- 2025中国农业科学院饲料研究所家禽营养与饲料创新团队科研助理招聘1人备考笔试题库及答案解析
- 四川省医学科学院·四川省人民医院2026年度专职科研人员、工程师及实验技术员招聘备考笔试题库及答案解析
- 2025福建厦门市集美区康城幼儿园非在编教职工招聘1人备考考试试题及答案解析
- 2025云南永德昆西医院、普洱西盟仁康医院招聘参考考试题库及答案解析
- 2025河南省中西医结合医院招聘员额制高层次人才11人备考笔试题库及答案解析
- 2026福建三明市教育局开展“扬帆绿都·圆梦三明”教育类高层次人才专项公开招聘44人备考笔试题库及答案解析
- 2025江西赣江新区永修投资集团招聘3人备考考试题库及答案解析
- 2025中建交通建设(雄安)有限公司招聘备考笔试试题及答案解析
- 六年级下册语文《默写小纸条》
- 宜宾市2024-2025学年上期义务教育质量监测九年级物理试题(含答案)
- 发电机日常巡查表(完整版)
- 瑞幸咖啡认证考试题库(咖啡师)
- 品管圈PDCA改善案例-降低住院患者跌倒发生率
- 个体诊所选址报告范文
- DB32T 3129-2016 适合机械化作业的单体钢架塑料大棚技术规范
- 土方倒运的方案
- 2024光伏发电工程施工质量验收规程
- 画说学习通超星期末考试答案章节答案2024年
- 苏教版一年级数学下册全册教案(完整版)教学设计含教学反思
评论
0/150
提交评论