版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于一元线性回归方程第一章一元线性回归模型
以下设x为自变量(普通变量)Y为因变量(随机变量).现给定x的n
个值x1,…,xn,观察Y得到相应的n
个值y1,…,yn,(xi,yi)
i=1,2,…,n
称为样本点.
以(xi,yi)为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图.第2页,共28页,2024年2月25日,星期天第3页,共28页,2024年2月25日,星期天§1.1模型的建立及其假定条件例如:研究某市可支配收入X对人均消费支出Y的影响。建立如下理论回归模型:Yi=
0
+1
Xi+εi其中:Yi——被解释变量;Xi——解释变量;εI——随机误差项;
0,1—回归系数随机变量ε
i包含:回归模型中省略的变量;确定数学模型的误差;测量误差一、一元线性回归模型第4页,共28页,2024年2月25日,星期天XY80100120140160180200220240260556579801021101201351371506070849310711513613714515265749095110120140140155175708094103116130144152165178758598108118135145157175180-88-113125140-160189185---115---162-191户数5657665765总支出32546244570767875068510439661211
假设调查了某社区所有居民,他们的人均可支配收入和消费支出数据如下:第5页,共28页,2024年2月25日,星期天YX5510012014016080
描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。第6页,共28页,2024年2月25日,星期天二、随机误差项εi的假定条件为了估计总体回归模型中的参数,需对随机误差项作出如下假定:假定1:零期望假定:E(εi)=0。假定2:同方差性假定:Var(εi)=
2。假定4:εi
服从正态分布,即εi
N(0,
2)。假定3:无序列相关假定:Cov(εi,εj)=0,(i
j)。前三个条件称为G-M条件第7页,共28页,2024年2月25日,星期天§1.2一元线性回归模型的参数估计普通最小二乘法(OrdinaryLeastSquares)OLS回归直线的性质OLSE的性质第8页,共28页,2024年2月25日,星期天一、普通最小二乘法对于所研究的问题,通常真实的回归直线E(Yi|Xi)
=
0
+1Xi
是观测不到的。可以通过收集样本来对真实的回归直线做出估计。
经验回归直线:
其中:为Yi的估计值(拟合值);为
0
,1
的估计值;如果观测值到这条直线的纵向距离(真实值与估计值的偏差)用ei表示(称为残差),则经验回归模型为:(ei为εi的估计值)第9页,共28页,2024年2月25日,星期天注意:分清4个式子的关系(4)经验(估计的)回归直线:(1)理论(真实的)回归模型:
(3)经验(估计的)回归模型:(2)理论(真实的)回归直线:第10页,共28页,2024年2月25日,星期天对于参数的估计采用最小二乘估计法、最小二乘法的原则是以“残差平方和最小”确定直线位置(即估计参数)。(Q为残差平方和)Q===则通过Q最小确定这条直线,即确定,以为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。求Q对两个待估参数的偏导数:=
=0=
=0正规方程组即第11页,共28页,2024年2月25日,星期天根据以上两个偏导方程得以下正规方程(Normalequation):第12页,共28页,2024年2月25日,星期天若记则第13页,共28页,2024年2月25日,星期天二、OLS回归直线的性质(1)估计的回归直线过点.
(3)Yi
的拟合值的平均数等于其样本观测值的平均数.=
=
=
(2)第14页,共28页,2024年2月25日,星期天统计性质线性无偏性有效性
2
的估计三、OLSE回归直线的性质第15页,共28页,2024年2月25日,星期天1、线性这里指都是Yi的线性函数。证明:=
=
令代入上式,得:同理可证:
0也具有线性特性。=
第16页,共28页,2024年2月25日,星期天2、无偏性证明:======类似可证第17页,共28页,2024年2月25日,星期天3、有效性
0
,
1的OLS估计量的方差比其他线性无偏估计量的方差都小。第18页,共28页,2024年2月25日,星期天总体(随机误差项)真实方差2的无偏估计量:三、
2的估计第19页,共28页,2024年2月25日,星期天§1.3回归方程的显著性检验一、回归参数的显著性检验(t检验)首先,提出原假设和备择假设:
H0:
H1:
其次,确定并计算统计量:
=如果不能拒绝H0:,认为X对Y没有显著影响。
如果拒绝H0:
,认为X对Y有显著影响。
同理,可对进行显著性检验。
第20页,共28页,2024年2月25日,星期天二、回归方程的显著性检验(F检验)
总离差平方和=回归平方和+残差平方和SST=SSR+SSEH0:
H1:
拒绝域F>Fα(1,n-2)第21页,共28页,2024年2月25日,星期天三、用样本可决系数检验回归方程的拟合优度R2
=
R2=0时表明解释变量X与被解释变量Y之间不存在线性关系;R2=1时表明样本回归线与样本值重合,这种情况极少发生;一般情况下,R2越接近1表示拟合程度越好,X对Y的解释能力越强。第22页,共28页,2024年2月25日,星期天四.
相关系数检验法1.提出原假设2.选择统计量3.对给定的显著性水平α,查临界值rα(n-2),
得否定域为|R|
>rα(n-2);第23页,共28页,2024年2月25日,星期天§1.4
回归系数估计值的置信区间
-t
/2(n-2)
0
t
/2(n-2)
由于:由大括号内不等式表示的
1的1-α的置信区间为:得:P{
t
/2
(n-2)
}=1-
同理,可,并求得的置信区间为:
第24页,共28页,2024年2月25日,星期天§1.5一元线性回归方程的预测和控制点预测Yi区间预测
(1)单个值Yi的区间预测(2)均值E(Yi)的区间预测控制第25页,共28页,2024年2月25日,星期天如果经过检验,样本回归方程的拟合优度好,且回归系数的估计值显著不为0,则可以用回归方程进行预测和控制。1、点预测
假设X0为解释变量的一个已知点,则带入样本回归方程即可得到Y0的估计值:2、区间预测
估计值是一个点预测值,它可以是(1)总体真值Y0的预测值;也可以是(2)总体回归线E(Y0
)的预测值。现在根据来对(1)(2)进行区
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国家用缝纫机电动机行业发展面临的挑战分析及投资战略研究报告
- 2024-2030年中国家庭装修用品行业市场现状供需分析及市场深度研究发展前景及规划战略投资分析研究报告
- 2024-2030年中国室内涡轮教练机行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国宠物监控摄像机行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国实时时钟(RTC)行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国安全防护罩行业运行形势与应用前景预测报告
- 2024-2030年中国学习机行业销售动态与需求前景预测报告
- 2024-2030年中国婴幼儿奶粉市场竞争策略及投资营销创新模式分析报告
- 2024-2030年中国婴儿光疗仪行业市场发展趋势与前景展望战略分析报告
- 2024-2030年中国奶牛养殖牧场行业市场发展分析及竞争格局与投资前景研究报告
- 幼儿园一日生活指南心得体会9篇
- 《危险化学品目录》2015年版
- 2023年第一季度护理质量与安全管理质量控制情况通报
- 四年级科学《运动与摩擦力》说课课件
- 品质异常报告表格
- 《化工建设设计概算编制办法》
- 职称技术职称申报材料公示表
- 《中华少年》朗诵稿原文
- 药剂科质控报告2020
- ISO37000-2021组织治理-指南(雷泽佳译2022)
- 新生儿呼吸窘迫综合征护理查房
评论
0/150
提交评论