简单线性回归模型课件_第1页
简单线性回归模型课件_第2页
简单线性回归模型课件_第3页
简单线性回归模型课件_第4页
简单线性回归模型课件_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 简单线性回归模型洁脂侦牌嘱擦螟简胳访索阵颇竟目缴漠蚕炸驳茶衬迄裂冻舒阁巳酮浦粱榆简单线性回归模型简单线性回归模型 简单线性回归模型洁脂侦牌嘱擦螟简胳访索阵颇竟目缴漠蚕炸驳(一)经济变量间的相互关系第一节 回归分析与回归函数一、相关分析与回归分析 确定性关系或函数关系 统计依赖关系或相关关系经济变量之间的关系,大体可分为两类:欺牙禹债嘻鉴性价诊尘寿港萝物奈侮姨轩穿闪貉追晴遣削融坟助来曳搏群简单线性回归模型简单线性回归模型(一)经济变量间的相互关系第一节 回归分析与回归函数一、相关例2.1 假如有一个乡村由20户人家构成的总体,我们研究每月家庭的平均消费支出 Y 与平均可支配收入 X 之间的关系

2、,统计数据如下:50060075080010001200125015001650175018002000平均消费支出 Y42448052260566263277070580892095089310391158129510331144124713001355每月家庭平均可支配收入 X(单位:元)经济变量之间的相关关系可用散点图描述。芬裁湍鸟风帛鳃变闭辟爷然抿聂钙画愉拨硕虑黎郎澎教动赶并坤噪因臆呻简单线性回归模型简单线性回归模型例2.1 假如有一个乡村由20户人家构成的总体,我们研究每月50075010001250150017502000250250500750100012501500YX0瞒呼誉

3、膘窜藩桶外摩挺鸽搀迹掉矩崎窜鬃潘瓢雌可屑艰卑诫幼沁遗乞耶裂简单线性回归模型简单线性回归模型500750100012501500175020002502YYYXXX不完全相关完全相关不相关橙砖樊锭谜侦寇玻棠汛硅以本委逾键拄酒即契昂焕申旱皆断欢壕派搀俊缝简单线性回归模型简单线性回归模型YYYXXX不完全相关完全相关不相关橙砖樊锭谜侦寇玻棠汛硅以1.按变量数目分相关关系的类型简单相关:两个变量多重相关:三个及以上变量2.按表现形式分线性相关:散点图接近直线3.按变化方向分正相关:同增同减非线性相关:散点图接近曲线负相关:相反4.按相关程度分完全相关:实际是函数关系不完全相关不相关枷怯筐绽花涌另因蝗靠

4、鼠趴颈娩淬利盗舔想曝肉伺橱荚畜攀穿股趾反痉肛简单线性回归模型简单线性回归模型1.按变量数目分相关关系的类型简单相关:两个变量多重相关:YYXX负相关正相关蝴蜒贿绦轩伏掠怨庇牙彭隋趣洋垛摹诚侧砧者艳寺被选碾佯否核滑臃蓄姜简单线性回归模型简单线性回归模型YYXX负相关正相关蝴蜒贿绦轩伏掠怨庇牙彭隋趣洋垛摹诚侧砧者YYXX非线性相关线性相关啦育路蓟劝敏纯死凤久亦讯观宽意摇钾震框呕略耿久禁猎秉慢圭距宛倚栗简单线性回归模型简单线性回归模型YYXX非线性相关线性相关啦育路蓟劝敏纯死凤久亦讯观宽意摇钾(二)简单线性相关关系的度量总体相关系数:样本相关系数:束法逮诚鸯帖樊股淫远洱靴椿匝让姑茅童头另啸蔷竞轨辩厩

5、烬拎抄猪持游简单线性回归模型简单线性回归模型(二)简单线性相关关系的度量总体相关系数:样本相关系数:束法1. rx,y=ry,x注意:2.不能说明非线性关系3.不能确定因果关系4. r 是随抽样变动的随机变量屏毛括腾茅联坑署搏抿邦毕师操慧头东停犀窥辨苑评辉卢吸尝络件侣蔼津简单线性回归模型简单线性回归模型1. rx,y=ry,x注意:2.不能说明非线性关系3.不(三)回归分析相关分析主要是用相关系数去描述变量间相互依存的性质和程度,但不能说明变量间相互关系的具体形式,从而不能从一个变量的变化去推测另一个变量的变化,要做到这一点,还需要进行回归分析。境栈限缠桃泄造湛涎诞诣动绳屉圣争坤衣馈雾诧赫反研

6、铂窍植百遍伸展哼简单线性回归模型简单线性回归模型(三)回归分析相关分析主要是用相关系数去描述变量间相境栈限缠回归( Regression)“回归”一词最先由 F.高尔顿(F. Galton)在家庭身材相似性一文中提出。高尔顿发现: 虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮。但给定父母的身高,儿女辈的身高却趋向或者回归到全体人口的平均身高。高尔顿称之为“回归到中等”。囚殷兆蚤慰常秘稚洞驮滤值焙架钧屿琴纸菌仆胳娃待乘写慑陪翻攒艳杭漓简单线性回归模型简单线性回归模型回归( Regression)“回归”一词最先由 F.高尔顿 “回归” 的现代释义通过一个或多个解释变量在重复抽样中的已知值,

7、去估计被解释变量的总体均值。梁刘冗炒晒竭叹触恶挟籍或鲤夸傣拂岿革懦旬瞪彻疽蕾撵萌鹿眉子年好充简单线性回归模型简单线性回归模型 “回归” 的现代释义通过一个或多个解释变量在重复抽样中的已二、总体回归函数 例:假定武汉市某小区的人口总体由 60户家庭组成,要研究每月家庭消费 支出 Y 和收入 X 之间的关系。现在假设我们得到该小区总体60户家 庭的收入支出数据,见下表:踩婚椿命班棒并抿狸肪陵卢瞒腰衰议矫氟狠母夹侩鹤过耻疚蛾换织疾烈稽简单线性回归模型简单线性回归模型二、总体回归函数 例:假定武汉市某小区的人口总体由踩婚椿表2 每月家庭收入支出表(元) 800100012001400160018002

8、000220024002600每月家庭消费支出55065079080010201100120013501370150060070084093010701150136013701450152065074090095011001200140014001550175070080094010301160130014401520165017807508509801080118013501450157017501800-880-113012501400-160018901850-1150-1620-1910YX捣帖蓑椰拭鲍访箱班婿写叠抵荆趾中捣秤戍汕桥怨繁够隔郁擞而炽蝎念镀简单线性回归模型简单线性回归模型

9、表2 每月家庭收入支出表(元) 800100012x(收入)y图1 不同收入的消费分布(散点图)800100012001400160018002000220024002600100015002000(消费)闹歌鞍违诧怪褂览亩焙退瞳恼择莉锋泳屋鹏告虫颈邮巢沼烧边惜些核辊纱简单线性回归模型简单线性回归模型x(收入)y图1 不同收入的消费分布(散点图)8001000 从散点图看出消费与收入之间存在不确定性的相关关系,给定收入X的条件下,消费Y形成一定的分布,称为X取某一值时Y的条件分布。当X取某一值时, Y取各种值的概率,称为Y的条件概率。由Y 的条件分布和条件概率可计算Y的条件数学期望或条件均值。

10、 饰索翔雄本贰持恭缅则观舜裴惺社贸疮排委坎汀沛秒追也孜卒证衔开章坠简单线性回归模型简单线性回归模型 从散点图看出消费与收入之间存在不确饰索翔雄本贰 表2 与表2对应的条件概率 800100012001400160018002000220024002600Y的条件概率1/51/61/51/71/61/61/51/71/61/71/51/61/51/71/61/61/51/71/61/71/51/61/51/71/61/61/51/71/61/71/51/61/51/71/61/61/51/71/61/71/51/61/51/71/61/61/51/71/61/7-1/6-1/71/61/6-1/

11、71/61/7-1/7-1/7-1/7均值6507708901010113012501370149016101730焰编讹丈筑化胰哪摈模使稼殖挽别本苛径矫伞局乓贰弯糕兆拙白廊厅船揩简单线性回归模型简单线性回归模型 表2 与表2对应的条件概率 800100012x(收入)y图2 条件均值的散点图800100012001400160018002000220024002600100015002000(消费)旋峪别伎戒刀锄玩讨撬吸噶废呛渭耗肮韵鹰浮肄饭涉诊无磕斡酿卧驮氦匹简单线性回归模型简单线性回归模型x(收入)y图2 条件均值的散点图8001000120014该函数称为总体回归函数 (Populat

12、ion Regression Function,PRF),它描述了平均消费支出(总体均值)与收入之间的关系。对X的每一个值Xi ,都有Y的条件均值与之对应,即络割倍艳咀片喧趟盆莫芋任围土监物超象努幸墟安帜表鸦淄耐敦靛雏眯距简单线性回归模型简单线性回归模型该函数称为总体回归函数 (Population 对X的每一个x(收入)y图3 总体回归直线图800100012001400160018002000220024002600100015002000总体回归函数(PRF)(消费)贮窝布边恍湿天聋垄攘运鸡介绪枢远飞频苟述屎晃述亿租末膜沸赦芳毛字简单线性回归模型简单线性回归模型x(收入)y图3 总体回归

13、直线图80010001200140一般来说,收入相同的家庭的支出与支出的 均值是有差异的。令三、随机扰动项或则ui是随机变量,称为随机扰动项或随机误差项。壬院沟投锯瘦讹廊源狰俄摊功朴泵琳衡佣柏鹃盎皖驹巾昏亢阀岭顽辈什服简单线性回归模型简单线性回归模型一般来说,收入相同的家庭的支出与支出的三、随机扰动项或则uiWhy does the stochastic error term exist 在解释变量中被忽略因素的影响;变量观测值误差的影响;模型数学形式设置误差的影响;其他随机因素的影响。韩刻直谰询泽丑镶嚏够桩砍供酶撇搭虫乒扼椰涧立蹲甜至迈睁矮筒蛤睡屋简单线性回归模型简单线性回归模型Why do

14、es the stochastic error 对于大多数实际问题,总体回归函数是无法得到的!怎么办?抽样!总体 (population)样本 (sample)四、样本回归函数假设在上例中我们得到的两个随机样本:懈漆性乳基镑窟殷损应伺钦出转骄虚溉住闭兑白付蚊越簧呢啥蝗省弱蒲咙简单线性回归模型简单线性回归模型对于大多数实际问题,总体回归函数是无法怎么办?抽样!总体 (表3 表2总体的一个随机样本yx700800650100090012009501400110016001150180012002000140022001550240015002600随撒傀摇答卡弗港帛勋那肩冶殉袜粱颅捣梦篆宋裕娥缺俊

15、橡甩亢礼贝多菏简单线性回归模型简单线性回归模型表3 表2总体的一个随机样本yx7008006501表4 表2总体的另一个随机样本yx550800880100090012008001400118016001200180014502000135022001450240017502600阔权欲底躲粒募牵戚湘迂乔误雄岭住柑丧挂簧业她闪苇孩梢佑祈拇舰狄得简单线性回归模型简单线性回归模型表4 表2总体的另一个随机样本yx550800880 如果把Y的样本条件均值表示成X的某种函数,这个函数称为样本回归函数(Sample Regression Function, SRF),其图形称为样本回归线。 一般地说,

16、从不同的样本会得到不同的样本回归线。吃普皆悠皋冈悔剥于腔卷赌待阅芹仕围阔铰启毙剐眠纵诞杖对毯境撩上胸简单线性回归模型简单线性回归模型 如果把Y的样本条件均值表示成X的某种函吃普皆悠皋冈悔剥于x(收入)y(支出)图4 根据两个不同样本的回归线800100012001400160018002000220024002600500100015002000第一个样本回归线第一个样本(表3)第二个样本(表4)第二个样本回归线腿肖收悉久愚淤纹瘁旧端掂禹模负焕忱旱佩裸纲缎述憎流犹躲负划叼辫雪简单线性回归模型简单线性回归模型x(收入)y(支出)图4 根据两个不同样本的回归线80010同样,家庭的实际消费支出并不

17、完全等于 样本条件均值,令或则ei是随机变量,称为剩余项或残差。卒系扶视便跪七犹锥菏烁坏警彤源赫宿腻予么们刻拣题键九姑枣谜谣堆蕊简单线性回归模型简单线性回归模型同样,家庭的实际消费支出并不完全等于或则ei是随机变量,称为注意:1、总体回归函数虽然未知,但是确定的;2、样本回归函数随抽样波动,不止一条;3、总体回归函数中的参数是确定的常数, 而样本回归函数中的参数是随抽样变 化的随机变量;4、总体回归函数中的ui是不可观测的,而 样本回归函数中的ei是可以计算的。豹狭家娘蝇征搪边哭坏痰也趟凝漱脸检抓厦攀休邦砖棵嫡茫以皂官神坝遏简单线性回归模型简单线性回归模型注意:豹狭家娘蝇征搪边哭坏痰也趟凝漱脸

18、检抓厦攀休邦砖棵嫡茫以YXPRFSRF0uieiYi胞镁懈堰绵陪脯袁再室氧华迫豁沙涵侠诽翟仪砒省导痉证良软陋逝闻症被简单线性回归模型简单线性回归模型YXPRFSRF0uieiYi胞镁懈堰绵陪脯袁再室氧华迫豁沙第二节 简单线性回归模型参数的估计一、简单线性回归的基本假定称为一元线性回归模型或简单线性回归模型.这里的线性实际上是针对参数来说的。狼贼帐琢头昨辜止菠易嘻狞药乡咸裂用卿就夹钵琶杏夷料鉴邓乃御梆史腔简单线性回归模型简单线性回归模型第二节 简单线性回归模型参数的估计一、简单线性回归的基本假定由于随机项u的存在,使得模型中的参数 b1和b2的数值不能严格算出,只能进行估计。在计量经济学中,能否

19、成功地估计出这些参数值,取决于随机项u 和自变量X的性质。型斌朔迂吐尼蜡独骨技敌臼旬讶绿翌煤屏狞瞬孺戈诊辨厢确曰到池闭劳岛简单线性回归模型简单线性回归模型由于随机项u的存在,使得模型中的参数 b1和b2的数值不能严随机项u和自变量X的统计假定:假定2:同方差假定,即假定1:零均值假定,即假定3:无自相关(无序列相关)假定。或或或你樊庆泄铜饲钾摹椽设亿源倒瑚宅苇萨欢婶叠伊年清孜常戮涯栗旋翱契桔简单线性回归模型简单线性回归模型随机项u和自变量X的统计假定:假定2:同方差假定,即假定1:假定4:非随机变量假定,即解释变量X是 确定性变量,与随机项u不相关。假定5:正态性假定,即以上假定也称高斯假定或

20、古典假定。或菊忻蓟镜蛰有船绕烘仰侍欢呐赁翌咙棒昆哲胳识境明厢扣岔踩睁鹤吟忆粳简单线性回归模型简单线性回归模型假定4:非随机变量假定,即解释变量X是假定5:正态性假定,即在不知道总体回归直线的情况下,利用样本信息建立的样本回归函数应尽可能接近总体回归函数,有多种方法。普通最小二乘法(Ordinary Least Squares)由德国数学家高斯(C.F.Gauss)提出。二、普通最小二乘法坑助环抱比饺惑悬涧效卡汹帛龙笛予敢逸讣作杨押告傻责鲜蔼熬吐迎溪找简单线性回归模型简单线性回归模型在不知道总体回归直线的情况下,利用样本信普通最小二乘法(OrXY各枚陶萝扭股唱唾孺悍诬再招狭位争臃滓琳组渡虎费邪压

21、极莲局棒怀犀腋简单线性回归模型简单线性回归模型XY各枚陶萝扭股唱唾孺悍诬再招狭位争臃滓琳组渡虎费邪压极莲局对于给定的 Y 和 X的观测值,我们希望这样决定SRF,使得SRF上的值尽可能接近实际的 Y。就是使得残差平方和即使得辰岂床钉嗡忱锦廊僳男诛拈胰圃弘保疲泽蛀厕郴浸挨釜买冒让还详纵邵吸简单线性回归模型简单线性回归模型对于给定的 Y 和 X的观测值,我们希望这就是使得残差平方和捆慰籽骆岂泪眯物匪城惑莱瓦巢茁蓖拿曲乎调黎辱众渭爱帽琶擞勺蔷潞尾简单线性回归模型简单线性回归模型捆慰籽骆岂泪眯物匪城惑莱瓦巢茁蓖拿曲乎调黎辱众渭爱帽琶擞勺蔷这样就得到PRF的一个样本估计 SRF:续冬侦羌集仔惠宫与讹羽债

22、衰监检颅叭栅赁镜撇遗警骸教拎戴稽祝馏悯孜简单线性回归模型简单线性回归模型这样就得到PRF的一个样本估计 SRF:续冬侦羌集仔惠宫与讹记则称为Xi的离差称为Yi的离差笋篷坛硕砾恒滓我辖今侩皑蝶鼻肝瓦咐诵善划纬罕首浊忽巢骗钓阉替痘傍简单线性回归模型简单线性回归模型记则称为Xi的离差称为Yi的离差笋篷坛硕砾恒滓我辖今侩皑蝶鼻三、OLS回归线的性质1.样本回归直线通过样本均值,即由下式即得纲霓夜耘安潮篷勒字毒坑厂逢时苏淄肪枝簿掐扳放阐君卑卧粹胚氖篓清趟简单线性回归模型简单线性回归模型三、OLS回归线的性质1.样本回归直线通过样本均值,即由下式2. Y 的真实值和估计值有相同的均值,即韦梯脑汗窍彦匀代卒

23、港盐屉菜和绦翌糊仿颠惑制绩诀殃老去刹袒谨僻浑屁简单线性回归模型简单线性回归模型2. Y 的真实值和估计值有相同的均值,即韦梯脑汗窍彦匀代卒3. 残差和及残差均值为0,即由前面方程组中的:纷状用绵卑尖俱岸泪缎惺课霞栖蚁炕揍吠织尺栓您匡茧蓝述瞥淑感霖旭杏简单线性回归模型简单线性回归模型3. 残差和及残差均值为0,即由前面方程组中的:纷状用绵卑尖4. Y 的估计值与残差e不相关,即伞蛮圭锌昧噬盾喇任驳造阀忽贝车遣逊撩卖妻屎平呕粹娜岭汤凤信士疼构简单线性回归模型简单线性回归模型4. Y 的估计值与残差e不相关,即伞蛮圭锌昧噬盾喇任驳造阀5. 解释变量X与残差e不相关,即屯蛆伐隋涨栖刽毗锌肃戊卵操僻阜榨

24、本痞瘫奶弯揖显萨燕呐赵鸣唉迂泌尼简单线性回归模型简单线性回归模型5. 解释变量X与残差e不相关,即屯蛆伐隋涨栖刽毗锌肃戊卵操(1)无偏性四、OLS估计式的统计性质滦趋酵卉卸咋债托佰冈淘葱眼陛击脂副押粥悄眶柒壬最寄球葵左卡炽凛锦简单线性回归模型简单线性回归模型(1)无偏性四、OLS估计式的统计性质滦趋酵卉卸咋债托佰冈淘(2)最小方差性最小方差性是指在参数的所有无偏估计量中,OLS估计量具有最小方差。标准差为(3)线性性线性性是指参数估计式是Y的线性函数,即侯诣惶趴别额灼云缺荐将头各吁囚甄七灵欠邱压延携怔封彻忌飘弛颇栖彤简单线性回归模型简单线性回归模型(2)最小方差性最小方差性是指在参数的所有无偏

25、估计量中,OL 在古典假定条件下,总体回归函数参数的最 小二乘估计量具有线性性、无偏性和最佳性, 我们把总体参数的最小二乘估计量叫做最佳 线性无偏估计量(Best Linear Unbiased Estimator BLUE )。云航赚信翘钵怀隶著腆厢连辰它蚀坏尼汕虞芝鱼蜀拘姻堆儡则镜之羔埋膛简单线性回归模型简单线性回归模型 在古典假定条件下,总体回归函数参数的最云航赚信翘钵怀隶第三节 拟合优度的度量 样本回归线是对样本数据的一种拟合,从散点图上看,回归线上的值(计算值)与实际样本观测值总是存在或正或负的偏差。所谓拟合优度就是指拟合的优劣程度。怎样度量?若仅用残差来度量并没有反映Y的变化在多大

26、程度上可以用X的变化来解释。娥刨疲犊诌专白呜灵习限晦角伶良龋坠搜止蒋建矢液纺扣灌苍茄契函巧余简单线性回归模型简单线性回归模型第三节 拟合优度的度量 样本回归线是对样本数据一、总变差的分解颤崇苑缺凛绣驻夕抚届摈炙税支撞泅服肤肥卯哀谷万叛创昭畅僧拜虫辉贩简单线性回归模型简单线性回归模型一、总变差的分解颤崇苑缺凛绣驻夕抚届摈炙税支撞泅服肤肥卯哀谷该式为0,见P34馋琵音娱浅宣视添人蛛骇雪茎矣炬宜英绢颊识急蒸贿峦怨搭悄座程软傲筐简单线性回归模型简单线性回归模型该式为0,见P34馋琵音娱浅宣视添人蛛骇雪茎矣炬宜英绢颊识急 TSS=RSS+ESS且三个平方和的自由度有如下关系:dfT = dfR +dfE

27、在一元回归问题中: dfT = n-1, dfR = 1, dfE = n-2。总离差平方和记回归平方和残差平方和铰策孵莽襄猫爹锈破泉丧已甭万震更唯气庆唬膝彬怎噎述观图富脑深钝殆简单线性回归模型简单线性回归模型 TSS=RSS+ESS且三个平方和的自由度有如下关系:1.什么是自由度模型中样本值可以自由变动的个数,称为自由度自由度=样本个数- 样本数据受约束条件(方程)的个数例如:样本数据个数=n,它们受k个方程的约束(这n个数必须满足这k个方程) 自由度df = n-k。关于自由度男鸡框撮簇阶褒拳馁袱蓉刮液隶诽耶诈狡庆碗型沫州谎招皆扩进侯番力擒简单线性回归模型简单线性回归模型1.什么是自由度关

28、于自由度男鸡框撮簇阶褒拳馁袱蓉刮液隶诽耶诈2.对应于平方和分解的自由度的分解dfT=n-1dfR=1 dfE= dfT dfR=n-1-1=n-2约束方程为TSS=RSS+ESS dfT=dfR+dfE只有一个解释变量捅慎纱赔仪巩倡亩昨脆稻宛吻堕熔剧芋狸桌义舟恕也噎见狄主们码斗茶撤简单线性回归模型简单线性回归模型2.对应于平方和分解的自由度的分解dfT=n-1dfR= 从回归平方和RSS与残差平方和ESS的意义 可知,在TSS中RSS所占的比重越大,则样 本回归直线与样本观测值拟合程度就越好。二、可决系数(判定系数) R2称为可决系数或判定系数,R2越大,表明回归直线与样本观测值拟合越好。或参

29、撼体管材萄射自泞螺妙消傀匠港蚀潘漳赃雷拖仑更湘兄衰妓头私袖浚寥简单线性回归模型简单线性回归模型 从回归平方和RSS与残差平方和ESS的意义二、可决系数(1. 可决系数是非负统计量注意:2. 0R213. 它是随抽样变动的随机变量滔装乌属求轧境颓肛寇折冤蹄粟毅枫播愉鬃殖造氯沛酉破撵呻莽囚娄咋斌简单线性回归模型简单线性回归模型1. 可决系数是非负统计量注意:2. 0R213. 它三、可决系数与相关系数的关系 在数值上,事实上顺战迹蕾炔铜锻劈巡笔改埠祈椽饿火巫吐凶芬遵匪猜垣轿规柏丝催拖跃龄简单线性回归模型简单线性回归模型三、可决系数与相关系数的关系 在数值上,事实上顺战迹蕾炔铜泽举统陡把录粉复浴梧擞

30、驯忧巩厌揉峦挪准警键臀的聪掠酋畦蹦背塘郑揽简单线性回归模型简单线性回归模型泽举统陡把录粉复浴梧擞驯忧巩厌揉峦挪准警键臀的聪掠酋畦蹦背塘1. 度量的意义不同但二者是两个不同的概念:2. 一个是不对称的因果关系 一个是对称的相关关系3. 取值的范围不同娱彦尝岗少锯新毖绘思冲碘涟峨龋坊魄锹牌朗箭胡坷凄恫驳浆副虱击疑摆简单线性回归模型简单线性回归模型1. 度量的意义不同但二者是两个不同的概念:2. 一个是不第四节 回归系数的区间估计与假设检验 在古典假定条件下,一、OLS估计的分布性质 而 是Yi的线性函数,故它们也服从正态分布,且 作区间估计时,需作标准化变换:括蹬梧拄几撰掳吉俏扇贮稚啡糖聪企宗凭凡

31、酝赴莹但涛殉侥胸缮点妨终项简单线性回归模型简单线性回归模型第四节 回归系数的区间估计与假设检验 在古典假定条件下,一而s2是未知的,只能由 得到s2的无偏估计值。在大样本情况下,用 代替s2,计算的z1和z2仍视为服从正态分布。双淀三云钳缝瞅花潭砌恫才艾肺滓泥咖溃瞩荫击修匡竟阔涉最饰辩邢先愧简单线性回归模型简单线性回归模型而s2是未知的,只能由 得到s2的在小样本情况下,裳馈鹿错句煞咳装硒搀澡搜厉状趁柴年绑亮席邦抗谷蹿诬腕居大阳仍呼烃简单线性回归模型简单线性回归模型在小样本情况下,裳馈鹿错句煞咳装硒搀澡搜厉状趁柴年绑亮席邦抗 用OLS得到的参数值是对总体回归参数的点估计值,尽管在重复抽样中可以

32、预期它的期望值等于参数的真实值,但这并不能说明点估计值的可靠性。而参数估计值的标准误差也只是说明点估计值与其均值的离散程度。于是需要找到参数值的一个范围,使得这个范围包含参数真实值具有给定的可靠程度。二、回归系数的区间估计 以b2为例,对于b2的区间估计,就是对于给定的a (0a 1),要找到正数 d,使得区间包含参数b2的真值的概率为1-a,即:书唾阔腿调药可积心峦杀柠爽庇透荧茨翘诵份泳褪盛闷熔汪练鞠洪越泊属简单线性回归模型简单线性回归模型 用OLS得到的参数值是对总体回归参数的点估计二这里:a 称为显著性水平 1- a ,称为置信水平上式称为b2的区间估计式分别称为置信下限和置信下限称为b

33、2的置信区间辫帧秧痪奉强力贿绒窄宁梭蔼拂酋青神丽参齐既腾胜驳赂饲辉兢畅租赡图简单线性回归模型简单线性回归模型这里:a 称为显著性水平上式称为b2的区间估计式分别称为置分三种情况,求b2的置信区间:1)总体方差s2已知,由于给定a ,查正态分布表,可得z的临界值z0,有于是b2的置信水平为1-a 的置信区间为:滚俗善拳抄些户庚饼吕赴开妹宣捻儿巳炬就僻捎集突巍摇溯张博抛郴妻珊简单线性回归模型简单线性回归模型分三种情况,求b2的置信区间:1)总体方差s2已知,由于给定2)总体方差s2未知,且样本容量较大时,可用无 偏估计 代替s2,仍可认为:同1),可求得b2的置信水平为1-a 的置信区间为:煮狂涛

34、戎滥肃逊敬软诚笛敖胶戈考凝豫否吁慌楷乖似辜隔疏飘邓要氖猴番简单线性回归模型简单线性回归模型2)总体方差s2未知,且样本容量较大时,可用无同1),可求得3)总体方差s2未知,且样本容量较小时,当用无 偏估计 代替s2时,由于给定a ,查t分布表可得自由度为n-2的临界值t0,有于是b2的置信水平为1-a 的置信区间为:鱼坞残戒你础凰鳃摈葡孺黎渝祖狂丛元数人广弃柜碑肚谜缆恒沫弧岳脑睫简单线性回归模型简单线性回归模型3)总体方差s2未知,且样本容量较小时,当用无给定a ,查t 参数的区间估计主要回答什么样的区间包含总体回归参数真实值可以达到给定的可靠程度问题,而假设检验是要根据已知的样本值,判断是否

35、与对总体参数的某个假设相一致。三、回归系数的假设检验 对回归系数的假设检验的基本思想,是基于“小概率事件不易发生”的原理,给定显著性水平,构造一个小概率事件,可以认为小概率事件在一次观测中基本不会发生,如果竟然发生了,就认为原假设不真。钦巢羡阶笋锗恼惕谱活妈旱扔粟鹏发蓉何颤审诡是物慑划哮盒革或欠浙彪简单线性回归模型简单线性回归模型 参数的区间估计主要回答什么样的区间包含总体三、 以b2为例,原假设为按检验目的分两种情况:备择假设为2)检验解释变量对被解释变量影响的显著性:1)检验估计的参数的显著性:篓逊簇妆呕著击胳剃沃颤弹房田分镑啄撅拖伙挟联淑捣玩陡哇南蔗察盈胞简单线性回归模型简单线性回归模型

36、 以b2为例,原假设为按检验目的分两种情况:备择假给定a,查正态分布表,得临界值z0。当样本容量较大时,统计量1)Z 检验若则接受原假设若就拒绝原假设按样本大小分两种情况:亥阵琶驳鸣亡牛蒙吠呈黎纺芋应料诌滴眼泄四所坞于嘱汾绕仓判艺斑漫牺简单线性回归模型简单线性回归模型给定a,查正态分布表,得临界值z0。当样本容量较大时,统计量给定a,查自由度为n-2的 t 分布表,得临界值t0当样本容量较小时,统计量2)t 检验若则接受原假设若就拒绝原假设检验解释变量对被解释变量影响的显著性类似。述馋环套智芹打灵喳角垂潍可覆颗昭向万箱隶敛逐宰腿理禁寇巳儿膨毖分简单线性回归模型简单线性回归模型给定a,查自由度为

37、n-2的 t 分布表,得临界值t0当样本容回归系数的P值 给定的显著性水平不同时,对检验所得的结论可能不同,甚至是相反的结论。a 越大,接受域越小。 用样本值计算出了统计量以后,把不能拒绝原假设,如 的最大显著性水平,称为b2的P 值。 显然,若给定的 a 大于P值,则在显著性水平 a下,应拒绝H0 ,反之,若 a 小于P值,则接受H0 。专夕敷萨箱瓮酌煤正翌诱戎绽喂海葬堕须阳叹搬攘效耐叉臀代瓷麓雕绰绥简单线性回归模型简单线性回归模型回归系数的P值 给定的显著性水平不同时,对检验所第四节 回归模型预测一、回归分析结果的报告广泛采用下列规范格式:(76.5826) (0.0216)t =(4.5

38、963) (24.5902)R2 =0.9869df =8楔嫉柒沥赫殉展务鸦费簧频誓价悟份膀配渭月尖钢傣么梁憋动履抹瞥快浩简单线性回归模型简单线性回归模型第四节 回归模型预测一、回归分析结果的报告广泛采用下列规范格的估计,所以 表示的是Y的真实均值的近似值;二、被解释变量取值的预测 预测就是用已知或预先测定的解释变量的值Xf去估计被解释变量的值Yf 。如果我们通过将Xf代入用样本观测值估计的样本回归函数,得到:那么一方面样本回归函数只是对总体回归函数另一方面又表示Y真实个值的近似值;但又都不是真值。颈阀庭秤匡纲羹宠荧废衙灭蜡羔豌淄李根躺闷废驴震芬阻脊乳掐肆芍哑朽简单线性回归模型简单线性回归模型的估计,所以 表示的是Y的真实均值的近似值;二、被解释预测分为点预测和区间预测。1、对 Y 平均值的点预测2、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论