




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3 一 元 线 性 回 归,返回目录,变量之间的关系大致有两种:,1.函数关系: 确定性关系,2. 相关关系:非确定性关系,社会经济领域中, 投入与产出;价格与需求的关系等.,例如: 人的身高与体重; 人的年龄与血压;,(一) 一元线性回归,x: 普通变量,Y : 随机变量,对Y 独立观察得到,当x 取定一组不完全相同的值,对应的样本值,用样本来估计Y 关于x 的回归函数(x).,例1 为研究某化学反应过程中,温度x ()对产品得率Y(%) 的影响,测得数据如下:,散点图,称为一元线性回归模型,b 称为回归系数.,其中未知参数a,b 和 都不依赖于x,一元线性回归,假设对x 的每一个值有,Y
2、有两部分组成:,x 的线性函数,随机误差,记,(二) a,b 的估计,作独立试验,得到样本,当x 取一组不全相同的值,相互独立,相互独立,它们的联合密度是,用最大似然估计法估计a,b.,L最大,只需下式最小,正规方程组:,系数行列式,有唯一解,回归函数 的估计,称为Y 关于x 的经验回归方程,简称回归方程,其图形称为回归直线.,例2 例1中为研究某化学反应过程中,温度x ()对产品得率Y(%) 的影响,测得数据如下:,计算,回归直线方程:,或,(三) 2 的估计,记,称 为 处的残差.,残差平方和,是 与 处的观察值 的偏差的平方和.,Qe的分解:,Qe的一个分解式:,2的无偏估计量:,记,可
3、证明:,例3 求例2中2的无偏估计.,(四) 线性假设的显著性检验,提出假设,可以证明,与Qe独立,当H0为真时,拒绝域:,例4 检验例2中的回归效果是否显著,=0.05,拒绝,认为回归效果是显著的.,* (五) 系数b 的置信区间,b 的置信水平为1-的置信区间为,=(0.45894,0.50712),例2中b 的置信水平为0.95的置信区间为,* (六) 回归函数(x)=a + bx 函数值的点估计和置信区间,点估计:,相应的估计量:,可以证明,与 独立,置信水平为1-的置信区间,或,(七) Y 的观察值的点预测和预测区间,点预测:,相互独立,Y0的置信水平为1-的预测区间,1* 该区间以
4、 为中心,长度为,是x0的函数;,或,2* 在 处区间长度最短, x0越远离 ,则长度就越长,随n的增加,长度缩短;,3* 置信区间的上限与下限的曲线对称地落在回归直线的两侧,成喇叭型.,例5 例2中,(1)*求回归函数(x)在x =125处的值(125) 的置信水平为0.95的置信区间,求在x =125处Y 的新观察值Y0置信水平为0.95的预测区间;,(2) 求在x = x0处Y 的新观察值Y0置信水平为0.95的预测区间;,=57.64,=0.84,回归函数(x)在x =125处的值(125) 的置信水平为0.95的置信区间为,(57.640.84)=(56.80,58.48),在x =
5、125处得率Y0 的置信水平为0.95的预测区间,(57.642.34)=(55.3059.98),(2) 求在x = x0 处得率Y0 的置信水平为0.95的预测区间:,=2.34,(八) 可化为一元线性回归的例子,变量之间的相关关系在实际中往往不一定是线性的,,直接求解回归曲线往往比较困难,对一些特殊类型,,可通过适当的变量替换化为线性回归问题来处理.,通常需要用回归曲线来描述.,常见的曲线方程及其图形如下:,1. 双曲线型,原方程:,变换方法:,变换后方程:,2. 指数曲线型(之一),原方程:,变换方法:,变换后方程:,原方程:,变换方法:,变换后方程:,(之二),3. 幂函数型,原方程
6、:,变换方法:,变换后方程:,4. 对数曲线型,原方程:,变换方法:,变换后方程:,5. S 曲线型,原方程:,变换方法:,变换后方程:,例6:为了解百货商店销售额x与流通费率(这是反映商业活动的一个质量指标,指每元商品流转额所分摊的流通费用)y 之间的关系,收集了九个商店的有关数据见下表:,解:(1) x 与y 的散点图:,观察上述散点图可以发现,这九个点大致在一条曲线附近,因而宜用曲线去拟合这批数据,即建立回归曲线方程.,回归曲线的形式确定,应尽可能地采用专业知识,此外也可以与典型的函数图象对照使用.此时可能有多种选择方案,对本例来讲可选用,(2) 确定回归曲线类型,(3) 对原始数据作相
7、应的变量替换,,变换后的数据列表,变换后的数据及拟合值与残差值,(4) 计算过程如下:,在上述方程中用原变量代入,有:,可见,回归效果还是较好的.,回归分析中应注意的问题:,1. 定性分析与定量分析相结合;,2. 检验假设的条件是否符合(可利用残差图);,3. 回归方程一般不宜外推,实际工作中往往需要外推,必须在理论上分析其是否可行.,4. 关于时间序列资料的回归.,思考题:,1.在线性模型 中,x 是什么 变量?Y是什么变量?对固定的x,Y 服从什么分布?,2. 一元线性回归系数 与样本相关系数 R 有什么关系?,思考题答案:,1. x是普通变量,Y 是随机变量,练习题:,2.在一元线性回归
8、模型 中,假定随机变量服从( ),(1) 两点分布,3. 在一元线性回归中,式子( )是正确的.,4. 在线性模型 的相关性检验中,如果原 假设 没有被否定,则表明( ),(4) 不存在一条曲线 能近似地描述两变量间的关系.,(1) 两个变量之间没有任何相关关系;,(2) 两个变量之间不存在显著的线性相关关系;,(3) 两个变量之间存在显著的线性相关关系;,5. 对下表所给的数据,建立水稻产量 y 对化肥用量 x 的回归直线.,6. 考察硫酸铜在水中的溶解度 y 与温度 x 的关系时,作了9次试验得数据如下,求 y 对 x 的线性回归方程.,7.某商品的价格与供给量的观察数据见下表:,(1)
9、求 y 对 x 的线性回归方程;,(2) 作相关性检验.,8. 求下表中营业税税收总额Y对某商品零售总额x的线性回归方程;并作回归效果的显著性检验;当x =300时,对营业税税收总额作出预测.,9. 随机地抽取50位妇女为样本,调查其年龄x与 胆固醇浓度y 的关系.现得到样本信息:一元回归平方和,试求y对x的线性回归方程.,10. 某化工厂生产一种油漆,其含杂质率 与搅拌速 度x有关,现抽取12桶,检验结果经计算得,,试求y对x的线性回归方程.,11.为研究一化学过程中,温度 对产品得率y(%)的影响,观测到10对数据,经计算得,,能否据此断定x与y 间存在显著的线性关系?,(1)求y 关于x
10、 的线性回归方程 ; (2)对所建立线性回归方程进行相关性检验; (3)当销售额95元时,利润的95%的预测区间.,12.某种商品的销售额x(元)与利润y(元)的统计数据如下: 销售额 54.5 61.0 67.5 74.0 80.5 87.0 利 润 6.54 7.22 8.55 9.61 10.53 11.46,13. 设x,y分别表示我国农民人均年纯收入与人均年消费支出(单位:元),统计了1978至1987年十年数据后计算得,求y对x的线性回归方程. 假设1988年农民人均收入为550元,预测1988年的农民人均消费支出是多少?,14.工厂在若干年内收集的资料说明,一批产品的成本 y(元)与生产件数 x(千件) 的关系:,(1) 求y 关于x 的回归方程; (2) 对所建立回归方程进行显著性检验; (3) 当产量为100时,成本 y 的置信度95%的预测区间.,练习题答案:,4;2. 3; 3. 3; 4.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电梯维保事故现场应急处置措施
- 幼儿园语言文字教学优化计划
- 教科版小学科学四年级上册科学实验教学活动计划
- 小学科学教研组实验室管理工作计划
- 施工机械使用成本节约措施
- 社会公益项目风险分析及保障措施
- 小学四年级A版语文学生能力提升计划
- 师徒结对课程开发计划
- 人力资源管理信访流程风险点及风控措施
- 教科版六年级上册科学数字化教学计划
- 2025年广东高考政治试卷真题答案详解讲评(课件)
- 卡口及道路交通智能监控系统方案设计
- 2025年家庭照护师职业资格考试试题及答案
- 呼吸机相关性肺炎的预防和护理
- 2025年绥化市中考化学试题卷(含答案解析)
- 门诊口腔院感基础知识培训
- 论咏叹调《妈妈不在》的形象刻画与唱段处理
- 危重病人观察和护理要点
- 砌体工程培训课件
- GB/T 45719-2025半导体器件金属氧化物半导体(MOS)晶体管的热载流子试验
- 2025-2030中国医药商业行业盈利态势与投资潜力分析报告
评论
0/150
提交评论