回归分析的基本思想及其初步应用3-完整精讲版课件_第1页
回归分析的基本思想及其初步应用3-完整精讲版课件_第2页
回归分析的基本思想及其初步应用3-完整精讲版课件_第3页
回归分析的基本思想及其初步应用3-完整精讲版课件_第4页
回归分析的基本思想及其初步应用3-完整精讲版课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、回归分析的基本思想及其初步应用第二课时复习回顾:相关系数上节课中的题目: 从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359预报一名身高为172的女大学生的体重。编号12345678身高165165157170175165155170体重4857505464614359身高为172的女学生体重一定是60.316吗?从散点图可看到,样本点散布在某条直线的附近,而不是一条直线上,所以不能用一次函数a 来描述它们之间的关系。理想化的斜率和截距是未知参数在实际中,随机变量还受其他因素影响我

2、们所选用的模型只是一种近似模型故线性回归模型的完整表达式为 y=bx+a+e因变量y的值由自变量x和随机变量e共同确定自变量x只能解释部分y的变化,称为解释变量因变量y称为预报变量解释变量x(身高)随机误差e预报变量y(体重)注意:注意:对随机误差e的研究线性回归模型的完整表达式 y=bx+a+e编号12345678身高165165157170175165155170体重y4857505464614359残差54.3754.37-6.292.71编号12345678身高165165157170175165155170体重4857505464614359残差-6.292.712.50-4.531

3、.226.71-2.810.47残差图:纵坐标为残差,横坐标如何选取?横坐标可以选为样本编号残差是个随机变量,如何来研究残差?如何分析残差图?以样本编号为横坐标的残差图:异常点 是否为错误数据? 残差图中的残差点比较均匀地落在水平的带状区域,说明选用的模型比较合适。区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。为了衡量预报的精度,需要估计的2值故线性回归模型的完整表达式为 y=bx+a+e为了衡量预报的精度,需要估计的2值为何除的是n-2如果n为或时又如何?编号12345678身高165165157170175165155170体重4857505464614359残差-6.37

4、32.6272.419-4.6181.1376.627-2.8830.382算大还是算小呢?练:若两变量的残差平方和为,总偏差平方和为,则随机误差对预报量变化的总效应约贡献了多少?总偏差平方和残差平方和回归平方和编号12345678身高165165157170175165155170体重4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382随机误差对预报变量变化约贡献了多少?则身高对体重差异的贡献约为? 这表明“身高解释了64%的体重变化”,或者说“体重的差异有64%是有身高引起的”(而随机误差贡献了剩余的36%,所以,身高对

5、体重的效应比随机误差的效应大得多,可以说身高和体重的相互关系较强)某运动员训练次数与运动成绩之间的数据关系如下:编号次数成绩试预测运动员训练次以及次的成绩编号次数成绩第一步:做散点图编号次数成绩第二步:求回归方程编号次数成绩残差-1.24-0.370.550.461.380.170.09-1.08第三步:残差图残差图编号次数成绩残差-1.24-0.370.550.461.380.170.09-1.08第四步:计算相关指数编号次数成绩残差-1.24-0.370.550.461.380.170.09-1.08说明了该运动员的成绩的差异有是由训练次数引起的,说明了两个变量的相关关系非常强第五步:作出

6、预报由上述分析可知,我们可以用回归方程一般地,建立回归模型的基本步骤为:1.确定研究对象2.画散点图3.由经验确定回归方程的类型4.按一定规则估计回归方程中的参数5. 分析残差图. 下结论. 分析残差图小结:作业:课外研究:试以本班期中考试数学物理成绩为样本,研究学生学习数学成绩对物理成绩的影响例2.一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程温度x/oC21232527293235产卵数y/个711212466115325 解:1)作散点图;例2.一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程温度x

7、/oC21232527293235产卵数y/个711212466115325 解:1)作散点图; 从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。利用线性回归模型来建立y和x之间的非线性回归方程x21232527293235z1.9462.3983.0453.1784.1904.7455.784例2.一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程温度x/oC21232527293235产卵数y/个711212466115325t44152962572984110241225

8、y711212466115325用残差来比较两个回归方程的拟合效果:x21232527293235y7112124661153250.518-0.1671.760-9.1498.889-14.15332.92847.69319.397-5.835-41.003-40.107-58.26877.965前一个模型的拟合效果好在一般情况下,比较两个模型的残差比较困难.原因是在某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反.这时可以通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.中残差平方和分别为1550.538和15448.431.说明前面那个模型的拟合效果好还可以用R2来比较两个模型的拟合效果.R2越大,模型的拟合效果也越好.中R2分别为0.98和0.80,说明前面那个模型的拟合效果好小 结 实际问题 样本分析 回归模型抽样回归分析预报精度预报假设某服装厂用10万元引进一批设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:x23456y2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论