版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.1回归分析的基本思想及其初步 应用习题课 我们的梦向往的地方 用自己的聪明和勤奋, 打造一个最优秀的自己 1.1回归分析的基本思想及其初步 应用习题课 北京师范大学是教育部直属重点大学,北京师范大学是教育部直属重点大学, 是一所以教师教育、教育科学和文理基础是一所以教师教育、教育科学和文理基础 学科为主要特色的著名学府。学校的前身学科为主要特色的著名学府。学校的前身 是是1902年创立的京师大学堂师范馆,年创立的京师大学堂师范馆,1908 年改称京师优级师范学堂,独立设校。年改称京师优级师范学堂,独立设校。 1912年改名为北京高等师范学校。年改名为北京高等师范学校。1923年年 更名为北
2、京师范大学,成为中国历史上第更名为北京师范大学,成为中国历史上第 一所师范大学。一所师范大学。1931年、年、1952年北平女子年北平女子 师范大学、辅仁大学先后并入北京师范大师范大学、辅仁大学先后并入北京师范大 学。学。 1.1回归分析的基本思想及其初步 应用习题课 1.1回归分析的基本思想及其初步 应用习题课 复习回顾:复习回顾: 2. b n nn n i ii ii i i i i i= =1 1i i= =1 1 n nn n 2 2 2 22 2 i ii i i i= =1 1i i= =1 1 a a = =y y- -b bx x ( (x x - -x x) )( (y y
3、 - -y y) )x x y y - -n nx xy y = = ( (x x - -x x) )x x - -n nx x 1.回归直线的方程回归直线的方程: axby 1.1回归分析的基本思想及其初步 应用习题课 我们又引入相关指数我们又引入相关指数R2来刻画回归的效果:来刻画回归的效果: n i i n i i yy yy R 1 2 1 2 2 )( )( 1 残差平方和残差平方和 总体偏差平方和总体偏差平方和 当当R2越接近于越接近于1,说明解释变量和预报变量说明解释变量和预报变量 之间的相关性越强之间的相关性越强,如果同一个问题如果同一个问题,采用采用 不同的回归方法分析不同的
4、回归方法分析,我们可以通过我们可以通过选择选择 R2大的来作为回归模型大的来作为回归模型 1.1回归分析的基本思想及其初步 应用习题课 相关系数相关系数 相关系数的性质相关系数的性质: : (1)|r|1 (1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接近于越接近于0 0, 相关程度越弱相关程度越弱 n n i ii i i i= =1 1 n nn n 2 22 2 i ii i i i= =1 1i i= =1 1 ( (x x - - x x) )( (y y - - y y) ) r r = = ( (x x - - x x)
5、 )( (y y - - y y) ) 如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱? 0.751, 1, 0.75, 0 25,0.25, r r r 当, 表明两个变量正线性相关很强; 当表明两个变量负线性相关很强; 当.表明两个变量线性相关性较弱。 问题:问题:达到怎样程度,达到怎样程度,x、y线性相关呢?线性相关呢? 它们的相关程度怎样呢?它们的相关程度怎样呢? 1.1回归分析的基本思想及其初步 应用习题课 基本步骤基本步骤 抽取样本抽取样本, ,采集数据采集数据 作出散点图作出散点图 确定类型确定类型, ,求回归方程求回归方程 残差分析残差分析 相关
6、指数相关指数 判定拟合程度判定拟合程度 1.1回归分析的基本思想及其初步 应用习题课 案例案例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温度和温度x有关。现有关。现 收集了收集了7组观测数据列于表中:组观测数据列于表中: (1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并之间的回归方程;并 预测温度为预测温度为2828o oC C时产卵数目。时产卵数目。 (2 2)你所建立的模型中温度在多大程度上解释了)你所建立的模型中温度在多大程度上解释了 产卵数的变化?产卵数的变化? 温度温度xoC21232527293235 产卵数产卵数y/个个71121246611532
7、5 非线性回归问题非线性回归问题 1.1回归分析的基本思想及其初步 应用习题课 假设线性回归方程为假设线性回归方程为 :=bx+a 选选 模模 型型 由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2= =r r2 20.8640.8642 2=0.7464=0.7464 估计参数估计参数 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。 选变量选变量 所以,二次函数模型中温度解释了所以,二次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。
8、探索新知探索新知 画散点图画散点图 0 50 100 150 200 250 300 350 036912151821242730333639 方案1 分析和预测分析和预测 当当x=28时,时,y =19.8728-463.73 93 一元线性模型一元线性模型 1.1回归分析的基本思想及其初步 应用习题课 奇怪?奇怪? 9366 ? 模型不好?模型不好? 1.1回归分析的基本思想及其初步 应用习题课 y=bx2+a 变换变换 y=bt+a 非线性关系非线性关系 线性关系线性关系 方案2 问题问题 选用选用y=bx2+a ,还是,还是y=bx2+cx+a ? 问题问题3 产卵数产卵数 气温气温
9、问题问题2 如何求如何求a、b ? 合作探究合作探究 t=x2 二次函数模型二次函数模型 1.1回归分析的基本思想及其初步 应用习题课 方案2解答 平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a 就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a 温度温度21232527293235 温度的平方温度的平方t44152962572984110241225 产卵数产卵数y/个个711212466115325 作散点图,并由计算器得:作
10、散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为 y=y=0.3670.367t t-202.543-202.543,相关指数,相关指数R R2 2=0.802=0.802 将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得: y=y=0.3670.367x x2 2 -202.543 -202.543 当当x x=28=28时时,y y=0.367=0.36728282 2- - 202.5485202.5485,且,且R R2 2=0.802=0.802, 所以,二次函数模型中温度解所以,二次函数模型中温度解 释了释了80.2%80.2%的产卵数变化
11、。的产卵数变化。 t 1.1回归分析的基本思想及其初步 应用习题课 问题问题 变换变换 y=bx+a 非线性关系非线性关系 线性关系线性关系 2 1 c x yce 问题问题 如何选取指数函数的底如何选取指数函数的底? 产卵数产卵数 气温气温 指数函数模型指数函数模型 方案3 合作探究合作探究 对数对数 1.1回归分析的基本思想及其初步 应用习题课 方案3解答 温度温度xoC21232527293235 z=lny 1.9462.3983.0453.1784.1904.7455.784 产卵数产卵数y/个个711212466115325 x z 当当x=28x=28o oC C 时,时,y 4
12、4 y 44 ,指数回归,指数回归 模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的产卵数的 变化变化 由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程 为为 0.272x-3.849 .ye 22 111221 lnln()lnlnlnlnln c xc x ycececc xec xc 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得 2 1 c x yce 令令 ,则,则 就转换为就转换为z=bx+a.z=bx+a. 12 ln,ln,zy ac bc 2 1 c x yce z=0.272x-3.849 , 相关指数相关指数R R2
13、 2=0.98=0.98 1.1回归分析的基本思想及其初步 应用习题课 最好的模型是哪个最好的模型是哪个? 产卵数产卵数 气温气温 产卵数产卵数 气温气温 线性模型线性模型 二次函数模型二次函数模型 指数函数模型指数函数模型 1.1回归分析的基本思想及其初步 应用习题课 比一比比一比 函数模型函数模型相关指数相关指数R2 线性回归模型线性回归模型0.7464 二次函数模型二次函数模型0.80 指数函数模型指数函数模型0.98 最好的模型是哪个最好的模型是哪个? 1.1回归分析的基本思想及其初步 应用习题课 回归分析(二)回归分析(二) (1)0.2723.849(2)2 y,y0.367202
14、.543. x ex 则回归方程的残差计算公式分别为:则回归方程的残差计算公式分别为: 由计算可得:由计算可得: (1)(1)0.2723.849 (2)(2)2 ,1,2,.,7; 0.367202.543,1,2,.,7. x iiii iiii eyyyei eyyyxi x21232527293235 y711212466115325 0.557-0.1011.875-8.9509.230- 13.381 34.675 47.69619.400-5.832- 41.000 - 40.104 - 58.265 77.968 (1) e (2) e (1)(2) 1550.538,1544
15、8.431.QQ 因此模型(因此模型(1)的拟合效果远远优于模型()的拟合效果远远优于模型(2)。)。 1.1回归分析的基本思想及其初步 应用习题课 练习:练习:为了研究某种细菌随时间为了研究某种细菌随时间x x变化,繁殖的个数,变化,繁殖的个数, 收集数据如下:收集数据如下: 天 数天 数 x /x / 天天 1 1 2 2 3 34 4 5 5 6 6 繁殖个数繁殖个数 y/y/个个 6 6 1212 2525 4949 9595190190 (1 1)用天数作解释变量,繁殖个数作预报变量,作出这些)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;数据的散点图; (2) 描述
16、解释变量与预报变量描述解释变量与预报变量 之间的关系;之间的关系; (3 3) 计算残差、相关指数计算残差、相关指数R R2 2. . 天数天数 繁殖个数繁殖个数 解:解:(1)散点图如右所示散点图如右所示 1.1回归分析的基本思想及其初步 应用习题课 (2 2)由散点图看出样本点分布在一条指数函数)由散点图看出样本点分布在一条指数函数y= y= 的周的周 围,于是令围,于是令Z=lny,Z=lny,则则 2 C x 1e C x x 1 1 2 23 34 45 56 6 Z Z 1.791.792.482.483.223.223.893.894.554.555.255.25 由计数器算得由
17、计数器算得 则有则有 Z=0.69X 1.112 0.69x 1.112 y=e y 6.066.06 12.0912.0924.0924.0948.0448.0495.7795.77190.9190.9 y y6 612122525 49499595 190190 n 22 i i=11 e()3.1643, n ii i yy n 222 i 1i=1 ()yny25553.3. n i i yy (3) 即(解释变量)天数即(解释变量)天数解释了解释了99.99%(预报变量)繁殖细菌得预报变量)繁殖细菌得 个数个数 2 3.1643 10.9999. 25553.3 R 1.1回归分析的
18、基本思想及其初步 应用习题课 理论迁移理论迁移 例例 19931993年到年到20022002年中国的国内生产总年中国的国内生产总 值(值(GDPGDP)的数据(单位:亿元)如下:)的数据(单位:亿元)如下: 104790.6104790.62002200274462.674462.619971997 97314.897314.82001200167884.667884.619961996 89468.189468.12000200058478.158478.119951995 82067.582067.51999199946759.446759.419941994 78345.278345.
19、21998199834634.434634.419931993 GDPGDP年份年份GDPGDP年份年份 1.1回归分析的基本思想及其初步 应用习题课 (1 1)作)作GDPGDP和年份的散点图,根据该图和年份的散点图,根据该图 猜想它们之间的关系应是什么?猜想它们之间的关系应是什么? (2 2)建立年份为解释变量)建立年份为解释变量GDPGDP为预报变为预报变 量的回归模型,并计算残差量的回归模型,并计算残差. . (3 3)根据你得到的模型,预报)根据你得到的模型,预报20032003年的年的 GDPGDP,看看你的预报与实际的,看看你的预报与实际的GDPGDP (117251.91172
20、51.9亿元)的误差是多少?亿元)的误差是多少? (4 4)你认为这个模型能较好地刻画)你认为这个模型能较好地刻画GDPGDP 和年份的关系吗?请说明理由和年份的关系吗?请说明理由. . 1.1回归分析的基本思想及其初步 应用习题课 0 20000 40000 60000 80000 100000 120000 1992199419961998200020022004 GDP GDP与年份近似地呈线性关系与年份近似地呈线性关系. . 7191.96914292537.729yt 1.1回归分析的基本思想及其初步 应用习题课 993.791993.791200220024638.0554638.
21、05519971997 1277.6221277.622200120015252.0245252.02419961996 1932.3531932.353200020003037.4933037.49319951995 2140.9842140.984199919991489.2381489.23819941994 1328.6851328.685199819986422.2696422.26919931993 残差残差年份年份残差残差年份年份 20032003年年GDPGDP预报值为预报值为112976.4112976.4,预报与实际,预报与实际 相差相差4275.54275.5 相关指数相
22、关指数R R2 20.9740.974,说明年份能够解释,说明年份能够解释 97.4%97.4%的的GDPGDP值变化,所建模型能很好地刻画值变化,所建模型能很好地刻画 GDPGDP和年份的关系和年份的关系. . 1.1回归分析的基本思想及其初步 应用习题课 练习某运动员训练次数与运动成绩之间的数据关系如下: 编号 次数 成绩 试预测运动员训练次以及次的成绩 1.1回归分析的基本思想及其初步 应用习题课 编号 次数 成绩 第一步:做散点图 1.1回归分析的基本思想及其初步 应用习题课 编号 次数 成绩 第二步:求回归方程 y=1.0415x-0.00302 1.1回归分析的基本思想及其初步 应
23、用习题课 编号编号 次数次数 成绩成绩 残差残差 y=1.0415x-0.00302 第三步:残差图 -1.24-0.370.550.461.380.170.09-1.08 1.1回归分析的基本思想及其初步 应用习题课 残差图残差图 编号编号 次数次数 成绩成绩 残差残差 -1.24 -0.370.550.461.380.170.09-1.08 1.1回归分析的基本思想及其初步 应用习题课 第四步:计算相关指数第四步:计算相关指数 编号编号 次数次数 成绩成绩 残差残差 -1.24 -0.370.550.461.380.170.09-1.08 2 2 1 2 1 10.9855 n ii i n i i yy R yy 相关指数 说明了该运动员的成绩的差异有是由训 练次数引起的,说明了两个变量的相关关系非常强 1.1回归分析的基本思想及其初步 应用习题课 第五步:作出预报 y=1.0415x-0.00302来作为该运动员成绩的预报值 4957 4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- QC/T 1248-2025温室气体产品碳足迹量化方法与要求道路车辆产品
- GA 2344-2025警服移民管理警察夏执勤背心
- 著作权法的保护对象和权利内容
- 印刷机械公司合同付款管理办法
- 某纺织公司生产安全管理制度
- 企业级数据加密与安全存储解决方案实施计划
- 2026云南玉溪市红塔区凤凰街道葫田社区居民委员会社区专职网格员招聘1人备考题库及参考答案详解(巩固)
- 2026江西赣州市政公用集团社会招聘39人备考题库附参考答案详解(培优b卷)
- 某生物制药厂质量标准细则
- 2026中国科学院广州地球化学研究所科研助理招聘2人备考题库(应用矿物学学科组)带答案详解(新)
- 2026江西抚州市公务用车保障服务中心有限公司招聘员工20人考试参考题库及答案解析
- 2026内蒙古锡林郭勒盟阿巴嘎旗林草执法人员补充招收6人备考题库含答案详解(综合题)
- (贵州一模)贵州省2026年4月高三年级适应性考试物理试卷(含标准答案)
- 安全仪表系统管理制度
- 2026年内蒙古联通校园招聘笔试备考试题及答案解析
- 应急物流风险预警-洞察与解读
- 2026四川绵阳市三台县公安局招聘警务辅助人员60人参考考试题库及答案解析
- 保税仓介绍教学课件
- 旧楼外墙改造安全防护方案
- 字母圈sm协议书
- 2025年山东档案职称考试《档案工作实务》考试题库(浓缩500题)
评论
0/150
提交评论