版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习课
知识网络
最小二
经脸回
归方程
成
对
数
据
分类
变量
教学突破
一、变量的相关性
1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散
点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.
2.在学习该部分知识时,体会直观想象和数学运算的素养.
例1.下列两个变量之间的关系是相关关系的为
A.正方体的体积与棱长的关系
B.学生的成绩和体重
C.路上酒后驾驶的人数和交通事故发生的多少
D.水的体积和重量
R解析》A中,由正方体的校长和体积的公式知,v=/m>o),是确定的函数关系,故A
错误;
B中,学生的成绩和体重,没有关系,故B错误;
C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关
性,故C正确;
D中,水的体积V和重量X的关系为是确定的函数关系,故D错误.
K答案Xc
反思感悟变量相关性的判断的两种方法
⑴散点图法:直观形象.
⑵公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,M
=1,且当r=1时,正相关;r=—1时,负相关.
跟踪训练1.有以下五组变量:
①某商品的销售价格与销售量;
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮销售量:
⑤电瓶车的重最和行驶每千米的耗电量.
其中两个变量成正相关的是
A.①③B.②®
C.②⑤D.@@
K解析》对于①,一般情况下,某商品的销售价格与销售量成负相关关系;
对于②,学生的学籍号与学生的数学成绩没有相关关系;
对于③,一•般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系:
对于④,一般情况下,气温与冷饮销售量成正相关关系;
对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中
两个变量成正相关的序号是④⑤.
R答案》D
二、一元线性回归模型及其应用
I.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际
问题做出预测和分析.
2.主要培养数学建模和数据分析的素养.
例2.某运动员训练次数与运动成绩之间的数据关系如下:
次数X3033353739444650
成绩y3034373942464851
(1)作出散点图;
(2)求出回归直线方程;
(3)计算相关系数并进行相关性检验;
(4)试预测该运动员训练47次及55次的成绩.
解:(I)作出该运动员训练次数/与成绩),之间的散点图,如图所示,由散点图可知,它们
之间具有线性相关关系.
y
60|
50|-
协
如
加
心
0204060*
(2)列表计算:
次数N成绩yiX?
3030900900900
3334108911561122
3537122513691295
3739136915211443
3942152117641638
4446193621162024
4648211623042208
5051250026012550
由上表可求得x=39.25,),=40.875,
8
£3=12656,
1=1
88
%?=13731,£^-=13180,
J=lf=l
8____
E-ViV/-8xV
1=1
:・b=—;----------1.0415,
》?一8x2
i=i
a=y—bx=—().(X)388:
,回归直线方程为y=1.0415.r-0.00388.
⑶计算相关系数r=0.9927,因此运动员的成绩和训练次数两个变量有较强的相关关系.
(4)由上述分析可知,我们可用回归直线方程>,=1.0415X-O.OO388作为该运动员成绩的预
报值.
将尸47和x=55分别代入该方程可得产49和产57.故预测该运动员训练47次和55次的成
绩分别为49和57.
反思感悟解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相
关关系;在此基础上,利用最小二乘法求I可归系数,然后写出经验回归方程.
(3)回归分析•.画残差图或计算R2,进行残差分析•.
⑷实际应用.依据求得的经验回归方程解决实际问题.
跟踪训练2.下表是一位母亲给儿子作的成长记录:
年龄/周岁3456789
身高/cm90.897.6104.2110.9115.6122.0128.5
年龄/周岁10111213141516
身高/cm134.2140.8147.6154.2160.9167.5173.0
(1)年龄和身高之间具有怎样的相关关系?
(2)如果年龄(3周岁〜16周岁之间)相差5岁,其身高有多大差异?
⑶如果身高相差20cm,其年龄相差多少?
一1
解:(1)设年龄为x,身高为y,则x=亦3+4+...+15+16)=9.5,
y=e(90.8+97.6+…+167.5+173.0)-131.9857,
14
工x?=l491,工)彳=252958.2,2为%=18990.6,14xy-17554.1,
14..14_
•••工人一14(X)2=227.5,-14(y六9075.05.
14__
工x"—14xy=1436.5,
14_______
14xy
**r=~/14-Z~_I14-ZT-
yz而—14(x工)孑.14(y)2
1436.5八…r
=>/227.5x而075.054
因此,年龄和身高之间具有较强的线性相关关系.
14_______
Lxiyi-14A),]4365
⑵由(1)得b=--------^―="7—314,
Z第一14(.丫产3°
a=y-bx=131.9857-6.314x9.5=72,
Ax与y的线性回归方程为),=6.314x+72.
因此,如果年龄相差5岁,那么身高相差6.3l4x5=3L57(cm).
2()
(3)如果身高相差20cm,年龄相差而于3.168=3(岁).
三、非线性经验回归方程
1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合
样本数据,再通过代数变换,把非线性问题线性化.
2.体现数学建模的优劣,提升数据分析的素养.
例3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到
的数据如下:
零件的个数M个)2345
加工的时间y(小时)2.5344.5
⑴在给定的坐标系中画出表中数据的散点图;
⑵求出),关于工的线性回归方程£=源+2,并在坐标系中画出回归宜线;
(3)试预测加工10个零件需要多少小时?
Y/dyi-nxy
A'1A—A—
(注:b=-----------------,a=y-bx)
r=1
解:(1)散点图如图.
r
5
4
3
2
1
012345
(2)由表中数据得:力5=52.5,
A=3.5,y=3.5,£x?=54,
i=l
・,工=0.7,・J=1.05,
(3)将x=10代入线性回归方程,
得£=0.7x10+1.05=8.05,
故预测加工10个零件约需要8.05小时.
反思感悟非线性经验回归方程的求解策略
(1)本例中,y与x不是线性相关关系,但通过拗=«,转换为卬与),的线性相关关系,从
而可利用线性回归分析间接讨论y与x的相关关系.
⑵可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模
型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.
跟踪训练3.测得某国10对父子身高(单位:英寸)如下:
父亲身高(x)6062646566
儿子身高(y)63.665.26665.566.9
父亲身高。)6768707274
儿子身高G)67.167.468.370.170
⑴画出散点图;
⑵如果),与x之间具有线性相关关系,求回归方程:
⑶如果父亲的身高为73英寸,估计儿子的身高.
解:⑴
儿子身高/英寸
71■
70-••
69-
68-.,
67--,
66-,,
65-・
64-.
63586062646668707274父亲身高/英寸
⑵从散点图看出,样本点散布在一条直线附近,因此两个变量呈线性相关关系.
设回归方程为;=
x=66.8,y=67.01,
__10
X2=4462.24,yM490.34,工召=44794,
ioio
£)*=44941.93,Z孙=44842.4,
通一10xy
,A_/=I______________44842.4—44762.6879.72/
由"=44794-44622,4=~nT^Ab46-
Xx?-io(7)2
a=~y~b~x=67.01-0.4646*66.%35.97.
故所求的回归方程为£=04646.v+35.97.
(3)当K=73时,y=0.4646x73+35.97U69.9.
所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.
四、独立性检验
1.主要考查根据样本制作2x2列联表,由2x2列联表计算:查表分析并判断相关性结论
的可信程度.
2.通过计算z2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
例4.某学校高三年级有学生1000名,经调查研究,其卜750名同学经常参加体育锻炼(称
为A类同学),另外250名同学不经常参加体育锻炼(称为8类同学).现用分层抽样方法(按
4类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165cm作为达标的
标准,对抽取的100名学生,得到以下列联表:
体育锻炼与身高达标2x2列联表
身高达标身高不达标总计
积极参加体育锻炼40
不积极参加体育锻炼15
总计100
(1)完成上表;
(2)请问体育锻炼与身高达标是否有关系(/值精确到0.01)?
______〃1以一儿)2______
参考公式:/=
(4+3(c+d)m+c)3+〈/y
解:⑴
身高达标身高不达标总计
积极参加体育锻炼403575
不积极参加体育锻炼1()1525
总计5050100
(2)根据列联表得
,100x(40x15-35x10)2
/=75x25x50x50-133<2.706,
所以没有充分的理由说明体育锻炼与身高达标有关系.
反思感悟独立性检验问题的求解策略
⑴等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两
个变量的相关性.
(2)通过公式三二先计算/,再与临界值表作比较,最后得出结论.
3+b)(c+rf)(a+c)S+")
跟踪训练4.考察黄烟经过药物处理跟发生青花病的关系,得到如下数据:在试验的470株黄
烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的
有185株发生青花病,200株没有发生青花病.试推断经过药物处理跟发生青花病是否有关
系.
解:由已知得到下表:
药物处理未经过药物处理总计
青花病25185210
无青花病60200260
总计85385470
假设经过药物处理跟发生青花病无关.
根据2x2列联表中的数据,可以求得笊孩常,鼠60忆97瓯
因为/>6.6.35,
所以我们有99%的把握认为经过药物处理跟发生青花病是有关系的.
当堂检测
1.每一吨铸铁成本),(元)与铸件废品率.1%建立的经验回归方程为;=56+8大,下列说法正确
的是()
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
K答案HC
2.对于给定的两个变量的统计数据,下列说法正确的是()
A.都可以分析出两个变量的关系
B,都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
K答案Xc
R解析X给出一组样本数据,总可以作出相应的散点图,故C正确;但不一定能分析出两
个变量的关系,故A错误;更不一定符合线性相关,不一定能用一条直线近似的表示,故B
错误;两个变量的统计数据不一定具有函数关系,故D错误.
3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如
下统计数据表:
收入x(万元)8.28.610.011.311.9
支出y(万元)6.27.58.08.59.8
根据上表可得回归直线方程£=源+2其中2=0.76,号亍一.据此估计,该社区一户年
收入为15万元家庭的年支出为万元.
R答案U11.8
R解析H由题意知,
—8.2+8.6+10.0+11.3+11.9
x=c=10,
—6・2+7.5+8.0+8・5+9.8
y=--------------s--------------=8,
•1=8-0.76x10=0.4,
:.当x=15时,y=0.76x15+0.4=11.8(万元).
4.根据如下样本数据
X345678
y4.02.5-0.50.5-2.0-3.()
得到的回归方程为£=法+小则
K答案U。乂),b<0
K解析》作出散点图如下:
观察图象可知,回归直线产取十。的斜率力<0,当x=0时,y=a>0做〃>0,b<0.
5.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52
名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是
表1
成绩
性别、不及格及格总计
男61420
女102232
总计163652
表2
视力
好差总计
性别
男41620
女122032
总计163652
表3
、、智商
性别、偏高正营总计
男81220
女82432
总计163652
表4
阅读量
丰富不丰富总计
性别
男14620
女23032
总计163652
K答案H阅读量
R解析?表1中,a=6,8=14,c=10,d=22,a+》=20,c+d=32,〃+c=16,b+d
36,〃=52,
,_52x(6x22—14xl0尸—13
-20x32x16x36-=I440'
表2中,a=4,b=16,c=12,d=2U,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
52x(4x20—16X12)2_637
丈=-20x32x16x36~~=360'
表3中,<s=8»b=12,c=8>t/=24,a+〃=20,c+d=32,a-\rc=16»/?+c/=36»H=52,
,_52X(8X24-12X8)2_13
/=20x32x16x36
表4中,a=14,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年《左公柳》教学设计
- 11.2 《与妻书》教学设计 统编版高一语文必修下册
- 2025-2026学年蟾蜍蛋糕教学设计
- 18.中学遐想 (教学设计)六年级下册心理健康同步备课系列苏科版
- 2021春七年级语文下册 第五单元 心灵絮语 21 古代诗歌五首教案 新人教版
- 2025-2026学年教学设计中句号的作用
- 室内石材结晶养护施工方案
- 2025-2026学年了解江西教案
- 企业会议纪要标准格式模板
- 2025-2026学年画儿朵朵教学设计
- 民间协会档案管理办法
- 酒店泳池安全培训
- 【课件】用统计图描述数据课件+2024-2025学年人教版数学七年级下册
- JG/T 491-2016建筑用网格式金属电缆桥架
- GB/T 17642-2025土工合成材料非织造布复合土工膜
- 基于电磁感应原理的旋转设备转速精确测量技术研究
- 珠海市地表水环境功能区划修编-文本附图-2009-5
- 特种设备重大事故隐患判定准则图解
- 2023CSCO免疫检查点抑制剂临床应用指南
- 医疗应急演练桌面推演
- 2024秋期国家开放大学本科《商法》一平台在线形考(形成性考核作业一至四)试题及答案
评论
0/150
提交评论