第八章 章末复习课_第1页
第八章 章末复习课_第2页
第八章 章末复习课_第3页
第八章 章末复习课_第4页
第八章 章末复习课_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章末复习课一、变量的相关性1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.2.在学习该部分知识时,体会直观想象和数学运算的素养.例1(1)下列两个变量具有相关关系且不是函数关系的是()A.圆的半径与面积B.匀速行驶的车辆的行驶距离与时间C.庄稼的产量与施肥量D.人的身高与视力答案C解析对于A,圆的半径与面积是确定的关系,是函数关系;对于B,匀速行驶的车辆的行驶距离与时间是确定的关系,是函数关系;对于C,庄稼的产量与施肥量在一定范围内有相关关系,不是函数关系;对于D,人的身高与视力,不具有相关关系,也不是函数关系.故选C.(2)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为________.答案-1解析方法一eq\x\to(x)=1.5,eq\x\to(y)=1,eq\i\su(i=1,4,x)eq\o\al(2,i)=22,eq\i\su(i=1,4,y)eq\o\al(2,i)=56,eq\i\su(i=1,4,x)iyi=-20,样本相关系数r=eq\f(-20-4×1.5×1,\r(22-4×1.5256-4×12))=-1.方法二观察四个点,发现其在一条单调递减的直线上,故y与x的样本相关系数为-1.反思感悟变量相关性的判断的两种方法(1)散点图法:直观形象.(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.跟踪训练1(1)已知变量x和y满足关系y=-2x+1,变量y与z正相关,下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C解析根据题意,变量x和y满足关系y=-2x+1,其比例系数为-2<0,所以x与y负相关;又由变量y与z正相关,则x与z负相关.故选C.(2)如图所示,给出了样本容量均为7的A,B两组成对样本数据的散点图,已知A组成对样本数据的样本相关系数为r1,B组成对样本数据的样本相关系数为r2,则()A.r1=r2 B.r1<r2C.r1>r2 D.无法判定答案C解析根据A,B两组成对样本数据的散点图知,A组成对样本数据几乎在一条直线上,且成正相关,∴样本相关系数为r1应最接近1,B组成对样本数据分散在一条直线附近,也成正相关,∴样本相关系数为r2,满足r2<r1,即r1>r2,故选C.二、一元线性回归模型及其应用1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.2.主要培养数学建模和数据分析的素养.例2一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:人数xi10152025303540件数yi471215202327其中i=1,2,3,4,5,6,7.(1)以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;(2)求经验回归方程;(结果保留到小数点后两位)(3)预测进店人数为80时商品销售的件数.(结果保留整数)参考公式:经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).解(1)由表中数据,画出7个数据点,可得散点图如图所示.(2)∵eq\i\su(i=1,7,x)iyi=3245,eq\x\to(x)=25,eq\x\to(y)≈15.43,eq\i\su(i=1,7,x)eq\o\al(2,i)=5075,7eq\x\to(x)2=4375.∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,7,x)iyi-7\x\to(x)·\x\to(y),\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)≈0.777,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-4.00.∴经验回归方程是eq\o(y,\s\up6(^))=0.78x-4.00.(3)进店人数为80时,商品销售的件数eq\o(y,\s\up6(^))=0.78×80-4.00≈58(件).反思感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的经验回归方程解决实际问题.跟踪表:房屋面积/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据对应的散点图;(2)求经验回归方程;(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.解(1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.(2)由(1)知y与x具有线性相关关系,可设其经验回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),依据题中的数据,可得出eq\x\to(x)=eq\f(1,5)eq\i\su(i=1,5,x)i=109,eq\i\su(i=1,5,)(xi-eq\x\to(x))2=1570,eq\x\to(y)=eq\f(1,5)eq\i\su(i=1,5,y)i=23.2,eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=308,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,5,)xi-\x\to(x)2)=eq\f(308,1570)≈0.1962,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)≈23.2-0.1962×109=1.8142.故所求经验回归方程为eq\o(y,\s\up6(^))=0.1962x+1.8142.(3)由(2)知当x=150时,销售价格的估计值为eq\o(y,\s\up6(^))=0.1962×150+1.8142=31.2442(万元).故当房屋面积为150m2时,估计销售价格是31.2442万元.三、非线性经验回归方程1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.2.体现数学建模的优劣,提升数据分析的素养.例3某公司为确定下一年度投入产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(wi-eq\x\to(w))2eq\i\su(i=1,8,)(xi-eq\x\to(x))(yi-eq\x\to(y))eq\i\su(i=1,8,)(wi-eq\x\to(w))(yi-eq\x\to(y))46.65636.8289.81.61469108.8注:表中wi=eq\r(xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)根据散点图判断,eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x与eq\o(y,\s\up6(^))=eq\o(c,\s\up6(^))+eq\o(d,\s\up6(^))eq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y之间的关系为z=0.2y-x,根据(2)的结果回答下列问题.①当年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的估计值最大?解(1)由散点图可以判断,eq\o(y,\s\up6(^))=eq\o(c,\s\up6(^))+eq\o(d,\s\up6(^))eq\r(x)适宜作为年销售量y关于年宣传费x的回归方程模型.(2)令w=eq\r(x),先建立y关于w的经验回归方程.由于eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=eq\x\to(y)-eq\o(d,\s\up6(^))eq\x\to(w)=563-68×6.8=100.6,所以y关于w的经验回归方程为eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的估计值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6,年利润z的估计值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的估计值eq\o(z,\s\up6(^))=0.2×(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12,所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故当年宣传费为46.24千元时,年利润的估计值最大.反思感悟非线性经验回归方程的求解策略(1)本例中,y与x不是线性相关关系,但通过wi=eq\r(xi),转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪训练3电容器充电达到某电压值时作为时间t的计算原点,此后电容器串联一电阻放电,测定各时间的电压值(U)所得数据见下表:t(h)012345678…U(V)100755540302015105…设U与t之间具有近似关系U≈U0e-αt(U0,α为常数,e≈2.71828…),求U对t的回归方程.解对U≈U0e-αt两边取自然对数,得lnU≈lnU0-αt.令z=lnU,eq\o(a,\s\up6(^))=lnU0,eq\o(b,\s\up6(^))=-α,则eq\o(z,\s\up6(^))≈eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t.将U的各数据代入z=lnU,求得:t012345678…z4.6054.3174.0073.6893.4012.9962.7082.3031.609…eq\o(b,\s\up6(^))≈-0.3553,eq\o(a,\s\up6(^))≈4.714,所以eq\o(z,\s\up6(^))=4.714-0.3553t,即lnU=4.714-0.3553t,所以U=e4.714-0.3553t.故所求回归方程为U≈e4.714-0.3553t.四、独立性检验1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.例4奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(2)依据小概率值α=0.01的独立性检验,能否据此推断该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.解(1)由题意,男生抽取6×eq\f(20,20+10)=4(人).(2)零假设H0:该校高中生是否愿意提供志愿者服务与性别无关.则χ2=eq\f(60×20×20-10×102,30×30×30×30)≈6.667>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,可以认为该校高中生是否愿意提供志愿者服务与性别有关.反思感悟独立性检验问题的求解策略(1)等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两个变量的相关性.(2)通过公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)先计算χ2,再与临界值表作比较,最后得出结论.跟踪训练4考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试分析依据小概与小麦发生黑穗病有关?解零假设H0:种子灭菌与小麦发生黑穗病无关.由列联表的数据可求χ2=eq\f(460×26×200-184×502,76×384×210×250)≈4.804>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,可以认为种子灭菌与小麦发生黑穗病有关系.1.(2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\x\to(x))2=80,eq\i\su(i=1,20,)(yi-eq\x\to(y))2=9000,eq\i\su(i=1,20,)(xi-eq\x\to(x))(yi-eq\x\to(y))=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:样本相关系数r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2\i\su(i=1,n,)yi-\x\to(y)2)),eq\r(2)≈1.414.解(1)由已知得样本平均数为eq\x\to(y)=eq\f(1,20)eq\i\su(i=1,20,y)i=60,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(xi,yi)(i=1,2,…,20)的相关系数为r=eq\f(\i\su(i=1,20,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,20,)xi-\x\to(x)2\i\su(i=1,20,)yi-\x\to(y)2))=eq\f(800,\r(80×9000))=eq\f(2\r(2),3)≈0.94.(3)分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论