新人教A版高中数学:统计案例_第1页
新人教A版高中数学:统计案例_第2页
新人教A版高中数学:统计案例_第3页
新人教A版高中数学:统计案例_第4页
新人教A版高中数学:统计案例_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章统计案例3.1 回归分析的基本思想及其初步应用第1课时线性回归模型高效演练知能提升一、选择题1 .有下列说法:线性回归分析就是由样本点去寻找一条直线,贴近这些样本点 的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以 用线性关系表示;通过回归方程;及其回归系数b,可以估计和观测变量 的取值和变化趋势;因为由任何一组观测值都可以求得一个线性回归方程,所以没 有必要进行相关性检验.其中正确说法的个数是()A. 1B. 2C. 3D. 4解析:反映的是最小二乘法思想,故正确.反映的是画散点 图的作用,也正确.反映的是回归模型y=x+“+e,其中e为随 机误差,故也正确.不正确,在

2、求回归方程之前必须进行相关性检 脸,以体现两变量的关系.答案:C2.设两个变量工和y之间具有线性相关关系,它们的相关系数 是r, y关于x的回归直线的斜率是瓦纵轴上的截距是明那么必有 ( )A. 与r的符号相同B. 与/的符号相同C. 与/的符号相反D.。与/,的符号相反解析:因为>0时,两变量正相关,此时r>0; 0V0时,两变 量负相关,此时/V0.答案:A3 .实验测得四组(X, y)的值为(1, 2), (2, 3), (3, 4), (4, 5), 则y与x之间的回归直线方程为()AAA.j=x+1B.j =x+2AAC.y=2x+1D.j=x1解析:求出样本中心(二,;

3、)代入选项检验知选项A正确.答案:A4 .设某大学的女生体重y(单位:kg)与身高单位:cm)具有线 性相关关系.根据一组样本数据,y)(i=L 2,,),用最小二A乘法建立的回归方程为y=0.85x85.7L则下列结论中不正确的是 ( )A. y与“具有正的线性相关关系B.回归直线过样本点的中心Q ,),)C.若该大学某女生身高增加1 cm,则其体重约增加085 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 解析:回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点 的中心,;,B正确;依据回

4、归方程中y的含义可知,x每变化1 个单位,y相应变化约0.85个单位,C正确;用回归方程对总体进行 估计不能得到肯定的结论,故D错误.答案:D5 . (2015福建卷)为了解某社区居民的家庭年收入与年支出的关 系,随机调查了该社区5户家庭,得到如下统计数据表:收入X/万元8.28.610.011.311.9支出y万元6.27.58.08.59.8根据上表可得回归直线方程y=Ax+a,其中。=0.76,。=)一A据此估计,该社区一户年收入为15万元家庭的年支出为()A. 1L4万元C. 12.0万元B. 11.8万元D. 122万元解析:由已知得x8.2+8.6+10.0+1L3+1L9_-=1

5、0(万兀),6.2+7.5+8.0+8.5+9.8=8(万元),故 4=80.76 X 10=04A所以回归直线方程为y=0.76x+0.4,社区一户年收入为15万元A家庭年支出为y=076x+0.4,社区一户年收入为15万元家庭支出为 y =0.76 X 15+0.4= 11.8(万元).答案:B二、填空题6 .若施化肥量x(kg)与小麦产量y(kg)之间的回归直线方程为/ = 250+4X,当施化肥量为50 kg时,预计小麦产量为 kg.解析:把 x=50 代入£=250+4r,得,=450.答案:4507 .已知X, y的取值如表所示:X0134y2.24.34.86.7若从散

6、点图分析,y与X线性相关,且£=095x+。,贝哈的值等 于.sl 1.1.2.2+43+4.8+6.7解析:戈=彳(0+1+3+4)=2, y=4.5,而回归直线方程过样本点的中心(2, 4.5),所以£ =y0.95X=4.5 - 0.95 X2=2.6.答案:2.68 .已知一个线性回归方程为;= L5x+45,其中x的取值依次为1, 7, 5, 13, 19,则=.- 1+7+5+13+19解析:* =9,因为回归直线方程过点J ,3,),所以 y = 1.5x+45 = 1.5X94-45=58.5.答案:58.5三、解答题9.某医院用光电比色计检验尿汞时,得尿汞

7、含量x(单位:mg/L) 与消光系数y读数的结果如下:尿汞含量X246810消光系数y64138205285360(1)画出散点图;(2)求回归方程.解:(1)散点图如图所示:400;.30020010005 10 15 20 %(2)由图可知y与x的样本点大致分布在一条直线周围,因此可 以用线性回归方程来拟合它.设回归方程为y =。工+ ”.: i. S ( Jr rr) ( yi- y)_h=;= 36. 95.a= y- bx= - 11. 3.S ( Xi 一久)2i= 1故所求的线性回归方程为y =3695x-11310.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份200

8、82010201220142016需求量/万吨236246257276286利用所给数据求年需求量与年份之间的回归直线方程y =bx+。;(2)利用中所求出的直线方程预测该地2018年的粮食需求量.解:(1)由所给数据看出,年需求量与年份之间是近似直线上升, 下面来求回归直线方程.为此对数据预处理如下:年份2012年-4-2024需求量257万吨-21-1101929对预处理后的数据,容易算得x =0,y=3.2.所以;(一4)X (21) + (2)X ( 11) +2X19+4X29=42+22+22+42=6.5,A _ A一a = v b Y =3.2. y 入由上述计算结果,知所求回

9、归直线方程为AAAy -257=b(x-2 012)+a=6.5(x-2 012)+3.2,A即y =6.5(x-2 012)+260.2(2)利用直线方程,可预测2018年的粮食需求量为Ay=6.5X(2 018-2 012)+260.2=6.5X6+260,2=299.2(万吨)七 300(万吨).B级能力提升1 .某学生四次模拟考试中,其英语作文的减分情况如下表:考试次数X1234所减分数y4.5432.5显然所减分数y与模拟考试次数x之间有较好的线性相关关系, 则其线性回归方程为()B. j=-0.6x+5.25A. y=0.7x+5.25C. j =-0.7x+6.25D. j=-0

10、.7x+5.25解析:由题意可知,所减分数y与模拟考试次数x之间为负相关, 所以排除A.考试次数的平均数为x=:(l+2+3+4)=2.5,所减分数的平均数为y=;(4.5+4+3+2.5)=3.5,即直线应该过点(25, 3.5),代入验证可知直线y=-0.7x+5.25 成立,故选D.答案:D2 .为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关 系,下表记录了小李某月1号到5号每天打篮球时间直单位:小时) 与当天投篮命中率y之间的关系:时间Xi2345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为,用线性回归分析的方 法,预测小李该月6号打6小时篮球的投篮命中率为

11、.解析:这5天的平均投篮命中率为 0.4+0>5+0.6+0.6+0.4y =5 =g- 1+2+3+4+5x =5=3£ ( jc,j x) ( yj y) = 0. 1 9 £ ( jq- a:)" = 10 i=li=l八 0 A A以。="=0.01,。= » 。r =0.47.iuy ”所以回归直线方程为y=0.01x+0.47当 x=6 时,j =0.01X6+0.47 =0.53.答案:0.5 0.533.某市垃圾处理厂的垃圾年处理量(单位:千万吨)与资金投入单位:千万元)有如下统计数据:分类2012 年2013 年2014

12、 年2015 年2016 年资金投入量X/ 千万元1.51.41.91.62.1垃圾处理量W 千万吨7.47.09.27.910.0(1)若从统计的5年中任取2年,求这2年的垃圾处理量至少有 一年不低于8.0千万吨的概率;(2)由表中数据求得线性回归方程为;=4x+;该垃圾处理厂计 划2017年的垃圾处理量不低于9.0千万吨,现由垃圾处理厂决策部 门获悉2017年的资金投入量约为1.8千万元,请你预测2017年能否 完成垃圾处理任务,若不能,缺口约为多少千万吨?解:(1)从统计的5年垃圾处理量中任取2年的基本事件共10个: (7.4, 7.0), (7.4, 9.2), (7.4, 7.9),

13、 (7.4, 10.0), (7.0, 9.2), (7.0, 7.9), (7.0, 10.0), (9.2, 7.9), (9.2, 10.0), (7.9, 10.0),其中垃圾处理量 至少有一年不低于8.0千万吨的基本事件有6个:(7.4, 9.2), (7.4, 10.0), (7.0, 9.2), (7.0, 10.0), (9.2, 7.9), (9.2, 10.0).所以,这2年的垃圾处理量至少有一年不低于8.0千万吨的概率L5+L4+1.9+L6+2J(2)x =17,7-4+7.0+9.2+7-9+10.0J =5=83,AA_因为直线J,=4x+过样本中心点J ,),AA

14、所以83=4X1.7+% 解得。= L5.A所以y =4r+l.5.A当 x=L8 时,j=4X1.8+1.5=8.7<9.0,所以不能完成垃圾处理任务,缺口约为03千万吨.第2课时线性回归分析高效演练知能提升A级基础巩一、选择题1.甲、乙、丙、丁四位同学各自对A, 3两变量的线性相关性 做实验,并用回归分析方法分别求得相关系数r与残差平方和m如 下表所示:分类甲乙丙Tr0.820.780.690.85m106115124103则哪位同学的试验结果体现4、B两变量有更强的线性相关性 ()B.乙A.甲C.丙D. T解析:/越接近1,相关性越强,残差平方和加越小,相关性越 强,所以选D正确.

15、答案:D 且回归方程是£=0.95x+%则当x=6时,y的预测值为()A.8.4 B. 8.3 C. 8.2 D. 8.1解析:由已知可得x0+1+2+3+42.2+4.3+4.5+4.84-6.7=4.5,所以 4.5=0.95X2+% 所以 a=2.6,所以回归方程是j=0.95x+2.6,所以当x=6时,y的预测值£=0.95X6+2.6=8.3.答案:B3 .若某地财政收入x与支出j满足线性回归模型y=法+。(单 位:亿元),其中力=0.8, a=2f lel<0.5,如果今年该地区财政收入 10亿元,年支出预计不会超过()A. 10亿元 B. 9亿元 C.

16、105亿元 D. 9.5亿元解析:x=10 时,£=0.8X10+2=10.因为lelv0.5,所以年支出预计不会超过105亿元.答案:C4 .通过残差图我们发现在采集样本点过程中,样本点数据不准确的是()A.第四个B.第五个C.第六个D.第八个解析:由题图可知,第六个的数据偏差最大,所以第六个数据不 准确.答案:C5 .如图所示,5个(X, y)数据,去掉。(3, 10)后,下列说法错误 的是()£(10,12)A.相关系数,变大8 .残差平方和变大C.相关指数改变大D.解释变量X与预报变量y的相关性变强解析:由散点图知,去掉。后,x与y的相关性变强,且为正相 关,所以变

17、大,相变大,残差平方和变小.答案:B二、填空题6.若一组观测值(ri, J1), (X2, J2),(xn9 之间满足yi= bxi+a+ei(i=l9 2, , n),且 阴恒为 0,则 R?为.解析:由4恒为0,知即y山=0,( yi yt)2故 R2 = i=1 o=.i=l答案:17 .x, y满足如下表的关系:X0.20.6L01.21.41.61.82.02.2y0.040.3611.41.92.53.23.984.82则*, y之间符合的函数模型为.解析:通过数据发现y的值与x的平方值比较接近,所以“,j 之间的函数模型为y=x2.答案:y=28 .关于“与y,有如下数据:X24

18、568y3040605070有如下的两个模型:(l)y=6.5x + 17.5; (2)y=7x+17.通过残差 分析发现第个线性回归模型比第个拟合效果好.则R Ri, 2i0(用大于,小于号填空,R,。分别是相关 指数和残差平方和).解析:根据相关指数和残差平方和的意义知此,犯,0V0.答案: V三、解答题9 .某服装店经营某种服装,在某周内纯获利y(单位:元)与该周 每天销售这种服装件数”之间的一组数据如下表:X3456789y 66 69 73 81 89 90 91求样本点的中心;画出散点图;求纯获利y与每天销售件数x之间的回归方程.解:(l)x=6,),Q7986,即样本点的中心为(

19、6, 79.86).散点图如图所示:"元 90 80 -70 .60 °O匕1;8一 件7A J=1(XLX)(3)因为为=7«4.75,Zj.i(XLX)2a =y-bx51.36,所以j =4.75x4-51.36.10.关于x与y有以下数据:X24568y3040605070已知X与y线性相关,由最小二乘法得1=65(1)求y与x的线性回归方程;(2)现有第二个线性模型:j=7x+17,且R2=o.82.若与的线 性模型比较,哪一个线性模型拟合效果比较好,请说明理由.AA解:(1)依题意设y与x的线性回归方程为j=6.5x+”._ 24-4+5+6+8_ 3

20、0+40+60+50+70_ , Ax =5, y =50,因为y =6.5x+。经过(X , y ),所以y与x的线性回归方程为y =6.5x+17.5 .所以 50=6.5X5+。.所以 = 17.5.(2)由的线性模型得yM与一丁的关系如下表所示:y-yi0.5-3.510-6.50.5y-20-1010020所以 £( Vi- V)2 = 155.2( Vi-y)2 = l 000.i= 1i= 1t ( ")2 _所以 R2 = l q -=1悬=0.845.乙(y 一了六i=i由于用=0.845, R2=o.82知出k,所以的线性模型拟合效果比较好.B级能力提升

21、L根据如下样本数据:X34567y4.02.50.50.52.0得到的回归方程为,=以+,若=7.9,则x每增加1个单位, 就()A.增加1.4个单位B.减少L4个单位C.增加L2个单位D.减少L2个单位解析:易知x=Jx(3+4+5+6+7)=5,J=lx (4+2.5-0.5+0.5-2)=0.9,所以样本点中心为0.9),所以0.9=5。+7.9,所以。=一1.4,所以x每增加1个单位,y就减少L4个单位.故选B.答案:B2.若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为,回归平方和为解析:因为火2=1一残差平方和总偏差平方和'0. 95=189

22、总偏差平方和'所以总偏差平方和为1 780;回归平方和=总偏差平方和一残差平方和=1 780-89=1 691.答案:1780 16913.某运动员训练次数与成绩之间的数据关系如下:次数X3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数相;(5)试预测该运动员训练47次及55次的成绩.解:(1)作出该运动员训练次数()与成绩之间的散点图,如图 所示,由散点图可知,它们之间具有线性相关关系.y6()5()40302010204060次数工656, E xiyi =F =39.25, 7=40.

23、875, 2 芯="=13 180, _ S -8 x v 所以否=-一 =1.041 5,S xf 8 j?AAa = y b x =-0.003 88.所以回归方程为y = L0415X-0.003 88.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.-1-1.5(4)计算得相关指数r2=0985 5,说明了该运动员的成绩的差异 有98.55%是由训练次数引起的.(5)由上述分析可知,我们可用回归方程y = L041 5x-0.003 88 作为该运动员成绩的预报值.将x=47和x=55分别代入该方程可得yQ49和y257.故预测该运动

24、员训练47次和55次的成绩分别为49和57.3.2独立性检验的基本思想及其初步应用高效演练知能提升A级基础巩固一、选择题1 .下面是2X2列联表:变量J1yi总计X1a2173X222527总计b46100则表中m 的值分别为()A. 94, 96 B. 52, 50 C. 52, 54 D. 54, 52 解析:因为“+21=73,所以。=52,又。+2=所以6=54. 答案:C2 .在独立性检测中,若有99%的把握认为两个研究对象I和H 有关系,则心的取值范围是()A. 3.841, 5.024)B. 5.024, 6.635)C. 6.635, 7.879)D. 7.879, 10.82

25、8)解析:查表可知选C.答案:C3.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影 部分表示喜欢理科的百分比,从图可以看出()09876543210 1000 009000A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:从等高条形图可以看出,男生比女生喜欢理科的可能性大 些.答案:C4 .在吸烟与患肺病这两个分类变量的计算中,下列说法正确的 是( )若K2的观测值满足好26.635,我们有99%的把握认为吸烟 与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 从独立性检验可知有99%的把握认为吸烟与患病

26、有关系时,我们说 某人吸烟,那么他有99%的可能患有肺病;从统计量中得知有95% 的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现 错误.A.B.C.D.解析:推断在100个吸烟的人中必有99人患有肺病,说法错 误,排除A、B,正确.排除D,所以选项C正确.答案:C5 .通过随机询问110名性别不同的大学生是否爱好某项运动, 得到如下表的列联表:喜好程度男女总计爱好402060不爱好203050总计6050110算得, (ad-be) 2(+。) (c+力) (a+c) (A+d)110 X (40X30-20X204 2 k =60X50X60X507,8,附表:尸(心/)0.0

27、500.0100.001ko3.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0的前提下,认为“爱好该项运 动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运 动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解析:由左心7.8及尸体226.635)=0.010可知,在犯错误的概率 不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有 99%以上的把握认为“爱好该项运动与性别有关”.答案:C二、填空题6 .下列关于K的说法中,正确的有.昭的值越大,两个分类变量的相

28、关性越大;若求出昭=4>3.841,则有95%的把握认为两个分类变量有 关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错 误;独立性检验就是选取一个假设册条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现 象,则做出拒绝的推断.解析:对于,M的值越大,只能说明我们有更大的把握认为 二者有关系,却不能判断相关性大小,故错误;根据独立性检验的概念和临界值表知正确.答案:7 .某小学对232名小学生调查发现:180名男生中有98名有多 动症,另外82名没有多动症,52名女生中有2名有多动症,另外50 名没有多动症,用独立性检验的方法判断多动症与性别(

29、填 “有关”或“无关”).解析:由题目数据列出如下列联表:性别多动症无多动症总计男生9882180女生25052总计100132232由表中数据可看到232X (98X50-82X2)180X52X100X132«42.117> 10.828.所以,在犯错误的概率不超过0.001的前提下,认为多动症与性 别有关系.答案:有关8 .某卫生机构对366人进行健康体检,其中某项检测指标阳性 家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有的把握认为糖尿病患者与遗传有关系.解析:先作出如下糖尿病患者与遗传列联表(单位:人):家族糖

30、尿病发病糖尿病不发病总计阳性家族史1693109阴性家族史17240257总计33333366根据列联表中的数据,得到 K 的观测值为k =366X (16X240-17X93)2l1 n。Yc*6.067 >5.024.故我们有 97.5% 的把握认为糖尿病患者与遗传有关系.答案:97.5%三、解答题9 .为考察某种药物预防疾病的效果进行动物试验,得到如下列 联表:分类患病未患病总计服用药104555未服用药203050总计3075105试用等高条形图分析服用药和患病之间是否有关系.解:根据列联表所给的数据可得出服用药患病的频率为获七0.18,未服用药患病的频率为高=04,两者的差距是

31、1018041=0.22,两者相差很大, 作出等高条形图如图所示,19876543210 O.SO.O.SSO.O.S因此服用药与患病之间有关系的程度很大.10 .某大型企业人力资源部为了研究企业员工工作积极性和对待 企业改革态度的关系,随机抽取了 189名员工进行调查,所得数据如 下表所示:工作态度积极支持企业 改革不太赞成企业 改革总计工作积极544094工作一般326395总计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?李明对该题进行了独立性检验的分析,结论是“在犯错误的概率 不超过0005的前提下,认为企业员工的工作积极性和对待企业改革 的态度有关系”.他的结

32、论正确吗?解:由列联表中的数据求得K2的观测值为710.759.189X (54X6340X32)=94X95X86X103""因为 10,759>7,879,所以在犯错误的概率不超过0.005的前提下认为企业员工的工作 积极性和对待企业改革的态度有关系.所以李明的结论正确.B级能力提升1.有两个分类变量X,山 其2X2列联表如下表.其中m 15 一。均为大于5的整数,若在犯错误的概率不超过0.1的前提下认为“”与)之间有关系”,则a的取值应为()变量J2XIa20-aX215a30+。A.5或6B. 6或7C. 7 或8D. 8 或 9解析:查表可知,要使在犯错误的概率不越过0的前提下,认 为驳2之间有关系,则 Ki > 2.706,而炉= 658(30+。)一(20)(15。)F _ 13

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论