第3讲变量间的相关关系、统计案例_第1页
第3讲变量间的相关关系、统计案例_第2页
第3讲变量间的相关关系、统计案例_第3页
免费预览已结束,剩余32页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3讲变量间的相关关系、统计案例最新耆纲考向预测“1会利 Hint点 ITIM 侃业城何帕棚戈it IL2.小二聲法的理雄.能紀祉幽出的藝淫糾归方樫累数贡式锻住堆性v TWiH -件核临训W程恿箱.歩圧用H切步I Ufi.4厂需阿门竹析的皓*思战I,厅茁堆咼单前屮,独4枚艮令国雅氏帶市点苛杳的肉种. 愿丐 讦制寒断 选持氐 圳专爾中吐合細理.主要等 豪風归Zrfi.相賞棗4L利用恻和厅段査廿Biih 立性脸Ifc的尼厲專一履心註学建也,敕男分斬J走进教材一、知识梳理1. 相关性线性相关若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,此时可用一条直线来拟合.

2、(2) 非线性相关若两个变量x和y的散点图中,所有点看上去都在某条曲线_(不是一条直线)附近波动, 则称此相关为非线性相关,此时可用一条曲线来拟合.不相关如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2. 最小二乘法(1) 最小二乘法如果有n个点(Xi,yi),(X2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直 线 y= a + bx 的接近程度:M (a+ bxi)2+(a + bx2)2 + + yn (a+ bxn)2,使得上式达到最小值的直线y= a+ bx即为所求直线,这种方法称为最小二乘法.(2) 线性回归方程nn刀(xi x )( yi y )Ex

3、iyi n i = ii = i线性回归方程为 y= bx+ a,其中b= n二=n二 ,a=二刀(xi x ) 2Ex2 n x2i = ii = ibx.3. 相关系数r(2)当r 0时,称两个变量正相关.当rv 0时,称两个变量负相关.当r = 0时,称两个变量线性不相关.r的绝对值越接近于1,表明两个变量之间的线性相关程度越高;r的绝对值越接近 0,表明两个变量之间的线性相关程度越低.4. 独立性检验设A, B为两个变量,每一个变量都可以取两个值,变量A: Ai, A2 = Ai;变量B: Bi,B2= Bi,通过观察得到下表所示数据:B1B2总计A1aba+ bA2cdc+ d总计a

4、 + cb+ dn = a + b+ c+ d则*( a+b)(dm ;)( b+,用它的大小来检验变量之间是否独立. 当XW2.706时,没有充分的证据判定变量A, B有关联,可以认为变量 A, B是没有关联的; 当X 2.706时,有90%的把握判定变量 A, B有关联; 当X 3.841时,有95%的把握判定变量 A, B有关联; 当X 6.635时,有99%的把握判定变量 A, B有关联.常用结论1. 求解线性回归方程的关键是确定回归系数a, b,应充分利用线性回归直线过样本中心点(x , y ).2. 根据X的值可以判断两个分类变量有关的可信程度,若X越大,则两分类变量有关的把握越大

5、.3根据线性回归方程计算的 y值,仅是一个预报值,不是真实发生的值.、教材衍化1 为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 ()A.回归分析B .均值与方差C.独立性检验D .概率解析:选C“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.2 .下面是2 X 2列联表:y1y2合计X1a2173X2222547合计b46120则表中a, b的值分别为()A. 94, 72B. 52, 50C. 52, 74D. 74, 52解析:选C.因为a + 21= 73,所以a =

6、 52又a+ 22= b,所以b= 74.3. 某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x681012y2356则y对x的线性回归直线方程为()B . y = 2.3x+ 0.7D . y= 0.7x+ 2.3A . y = 2.3x 0.76+ 8 + 10+ 12=9,C. y = 0.7x 2.34解析:选 C.因为 Xiyi = 6X 2 + 8X 3+ 10X 5+ 12X 6= 158, xi = 12 + 3 + 5+ 6158 4X 9 X 4=4.所以 b= 0.7, a = 4 0.7X 9= 2.3.故线性回436 + 64 + 100+ 14

7、4 4X 81归直线方程为y= 0.7x 2.3.故选C.走出误区一、思考辨析判断正误(正确的打“V”,错误的打“X”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4) 事件X, Y的关系越密切,由观测数据计算得到的X的观测值越大.()(5) 通过线性回归方程 y= bx+ a可以估计和观测变量的取值和变化趋势.()答案:(1)X (2) V (3) V (4) V (5) V二、易错纠偏常见误区|K (1)混淆相关关系与函数关系;(2

8、) 对独立性检验 X值的意义不清楚;(3) 不知道线性回归直线必过样本点中心.1. 两个变量的相关关系有正相关,负相关,不相关,则下列散点图从左到右分C.D .解析:选D.第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是 2. 某医疗机构通过抽样调查 (样本容量n = 1 000),利用2 X 2列联表和X统计量研究患 肺病是否与吸烟有关.计算得 X= 4.453,经查阅临界值表知 P( 3.841)衣0.05,现给出四 个结论,

9、其中正确的是()A .在100个吸烟的人中约有 95个人患肺病B .若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D .只有5%的把握认为“患肺病与吸烟有关”解析:选C.由已知数据可得,有1 0.05= 95%的把握认为“患肺病与吸烟有关”.故 选C.3. 某车间为了规定工时定额, 需要确定加工零件所花费的时间,为此进行了 5次试验.根据收集到的数据(如下表),由最小二乘法求得线性回归方程为y= 0.67x+ 54.9.零件数X/个1020304050加工时间y/mi n62o758189现发现表中有一个数据模糊看不清,则该数据为 m+ 307解析:设表中那

10、个模糊看不清的数据为m.由表中数据得x = 30, y =,所以样5本点的中心为30,讣 ,因为样本点的中心在线性回归直线上,所以 讣;07 = 0.67X 3055+ 54.9,解得 m = 68.答案:68考点相关关系的判断(自主练透)1.对变量x, y有观测数据(xi, yi)(i= 1, 2,,10),得散点图如图,对变量 有观测数据(Ui, vi)(i= 1, 2,10),得散点图如图由这两个散点图可以判断(-F*1 , , *| 0i 0 13 14 5 6 7 -CDu与v正相关A .变量x与y正相关,B .变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D .变

11、量x与y负相关,u与v负相关解析:选C.由散点图可得两组数据均线性相关,且图的线性回归方程斜率为负的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.2.某公司在2019年上半年的月收入 x(单位:万元)与月支出y(单位:万元)的统计资料 如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,则()A.月收入的中位数是15,B.月收入的中位数是17,C.月收入的中位数是16,D.月收入的中位数是16,x与y有正线性相关关系x与y有负线性相关关系x与y有正线性

12、相关关系x与y有负线性相关关系解析:选C.月收入的中位数是 苇卫=16,收入增加,支出增加,故x与y有正线性相关关系.3变量 X 与 Y 相对应的一组数据为(10 , 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量 U 与 V 相对应的一组数据为(10 , 5), (11.3, 4), (11.8, 3), (12.5, 2) , (13 , 1). n 表示变量Y与X之间的线性相关系数,匕表示变量V与U之间的线性相关系数,则()A. r2ri0B. 0r2riC. r200 ;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即20,故选

13、C.判断相关关系的2种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.相关系数法:利用相关系数判定,当|r|越趋近于1时,相关性越强.考点回归分析(多维探究)角度一线性回归方程及其应用(2020福建福州模拟)随着我国中医学的发展,多每年春暖以后至寒冬前,是昆虫大量活动与繁殖的季节,药用昆虫的使用相应愈来愈易于采集各种药用昆虫.已知一只药用昆虫的产卵数 y(单位:个)与一定范围内的温度 x(单位:C )有关,于是科研人员在3月份的31天中随机挑选了 5天进行研究,现收集了该种药用昆虫的5组观测数据如

14、表:日期2日7日15日22日30日温度x/ C101113128产卵数y/个2325302616(1)从这5天中任选2天,记这两天药用昆虫的产卵数分别为m, n,求事件m, n均不小于25”的概率;(2)科研人员确定的研究方案是:先从这五组数据中任选 2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.(i) 若选取的是3月2日与30日的两组数据,请根据3月7日、15日和22日这三天的数据,求出y关于x的线性回归方程;(ii) 若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问(i)中所得的线性回归方程是否可靠?

15、附:线性回归直线的斜率和截距的最小二乘估计公式分别为b =n_刀(Xi - X )( yi - y )i =1,a= y b xn刀(Xi X ) 2 i= 1【解】(1)依题意得,m, n的所有情况有23 , 25, 23 , 30, 23 , 26, 23 ,16,25 , 30 , 25 , 26 , 25 , 16, 30 , 26 , 30 , 16 , 26 , 16,共 10 个.设“ m , n均不小于25”为事件A,则事件A包含的基本事件有25 , 30 , 25 , 26,30 , 26,共 3 个.所以P(A)= 13,即事件A的概率为 器(2) (i)由数据得 7 =

16、12 , 了 = 27 ,3_3_2(Xi x )(yi y )= 5 ,(xi x ) = 2 ,i = 1i = 1寿lBbAiK -y) c所说畀 二鼻 (乳-jc)21=1 15a= y b x = 27 孑 12= 3 ,5 所以y关于x的线性回归方程为y= x 3.5(ii)由(i)知,y关于x的线性回归方程为 y=3 ,5当 x = 10 时,y = 5X 10 3 = 22 ,且|22 23|2 ,5口当 x = 8 时,y= ?X 8 3 = 17 ,且 |17 16|0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提

17、供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X/小时30X5050 70光照控制仪运行台数321对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1 000元.若商家安装了 3台光照控制仪, 求商家在过去50周的周总利润的平均值.n相关系数公式:参考数据:,0.3=2(-3)2*(- 1)2* 02* 12* 32= 2 . 5,(yi - y )(-1 ) 2* 02* 02* 02* 12 = .2,5(2)由条件可得在过去 50周里,当X70时,共有10周,此时只有1台光照

18、控制仪运行,每周的周总利润为 1 X 3 000- 2X 1 000 = 1 000(元).当50W X 70时,共有35周,此时有2台光照控制仪运行每周的周总利润为 2X 3 000- 1X 1 000 = 5 000(元).当30X10.828.2 000 X ( 800 X 600 200X 400)1 000 X 1 000 X 1 200 X 800故有99.9%的把握认为“是否愿意购买该款电视机”与“市民的年龄”有关.(3)依题意知,抽取的5台电视机中使用寿命在0 , 4)内的有1台,使用寿命在4 , 20内的有4台,则从5台电视机中随机抽取 2台,所有的情况有C5= 10(种),

19、其中满足条件的有C4= 6(种),故所求概率P=(1)独立性检验的一般步骤根据样本数据制成 2X2列联表;n (ad be) 2根据公式X=( a+ b)( e+ d)( a + e)( b + d)计算的值;查表比较X与临界值的大小关系,作出统计判断.(2)解独立性检验的应用问题的关注点两个明确:(i )明确两类主体;(ii )明确研究的两个问题;两个准确:(i )准确画出2 X 2列联表;(i )准确理解 X.匡変戒UII隊卜某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第

20、一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:第-种生产力式那一种生产方式65 5 6 89 7 6 27 2 2 3 4 5 6 6 R9 R 7 7 6 5 4 3 3 2R14 4 52 110 090(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数 和不超过m的工人数填入下面的列联表:m,并将完成生产任务所需时间超过m超过m不超过m第一种生产方式第二种生产方式根据中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附:n (ad be) 2(a + b)( c+ d

21、)( a + e)( b+ d)P( X k)0.0500.0100.001k3.8416.63510.828解:(1)第二种生产方式的效率更高.理由如下:(i )由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务

22、平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟因此第二种生产方式的效率更高.(iv )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布 的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完 成生产任务所需的时间更少因此第二种生产方式的效率更高.79 + 81由茎叶图知 m= 80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式5154

23、0X (15X 15- 5X 5) 2由于X= 106.635,所以有99%的把握认为两种生产方式20 X 20 X 20 X 20的效率有差异.化非线性回归分析为线性回归分析典働某机构为研究某种图书每册的成本费y(单位:元)与印刷数量 x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.表中5= -, uXi8i=1y -1 (y, -v)E ( |1)工EE (制 - FA ) (J d15. 25163n.292 0R5. 5-230. 30. 7S77.ft4918(1)根据散点图判断:y= a+ bx与y= c+ 哪一个模型更适合作为该图书每册

24、的成本费Xy(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由 )(2)根据(1)的判断结果及表中数据,建立y关于x的线性回归方程(回归系数的结果精确到 0.01);若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)附:对于一组数据(31, U 1) ,(32, U 2),,(wn, u n),其线性回归直线U= a+ 3的*II I: 3. . I* )斜率和截距的最小二乘估计分别为3, a= u 3E-l 【解】(1)由散点图判断,y= c+ d更适合作为该图书每册的成本费y(单位:元)与印刷

25、X数量x(单位:千册)的线性回归方程.1令U =丄,先建立y关于U的线性回归方程X由于7.0490. 7S7957=8所以 c= y d -u = 3.63-8.96X 0.2691.22,所以y关于u的线性回归方程为y= 1.22 + 8.96u,所以y关于x的线性回归方程为y= 1.22 +8.96x假设印刷X千册,依题意得10x (1.22 +8.96x)x78.840,所以 x 10,所以至少印刷10 000册才能使销售利润不低于78 840元.对非线性回归分析问题可通过适当的换元转化为线性回归分析问题求解.更展嫌习P某市一中学课外活动小组为了研究经济走势,对该市 19962018年的

26、GDP(国内生产总值)相关数据进行了初步处理,得到下面的散点图及一些统计量的值.冋 因2(015()wfrt.二亿Jl_01 3 34367S 9IOlll2l3l4L5l6riKW20Ql222年倚化細加肥码I鮎井別茁应年曲I刑401勺- J112113.7A92.24I 012蛊-幻-1) I utT)-T(M T t t - fr) 2lwlJ-I 111 1.11 1 =1(?, -y)(2)517 840212P 521曲一 b其中乙=in yi, wi= In xi.e&42 614.003, e&63757.482 , e6叫 934.489, In 243.18, In 25

27、3.22, ln 26 3.26.(1)根据散点图判断,y= a+ bx, y= ec+ dx与y= m + nln x哪一个适合作为该市 GDP值y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由 )(2)根据(1)的判断结果及表中数据,建立y关于x的线性回归方程;试预测该市 2020年的GDP值.一町(儿-)(参考公式:占二 ;-bx)号也“)解:由散点图可以判断,y= ec+dx适宜作为该市 GDP值y关于年份代码x的回归方 程类型.令z= In y,则z= c+ dx,由参考数据得,2 JZ(x -x)(3 7)y1 012 f所以z关于x的线性回归方程为z= 1.38 +

28、0.21 x,所以y关于x的线性回归方程为y= e1.38+ 0.21x由可知,当 x= 25 时,y= e1.38+0.21 X 25 = e6.63757.482.所以预测2020年该市GDP值约为757.482亿元.基础题组练1根据如下样本数据:x345678y4.02.50.50.50.40.1得到的线性回归方程为y = bx+ a,则()A. a0, b0C.a0B. a0 , b0D. a0, b0解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以b0 ,故选 B.2. 在一组样本数据(X1,y1),(x2,y2),(xn,yn)( n 2 ,X1,X2,xn 不全相等

29、)的散点图中,若所有样本点(Xi, yi)(i = 1, 2,,n)都在直线y=1x+ 1上,则这组样本数据的样本相关系数为()1C2D. 1解析:选D.所有点均在直线上,则样本相关系数最大,即为1 ,故选D.3. (2020山东德州模拟)已知某产品连续4个月的广告费xi(千元)与销售额yi(万元)(i = 1,442, 3, 4)满足xi = 15,yi = 12若广告费用x和销售额y之间具有线性相关关系,且回归i = 1i = 1直线方程为y= bx+ a, b= 0.6,当广告费用为5千元时,可预测销售额为(),A.3万元B.3.15万元C. 3.5 万元D.3.75 万元,解析:选 D

30、.由已知 乙为=15,袒y i = 12,得 x = -4- = 3.75, y = _4_= 3 所以 3= 3.75 X 0.6+ a,解得a= 0.75.所以回归直线方程为y= 0.6x+ 0.75.则当x= 5时,y= 3.75万元.故选D.4. 千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计年份(届)2014201520162017学科竞赛获省级一等奖及以上的学生人数 x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程y= b

31、x+ a中的b为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为()A . 111B. 117C. 118D. 123解析:选 B.因为 x = 53, y = 103.5,所以 a = y b x = 103.5 1.35X 53= 31.95,所以回归直线方程为 y= 1.35x + 31.95.当 x= 63时,代入解得y= 117,故选B.5. 随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿, 某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计

32、愿生452065不愿生132235总计5842100(a + b)n ( ad be)(c+ d)( a + e)( b+ d),得x=2一 9.616.100X( 45X 22 20X 13)65 X 35 X 58 X 42参照下表,P(Xk。)0.0500.0100.001k03.8416.63510.828下列结论正确的是()A .在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别有关” B .在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关”解

33、析:选C.因为K29.6166.635 ,所以有99%以上的把握认为 “生育意愿与城市级别 有关”,故选C.6某考察团对10个城市的职工人均工资 x(千元)与居民人均消费y(千元)进行调查统计, 得出y与x具有线性相关关系,且回归方程为y= 0.6x+ 1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为 .解析:因为y与x具有线性相关关系,满足回归方程y= 0.6x+ 1.2,该城市居民人均工资为x= 5,所以可以估计该城市的职工人均消费水平y= 0.6 X 5 + 1.2= 4.2 ,所以可以估计4 2该城市人均消费额占人均工资收入的百分比为=84%.5答案:

34、84%7.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下: 根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; 根据散点图,可以判断数学成绩与物理成绩具有一次函数关系; 从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为 60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断

35、数学成绩与物理成绩具有一次函数关系,故正确,错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故错误.综上,正确的个数为1.答案:1&在一组样本数据(xi,yi),(X2,y2),(X6,y6)的散点图中,若所有样本点(xi,yi)(i1 6 6 6=1, 2,6)都在曲线y= bx2 f附近波动经计算E. xi = 11,刀$ = 13,马x2= 21,则实3i= 17 i=v7 i = 17数b的值为.61- iE 1x2解析:令t = x2,则曲线的回归方程变为线性的回归方程,即y= bt1此时t =3667 fiyi2, y =T尹,

36、代入y= bt 3,/曰 1371得沪bx 2 - 3,5 解得b = 5.5答案:59. (2020云南昆明诊断)某公司准备派出选手代表公司参加某职业技能挑战赛经过层层选拔,最后集中在甲、乙两位选手在一项关键技能的区分上, 选手完成该项挑战的时间越 少越好.已知这两位选手在 15次挑战训练中,完成该项关键技能挑战所用的时间t(单位:秒)及挑战失败(用“X”表示)的情况如表1 :序号x123456789101112131415t甲X9693X92X9086XX8380787775t乙X95X93X92X8883X8280807473均值(单位:秒)方差线性回归方程甲8550.2t 甲=1.59

37、x+ 99.31乙8454t 乙=1.73x+ 100.26(1) 根据上述回归方程,预测甲、乙分别在下一次完成该项关键技能挑战所用的时间;(2) 若该公司只有一个参赛名额,根据以上信息,判断哪位选手代表公司参加职业技能 挑战赛更合适?请说明你的理由.解:当 x= 16 时,t 甲=1.59X 16+ 99.31 = 73.87(秒),t 乙=1.73 X 16+ 100.26 = 72.58(秒).(2)甲、乙两位选手完成关键技能挑战成功的次数都为10次,失败次数都为5次,所以,只需要比较他们完成关键技能挑战成功的情况即可,根据所给信息,结合(1)中预测结果,综合分析,选手乙代表公司参加技能

38、挑战赛更合适,理由如下:因为在相同次数的挑战练习中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,x甲x乙,乙选手用时更短;由于S甲S乙,虽然甲选手的发挥更稳定 ,但稳定在较大的平均数上,随着训练次数增加,甲、乙用时都在逐步减少,乙的方差大,说明乙进步更大;从(1)的计算结果t乙t甲,进一步说明选手乙代表公司参加技能挑战赛更合适.10. (2020 宁五校模拟)进入二十一世纪以来,科技发展日新月异,工业生产更加依赖科技的发展,沈阳某企业积极进行升级,对现有设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取了200件产品作为样本,检测一项质量指标值,若该项质

39、量指标值落在20, 40)内的产品视为合格品,否则为不合格品,图1是设备改造前的样本的频率分布直方图,表1是设备改造后的样本的频数分布表:图1 :设备改造前的样本的频率分布直方图表1:设备改造后的样本的频数分布表质量指标值15, 20)20 , 25)25, 30)30, 35)35 , 40)40, 45频数4369628324(1)完成下面的2 X 2列联表,并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.设备改造前设备改造后合计合格品不合格品合计(2)根据图1和表1提供的数据,试从产品合格率的角度对改造前后设备的优劣进行比较.附P(Xk)0.1500.1000

40、.0500.0250.010k2.0722.7063.8415.0246.6352n (ad be) 2x=,其中 n= a + b + c+ d(a+ b)( c+ d)( a+ c)( b+ d)解:(1)根据题意填写2X 2列联表设备改造前设备改造后合计合格品172192364不合格品28836合计200200400400X ( 172X 8 192 X 28) 2364 X 36 X 200 X 200所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.(2)根据频率分布直方图和频数分布表知,设备改造前产品为合格品的概率为172_ 43200= 50设备改造后产品为合

41、格品的概率为19224 43 ,20025 50显然设备改造后产品合格率更高,因此设备改造后性能更优.综合题组练1 中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研. 人社部从网上年龄在1565岁的人群中随机调查 100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄15 , 25)25 , 35)35, 45)45 , 55)55, 65支持“延迟退休”的人数155152817(1)由以上统计数据填写 2X 2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这 8人中随机抽2人. 抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率; 记抽到45岁以上的人数为 X,求随机变量X的分布列及数学期望.参考数据及公式:P(Xk)0.1000.0500.0100.001k2.7063.8416.63510.828n (ad be) 2x(a+ b)( c+ d)( a+ e)( b+ d)解:(1)列联表如下:45

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论