高三数学(理数)总复习练习专题十八 统计与统计案例_第1页
高三数学(理数)总复习练习专题十八 统计与统计案例_第2页
高三数学(理数)总复习练习专题十八 统计与统计案例_第3页
高三数学(理数)总复习练习专题十八 统计与统计案例_第4页
高三数学(理数)总复习练习专题十八 统计与统计案例_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 1(2015课标,3,易)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱 形图,以下结论中不正确的是() A逐年比较,2008 年减少二氧化硫排放量的效果最显著 B2007 年我国治理二氧化硫排放显现成效 C2006 年以来我国二氧化硫年排放量呈减少趋势 D2006 年以来我国二氧化硫年排放量与年份正相关 【答案】DA,B,C 均正确,对 D,2006 年以来随年份增加,二氧化硫年排放量减少,不与年 份正相关 2(2015湖北,2,易)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送 来米 1 534 石,验得米内夹谷,抽样取米一把,数得 25

2、4 粒内夹谷 28 粒,则这批米内夹谷约为() A134 石 B169 石 C338 石 D1 365 石 【答案】B由题可知,谷占的比例约为, 28 254 所以米内夹谷约为1 534169(石) 28 254 3(2015安徽,6,中)若样本数据 x1,x2,x10的标准差为 8,则数据 2x11,2x21,2x10 1 的标准差为() A8 B15 C16 D32 【答案】C若 x1,x2,xn的标准差为 s,则 ax1b,ax2b,axnb 的标准差为 as.由题 意 s8,则所求标准差为 2816. 4(2015江苏,2,易)已知一组数据 4,6,5,8,7,6,那么这组数据的平均数

3、为_ 【解析】平均数 6. x 465876 6 【答案】6 5(2015湖南,12,易)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所 示 1300345668889 1411122233445556678 150122333 若将运动员按成绩由好到差编为 135 号, 再用系统抽样方法从中抽取 7 人, 则其中成绩在区间139, 151上的运动员人数是_ 【解析】35 人抽取 7 人,则 n5,而在139,151上共有 20 人,应抽取 4 人 35 7 【答案】4 6(2015课标,18,12 分,中)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机 调

4、查了 20 个用户,得到用户对产品的满意度评分如下: A 地区:6273819295857464537678869566977888827689 B 地区:7383625191465373648293486581745654766579 (1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均 值及分散程度(不要求计算出具体值,给出结论即可); (2)根据用户满意度评分,将用户的满意度从低到高分为三个等级: 满意度评分低于 70 分70 分至 89 分不低于 90 分 满意度等级不满意满意非常满意 记事件 C:“A 地区用户的满意度等级高于 B 地区用户的满意

5、度等级” 假设两地区用户的评价结 果相互独立根据所给数据,以事件发生的频率作为相应事件发生的概率,求 C 的概率 解:(1)两地区用户满意度评分的茎叶图如下: 通过茎叶图可以看出,A 地区用户满意度评分的平均值高于 B 地区用户满意度评分的平均值;A 地 区用户满意度评分比较集中,B 地区用户满意度评分比较分散 (2)记 CA1表示事件:“A 地区用户的满意度等级为满意或非常满意” ; CA2表示事件:“A 地区用户的满意度等级为非常满意” ; CB1表示事件:“B 地区用户的满意度等级为不满意” ; CB2表示事件:“B 地区用户的满意度等级为满意” , 则 CA1与 CB1独立,CA2与

6、CB2独立,CB1与 CB2互斥,C(CB1CA1)(CB2CA2) P(C)P(CB1CA1)(CB2CA2) P(CB1CA1)P(CB2CA2) P(CB1)P(CA1)P(CB2)P(CA2) 由所给数据得 CA1,CA2,CB1,CB2发生的频率分别为, , , ,故 16 20 4 20 10 20 8 20 P(CA1),P(CA2), 16 20 4 20 P(CB1),P(CB2), 10 20 8 20 P(C)0.48. 10 20 16 20 8 20 4 20 1(2014湖南,2,易)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽 样和分

7、层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1,p2,p3,则() Ap1p2p3 Bp2p3p1 Cp1p3p2 Dp1p2p3 【答案】D在简单随机抽样、系统抽样、分层抽样中每个个体被抽到的机会是均等的,即每个 个体被抽到的概率是相等的,故 p1p2p3. 2(2013江西,4,易)总体由编号为 01,02,19,20 的 20 个个体组成利用下面的随机数表 选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字, 则选出来的第 5 个个体的编号为() 78166572080263140702436997280198

8、32049234493582003623486969387481 A.08 B07 C02 D01 【答案】D由随机数表法的随机抽样的过程可知选出的 5 个个体的编号为 08, 02, 14, 07, 01(第 2 个 02 需剔除),所以选出来的第 5 个个体的编号为 01,选 D. 3(2013安徽,5,易)某班级有 50 名学生,其中有 30 名男生和 20 名女生,随机询问了该班五名男 生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为 86,94,88,92,90,五名女生的成绩 分别为 88,93,93,88,93.下列说法一定正确的是() A这种抽样方法是一种分层抽样 B这

9、种抽样方法是一种系统抽样 C这五名男生成绩的方差大于这五名女生成绩的方差 D该班级男生成绩的平均数小于该班女生成绩的平均数 【答案】CA 项,不是分层抽样,因为抽样比不同 B 项,不是系统抽样,因为随机询问,抽样间隔未知 C 项,五名男生成绩的平均数是 90,x 8694889290 5 五名女生成绩的平均数是 91,y 8893938893 5 五名男生成绩的方差为 s (1616440)8, 2 1 1 5 五名女生成绩的方差为 s (94494)6, 2 2 1 5 显然,五名男生成绩的方差大于五名女生成绩的方差 D 项,由于五名男生和五名女生的成绩无代表性,不能确定该班男生和女生的平均

10、成绩 4(2013重庆,4,易)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位 : 分) 已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x,y 的值分别为() A2,5 B5,5 C5,8 D8,8 【答案】C由茎叶图及已知得 x5,又乙组数据的平均数为 16.8, 即16.8, 915(10y)1824 5 解得 y8,选 C. 5(2012山东,4,中)采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9,抽到的 32 人中,编号落入 区间1,450的人做

11、问卷 A,编号落入区间451,750的人做问卷 B,其余的人做问卷 C,则抽到的人中, 做问卷 B 的人数为() A7 B9 C10 D15 【答案】C由题意知应将 960 人分成 32 组,每组 30 人设每组选出的人的号码为 30k9(k 0,1,31),由 45130k9750,解得k.又 kN,故 k15,16,24.故选 C. 442 30 741 30 6(2014江苏,6,易)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单 位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有 _株树木的底部周长小于 100

12、 cm. 【解析】由题意知在抽测的 60 株树木中,底部周长小于 100 cm 的株数为(0.0150.025)1060 24. 【答案】24 7(2014天津,9,易)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样 的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查已知该校一年级、二年级、 三年级、四年级的本科生人数之比为 4556,则应从一年级本科生中抽取_名学生 【解析】30060(名) 4 20 【答案】60 8(2013江苏,6,中)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下: 运动员第 1 次第 2 次第 3 次第

13、4 次第 5 次 甲8791908993 乙8990918892 则成绩较为稳定(方差较小)的那位运动员成绩的方差为_ 【解析】设甲、乙两位射击运动员成绩的方差分别为 s ,s ,由题意可得甲、乙两人的平均成绩 2 甲 2 乙 都是 90, s (8790)2(9190)2(9090)2(8990)2(9390)24, 2 甲 1 5 s (8990)2(9090)2(9190)2(8890)2(9290)22. 2 乙 1 5 【答案】2 9(2013广东,17,12 分,易)某车间共有 12 名工人,随机抽取 6 名,他们某日加工零件个数的茎 叶图如图所示,其中茎为十位数,叶为个位数 (1

14、)根据茎叶图计算样本均值; (2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间 12 名工人中有几名优 秀工人? (3)从该车间 12 名工人中,任取 2 人,求恰有 1 名优秀工人的概率 解:(1)样本均值为 22. 171920212530 6 (2)由(1)知样本中优秀工人占的比例为 ,故推断该车间 12 名工人中有 2 6 1 3 12 4 名优秀工人 1 3 (3)设“从该车间 12 名工人中,任取 2 人,恰有 1 名优秀工人”为事件 A,则 P(A). CC C 16 33 考向 1三种抽样方法及其应用 三种抽样方法的比较 类别共同点各自特点相互联系适用范围

15、简单 随机 抽样 从总体中逐个抽取 总体中的个数 较少 系统 抽样 将总体均分成几部 分,按事先确定的 规则,在各部分抽 取 在起始部分抽 样时,采用简 单随机抽样 总体中的个数 比较多 分层 抽样 都是不放回抽样, 抽 样过程中, 每个个体 被抽到的机会(概率) 相等将总体分成几层, 分层进行抽取 各层抽样时, 采用简单随机 抽样或者系统 抽样 总体由差异明 显的几部分组 成 (1)(2013课标,3)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽 取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而 男女生视力情况差异不大在下面的抽样方法中

16、,最合理的抽样方法是() A简单随机抽样 B按性别分层抽样 C按学段分层抽样 D系统抽样 (2)(2014广东,6)已知某地区中小学生人数和近视情况分别如图 1 和图 2 所示为了解该地区中小 学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人 数分别为() A200,20 B100,20 C200,10 D100,10 【解析】(1)因为男女生视力情况差异不大,而学段的视力情况有较大差异,所以应按学段分层抽 样 (2)由题意知, 该地区中小学生共有 10 000 名, 故样本容量为 10 0002%200.由分层抽样知应抽取 高中学生的人数为 200

17、40,其中近视人数为 4050%20. 2 000 10 000 【答案】(1)C(2)A 【点拨】解题(1)的关键是了解样本特征的差异性;解题(2)的关键是从扇形统计图和条形统计图中 读出相关数据并进行计算 1.抽样方法的选择与判断 解决此类问题的关键是掌握这三种抽样方法的适用原则: (1)简单随机抽样:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用 简单随机抽样法抽出的个体带有随机性,个体间无固定间距 (2)系统抽样:元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分 抽样时,采用简单随机抽样 (3)分层抽样:总体由差异明显的几部分组成,如年

18、龄、学段、性别、工种等;分层后,在每一层抽 样时可采用简单随机抽样或系统抽样 2分层抽样中公式的运用 (1)抽样比; 样本容量 个体总量 各层样本容量 各层个体数量 (2)层 1 的数量层 2 的数量层 3 的数量样本 1 的容量样本 2 的容量样本 3 的容量 (1)(2013陕西, 4)某单位有 840 名职工, 现采用系统抽样方法抽取 42 人做问卷调查, 将 840 人按 1,2,840 随机编号,则抽取的 42 人中,编号落入区间481,720的人数为() A11 B12 C13 D14 (2)(2015湖北武汉联考,12)已知某单位有 40 名职工,现要从中抽取 5 名职工,将全体

19、职工随机按 140 编号,并按编号顺序平均分成 5 组按系统抽样方法在各组内抽取一个号码若第 1 组抽出的号 码为 2,则所有被抽出职工的号码为_ (1)【答案】B因为 84042201,故编号在481,720内的人数为 2402012. (2)【解析】由系统抽样知识知,第一组 18 号;第二组为 916 号;第三组为 1724 号;第四 组为 2532 号;第五组为 3340 号 第一组抽出号码为 2,则依次为 10,18,26,34. 【答案】2,10,18,26,34 考向 2统计图表 1频率分布直方图的特征 (1)各矩形的面积和为 1. (2)纵轴的含义为,矩形的面积组距频率 频率 组

20、距 频率 组距 (3)样本数据的平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和 (4)众数为最高矩形的底边中点的横坐标 2各种统计图表的优点与不足 优点不足 频率分布表表示数据较确切 分析数据分布的总体态势不方 便 频率分布直 方图 表示数据分布情况非常直观原有的具体数据信息被抹掉了 频率分布折 线图 能反映数据的变化趋势不能显示原有数据 茎叶图 一是所有的信息都可以从这个 茎叶图中得到;二是茎叶图便 于记录和表示,能够展示数据 的分布情况 样本数据较多或数据位数较多 时,不方便表示数据 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数 (2014广东, 17, 13 分)随

21、机观测生产某种零件的某工厂 25 名工人的日加工零件数(单位 : 件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43, 38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如下: 分组频数频率 25,3030.12 (30,3550.20 (35,4080.32 (40,45n1f1 (45,50n2f2 (1)确定样本频率分布表中 n1,n2,f1和 f2的值; (2)根据上述频率分布表,画出样本频率分布直方图; (3)根据样本频率分布直方图,求在该厂任取 4 人,至少有 1 人的日加工零件数

22、落在区间(30,35的 概率 【思路导引】(1)根据题目中数据得 n1,n2,利用得出 f1,f2;(2)根据分组、频率及组距画出 频数 25 频率分布直方图;(3)利用独立重复试验公式,根据对立事件求概率的方法即可求出 【解析】(1)由所给数据知,落在区间(40,45内的有 7 个,落在(45,50内的有 2 个,故 n17, n22,所以 f10.28,f20.08. 7 25 2 25 (2)频率分布直方图如图所示: (3)工人们日加工零件数落在区间(30,35的概率为 0.2,设日加工零件数落在区间(30,35的人数为 随机变量 ,则 B(4,0.2),故 4 人中,至少有 1 人的日

23、加工零件数落在区间(30,35的概率为:1C (0.2)0(0.8)410.409 60.590 4.0 4 解决统计图表问题的方法 解决图表类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键频 率分布直方图直观形象地表示了样本的频率分布 (2013辽宁,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组 依次为 : 20,40),40,60),60,80),80,100若低于 60 分的人数是 15,则该班的学生人数是() A45 B50 C55 D60 【答案】B由频率分布直方图可知20,40)间的频率为 0.005200.1,40,60)间的频率

24、为 0.01200.2.所以低于 60 分的频率为 0.3,总人数为50,选 B. 15 0.3 考向 3用样本数字特征估计总体 1众数、中位数、平均数 数字特征样本数据频率分布直方图 众数出现次数最多的数据 取最高的小长方形底边中点 的横坐标 中位数 将数据按大小依次排列,处在最中 间位置的一个数据(或最中间两个 把频率分布直方图划分为左 右两个面积相等的部分, 分界 数据的平均数)线与 x 轴交点的横坐标 平均数样本数据的算术平均数 每个小矩形的面积乘小矩形 底边中点的横坐标之和 2.方差和标准差 方差和标准差反映了数据波动程度的大小 (1)方差:s2 (x1 )2(x2 )2(xn )2

25、; 1 n x x x (2)标准差:s. 1 n(x 1x )2(x2x )2(xnx )2 3关于平均数、方差的有关性质 (1)若 x1,x2,xn的平均数为 ,那么 mx1a,mx2a,mxna 的平均数为 m a.x x (2)数据 x1,x2,xn与数据 x1x1a,x2x2a,xnxna 的方差相等,即数据经过 平移后方差不变 (3)若 x1,x2,xn的方差为 s2,那么 ax1b,ax2b,axnb 的方差为 a2s2. (2014山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者 的舒张压数据(单位 : kPa)的分组区间为12,13),13,14),14

26、,15),15,16),16,17,将其按从左 到右的顺序分别编号为第一组,第二组,第五组下图是根据试验数据制成的频率分布直方图已 知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为() A6 B8 C12 D18 (2)(2014陕西,9)设样本数据 x1,x2,x10的均值和方差分别为 1 和 4,若 yixia(a 为非零常 数,i1,2,10),则 y1,y2,y10的均值和方差分别为() A1a,4 B1a,4a C1,4 D1,4a 【解析】(1)第一、二两组的频率为 0.240.160.4, 志愿者的总人数为50(人) 20 0.4 第三组的人

27、数为 500.3618(人), 有疗效的人数为 18612(人) (2) (y1y2y10)(x1x2x1010a)(x1x2x10)a1a, y 1 10 1 10 1 10 S2(y1 )2(y10 )2(x11)2(x101)2(x1 )2(x10 )24. 1 10 y y 1 10 1 10 x x 【答案】(1)C(2)A 【点拨】解题(1)的关键是理解频率分布直方图中频率与频数的关系;题(2)根据公式直接求解 有关样本数字特征问题的解题技巧 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当 所得数据平均数不相等时,需先分析平均水平,再计算标

28、准差(方差)分析稳定情况 (2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差); 另一方面, 可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差 (标准差)的大小 (2013湖北, 11)从某小区抽取 100 户居民进行月用电量调查, 发现其用电量都在 50 至 350 度之间,频率分布直方图如图所示 (1)直方图中 x 的值为_; (2)在这些用户中,用电量落在区间100,250)内的户数为_ 【解析】(1)由频率分布直方图的性质知 500.002 4500.003 6500.006 050 x 500.002 4500.

29、001 21,解得 x0.004 4. (2)用电量落在区间100,250)内的频率为 50(0.003 60.006 00.004 4)0.7,故用电量落在区间 100,250)内的户数为 1000.770. 【答案】(1)0.004 4(2)70 考向 4统计与概率的综合应用 (2014课标,18,12 分)从某企业生产的某种产品中抽取 500 件,测量这些产品的一项 质量指标值,由测量结果得如下频率分布直方图: (1)求这 500 件产品质量指标值的样本平均数 和样本方差 s2(同一组中的数据用该组区间的中点值x 作代表); (2)由直方图可以认为,这种产品的质量指标值 Z 服从正态分布

30、 N(,2),其中近似为样本平均 数 ,2近似为样本方差 s2.x 利用该正态分布,求 P(187.8Z212.2); 某用户从该企业购买了 100 件这种产品,记 X 表示这 100 件产品中质量指标值位于区间(187.8, 212.2)的产品件数,利用的结果,求 EX. 附:12.2.若 ZN(,2),则 P(Z)0.682 6,P(2Z2)0.954 4.150 【解析】(1)抽取产品的质量指标值的样本平均数 和样本方差 s2分别为 x 1700.021800.091900.222000.332100.242200.082300.02200, x s2(30)20.02(20)20.09

31、(10)20.2200.331020.242020.083020.02150. (2)由(1)知,ZN(200,150),从而 P(187.8Z212.2)P(20012.2Z1”的概率 解:(1)由频率分布直方图知,成绩在14,16)内的人数为 500.16500.3827(人), 所以该班在这次测试中成绩良好的人数为 27 人 (2)由频率分布直方图知,成绩在13,14)的人数为 500.063(人),设为 x,y,z;成绩在17,18 的人数为 500.084(人),设为 A,B,C,D. 当 m,n13,14)时,有 xy,yz,xz,3 种情况; 当 m,n17,18时,有 AB,A

32、C,AD,BC,BD,CD,6 种情况 若 m,n 分别在13,14)和17,18内时,如下表所示: ABCD xxAxBxCxD yyAyByCyD zzAzBzCzD 共有 12 种情况,所以基本事件总数为 21 种,事件“|mn|1” 所包含的基本事件有 12 种,P(|m n|1) . 12 21 4 7 1(2014河北石家庄二模,3)某学校高三年级一班共有 60 名学生,现采用系统抽样的方法从中抽取 6 名学生做 “早餐与健康” 的调查, 为此将学生编号为 1, 2, 60.选取的这 6 名学生的编号可能是() A1,2,3,4,5,6 B6,16,26,36,46,56 C1,2

33、,4,8,16,32 D3,9,13,27,36,54 【答案】B由系统抽样知识知,所选取学生编号之间的间距相等且为 10,所以应选 B. 2(2015浙江杭州模拟,7)某校 150 名教职工中,有老年人 20 名,中年人 50 名,青年人 80 名,从 中抽取 30 名作为样本 采用随机抽样法:抽签取出 30 个样本; 采用系统抽样法:将教职工编号为 00,01,149,然后平均分组抽取 30 个样本; 采用分层抽样法:从老年人、中年人、青年人中抽取 30 个样本 下列说法中正确的是() A无论采用哪种方法,这 150 名教职工中每个人被抽到的概率都相等 B两种抽样方法,这 150 名教职工

34、中每个人被抽到的概率都相等;并非如此 C两种抽样方法,这 150 名教职工中每个人被抽到的概率都相等;并非如此 D采用不同的抽样方法,这 150 名教职工中每个人被抽到的概率是各不相同的 【答案】A三种抽样方法中,每个人被抽到的概率都等于 ,故选 A. 30 150 1 5 3(2015湖北武汉第二次调研,8)如图是依据某城市年龄在 20 岁到 45 岁的居民上网情况调查而绘 制的频率分布直方图,现已知年龄在30,35),35,40),40,45)的上网人数呈现递减的等差数列分布, 则年龄在35,40)的网民出现的频率为() A0.04 B0.06 C0.2 D0.3 【答案】C由频率分布直方

35、图的知识得,年龄在20,25)的频率为 0.0150.05,25,30)的频 率为 0.0750.35,设年龄在30,35),35,40),40,45的频率为 x,y,z,又 x,y,z 成等差数列, 所以可得解得 y0.2, xyz10.050.35, xz2y,) 年龄在35,40)的网民出现的频率为 0.2.故选 C. 4(2015湖北十校联考,6)已知某次期中考试中,甲、乙两组学生的数学成绩如下: 甲:881009586959184749283 乙:9389 8177967877858986 则下列结论正确的是() A. 甲乙,s甲s乙 B.甲乙,s甲s乙x x x x C. 甲s乙

36、D.甲乙,s甲0,b0 Ba0,b0 Ca0 Da0,b0,b0, y 与 x 正相关, A 正确 ; 线性回归方程经过样本点的中心( , ), x y B 正确;y0.85(x1)85.71(0.85x85.71)0.85,C 正确;体重 58.79 kg 为估计值,故选 D. 4(2011山东,7,易)某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元)4235 销售额 y(万元)49263954 根据上表可得回归方程 x 中的 为 9.4,据此模型预报广告费用为 6 万元时销售额为()y b a b A63.6 万元 B65.5 万元 C67.7 万元 D72.0

37、 万元 【答案】B由表可计算 , 42.因为点在回归直线x 4235 4 7 2 y 49263954 4 ( 7 2,42) x 上,且 为 9.4,所以 429.4 ,解得 9.1,故回归方程为 9.4x9.1,令 x6,得y b a b 7 2 a a y y 65.5. 5(2011湖南,4,易)通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联 表: 男女总计 爱好402060 不爱好203050 总计6050110 由 K2算得, n(adbc)2 (ab)(cd)(ac)(bd) K27.8. 110 (40 3020 20)2 60 50 60 50 附表

38、: P(K2k)0.0500.0100.001 k3.8416.63510.828 参照附表,得到的正确结论是 () A在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” B在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” C有 99%以上的把握认为“爱好该项运动与性别有关” D有 99%以上的把握认为“爱好该项运动与性别无关” 【答案】C由 K27.8 及 P(k26.635)0.010 可知,在犯错 110 (40 3020 20)2 60 50 60 50 误的概率不超过 1%的前提下,认为“爱好该项运动与性别有关” ,也就是有 99%以上的把握

39、认为“爱好 该项运动与性别有关” ,故选 C. 考向 1线性回归方程及其应用 1两个变量的线性相关 (1)正相关:在散点图中,点散布在从左下角到右上角的区域对于两个变量的这种相关关系,将它 称为正相关 (2)负相关:在散点图中,点散布在从左上角到右下角的区域对于两个变量的这种相关关系,将它 称为负相关 2相关系数 r n i1 (xix )(yiy ) n i1 (xix )2 n i1 (yiy )2 . n i1xiyinx y ( n i1xnx 2)( n i1yny 2) (1)|r|1,当 r0 时,两个变量正相关;当 r0.75 时,我们认为两个变量之间存在较强的线性相关关系 3

40、线性回归直线方程 x ,其中 , ,主要用来估计和预y b a b n i1 (xix )(yiy ) n i1 (xix )2 n i1xiyinx y n i1xnx 2 a y b x 测取值,从而获得对两个变量之间整体关系的了解 回归直线一定经过样本的中心点( , ),据此性质可以解决有关的计算问题同时可以应用回归直 x y 线方程作出预测 (2014课标,19,12 分)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单位 : 千 元)的数据如下表: 年份2007200820092010201120122013 年份代号 t1234567 人均纯收入 y2.93.33

41、.64.44.85.25.9 (1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并预 测该地区 2015 年农村居民家庭人均纯收入 附:回归直线的斜率和截距的最小二乘估计公式分别为: , .b n i1 (tit )(yiy ) n i1 (tit )2 a y b t 【解析】(1)由所给数据计算得 (1234567)4, t 1 7 (2.93.33.64.44.85.25.9)4.3,y 1 7 (ti )2941014928, 7 i1 t (ti )(yi )(3)(1.4)(2)(1)(

42、1)(0.7)00.110.520.931.6 7 i1 t y 14, 0.5, b 7 i1 (tit )(yiy ) 7 i1 (tit )2 14 28 4.30.542.3. a y b t 所求回归方程为 0.5t2.3. y (2)由(1)知, 0.50,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增 b 加 0.5 千元 将 2015 年的年份代号 t9 代入(1)中的回归方程,得 0.592.36.8, y 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元 【点拨】在求解过程中,对数值的处理要细心,由于计算烦琐极易出错 ; 在

43、求 时,由公式 a a y 求解,注意不要代错数值特别提醒:回归直线方程恒过样本中心( , ) b x x y 求线性回归直线方程的步骤 (1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系; (2)列表求出 ,x ,y ,xiyi(可用计算器进行计算);x y n i1 2i n i1 2i n i1 (3)利用公式 , 求得回归系数;b n i1xiyinx y n i1xnx 2 a y b x (4)写出回归直线方程 (2014河北石家庄模拟,19,12 分)下表提供了某厂节能降耗技术改造后生产甲产品过程 中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据

44、x3456 y2.5344.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤,试根据(2)求出的线性回归方程,预测 生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5435464.566.5) 解:(1)由题意,作散点图如图 (2)由对照数据,计算得xiyi66.5, 4 i1 x 3242526286, 4 i1 2i 4.5, 3.5, x y 0.7, b 66.54 4.5 3.5 864 4.52 66.56

45、3 8681 3.50.74.50.35, a y b x 所以回归方程为 0.7x0.35. y (3)当 x100 时, y1000.70.3570.35(吨标准煤), 预测生产 100 吨甲产品的生产能耗比技改前降低 9070.3519.65(吨标准煤) 考向 2独立性检验 122 列联表 列出的两个变量的频数表称作列联表假设有两个分类变量 X,Y,它们的可能取值分别为x1,x2 和y1,y2,其样本频数 22 列联表为: y1y2总计 x1abab x2cdcd 总计acbdnabcd 构造随机变量 K2. n(adbc)2 (ab)(cd)(ac)(bd) 2判断两个分类变量 X 和

46、 Y 是否有关系的方法 利用随机变量 K2来确定在多大程度上可以认为“两个分类变量有关系” 的方法称为两个分类变量的 独立性检验 统计学研究表明:当 K23.841 时,认为 X 与 Y 无关; 当 K23.841 时,有 95%的把握说 X 与 Y 有关; 当 K26.635 时,有 99%的把握说 X 与 Y 有关; 当 K210.828 时,有 99.9%的把握说 X 与 Y 有关 (2012辽宁, 19, 12 分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况, 随机抽取了 100 名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布 直方图: 将日均

47、收看该体育节目时间不低于 40 分钟的观众称为“体育迷” (1)根据已知条件完成下面的 22 列联表,并据此资料你是否认为“体育迷”与性别有关? 非体育迷体育迷合计 男 女1055 合计 (2)将上述调查所得到的频率视为概率现在从该地区大量电视观众中,采用随机抽样方法每次抽取 1 名观众,抽取 3 次,记被抽取的 3 名观众中的“体育迷”人数为 X.若每次抽取的结果是相互独立的, 求 X 的分布列、期望 E(X)和方差 D(X) 附:2或 K2. n(n11n22n12n21)2 n1n2n1n2 n(adbc)2 (ab)(cd)(ac)(bd) P(2k)0.050.01 k3.8416.

48、635 【思路导引】(1)根据所给的频率分布直方图得出数据,列出列联表,再代入公式计算得出 K2, 与 3.841 比较即可得出结论;(2)用频率代替概率可得出从观众中抽取一名“体育迷”的概率是 ,由于 1 4 XB,从而得出分布列,再计算出期望与方差 (3, 1 4) 【解析】(1)由频率分布直方图可知,在抽取的 100 人中, “体育迷” 有(0.0200.005)10100 25(人), 由独立性检验的知识得 22 列联表如下: 非体育迷体育迷合计 男301545 女451055 合计7525100 将 22 列联表中的数据代入公式计算,得 K2 n(adbc)2 (ab)(cd)(ac

49、)(bd) 3.030. 100 (30 1045 15)2 75 25 45 55 100 33 因为 3.0303.841,所以没有理由认为“体育迷”与性别有关 (2)由频率分布直方图知抽到“体育迷”的频率为(0.0200.005)100.25,将频率视为概率,即从 观众中抽取一名“体育迷”的概率为 . 1 4 由题意知 XB, (3, 1 4) 从而 X 的分布列为 X0123 P 27 64 27 64 9 64 1 64 由二项分布的期望与方差公式得 E(X)np3 , 1 4 3 4 D(X)np(1p)3 . 1 4 3 4 9 16 解决独立性检验应用问题的方法 解决一般的独立

50、性检验问题,首先由所给 22 列联表确定 a,b,c,d,n 的值,然后根据统计量 K2 的计算公式确定 K2的值,最后根据所求值确定有多大的把握判定两个变量有关联 (2015广东六校联考,17,13 分)某市调研考试后,某校对甲、乙两个文科班的数学考试 成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀统计成绩后,得到如下的列联 表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为. 3 11 优秀非优秀合计 甲班10 乙班30 合计110 (1)请完成上面的列联表; (2)根据列联表的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关

51、系” ; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先 后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号试求抽到 9 号或 10 号的概率 参考公式与临界值表:K2. n(adbc)2 (ab)(cd)(ac)(bd) P(K2k)0.1000.0500.0250.0100.001 k2.7063.8415.0246.63510.828 解:(1) 优秀非优秀合计 甲班105060 乙班203050 合计3080110 (2)根据列联表中的数据,得到 K2110 (10 3020 50) 2 60 50 30 80 7.487

52、10.828.因此按 99.9%的可靠性要求,不能认为“成绩与班级有关系” (3)设“抽到 9 或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),所有的基 本事件有:(1,1),(1,2),(1,3),(6,6),共 36 个 事件 A 包含的基本事件有:(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4),共 7 个 P(A),即抽到 9 号或 10 号的概率为. 7 36 7 36 1(2015河南郑州二模,7)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的 价格进行试销,得到如下数据: 单价(元)456789 销量

53、(件)908483807568 由表中数据,求得线性回归方程 4xa,若在这些样本点中任取一点,则它在回归直线左下方y 的概率为() A. B. 1 6 1 3 C. D. 1 2 2 3 【答案】B由表中数据得 6.5, 80.x y 由( , )在直线 4xa 上,得 a106.即线性回归方程为 4x106.经过计算只有(5,84)和x y y y (9,68)在直线的下方,故所求概率为 ,选 B. 2 6 1 3 2(2015江西上饶二模,6)以下命题中:pq 为假命题,则 p 与 q 均为假命题; 对具有线性相关的变量 x,y 有一组观测数据(xi,yi)(i1,2,8),其回归直线方

54、程是 xy 1 3 a,且 x1x2x3x82(y1y2y3y8)6,则实数 a ; 1 4 已知0,则函数 f(x)2x 的最小值为 16.其中真命题的个数为() x1 2x 1 x A0 B1 C2 D3 【答案】B正确中 a ,所以不正确中,由0 可得 1x2,因为 f(x)2x 1 8 x1 2x 224,当且仅当 x1 时取等号,所以不正确 1 x 3(2014山东潍坊二模,7)为了普及环保知识,增强环保意识,某大学从理工类专业的 A 班和文史 类专业的 B 班各抽取 20 名同学参加环保知识测试统计得到成绩与专业的列联表: 优秀非优秀总计 A 班14620 B 班71320 总计2

55、11940 附:参考公式及数据: (1)统计量: K2(nabcd) n(adbc)2 (ab)(cd)(ac)(bd) (2)独立性检验的临界值表: P(K2k0)0.0500.010 k03.8416.635 则下列说法正确的是() A有 99%的把握认为环保知识测试成绩与专业有关 B有 99%的把握认为环保知识测试成绩与专业无关 C有 95%的把握认为环保知识测试成绩与专业有关 D有 95%的把握认为环保知识测试成绩与专业无关 【答案】C因为 K24.912,3.841K26.635, 40 (14 137 6)2 20 20 21 19 所以有 95%的把握认为环保知识测试成绩与专业有

56、关 4(2015湖北荆州中学第一次质检,7)从某高中随机选取 5 名高三男生,其身高和体重的数据如下 表所示: 身高 x(cm)160165170175180 体重 y(kg)6366707274 根据上表可得回归直线方程 0.56x ,据此模型预测身高为 172 cm 的高三男生的体重为()y a A70.09 kg B70.12 kg C70.55 kg D71.05 kg 【答案】B由表中数据可得 170,x 160165170175180 5 69,因为( , )一定在回归直线 0.56x 上,y 6366707274 5 x y y a 故 690.56170 ,解得 26.2.a

57、a 故 0.56x26.2.y 当 x172 时, 0.5617226.27012,故选 B.y 5 (2015安徽黄山二模, 12)某市居民 20102014 年家庭年平均收入 x(单位 : 万元)与年平均支出 y(单 位:万元)的统计资料如下表所示: 年份20102011201220132014 收入 x11.512.11313.315 支出 y6.88.89.81012 根据统计资料, 居民家庭年平均收入的中位数是_, 家庭年平均收入与年平均支出有_ 线性相关关系 【解析】中位数是 13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出 也增多,因此两者之间具有正线性相关关系 【答案】13正 6(2015安徽安庆一模,16,12 分)以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数 据: 房屋面积(m2)11511080135105 销售价格(万元)24.821.618.429.222 (1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论