




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 / 39 第第 2 讲讲 统计、统计案例统计、统计案例 考情研析 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等 2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等. 核心知识回顾核心知识回顾 1.三种抽样方法的特点 简单随机抽样:操作简便,适合总体个数较少的抽样 分层抽样:按比例抽样 系统抽样:等距抽样 2必记公式 数据 x1,x2,x3,xn的数字特征公式: (1)平均数: x 01x1x2x3xnn. (2)方差:s2 021n(x1 x)2(x2 x)2(xn x)2. (3)标准差: s 03 1n(x1 x)2(x2 x)
2、2(xn x)2. 3重要性质及结论 (1)频率分布直方图的三个结论 小长方形的面积 01 组距频率组距频率; 各小长方形的面积之和等于 1; 小长方形的高 02频率组距,所有小长方形高的和为1组距. (2)回归直线方程:一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn, yn) 其 回 归 方 程 y 03 bx a, 其 过 样 本 点 中 心 04 ( x,2 / 39 y)其中bi1n (xi x)(yi y)i1nx2in x2,a yb x. (3)独立性检验 k2n(adbc)2(ab)(cd)(ac)(bd)(其中 nabcd,n为样本容量). 热点考向探究热点
3、考向探究 考向 1 抽样方法 例 1 (1)从编号为 001,002,500 的 500 个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为 007,032,则样本中最大的编号应该为( ) a480 b481 c482 d483 答案 c 解析 样本中编号最小的两个编号分别为 007,032, 样本数据组距为 32725,则样本容量为5002520,则对应的号码数 x725(n1),当 n20 时,x取得最大值,此时 x72519482.故选 c. (2)(2020 海南省高三三模)某地 a,b,c 三所学校分别有教师 72,144,216人当地教育部门组织教研活动,计划
4、用分层抽样的方法从这三所学校的教师中抽取若干人组成领导小组,若从学校 b 抽取 8 名教师,则从学校 a 和 c 共抽取的教师人数为_. 答案 16 解析 设从学校 a 和 c 分别抽取的教师人数为 x 和 y,由题意可知x7281443 / 39 y216,所以 x4,y12,xy16. 系统抽样与分层抽样的求解方法 (1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定每组抽取样本的号码依次构成一个以第一组抽取的号码 m为首项,组距 d为公差的等差数列an,第 k组抽取样本的号码 akm(k1)d. (2)分层抽样的关键是根据样本特征的差异进行分层
5、,实质是等比例抽样,求解此类问题需先求出抽样比样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积在每层抽样时,应采用简单随机抽样或系统抽样进行 1(2020 天津市红桥区二模)某校三个社团的人员分布如下表(每名同学只能参加一个社团):学校要对这三个社团的活动效果进行抽样调查,按分层抽样的方法从社团成员中抽取 30人,结果武术社被抽出 12 人,则这三个社团总人数为_. 武术社 摄影社 围棋社 高一 45 30 a 高二 15 10 20 答案 150 解析 设三个社团共有 x 人,由分层抽样的定义和方法可得30 x124515,解得 x150,所以这三个社团共有 15
6、0人 2某公司生产 a,b,c 三种不同型号的轿车,产量之比依次为 234,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为 n 的样本,若样本中 a种型号的轿车比 b种型号的轿车少 8辆,则 n( ) a96 b72 c48 d36 答案 b 4 / 39 解析 由题意,得29n39n8,n72.选 b. 考向 2 用样本估计总体 例 2 (1)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间0,10内的一个数来表示,该数越接近 10 表示满意程度越高,现随机抽取 6 位小区居民,他们的幸福感指数分别为 5,6,7,8,9,5,则这组数据的中位数是( )
7、 a5 b5.5 c6.5 d7 答案 c 解析 将该组数据从小到大排列为 5,5,6,7,8,9.所以这组数据的中位数是6726.5.故选 c. (2)甲、乙两名学生在 5 次数学考试中的成绩统计如下: 甲:74 82 91 88 95 乙:77 86 78 92 77 若 x甲, x乙分别表示甲、乙两人的平均成绩,则下列结论正确的是( ) a. x甲 x乙,乙比甲稳定 b x甲 x乙,甲比乙稳定 c. x甲 x乙,乙比甲稳定 d x甲 x乙 因为 s2甲15(12)2(4)252229254, s2乙15(5)242(4)2102(5)236.4, 所以 s2甲s2乙,故乙比甲稳定故选 a
8、. (3)(多选)(2020 山东省泰安市高三一模)某调查机构对全国互联网行业进行调5 / 39 查统计,得到整个互联网行业从业者年龄分布饼状图、90 后从事互联网行业岗位分布条形图,则下列结论正确的是( ) 注:90 后指 1990 年及以后出生,80 后指 19801989 年之间出生.80 前指1979年及以前出生 a互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上 b互联网行业中从事技术岗位的人数超过总人数的 20% c互联网行业中从事运营岗位的人数 90后比 80 前多 d互联网行业中从事技术岗位的人数 90后比 80后多 答案 abc 解析 由整个互联网行业从业者年龄
9、分布饼状图、90 后从事互联网行业岗位分布条形图得到:56%(39.6%17%)31.696%30%,所以互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上,故 a 正确;由整个互联网行业从业者年龄分布饼状图、90 后从事互联网行业岗位分布条形图得到:56%39.6%22.176%20%,所以互联网行业中从事技术岗位的人数超过总人数的 20%,故 b 正确;由整个互联网行业从业者年龄分布饼状图、90 后从事互联网行业岗位分布条形图得到:17%56%9.52%,所以互联网行业中从事运营岗位的人数 90 后比 80 前多,故 c 正确;由整个互联网行业从业者年龄分布饼状图、90 后从事
10、互联网行业岗位分布条形图得到:互联网行业中从事技术岗位的人数 90 后不一定比 80后多,故 d错误故选 abc. (4)(2020 天津市河北区二模)某班同学进行社会实践,对25,55岁的人群随6 / 39 机抽取 n人进行了生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图,则图表中的 p,a的值分别为( ) 组数 分组 低碳族的人数 占本组的频率 第一组 25,30) 120 0.6 第二组 30,35) 195 p 第三组 35,40) 100 0.5 第四组 40,45) a 0.4 第五组 45,
11、50) 30 0.3 第六组 50,55 15 0.3 a0.79,20 b0.195,40 c0.65,60 d0.975,80 答案 c 解析 由题意,得 n1200.60.0451000,a10000.0350.460.p19510001(0.040.040.030.020.01)50.65.故选 c. 用样本估计总体 (1)在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点 (2)理解样本数据标准差的意义和作用,学会计算数字特征(如平均数、标准差),并作出合理的解释 7 / 39 (3)会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用
12、样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性 1为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为 5 分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是( ) a乙的数据分析素养优于甲 b乙的数学建模素养优于数学抽象素养 c甲的六大素养整体水平优于乙 d甲的六大素养中数据分析最差 答案 c 解析 根据雷达图得到如下数据: 数学抽象 逻辑推理 数学建模 直观想象 数学运算 数据分析 甲的得分 4 5 4 5 4 5 乙的得分 3 4 3 3 5 4 由数据可知选 c. 2(2020
13、 广东省惠州市三模)惠州市某学校一位班主任需要更换手机语音月卡套餐,该教师统计自己 1至 8月的月平均通话时间,其中有 6 个月的月平均通话时间分别为 520,530,550,610,650,660(单位:分钟),有 2 个月的数据未统计出来根据以上数据,该教师这 8 个月的月平均通话时间的中位数大小不可能是( ) 8 / 39 a580 b600 c620 d640 答案 d 解析 当另外两个月的平均通话时间都小于 530(分钟)时,中位数为5305502540(分钟),当另外两个月的平均通话时间都大于 650(分钟)时,中位数为6106502630(分钟),所以这 8 个月的月平均通话时间
14、的中位数大小的取值区间为540,630故选 d. 3(2020 山东省泰安市四模)某药厂选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kpa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有 20人,则第三组中的人数为_. 答案 18 解析 由直方图可得,分布在第一组与第二组共有 20 人,分布在第一组与第二组的频率分别为 0.24,0.16,设总的人数为 n,则20n0.240.160.4,所以n50.所以第三组中的人数为 500.
15、3618. 考向 3 回归分析与独立性检验 角度 1 回归分析在实际中的应用 例 3 某市地产数据研究所的数据显示,2019 年该市新建住宅销售均价走势如下图所示,3 月至 7 月房价上涨过快,政府从 8 月开始采取宏观调控措施,109 / 39 月份开始房价得到很好的抑制 (1)地产数据研究所发现,3 月份至 7 月份的各月均价 y(万元/平方米)与月份x 之间具有较强的线性相关关系,试建立 y 关于 x 的回归方程;政府若不调控,依此相关关系预测 12 月份该市新建住宅销售均价; (2)地产数据研究所在 2019 年的 12 个月中,随机抽取三个月的数据作样本分析,若关注所抽三个月份的所属
16、季度,记所属季度的个数为 x,求 x的分布列和数学期望 参考数据:5i1xi25,5i1yi5.36,5i1 (xi x)(yi y)0.64; 回归方程ybxa中斜率和截距的最小二乘法估计公式分别为:bni1 (xi x)(yi y)ni1 (xi x)2,a yb x. 解 (1) 月份 x 3 4 5 6 7 均价 y 0.95 0.98 1.11 1.12 1.20 计算可得 x5, y1.072,5i1 (xi x)210, 所以b0.64100.064,a yb x1.0720.06450.752. 所以从 3 月份至 7月份 y关于 x的回归方程为y0.064x0.752. 将
17、x12 代入回归方程,得y0.064120.7521.52, 所以预测 12 月份该市新建住宅的销售均价约为 1.52万元/平方米 (2)根据题意,x的可能取值为 1,2,3. p(x1)c14c312155,p(x3)c34c13c13c13c3122755, 10 / 39 p(x2)1p(x1)p(x3)2755, 所以 x的分布列为 x 1 2 3 p 155 2755 2755 因此,x的数学期望 e(x)1155227553275513655. 在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计
18、或预测变量的值 近年来随着互联网的高速发展,旧货交易市场也得以快速发展某网络旧货交易平台对 2019 年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图和散点图现把直方图中各组的频率视为概率,用 x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格 (1)已知 2019 年在此网络旧货交易平台成交的该种机械设备为 100 台,现从11 / 39 这 100 台设备中,按分层抽样抽取使用时间 x(12,20的 4 台设备,再从这 4 台设备中随机抽取 2 台,求这 2台设备的使用时间都在(12,16的概率; (2)由散点图分析后,可用 yebxa作为此网络旧
19、货交易平台上该种机械设备的平均交易价格 y关于其使用时间 x的回归方程 x y z i110 xiyi i110 xizi i110 x2i 5.5 8.7 1.9 301.4 79.75 385 表中 zln y, z110i110zi. 根据上述相关数据,求 y关于 x的回归方程; 根据上述回归方程,求当使用时间 x15 时,该种机械设备的平均交易价格的预报值(精确到 0.01) 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 vu的斜率和截距的最小二乘估计分别为i110uivin uvi110u2in u2, v u. 参考数据:e0.551.733,e0.9
20、50.3867,e1.850.1572. 解 (1)由图 1 中频率分布直方图可知,从 2019 年成交的该种机械设备中使用时间 x(12,16的台数为 10040.0312,使用时间 x(16,20的台数为10040.014, 按分层抽样所抽取的 4 台中,使用时间 x(12,16的设备有 3 台,分别记为 a,b,c; 使用时间 x(16,20的设备有 1台,记为 d, 从这 4 台设备中随机抽取 2 台的结果为(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共有 6 种等可能出现的结果,其中这 2 台设备的使用时间都在(12,16的结果为(a,b),(a,c),(
21、b,c),共有 3 种,故所求事件的概率为12 / 39 3612. (2)由题意得 zln yln ebxabxa, bi110 xizi10 xzi110 x2i10 x279.75105.51.9385105.520.3, a zb x1.90.35.53.55, z 关于 x的线性回归方程为z0.3x3.55, y关于 x的回归方程为ye0.3x3.55. 由知,当使用时间 x15 时,ye0.3153.550.39,故该种机械设备的平均交易价格的预报值为 0.39 万元 角度 2 独立性检验在实际中的应用 例 4 (1)(多选)(2020 山东省烟台市模拟)某校计划在课外活动中新增攀
22、岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男女生人数相同,并绘制了如图所示的等高条形图,则( ) p(k2k0) 0.05 0.01 k0 3.841 6.635 参考公式:k2n(adbc)2(ab)(cd)(ac)(bd),nabcd. a参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多 b参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多 13 / 39 c若参与调查的男女生人数均为 100 人,则有 99%的把握认为喜欢攀岩和性别有关 d无论参与调查的男女生人数为多少,都有 99%的把握认为喜欢攀岩和性别有关 答案 ac 解析 对于 a
23、,因为参加调查的男女生人数相同,而男生中喜欢攀岩的占80%,女生中喜欢攀岩的占 30%,所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,所以 a 正确;对于 b,参与调查的女生中喜欢攀岩的人数占 30%,不喜欢攀岩的人数占 70%,所以参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,所以 b 错误;对于 c,若参与调查的男女生人数均为 100人,根据图表,列出 22 列联表如下: 喜欢 不喜欢 总计 男 80 20 100 女 30 70 100 总计 110 90 200 所以 k2200(80702030)21109010010050009950.5056.635, 所以
24、有 99%的把握认为喜欢攀岩和性别有关,所以 c 正确;对于 d,如果不确定参与调查的男女生人数,无法计算是否有 99%的把握认为喜欢攀岩和性别有关,所以 d错误故选 ac. (2)(2020 山东省淄博市模拟)新生儿某疾病要接种三次疫苗免疫(即 0,1,6 月龄),假设每次接种之间互不影响,每人每次接种成功的概率相等为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10 g/次剂量组与 20 g/次剂量组,试验结果如表: 接种成功 接种不成功 总计(人) 10 g/次剂量组 900 100 1000 20 g/次剂量组 973 27 1000 14 / 39
25、 总计(人) 1873 127 2000 根据数据说明哪种方案接种效果好?并判断能否有 99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关? 以频率代替概率,若选用接种效果好的方案,参与该试验的 1000 人的成功人数比此剂量只接种一次的成功人数平均提高多少人? 参考公式:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. 参考附表: p(k2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 由于两种接种方案都是 1000 人接受临床试验,接种成功人数 10 g/次剂量组 900 人,20 g/次剂量组 973人,且 973
26、900, 所以方案 20 g/次剂量组接种效果好; 计算 k22000(90027100973)210001000187312744.80610.828, 所以有 99.9%的把握认为该疾病疫苗接种成功与两种接种方案有关 假设 20 g/次剂量组临床试验接种一次成功的概率为 p, 由数据知,三次接种成功的概率为97310000.973,不成功的概率为2710000.027, 由于三次接种之间互不影响,每人每次接种成功的概率相等, 所以(1p)30.027,解得 p0.7; 设参与试验的 1000 人此剂量只接种一次成功的人数为 x, 显然 xb(1000,0.7),e(x)10000.7700
27、, 参与试验的 1000 人此剂量只接种一次成功的人数平均为 700人, 且 973700273, 试验选用 20 g/次剂量组方案,参与该试验的 1000 人比此剂量只接种一次的成功人数平均提高 273 人 独立性检验的关键 15 / 39 (1)根据 22 列联表准确计算 k2,若 22 列联表没有列出来,要先列出此表 (2)k2的观测值 k 越大,对应假设事件 h0成立的概率越小,h0不成立的概率越大 某市自 2020 年 5 月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机
28、动车的通畅率降低该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为 0.4,并从穿越该路口的行人中随机抽取了 200 人进行调查,对是否存在闯红灯情况得到22列联表如下: 30岁以下 30岁以上 合计 闯红灯 60 未闯红灯 80 合计 200 近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口试行了对闯红灯行人进行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了 200 人进行调查,得到下表: 处罚金额(单位:元) 5 10 15 20 闯红灯的人数 50 40 20 0 将统计数据所得频率代替概率,完成下列问题 (1)将 22 列联表填写完
29、整(不需写出填写过程),并根据表中数据分析,在未试行对闯红灯行人进行经济处罚前,是否有 99.9%的把握认为闯红灯与年龄有关; (2)当处罚金额为 10元时,行人闯红灯的概率会比不进行处罚降低多少; (3)结合调查结果,谈谈如何治理行人闯红灯现象 参考公式:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. 16 / 39 参考数据: p(k2k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.132 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1) 30岁以下 30岁以
30、上 合计 闯红灯 20 60 80 未闯红灯 80 40 120 合计 100 100 200 k2200(40206080)210010080120100333.33310.828. 有 99.9%的把握认为闯红灯与年龄有关 (2)未进行处罚前,行人闯红灯的概率为 0.4,进行处罚 10 元后,行人闯红灯的概率为40200150.2, 降低了 0.2. (3)根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对 30 岁以上人群开展“道路安全”宣传教育;由于处罚可以明显降低行人闯红灯的概率,所以可以进行适当处罚来降低行人闯红灯的概率 真题真题押题押题 真题检验 1(2020 全国卷)某校一
31、个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图: 17 / 39 由此散点图,在 10 至 40 之间,下面四个回归方程类型中最适宜作为发芽率 y和温度 x的回归方程类型的是( ) ayabx byabx2 cyabex dyabln x 答案 d 解析 由散点图分布可知,散点图分布在一个对数型函数图象的附近,因此最适宜作为发芽率 y和温度 x的回归方程类型的是 yabln x故选 d. 2(2020 全国卷)设一组样本数据 x1,x2,xn的方差为 0.01,则数
32、据10 x1,10 x2,10 xn的方差为( ) a0.01 b0.1 c1 d10 答案 c 解析 因为数据 axib(i1,2,n)的方差是数据 xi(i1,2,n)的方差的 a2倍,所以所求数据的方差为 1020.011.故选 c. 3(2020 全国卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3,p4,且4i1pi1,则下面四种情形中,对应样本的标准差最大的一组是( ) ap1p40.1,p2p30.4 bp1p40.4,p2p30.1 cp1p40.2,p2p30.3 dp1p40.3,p2p30.2 答案 b 解析 对于 a,该组数据的平均数为 xa(1
33、4)0.1(23)0.42.5, 方差为 s2a(12.5)20.1(22.5)20.4(32.5)20.4(42.5)20.118 / 39 0.65; 对于 b,该组数据的平均数为 xb(14)0.4(23)0.12.5, 方差为 s2b(12.5)20.4(22.5)20.1(32.5)20.1(42.5)20.41.85; 对于 c,该组数据的平均数为 xc(14)0.2(23)0.32.5, 方差为 s2c(12.5)20.2(22.5)20.3(32.5)20.3(42.5)20.21.05; 对于 d,该组数据的平均数为 xd(14)0.3(23)0.22.5, 方差为 s2d(
34、12.5)20.3(22.5)20.2(32.5)20.2(42.5)20.31.45. 因此,b 项这一组样本数据的标准差最大故选 b. 4(2020 江苏高考)已知一组数据 4,2a,3a,5,6 的平均数为 4,则 a 的值是_. 答案 2 解析 数据 4,2a,3a,5,6 的平均数为 4, 42a3a5620,解得 a2. 5(2020 新高考卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100 天空气中的 pm2.5 和 so2浓度(单位:g/m3),得下表: so2 pm2.5 0,50 (50,150 (150,475 0,35 32 18
35、4 (35,75 6 8 12 (75,115 3 7 10 (1)估计事件“该市一天空气中 pm2.5 浓度不超过 75,且 so2浓度不超过150”的概率; (2)根据所给数据,完成下面的 22列联表: so2 0,150 (150,475 19 / 39 pm2.5 0,75 (75,115 (3)根据(2)中的列联表,判断是否有 99%的把握认为该市一天空气中 pm2.5浓度与 so2浓度有关? 附:k2n(adbc)2(ab)(cd)(ac)(bd). p(k2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解 (1)由表格中的数据可知,该市 10
36、0 天中,空气中的 pm2.5 浓度不超过75,且 so2浓度不超过 150 的天数有 32618864天, 所以该市一天空气中 pm2.5 浓度不超过 75,且 so2浓度不超过 150 的概率为641000.64. (2)由所给数据,可得 22列联表为 so2 pm2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 (3)根据 22 列联表中的数据可得 k2n(adbc)2(ab)(cd)(ac)(bd)100(64101610)280207426 36004817.4846.635, 所以有 99%的把握认为该市一天空气中 pm2.5 浓度与 so2浓
37、度有关 6(2020 全国卷)某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200 (200,400 (400,600 1(优) 2 16 25 20 / 39 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染) 7 2 0 (1)分别估计该市一天的空气质量等级为 1,2,3,4的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为 1 或 2,则称这天“空气质量好”;若某天的空气质量等级为 3 或 4,
38、则称这天“空气质量不好”根据所给数据,完成下面的22 列联表,并根据列联表,判断是否有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次400 人次400 空气质量好 空气质量不好 附:k2n(adbc)2(ab)(cd)(ac)(bd). p(k2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解 (1)由频数分布表可知,该市一天的空气质量等级为 1 的概率为216251000.43,空气质量等级为 2 的概率为510121000.27,空气质量等级为 3的概率为6781000.21,空气质量等级为 4的概率为7201000.09.
39、 (2)由频数分布表可知,一天中到该公园锻炼的平均人次的估计值为100203003550045100350. (3)22 列联表如下: 人次400 人次400 空气质量好 33 37 空气质量不好 22 8 21 / 39 k2100(3383722)2554570305.8203.841, 因此,有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关 7(2020 全国卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为 a,b,c,d 四个等级加工业务约定:对于 a 级品、b 级品、c 级品,厂家每件分别收取加工费 90 元,50 元,20 元;对于 d 级品,厂
40、家每件要赔偿原料损失费 50 元该厂有甲、乙两个分厂可承接加工业务甲分厂加工成本费为 25 元/件,乙分厂加工成本费为 20 元/件厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了 100件这种产品,并统计了这些产品的等级,整理如下: 甲分厂产品等级的频数分布表: 等级 a b c d 频数 40 20 20 20 乙分厂产品等级的频数分布表: 等级 a b c d 频数 28 17 34 21 (1)分别估计甲、乙两分厂加工出来的一件产品为 a级品的概率; (2)分别求甲、乙两分厂加工出来的 100 件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务? 解 (1)由表中数
41、据可知,甲厂加工出来的一件产品为 a 级品的概率为401000.4,乙厂加工出来的一件产品为 a级品的概率为281000.28. (2)甲分厂加工 100 件产品的总利润为 40(9025)20(5025)20(2025)20(5025)1500 元, 所以甲分厂加工 100 件产品的平均利润为 15元/件 乙分厂加工 100 件产品的总利润为 28(9020)17(5020)34(2020)21(5020)1000 元, 22 / 39 所以乙分厂加工 100 件产品的平均利润为 10元/件 故厂家应选择甲分厂承接加工业务 8(2020 全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生
42、动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的 200个地块,从这些地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中 xi和 yi分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20i1xi60,20i1yi1200,20i1 (xix)280,20i1 (yi y)29000,20i1 (xi x) (yi y)800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数); (2)求样本(xi,yi)(i1,2,20)的相关系数
43、(精确到 0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由 附:相关系数 rni1 (xi x)(yi y)ni1 (xi x)2ni1 (yi y)2, 21.414. 解 (1)每个样区野生动物数量的平均数为12020i1yi120120060,地块数为200,所以该地区这种野生动物数量的估计值为 2006012000. (2)样本(xi,yi)的相关系数为 r20i1 (xi x)(yi y)20i1 (xi x)220i1 (yi y)28008090002 230
44、.94. (3)由于各地块间植物覆盖面积差异很大,为提高样本数据的代表性,应采用分层抽样, 先将植物覆盖面积按优、中、差分成三层, 在各层内按比例抽取样本, 23 / 39 在每层内用简单随机抽样法抽取样本即可 金版押题 9光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表: 年份 2012 年 2013 年 2014 年 2015 年 2016年 2017 年 2018 年 2019 年 年份 代码 x 1 2 3 4 5 6 7 8 新增光 伏装机 量 y兆瓦 0.4 0.8 1.6 3.1 5.1 7.
45、1 9.7 12.2 某位同学分别用两种模型:ybx2a,ydxc 进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于 yiyi): 经过计算得i18 (xi x)(yi y)72.8,i18 (xi x)242,i18 (ti t )(yi y)686.8,i18 (ti t )23570,其中 tix2i, t 18i18ti. (1)根据残差图,比较模型,的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)的判断结果及表中数据建立 y 关于 x 的回归方程,并预测该地区24 / 39 2021年新增光伏装机量是多少?(在计算回归系数时精确到 0.01) 附:
46、回归直线的斜率和截距的最小二乘估计公式分别为 bi18 (xi x)(yi y)i18 (xi x)2,a yb x. 解 (1)选择模型. 理由如下:根据残差图可以看出,模型的估计值和真实值比较接近,模型的残差值相对较大一些,所以模型的拟合效果相对较好 (2)由(1)可知,y关于 x 的回归方程为ybx2a, 令 tx2, 则ybta. 由所给数据可得 t 18i18ti18(1491625364964)25.5. y18i18yi18(0.40.81.63.15.17.19.712.2)5, 所以bi18 (ti t )(yi y)i18 (ti t )2686.835700.19, a
47、yb t 50.1925.50.16, 所以 y关于 x的回归方程为y0.19x20.16, 当 x10 时,y0.191020.1619.16, 故预测该地区 2021 年新增光伏装机量为 19.16兆瓦 专题作业专题作业 25 / 39 一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的 1(2020 山东菏泽一中模拟)空气质量指数 aqi 是用来反映空气质量状况的,aqi越小,表明空气质量越好,其对应关系如下表: aqi 050 51100 101150 151200 201300 300 空气质量 优 良 轻度污染 中度污染 重度污染 严重污染 下图是某市今年某月 1 日至
48、 20 日的 aqi折线图 下列叙述错误的是( ) a这 20 天的 aqi的中位数略高于 100 b这 20天中空气质量为中度污染及以上的天数占14 c该市该月的前半个月的空气质量越来越好 d总体来说,该市该月上旬的空气质量比中旬的空气质量好 答案 c 解析 对于 a,将这 20 天的 aqi 从小到大排序后,第 10 个数据略小于100,第 11 个数据约为 120,因为中位数是这两个数据的平均数,所以中位数略高于 100,故 a 正确;对于 b,这 20 天中,aqi 大于 150 的有 5 天,故空气质量为中度污染及以上的天数占14,故 b 正确;对于 c,由题中折线图可知,这 20天
49、中,前 5 天空气质量越来越好,从 6 日开始至 15 日空气质量越来越差,故 c错误;对于 d,由题中折线图可知,上旬 aqi 大部分在 100 以下,中旬 aqi 大部分在 100 以上,故该市该月上旬的空气质量比中旬的好,故 d正确故选 c. 2(2020 山东潍坊模拟)为庆祝中华人民共和国成立 70 周年,我国于 2019年 10 月 1日在北京天安门广场举行了大型阅兵仪式在此次活动中,共有 15 个26 / 39 徒步方队,32 个装备方队,12 个空中梯队,官兵约 15000 名通过天安门广场接受党和人民的检阅若按照方队个数进行分层抽样,从徒步方队与空中梯队中共选出 18 个方队,
50、则选出的空中梯队的个数为( ) a12 b10 c8 d6 答案 c 解析 空中梯队所占的比例为12151249,故选出的空中梯队的个数为18498,故选 c. 3某考察团对 10 个城市的职工人均工资 x(千元)与人均消费 y(千元)进行调查统计,得出 y 与 x 具有线性相关关系,且回归方程为y0.6x1.2.若某城市职工人均工资为 5 千元,估计该城市职工人均消费额占人均工资收入的百分比为( ) a66% b67% c79% d84% 答案 d 解析 y 与 x 具有线性相关关系,满足回归方程y0.6x1.2,该城市职工人均工资为 x5,可以估计该城市的职工人均消费水平y0.651.24
51、.2,可以估计该城市职工人均消费额占人均工资收入的百分比为4.2584%. 4(2019 全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9个原始评分相比,不变的数字特征是( ) a中位数 b平均数 c方差 d极差 答案 a 解析 中位数是将 9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉 1个最高分和 1个最低分,不变的是中位数,平均数、方差、极差27 / 39 均受影响故选 a. 5一个样本容量为 10 的样本数据,它们组成一个公差不为 0 的等差数列
52、an,若 a38,且 a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( ) a13,12 b13,13 c12,13 d13,14 答案 b 解析 设等差数列an的公差为 d(d0),因为 a1,a3,a7成等比数列,a38,所以 a1a7a2364,即(82d)(84d)64,2dd20,又 d0,故 d2,故样本数据为 4,6,8,10,12,14,16,18,20,22,平均数为(422)51013,中位数为1214213. 6(2020 山东省济南市高三 6 月针对性训练)“平均增长量”是指一段时间内某一数据指标增长量的平均值,其计算方法是将每一期增长量相加后,除以期数,即
53、ni1 (aiai1)n1.国内生产总值(gdp)被公认为是衡量国家经济状况的最佳指标,如表是我国 20152019 年 gdp 数据: 年份 2015 2016 2017 2018 2019 国内生产总值/万亿 68.89 74.64 83.20 91.93 99.09 根据表中数据,20152019年我国 gdp 的平均增长量为( ) a5.03 万亿 b6.04万亿 c7.55万亿 d10.07万亿 答案 c 解析 设 2015 年国内生产总值为 a168.89 万亿,则依次 a274.64 万亿,a383.20 万亿,a491.93 万亿,a599.09 万亿.20152019 年我国
54、 gdp 的平均增长量为 (74.6468.89)(83.2074.64)(91.9383.20)(99.0991.93)4 28 / 39 99.0968.89430.247.55万亿元 7.(2020 江淮十校第一次联考)某省新高考采取的是“312”模式,“3”指“语文、数学、英语”,均为必考科目,“1”指在“物理、历史”中任选 1 科作为考试科目,“2”指在“化学、生物、政治、地理”中任选 2 科作为考试科目,为了指导学生进行合理选科,班主任唐老师将每个学生选考科目的成绩制成 5 分制的雷达图,已知甲同学成绩的雷达图如图所示,以全年级同学的成绩为标准进行比较,则甲同学较为理想的选科为(
55、) a物理化学地理 b物理生物地理 c历史生物地理 d物理化学生物 答案 b 解析 由题中雷达图得,甲同学物理、历史、地理科目的分数高于年级平均分,生物科目的分数等于年级平均分,但物理、历史中只能选择 1 科为考试科目,甲同学物理比历史更有优势,则甲同学较为理想的选科为物理生物地理,故选 b. 8(2020 山东省德州市二模)某中学共有 1000 人,其中男生 700 人,女生300 人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于 4小时),现在用分层抽样的方法从中收集 200 位学生每周平均体育锻炼时间的
56、样本数据(单位:小时),其频率分布直方图如图已知在样本数据中,有 40 位女生的每周平均体育锻炼时间超过 4小时,根据独立性检验原理( ) 29 / 39 附:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. p(k2k0) 0.10 0.05 0.01 0.005 k0 2.706 3.841 6.635 7.879 a有 95%的把握认为“该校学生每周平均体育锻炼时间与性别无关” b有 90%的把握认为“该校学生每周平均体育锻炼时间与性别有关” c有 90%的把握认为“该校学生每周平均体育锻炼时间与性别无关” d有 95%的把握认为“该校学生每周平均体育锻炼时间与性
57、别有关” 答案 b 解析 由频率分布直方图可知,每周平均体育锻炼时间不少于 4 小时的频率为 2(0.150.1250.0750.025)0.75,故经常进行体育锻炼的学生有2000.75150 人又其中有 40 位女生的每周平均体育锻炼时间超过 4 小时,故有 15040110 位男生经常锻炼根据分层抽样的方法可知,样本中男生的人数为7001000200140,女生的人数为300100020060.列出 22列联表如下: 男生 女生 总计 经常锻炼 110 40 150 不经常锻炼 30 20 50 总计 140 60 200 故 k2200(110203040)214060150503.1
58、7,因为 2.7063.17569,所以第 4 天的平均单场门票价格低于 20 元,所以 d错误故选 ab. 10(2020 山东嘉祥一中模拟)在某次高中学科知识竞赛中,对 4000 名考生的竞赛成绩(单位:分)进行统计,得到如图所示的频率分布直方图,其中分组为40,50),50,60),60,70),70,80),80,90),90,100,60 分以下视为不及格,若同一组数据用该组区间中点值作代表,则下列说法中正确的是( ) a成绩在70,80)内的考生人数最多 31 / 39 b不及格的考生人数为 1000 c考生竞赛成绩的平均分约为 70.5分 d考生竞赛成绩的中位数为 75分 答案
59、abc 解析 由题中频率分布直方图可得,成绩在70,80)内的频率最高,因此成绩在70,80)内的考生人数最多,故 a 正确;成绩在40,60)内的频率为 0.01100.015100.25,因此不及格的人数为 40000.251000,故 b 正确;考生竞赛成绩的平均分约为 450.1550.15650.2750.3850.15950.170.5(分),故 c 正确;因为成绩在40,70)内的频率为 0.45,在70,80)内的频率为 0.3,所以考生竞赛成绩的中位数为 70100.050.371.67(分),故 d 错误故选 abc. 11(2020 长沙一中模拟)某大学为了解学生对学校食
60、堂服务的满意度,随机调查了 50 名男生和 50 名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下列联表经计算 k2的观测值 k4.762,则可以推断出( ) 满意 不满意 总计 男 30 20 50 女 40 10 50 总计 70 30 100 p(k2k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635 a该学校男生对食堂服务满意的概率的估计值为35 b调研结果显示,该学校男生比女生对食堂服务更满意 c有 95%的把握认为对该食堂服务的评价与性别有关 d有 99%的把握认为对该食堂服务的评价与性别有关 答案 ac 32 / 39 解析 对于 a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 英语三年级上册人教版三年级英语上册recycle1第二课时模板-英语
- 钢铁物流货运车辆挂靠承运合作协议
- 生物制药研发项目知识产权质押融资合同
- 数据中心机房基础设施改造与智能化升级合同
- 矿山设备工业设计专利许可与技术输出合同
- 网红饮品品牌授权与品牌推广合作合同
- 健身俱乐部私教课程全年销售与服务合同
- 繁华街区广告位租赁及品牌合作宣传协议
- 旅游度假区租赁合同(休闲娱乐)
- 新能源汽车电池租赁业务保险理赔操作规范合同
- GB/T 37356-2019色漆和清漆涂层目视评定的光照条件和方法
- GB/T 262-2010石油产品和烃类溶剂苯胺点和混合苯胺点测定法
- GB/T 22720.1-2017旋转电机电压型变频器供电的旋转电机无局部放电(Ⅰ型)电气绝缘结构的鉴别和质量控制试验
- 机柜间主体施工方案
- 福格行为模型
- 银级考试题目p43测试题
- 有限空间作业及应急物资清单
- 思想道德与法治教案第一章:领悟人生真谛把握人生方向
- 0-6岁儿童随访表
- 江西新定额2017土建定额说明及解释
- 国家电网有限公司十八项电网重大反事故措施(修订版)-2018版(word文档良心出品)
评论
0/150
提交评论