2019年高考数学大一轮复习 热点聚焦与扩展 专题68 统计案例.doc_第1页
2019年高考数学大一轮复习 热点聚焦与扩展 专题68 统计案例.doc_第2页
2019年高考数学大一轮复习 热点聚焦与扩展 专题68 统计案例.doc_第3页
2019年高考数学大一轮复习 热点聚焦与扩展 专题68 统计案例.doc_第4页
2019年高考数学大一轮复习 热点聚焦与扩展 专题68 统计案例.doc_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题68 统计案例【热点聚焦与扩展】纵观近几年的高考试题,对统计案例的考查重点有用样本估计总体、回归分析和独立性检验等考查数据处理能力以及分析问题解决问题的能力.有时概率统计问题一同考查.难度控制在中等本专题在分析研究近几年高考题及各地模拟题的基础上,举例说明.1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关2两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线(2)回归方程为x,其中.(3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法(4)相关系数:当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性3独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd【经典例题】例1.【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为已知,该班某学生的脚长为24,据此估计其身高为(A) (B) (C) (D)【答案】C【解析】试题分析:由已知 ,选C.例2.【2018届【衡水金卷】四省第三次大联考】近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S城某大学的10000名(其中男生6000名,女生4000名)在校本科生.按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计.通过整理得到如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人,根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:其中A. 月消费金额超过2000元的女生人数少于男生人数B. 所调查的同学中月消费金额不超过500元的共有4人C. 样本数据的中位数约为1750元D. 在犯错的概率不超过的情况下认为月消费金额在2000元以上的大学生与性别有关【答案】D月消费金额不超过500元的人数为0.00451000=20人,故选项B错误;又由频率分布直方图知,当消费金额小于1750元时,频率为(0.004+0.027+0.039)5+0.085=0.550.5.选项C错误;由条件可以列出列联表:男生女生合计消费金额不超过2000元500人250人750人消费金额超过2000元100人150人250人合计600人400人1000人故K2的观测值,所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关.本题选择D选项. 例3.【2018届安徽省江南十校二模】甲乙两个班进行物理测试,其中女生人,男生人,从全部人任取一人及格的概率为,并且男生和女生不及格人数相等.(1)完成如下列联表及格不及格合计女男合计(2)根据表中数据,能否在犯错误的概率不超过的前提下认为物理成绩及格与学生性别有关?(3)从两个班有放回的任取人,记抽取的人中不及格人数为,求的数学期望和方差.附:.【答案】(1)见解析(2)没有(3),【解析】分析:(1)根据题意填写列联表即可;(2)利用列联表和所给公式求值,再利用临界值表进行判定;(3)先判定该分布为二项分布,再利用二项分布的期望公式和方差公式进行求解详解:(1)及格不及格合计女男合计例4.【2018年理数全国卷II】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图 为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型根据2000年至2016年的数据(时间变量的值依次为)建立模型:;根据2010年至2016年的数据(时间变量的值依次为)建立模型: (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由【答案】(1)利用模型预测值为226.1,利用模型预测值为256.5,(2)利用模型得到的预测值更可靠详解:(1)利用模型,该地区2018年的环境基础设施投资额的预测值为 =30.4+13.519=226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.例5.【河南省洛阳市2018届三模】高中生在被问及“家,朋友聚集的地方,个人空间”三个场所中“感到最幸福的场所在哪里?”这个问题时,从洛阳的高中生中,随机抽取了55人,从上海的高中生中随机抽取了45人进行答题.洛阳高中生答题情况是:选择家的占、选择朋友聚集的地方的占、选择个人空间的占.上海高中生答题情况是:选择朋友聚集的地方的占、选择家的占、选择个人空间的占.(1)请根据以上调查结果将下面列联表补充完整,并判断能否有的把握认为“恋家(在家里感到最幸福)”与城市有关:在家里最幸福在其它场所最幸福 合计洛阳高中生上海高中生合计(2) 从被调查的不“恋家”的上海学生中,用分层抽样的方法选出4人接受进一步调查,从被选出的4 人中随机抽取2人到洛阳交流学习,求这2人中含有在“个人空间”感到幸福的学生的概率.附:,其中d.【答案】(1)见解析;(2).【解析】分析:第一问就需要根据题意,将对应的数据填入表中的相应位置,之后应用公式求得观测值,与表中所给的临界值比较,得出结果;第二问将所有的基本事件和满足条件的基本事件都写出来,之后借助于古典概型概率公式求得结果.详解:(1)由已知得,在家里最幸福在其它场所最幸福 合计洛阳高中生223355上海高中生93645合计3169100,有的把握认为“恋家”与城市有关.例6.【2018年全国卷文】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过不超过第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:,【答案】(1)第二种生产方式的效率更高理由见解析(2)超过不超过第一种生产方式155第二种生产方式515(3)有详解:(1)第二种生产方式的效率更高理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分(2)由茎叶图知列联表如下:超过不超过第一种生产方式155第二种生产方式515(3)由于,所以有99%的把握认为两种生产方式的效率有差异例7.【2018年全国卷理】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过不超过第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:, 【答案】(1)第二种生产方式的效率更高. 理由见解析(2)80(3)能详解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致列联表如下:超过不超过第一种生产方式155第二种生产方式515(3)由于,所以有99%的把握认为两种生产方式的效率有差异.点睛:本题主要考查了茎叶图和独立性检验,考察学生的计算能力和分析问题的能力,贴近生活。例8【山东省潍坊市2018届三模】新能源汽车的春天来了!2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:(1)经分析发现,可用线性回归模型拟合当地该品牌新能源汽车实际销量(万辆)与月份编号之间的相关关系.请用最小二乘法求关于的线性回归方程,并预测2018年5月份当地该品牌新能源汽车的销量;(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到如下一份频数表:(i)求这200位拟购买新能源汽车的消费者对补贴金额的心理预期值的样本方差及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);(ii)将对补贴金额的心理预期值在(万元)和(万元)的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,求抽出的3人中至少有1名“欲望膨胀型”消费者的概率.参考公式及数据:回归方程,其中,;.【答案】(1),销量约为2万辆;(2)(i)见解析,(ii)0.8【解析】分析:(1)利用最小二乘法的计算公式,即可求解回归直线方程,作出预测;(2)(i)根据题意,利用平均数和方差的计算公式,即可求解数据的平均数和方差,根据中位数的定义,得到数据的中位数;详解:(1)易知,则关于的线性回归方程为,当时,即2018年5月份当地该品牌新能源汽车的销量约为2万辆.(2)(i)根据题意,这200位拟购买新能源汽车的消费者对补贴金额的心里预期值的平均值,样本方差及中位数的估计值分别为:共20种其中至少有1名“欲望膨胀型”消费者的情况由16种记事件为“抽出的3人中至少有1名欲望膨胀型消费者”,则例9.【2017课标1,文19】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸995101299699610019929981004抽取次序910111213141516零件尺寸10269911013100292210041005995经计算得,其中为抽取的第个零件的尺寸,(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到001)附:样本的相关系数,【答案】(1),可以;(2)()需要;()均值与标准差估计值分别为1002,009【解析】试题分析:(1)依公式求;(2)(i)由,得抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查;(ii)剔除第13个数据,则均值的估计值为1002,方差为009(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为1002,剔除第13个数据,剩下数据的样本方差为,这条生产线当天生产的零件尺寸的标准差的估计值为例10.【2017课标II,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1) 设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附: 【答案】(1);(2) 有的把握认为箱产量与养殖方法有关;(3)。【解析】,故的估计值为0。66因此,事件A的概率估计值为。(2)根据箱产量的频率分布直方图得列联表箱产量箱产量旧养殖法6238新养殖法3466由于,故有的把握认为箱产量与养殖方法有关。【精选精练】1【2018届【衡水金卷】四省第三次大联考】近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对s城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:.A. 月消费金额超过2000元的女生人数少于男生人数B. 所调查的同学中月消费金额不超过500元的共有4人C. 样本数据的中位数约为1750元D. 在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关【答案】D由题知,月消费金额超过2000元的男生人数为100人,故A选项错误;月消费金额不超过500元的人数为0.00451000=20人,故选项B错误;又由频率分布直方图知,当消费金额小于1750元时,频率为(0.004+0.027+0.039)5+0.085=0.550.5.选项C错误;由条件可以列出列联表:男生女生合计消费金额不超过2000元500人250人750人消费金额超过2000元100人150人250人合计600人400人1000人故K2的观测值,所以在犯错的概率不超过0.1%的情况下可以判断月消费金额在2000元以上的大学生与性别有关.本题选择D选项.2.【2018届辽宁省葫芦岛市二模】下列说法:线性回归方程必过;命题“”的否定是“” 相关系数越小,表明两个变量相关性越弱;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是_(把你认为正确的结论都写在横线上)本题可参考独立性检验临界值表:【答案】【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果详解:线性回归方程必过样本中心点,故正确命题“”的否定是“” 故错误相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.故答案为.3【2018届河北省石家庄二中三模】如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的个点所对应的数据的相关系数最大,则应当去掉的点是_【答案】. 点睛:(1)本题主要考查回归直线方程和相关系数,意在考查学生对这些基础知识的掌握水平.(2) 两个变量之间线性相关关系的强弱用相关系数来衡量.相关系数 ,表示两个变量正相关;,表示两个变量负相关;的绝对值越接近1,表明两个变量的线性相关性越强.的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系.通常,的绝对值大于0.75时,表明两个变量的线性相关性很强.4某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟订的价格进行试销,得到如下数据.单价(元)456789销量(件)908483807568由表中数据求得线性回归方程,则元时预测销量为_件【答案】66.【解析】分析:计算样本中心,代入回归方程解出a,得到回归方程,再计算当x=10时的预测值,进而得到答案详解:由题得:故答案为66.5【2018届四川省双流中学二模】为推动实施健康中国战略,树立国家大卫生、大健康概念,手机APP也推出了多款健康运动软件,如“微信运动”,杨老师的微信朋友圈内有600位好友参与了“微信运动”,他随机选取了40位微信好友(女20人,男20人),统计其在某一天的走路步数,其中,女性好友的走路步数数据记录如下:5860852073266798732584303216745311754986087536450729048501022397637988917664215980男性好友走路的步数情况可分为五个类别:(说明:“”表示大于等于0,小于等于2000,下同),且,三种类别人数比例为,将统计结果绘制如图所示的条形图,若某人一天的走路步数超过8000步被系统认定为“卫健型”,否则被系统认定为“进步型”.若以杨老师选取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信好友圈里参与“微信运动”的600名好友中,每天走路步数在500110000步的人数;请根据选取的样本数据完成下面的列联表并据此判断能否有以上的把握认定“认定类型”与“性别”有关?卫健型进步型总计男20女20总计40若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,再从中任意选取3人,记选到“卫健型”的人数为,女性好友中按比例选取5人,再从中任意选取2人,记选到“卫健型”的人数为,求事件“”的概率.附:,【答案】(1)375(2)没有(3)人, 在女性好友中“卫健型”与“进步型”的比例为, 恰好选取“卫健型”2人, “进步型”3人, “”包含“,”,“,”,“,”,“,”,按公式计算即可.详解:(1)在样本数据中,男性好友类别设为人,则由题意可知,可知,故类别有2人,类别有6人,类别有8人,走路步数在500110000步的包括,两类别共计9人;女性好友走路步数在500110001步共有16人.用样本数据估计所有微信好友每日走路频数的概率分布,则:人.(2)根据题意选取的40个样本数据的列联表为:卫健型进步型总计男14620女81220总计221840得:,,,故.6【2018届四川省成都市第七中学三诊】中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在1565岁的人群中随机调查100人,调査数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄支持“延迟退休”的人数155152817(1)由以上统计数据填列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;45岁以下45岁以上总计支持不支持总计(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.记抽到45岁以上的人数为,求随机变量的分布列及数学期望.参考数据:0.1000.0500.0100.0012.7063.8416.63510.828,其中【答案】(1)能(2)见解析【解析】分析:(1)由统计数据填写列联表,计算观测值,对照临界值得出结论;(2)求抽到1人是45岁以下的概率,再求抽到1人是45岁以上的概率,根据题意知的可能取值,计算对应的概率值,写出随机变量的分布列,计算数学期望值详解:(1)由频率分布直方图知45岁以下与45岁以上各50人,故填充列联表如下:45岁以下45岁以上总计支持354580不支持15520总计5050100从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.所以的可能取值为0,1,2.,.故随机变量的分布列为:012所以.7【2018届河南省巩义市市直高中模拟】某印刷厂为了研究单册书籍的成本(单位:元)与印刷册数(单位:千册)之间的关系,在印制某种书籍时进行了统计,相关数据见下表:印刷册数(千册)单册成本(元)根据以上数据,技术人员分别借助甲、乙两种不同的回归模型,得到两个回归方程,方程甲:,方程乙:.(1)为了评价两种模型的拟合效果,完成以下任务.完成下表(计算结果精确到);印刷册数(千册)单册成本(元)模型甲估计值 残差 模型乙估计值 残差 分别计算模型甲与模型乙的残差平方和,并通过比较,判断哪个模型拟合效果更好.(2)该书上市之后,受到广大读者热烈欢迎,不久便全部售罄,于是印刷厂决定进行二次印刷,根据市场调查,新需求量为千册,若印刷厂以每册元的价格将书籍出售给订货商,求印刷厂二次印刷千册获得的利润?(按(1)中拟合效果较好的模型计算印刷单册书的成本).【答案】(1)见解析模型乙的拟合效果更好(2)印刷利润元.详解:(1)经计算,可得下表:印刷册数(千册)单册成本(元)模型甲估计值 残差 模型乙估计值 残差 ,故模型乙的拟合效果更好;(2)二次印刷千册,由(1)可知,单册书印刷成本为(元),故印刷总成本为(元),印刷利润元.8【2018届山东省实验中学二模】2018 年1月16日,由新华网和中国财经领袖联盟联合主办的2017中国财经年度人物评选结果揭晓,某知名网站财经频道为了解公众对这些年度人物是否了解,利用网络平台进行了调查,并从参与调查者中随机选出人,把这人分为 两类(类表示对这些年度人物比较了解,类表示对这些年度人物不太了解),并制成如下表格:年龄段 岁岁岁岁岁岁岁岁人数类所占比例(1)若按照年龄段进行分层抽样,从这人中选出人进行访谈,并从这人中随机选出两名幸运者给予奖励.求其中一名幸运者的年龄在岁岁之间,另一名幸运者的年龄在岁岁之间的概率;(注:从人中随机选出人,共有种不同选法)(2)如果把年龄在 岁岁之间的人称为青少年,年龄在岁岁之间的人称为中老年,则能否在犯错误的概率不超过的前提下认为青少年与中老年人在对财经年度人物的了解程度上有差异?参考数据:,其中 x/k/w【答案】(1).(2)在犯错误的概率不超过的前提下认为青少年与老年人在对财经年度人物的了解程度上有差异.详解:(1)按照年龄段进行分层抽样,从这人中选出人,则年龄在岁岁之间的有人,年龄在岁岁之间的有人,记作,年龄在岁岁之间的有人,记作,年龄岁岁在之间的有人.(2)青少年中类的人数为,则类的人数为中老年中类的人数为,则类的人数为列出列联表如下:类类合计青少年中老年合计计算得的观测值所以在犯错误的概率不超过的前提下认为青少年与老年人在对财经年度人物的了解程度上有差异.9【2018届河北省武邑中学四模】某机构为了解某地区中学生在校月消费情况,随机抽取了 100名中学生进行调查.如图是根据调査的结果绘制的学生在校月消费金额的频率分布直方图.已知三个金额段的学生人数成等差数列,将月消费金额不低于550元的学生称为“高消费群”.(1)求的值,并求这100名学生月消费金额的样本平均数 (同一组中的数据用该组区间的中点值作代表);(2)根据已知条件完成下面列联表,并判断能否有的把握认为“高消费群”与性别有关?【答案】(1)见解析;(2)没有的把握认为“高消费群”与性别有关.所求平均数为(元)(2)根据频率分布直方图得到如下列联表点睛:(1)本题主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论