




免费预览已结束,剩余20页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
考点28 离散型随机变量的均值与方差【考点剖析】1.最新考试说明:1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.4.概率(1)理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性.(2)理解超几何分布及其导出过程,并能进行简单的应用.(3)了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.(4)理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题. (5)利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.5.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.2.命题方向预测:1考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算主要以选择题、填空题为主2考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数)3.离散型随机变量的均值与方差是高考的热点题型,以解答题为主,也有选择、填空题,属中档题,常见统计与概率综合命题的情形.3.名师二级结论:两个异同(1)众数、中位数与平均数的异同众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质. 众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题某些数据的变动对中位数可能没有影响中位数可能出现在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标两个防范在记忆d(axb)a2d(x)时要注意:d(axb)ad(x)b,d(axb)ad(x)三种分布(1)若x服从两点分布,则e(x)p,d(x)p(1p);(2)xb(n,p),则e(x)np,d(x)np(1p);(3)若x服从超几何分布,则e(x)n.六条性质(1)e(c)c(c为常数)(2)e(axb)ae(x)b(a、b为常数)(3)e(x1x2)ex1ex2(4)如果x1,x2相互独立,则e(x1x2)e(x1)e(x2)(5)d(x)e(x2)(e(x)2(6)d(axb)a2d(x)【考点分类】热点一 抽样方法1.【2016高考北京文数】某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.学生序号12345678910立定跳远(单位:米)1.961.921.821.801.781.761.741.721.681.6030秒跳绳(单位:次)63a7560637270a1b65在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则a.2号学生进入30秒跳绳决赛 b.5号学生进入30秒跳绳决赛 c.8号学生进入30秒跳绳决赛 d.9号学生进入30秒跳绳决赛【答案】b2.【2017江苏,3】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.【答案】18【解析】所求人数为,故答案为18【方法总结】类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的机会均等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成(1)当总体中的个体数较多,并且没有明显的层次差异时,可用系统抽样的方法,把总体分成均衡的几部分,按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本(2)在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除热点二 频率分布直方图的绘制与应用1.【2016高考山东理数】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )(a)56(b)60(c)120(d)140【答案】d【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有(人),选d.2.【2016年高考四川理数】我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5)分成9组,制成了如图所示的频率分布直方图.(i)求直方图中a的值;(ii)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(iii)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值,并说明理由.【答案】();()36000;()2.9【解析】()由频率分布直方图知,月均用水量在0,0.5)中的频率为0.080.5=0.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02由0.04+0.08+0.5a+0.20+0.26+0.5a+0.06+0.04+0.02=1,解得a=0.30【方法总结】1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率组距.2频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比3频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观热点三 茎叶图与基本数字特征1【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )a. 3,5 b. 5,5 c. 3,7 d. 5,7 【答案】a【解析】2.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为,中位数分别为,则 ()a , b, c, d,【答案】【解析】直接根据茎叶图判断,选b【方法总结】由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等热点四 变量的相关性与回归分析1.【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为已知,该班某学生的脚长为24,据此估计其身高为(a) (b) (c) (d)【答案】c【解析】由已知 ,选c.2.【2018届华大新高考联盟11月测评】某地区2008年至2016年粮食产量的部分数据如下表:(1)求该地区2008年至2016年的粮食年产量与年份之间的线性回归方程;(2)利用(1)中的回归方程,分析2008年至2016年该地区粮食产量的变化情况,并预测该地区 2018年的粮食产量.附:回归直线的斜率和截距的最小二乘估计公式分别为, .【答案】(1);(2)测该地区2018 量为299. 2万吨.【解析】试题分析:(1)计算和,利用的计算公式即可得解;(2)由的意义得该地区粮食产量逐年增加,平均每两年增加6. 5 万吨,将代入中的线性回归方程得预测值.由上述计算结果,知所求线性回归方程为,即.(2)由(1)知, ,故2008年至2016年该地区粮食产量逐年增加,平均每两年增加6. 5 万吨.将代入(1)中的线性回归方程,得,故预测该地区2018 量为299. 2万吨.热点五 独立性检验1.【2017课标ii,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1) 设两种养殖方法的箱产量相互独立,记a表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计a的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)附: 【答案】(1);(2) 有的把握认为箱产量与养殖方法有关;(3)。【解析】,故的估计值为0。66因此,事件a的概率估计值为。(2)根据箱产量的频率分布直方图得列联表箱产量箱产量旧养殖法6238新养殖法3466由于,故有的把握认为箱产量与养殖方法有关。2.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:()根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;()已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.【答案】()有的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”; ().【解析】()将列联表中的数据代入公式计算得由于所以有的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”()从5名数学系的学生任取3人的一切可能结果所组成的基本事件空间, ,其中表示喜欢甜品的学生,表示不喜欢甜品的学生,由10个基本事件组成,切这些基本事件出现是等可能的用a表示“3人中至多有1人喜欢甜品”这一事件,则事件a是由7个基本事件组成因而热点六 离散型随机变量的均值与方差1.若样本数据,的标准差为,则数据,的标准差为( ) (a) (b) (c) (d)【答案】c【解析】设样本数据,的标准差为,则,即方差,而数据,的方差,所以其标准差为.故选c.2.【2017北京,理17】为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.()从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;()从图中a,b,c,d四人中随机.选出两人,记为选出的两人中指标x的值大于1.7的人数,求的分布列和数学期望e();()试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小.(只需写出结论)【答案】()0.3;()详见解析;()在这100名患者中,服药者指标数据的方差大于未服药者指标数据的方差.【解析】()由图知,a,b,c,d四人中,指标的值大于1.7的有2人:a和c.所以的所有可能取值为0,1,2.所以的分布列为012 故的期望.()在这100名患者中,服药者指标数据的方差大于未服药者指标数据的方差.3.【2017课标3,理18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量x(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,y的数学期望达到最大值?【答案】(1)分布列略;(2) n=300时,y的数学期望达到最大值,最大值为520元.【解析】试题分析:(1) 所有的可能取值为200,300,500,利用题意求得概率即可得到随机变量的分布列;(2)由题中所给条件分类讨论可得n=300时,y的数学期望达到最大值520元.试题解析:(1)由题意知,所有的可能取值为200,300,500,由表格数据知,.因此的分布列为0.20.40.4【方法总结】1.求离散型随机变量均值的方法步骤:(1)理解的意义,写出可能取的全部值;(2)求取每个值的概率;(3)写出的分布列;(4)由均值的定义求e()需要注意的是:e()是一个实数,即作为随机变量是可变的,而e()是不变的2.求离散型随机变量的分布列的突破口:首先,明确随机变量的所有可能取值,以及取每个值时所表示的意义;其次,利用概率的有关知识,求出随机变量取每个值时的概率,如本例中,利用古典概型的概率公式求出随机变量取各个值时的概率;最后,列表格写出分布列,并注意用分布列的性质检验所求的分布列或某事件的概率是否正确1.离散型随机变量的分布列刻画了随机变量取值的概率规律,随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定3.离散型随机变量的方差d()表示随机变量对e()的平均偏离程度,d()越大表明平均偏离程度越大,说明的取值越分散,反之,d()越小,的取值越集中在e()附近,统计中常用标准差来描述的分散程度同时利用公式d(ab)a2d()可解决呈线性关系的两变量方差的计算问题期望与方差的关系是d()e(2)(e()2.因此也可利用该关系求方差4.求离散型随机变量的方差的方法步骤:(1)求e()(具体方法见考点一的3);(2)代入方差公式求d()正确求出分布列是求均值和方差的前提,有时善于使用公式,可简化计算.【热点预测】1.【2017届浙江省绍兴市柯桥区高三第二次检测】已知随机变量的分布列如下:-101若,则 ( )a. b. c. 1 d. 【答案】b2.【2018届河南省驻马店市正阳县第二高级中学高三9月考试】具有线性相关关系的两变量满足的一组数据如下表,若与的回归直线方程为 ,则的值为( )a. 4 b. c. 5 d. 6【答案】a【解析】由表中数据得:,根据最小二乘法,将代入回归方程 ,得,故选a.3.【2018届福建省三明市第一中学高三上第一次月考】下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程,变量增加一个单位时,平均增加个单位;线性回归方程必过);在一个列联表中,由计算得,则有以上的把握认为这两个变量间有关系其中错误的个数是()a. b. c. d. 【答案】b【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),正确;回归方程中的系数具备直线斜率的功能,对于回归方程 ,当增加一个单位时,平均减少个单位,错误;由线性回归方程的定义知,线性回归方程= 必过点,正确;因为,故有以上的把握认为这两个变量间有关系,正确,即错误的个数为,故选b.4.【2017年福建省数学基地校】设随机变量服从,则的值是a. b. c. d. 【答案】a【解析】随机变量服从,则,故选a.5.设,这两个正态分布密度曲线如图所示下列结论中正确的是( )a b c对任意正数, d对任意正数,【答案】c【解析】由正态密度曲线的性质可知,、的密度曲线分别关于、对称,因此结合所给图象可得且的密度曲线较的密度曲线“瘦高”,所以,所以对任意正数,.6.【2017届东北师大附中、哈尔滨师大附中、辽宁省实验中学高三下第四次模拟】据统计2016年“十一”黄金周哈尔滨太阳岛每天的游客人数服从正态分布,则在此期间的某一天,太阳岛的人数不超过2300的概率为( )附;若a. b. c. d. 【答案】d【解析】游客人数服从正态分布,则由则 ,可得,所以故本题答案选7.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间内,其频率分布直方图如图所示. ()直方图中的_;()在这些购物者中,消费金额在区间内的购物者的人数为_. 【答案】()3;()6000.8.【2017届浙江温州市普通高中高三8月】盒中有大小相同的5个白球和3个黑球,从中随机摸出3个小球,记摸到黑球的个数为,则_,_【答案】【解析】,所以9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_(米).【答案】1.76【解析】将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.10.【2017届浙江省杭州市高三4月检测】已知随机变量的概率分布列为:则_, _.【答案】 1 【解析】 , .11.【2017届河北定州中学高三上学期周练】工作人员需进入核电站完成某项具有高辐射危险的任务,每次只派一个人进去,且每个人只派一次,工作时间不超过10分钟,如果前一个人10分钟内不能完成任务则撤出,再派下一个人。现在一共只有甲、乙、丙三个人可派,他们各自能完成任务的概率分别,假设互不相等,且假定各人能否完成任务的事件相互独立.(1)如果按甲最先,乙次之,丙最后的顺序派人,求任务能被完成的概率若改变三个人被派出的先后顺序,任务能被完成的概率是否发生变化?(2)若按某指定顺序派人,这三个人各自能完成任务的概率依次为,其中是的一个排列,求所需要派出人员数目的分布列和均值(数字期望);(3)假定,试分析以怎样的先后顺序派出人员,可使所需派出的人员数目的均值(数字期望)达到最小【答案】(1),不论如何改变三个人被派出的先后顺序,任务能被完成的概率不发生变化;(2)分布列见解析,;(3)先派甲,再派乙,最后派丙时, 均值(数字期望)达到最小(2)由题意得可能取值为,其分布列为:(3), 要使所需派出的人员数目的均值(数字期望)达到最小,则只能先派甲、乙中的一人.若先派甲,再派乙,最后派丙,则;若先派乙,再派甲,最后派丙, 则,先派甲,再派乙,最后派丙时, 均值(数字期望)达到最小12.【2017课标1,理19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮服务中级考试题库及答案
- 2025年银川中考语文题目及答案
- 小学教育专升本考试题库及答案
- 广告装修类合同模板范本(3篇)
- 自治区新课标语文考试试题及答案
- 2025标准版技术咨询服务合同
- 2025年工业互联网平台数据备份与恢复系统稳定性提升策略报告
- 2025年新能源汽车电池原材料市场分析及趋势预测报告
- 广告策划上游合同模板(3篇)
- 服装产品考试题
- 2024年贵州省公务员考试《行测》真题及答案解析
- 港区泊位码头工程施工组织设计(图文)
- 2023年全国职业院校技能大赛-融媒体内容策划与制作赛项规程
- 《水利工程施工监理规范》SL288-2014
- 胸外科讲课完整全套课件
- 产品知识培训-汽车悬架系统
- 维生素C在黄褐斑治疗中的作用
- 台球市场调研报告
- 【联合验收】房地产企业展示区联合验收考评表
- 糖尿病周围神经病变知多少课件
- 儿童肺炎支原体肺炎诊疗指南(2023年版)解读
评论
0/150
提交评论