2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文_第1页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文_第2页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文_第3页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文_第4页
免费预览已结束,剩余44页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、专题七概率统计专题七概率统计 7.17.1统计与统计案例统计与统计案例 -3- -4- 命题热点一命题热点二命题热点三命题热点四 频率分布直方图的应用 【思考】 观察频率分布直方图能得到哪些信息? 例1某公司为了解用户对其产品的满意度,从A,B两地区分别随 机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户 满意度评分的频率分布直方图和B地区用户满意度评分的频数分 布表. A地区用户满意度评分的频率分布直方图 -5- 命题热点一命题热点二命题热点三命题热点四 B地区用户满意度评分的频数分布表 -6- 命题热点一命题热点二命题热点三命题热点四 (1)作出B地区用户满意度评分的频率分布

2、直方图,并通过直方图 比较两地区满意度评分的平均值及分散程度(不要求计算出具体值, 给出结论即可); B地区用户满意度评分的频率分布直方图 -7- 命题热点一命题热点二命题热点三命题热点四 (2)根据用户满意度评分,将用户的满意度分为三个等级: 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. -8- 命题热点一命题热点二命题热点三命题热点四 解 (1) B地区用户满意度评分的频率分布直方图 通过两地区用户满意度评分的频率分布直方图可以看出,B地区 用户满意度评分的平均值高于A地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A地区用户满意度评分比较分散. -9- 命题热点

3、一命题热点二命题热点三命题热点四 (2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事 件:“B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.03)10=0.6,P(CB)的 估计值为(0.005+0.02)10=0.25. 所以A地区用户的满意度等级为不满意的概率大. -10- 命题热点一命题热点二命题热点三命题热点四 -11- 命题热点一命题热点二命题热点三命题热点四 对点训练1某大学艺术专业400名学生参加某次测评,根据男女学 生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记

4、录 他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到 如下频率分布直方图: -12- 命题热点一命题热点二命题热点三命题热点四 (1)从总体的400名学生中随机抽取一人,估计其分数小于70的概 率; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区 间40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于 70的男女生人数相等.试估计总体中男生和女生人数的比例. 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为 (0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4. 所以从

5、总体的400名学生中随机抽取一人,其分数小于70的概率 估计为0.4. -13- 命题热点一命题热点二命题热点三命题热点四 (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为 100-1000.9-5=5. 所以总体中分数在区间40,50)内的人数估计为400 =20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04) 10100=60,所以样本中分数不小于70的男生人数为60 =30. 所以样本中的男生人数为302=60,女生人数为100-60=40,男生 和女生人数的比例为6040=

6、32. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为 32. -14- 命题热点一命题热点二命题热点三命题热点四 用样本的数字特征估计总体 【思考1】 样本有哪些数字特征?这些数字特征反映了样本数据 的什么情况? 【思考2】 茎叶图刻画数据有哪些优点及不足? -15- 命题热点一命题热点二命题热点三命题热点四 例2为比较甲、乙两地某月14时的气温状况,随机选取该月中的 5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图. 考虑以下结论: 甲地该月14时的平均气温低于乙地该月14时的平均气温; 甲地该月14时的平均气温高于乙地该月14时的平均气温; 甲地该月14时的气温的标

7、准差小于乙地该月14时的气温的标 准差; 甲地该月14时的气温的标准差大于乙地该月14时的气温的标 准差. 其中根据茎叶图能得到的统计结论的编号为() A.B.C.D. 答案解析解析 关闭 答案解析 关闭 -16- 命题热点一命题热点二命题热点三命题热点四 题后反思1.样本的数字特征主要有:中位数、众数、平均数、标 准差、方差,中位数、平均数、众数反映了这组数据的集中程度, 反映了样本数据的总体水平;而标准差、方差反映这组数据的波动 情况,标准差或方差越大,波动越大. 2.茎叶图刻画数据的优点:(1)所有数据信息都可由茎叶图看到;(2) 茎叶图便于记录和表示,能反映数据在各段上的分布情况. 3

8、.茎叶图刻画数据的不足:茎叶图不能直接反映总体的分布情况, 这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计 总体情况. -17- 命题热点一命题热点二命题热点三命题热点四 对点训练2某市为了考核甲、乙两部门的工作情况,随机访问了 50名市民.根据这50名市民对这两部门的评分(评分越高表明市民 的评价越高),绘制茎叶图如下: (1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价. -18- 命题热点一命题热点二命题热点三命题热点四 解 (1)由所给茎叶图知,50名市民对甲

9、部门的评分由小到大排序,排 在第25,26名的是75,75,则样本中位数为75,所以该市的市民对甲部 门评分的中位数的估计值是75. 50名市民对乙部门的评分由小到大排序,排在第25,26名的是 66,68,则样本中位数为,所以该市的市民对乙部门评分的 中位数的估计值是67. (2)由所给茎叶图知,50名市民对甲、乙部门的评分高于90的比率 分别为,故该市的市民对甲、乙部门的评分高于90 的概率的估计值分别为0.1,0.16. -19- 命题热点一命题热点二命题热点三命题热点四 (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门 的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分

10、的标 准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评 价较高、评价较为一致,对乙部门的评价较低,评价差异较大.(注:利 用其他统计量进行分析,结论合理的也可) -20- 命题热点一命题热点二命题热点三命题热点四 回归方程的求法及回归分析 【思考】 两个变量具备什么关系才能用线性回归方程来预测? 如何判断两个变量具有这种关系? 例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣 传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响. 对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理, 得到下面的散点图及一些统计量的值. -21- 命题

11、热点一命题热点二命题热点三命题热点四 -22- 命题热点一命题热点二命题热点三命题热点四 (1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售 量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结 果回答下列问题: 当年宣传费x=49时,年销售量及年利润的预报值是多少? 当年宣传费x为何值时,年利润的预报值最大? -23- 命题热点一命题热点二命题热点三命题热点四 -24- 命题热点一命题热点二命题热点三命题热点四 -25-

12、命题热点一命题热点二命题热点三命题热点四 题后反思当两个变量之间具有相关关系时,才可通过线性回归方 程来估计和预测. 对两个变量的相关关系的判断有两个方法:一是根据散点图,具 有很强的直观性,直接得出两个变量是正相关或负相关;二是计算 相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝 对值越接近1,相关性就越强. -26- 命题热点一命题热点二命题热点三命题热点四 对点训练3(2018全国,文18)下图是某地区2000年至2016年环境 基础设施投资额y(单位:亿元)的折线图. -27- 命题热点一命题热点二命题热点三命题热点四 为了预测该地区2018年的环境基础设施投资额,建立了y

13、与时间 变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,17)建立模型: =-30.4+13.5t;根据2010年至 2016年的数据(时间变量t的值依次为1,2,7)建立模型: =99 +17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额 的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 解 (1)利用模型,该地区2018年的环境基础设施投资额的预测 值为 =-30.4+13.519=226.1(亿元). 利用模型,该地区2018年的环境基础设施投资额的预测值为 =99+17.59=256.5(亿元).

14、-28- 命题热点一命题热点二命题热点三命题热点四 (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机 散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据 建立的线性模型不能很好地描述环境基础设施投资额的变化趋 势.2010年相对2009年的环境基础设施投资额有明显增加,2010年 至2016年的数据对应的点位于一条直线的附近,这说明从2010年开 始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至 2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年 以后的环境基础

15、设施投资额的变化趋势,因此利用模型得到的预 测值更可靠. -29- 命题热点一命题热点二命题热点三命题热点四 (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元, 由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型 得到的预测值的增幅比较合理,说明利用模型得到的预测值更可 靠. (以上给出了2种理由,答出其中任意一种或其他合理理由均可得 分) -30- 命题热点一命题热点二命题热点三命题热点四 独立性检验 【思考】 独立性检验有什么用途? 例4某高校共有学生15000名,其中男生10500名,女生4500名.为 调查该校学生每周平均体育运动时间的情况,采用分层抽样的方

16、法, 收集300名学生每周平均体育运动时间的样本数据(单位:h). -31- 命题热点一命题热点二命题热点三命题热点四 (1)应收集多少名女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频 率分布直方图(如图),其中样本数据的分组区间 为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育 运动时间超过4h的概率; -32- 命题热点一命题热点二命题热点三命题热点四 (3)在样本数据中,有60名女生的每周平均体育运动时间超过4h, 请完成每周平均体育运动时间与性别列联表,能否在犯错误的概率 不超过0.05的前提下认为该校学生每

17、周平均体育运动时间与性别 有关系? -33- 命题热点一命题热点二命题热点三命题热点四 解 (1)300 =90,所以应收集90名女生的样本数据. (2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生 每周平均体育运动时间超过4h的概率的估计值为0.75. (3)由(2)知,3000.75=225(人),则有225人每周平均体育运动时间 超过4h,75人每周平均体育运动时间不超过4h.因为样本数据中有 210份是关于男生的,90份是关于女生的,所以每周平均体育运动时 间与性别列联表如下: 每周平均体育运动时间与性别列联表 -34- 命题热点一命题热点二命题热点三命题

18、热点四 结合列联表可算得 所以,能在犯错误的概率不超过0.05的前提下认为该校学生的每 周平均体育运动时间与性别有关系. -35- 命题热点一命题热点二命题热点三命题热点四 题后反思利用独立性检验,能够帮助我们对日常生活中的实际问 题作出合理的推断和预测.独立性检验就是考察两个分类变量是否 有关系,并能较为准确地给出这种判断的可信度,具体做法是根据 公式计算随机变量的观测值k,k值越大,说 明“两个变量有关系”的可能性越大. -36- 命题热点一命题热点二命题热点三命题热点四 对点训练4海水养殖场进行某水产品的新、旧网箱养殖方法的 产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量

19、 (单位:kg),其频率分布直方图如下: 旧养殖法 -37- 命题热点一命题热点二命题热点三命题热点四 新养殖法 -38- 命题热点一命题热点二命题热点三命题热点四 (1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱 产量与养殖方法有关; (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行 比较. 附: , -39- 命题热点一命题热点二命题热点三命题热点四 解 (1)旧养殖法的箱产量低于50kg的频率为 (0.012+0.014+0.024+0.034+0.040)5=0.62. 因此,事件A的概率估计

20、值为0.62. (2)根据箱产量的频率分布直方图得列联表 由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关. -40- 命题热点一命题热点二命题热点三命题热点四 (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或 中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数) 在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖 法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较 高且稳定,从而新养殖法优于旧养殖法. -41- 规律总结拓展演练 1.对于频率分布表和频率分布直方图,在计数和计算时一定要准 确,在绘制小长方形时,宽窄要一致.

21、通过频率分布表和频率分布直 方图可以对总体作出估计. 2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数 据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本 信息,可以随时记录;而频率分布表和频率分布直方图则损失了样 本的一些信息,必须在完成抽样后才能制作. 3.若x1,x2,xn的平均数为,方差为s2,则ax1+b,ax2+b,axn+b的 平均数为,方差为a2s2. -42- 规律总结拓展演练 4.利用频率分布直方图求众数、中位数与平均数时,应注意这三 者的区分:(1)最高的长方形的中点即众数;(2)中位数左边和右边的 直方图的面积是相等的;(3)平均数是频率分布直方图的“重

22、心”,等 于频率分布直方图中每个小长方形的面积乘小长方形底边中点的 横坐标之和. 5.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确 定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学 表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变 化趋势;(3)求出线性回归方程. 6.根据K2的值可以判断两个分类变量有关的可信程度. -43- 规律总结拓展演练 1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整 理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数 据,绘制了下面的折线图. 根据该折线图,下列结论错误的是() A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论