9.2.3总体集中趋势的估计9.2.4总体离散程度的估计课件高一下学期数学人教A版_第1页
9.2.3总体集中趋势的估计9.2.4总体离散程度的估计课件高一下学期数学人教A版_第2页
9.2.3总体集中趋势的估计9.2.4总体离散程度的估计课件高一下学期数学人教A版_第3页
9.2.3总体集中趋势的估计9.2.4总体离散程度的估计课件高一下学期数学人教A版_第4页
9.2.3总体集中趋势的估计9.2.4总体离散程度的估计课件高一下学期数学人教A版_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计9.2.3总体集中趋势的估计9.2.4总体离散程度的估计人教A版

数学

必修第二册课程标准1.掌握众数、中位数、平均数、标准差、方差的定义和特征及其在刻画数据中各自的作用.2.理解平均数和中位数在频率分布直方图中的关系.3.理解标准差、方差公式的基本性质.4.通过具体实际问题不断体会集中趋势、离散程度是如何刻画的,以及它们之间的内在联系.基础落实·必备知识全过关知识点1

众数、中位数、平均数1.众数(1)定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.2.中位数

一定要注意将数据排序(1)定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.(2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,xn的平均数为(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.(3)若x1,x2,…,xn的平均数是,则mx1+a,mx2+a,…,mxn+a的平均数是

.

名师点睛

三种数字特征的优缺点名称优点缺点众数(1)体现了样本数据的最大集中点;(2)容易得到(1)它只能表达样本数据中很少的一部分信息;(2)无法客观地反映总体特征中位数(1)不受少数几个极端数据,即排序靠前或靠后的几个数据的影响;(2)容易得到,便于利用中间数据的信息对极端值不敏感平均数能反映出更多关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大过关自诊1.一组样本数据为19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为(

)

A.14,14 B.12,14C.14,15.5 D.12,15.5A解析

把这组数据按从小到大排列为10,12,12,14,14,14,17,18,19,23,27,则可知其众数为14,中位数为14.2.有一组数据,其中10,12,13,15,16出现的频率分别是0.15,0.2,0.3,0.2,0.15,则该组数据的平均数为

.

13.2解析

该组数据的平均数为10×0.15+12×0.2+13×0.3+15×0.2+16×0.15=13.2.知识点2

探索图表中的中位数与平均数数值规律平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图1),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图2),那么平均数

中位数;如果直方图在左边“拖尾”(图3),那么平均数

中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.

大于小于

名师点睛1.平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中点的横坐标的乘积之和即为平均数的估计值.2.根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.过关自诊1.判断正误.(正确的画√,错误的画×)(1)平均数、中位数和众数从不同的角度描述了一组数据的集中趋势.(

)(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据.(

)(3)若改变一组数据中其中一个数,则这组数据的平均数、中位数和众数一定都会发生改变.(

)√××2.AQI是表示空气质量的指数,AQI指数值越小,表明空气质量越好,当AQI指数值不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI指数值的统计数据,图中点A表示4月1日的AQI指数值为201,则下列叙述不正确的是(

)A.这12天中有6天空气质量为“优良” B.这12天中空气质量最好的是4月9日C.这12天的AQI指数值的中位数是90 D.从4日到9日,空气质量越来越好C解析

这12天中,空气质量为“优良”的有95,85,77,67,72,92,共6天,故A正确;这12天中空气质量最好的是4月9日,AQI指数值为67,故B正确;这12天的AQI指数值的中位数是

=99.5,故C不正确;从4日到9日,AQI指数值越来越小,表示空气质量越来越好,故D正确.故选C.知识点3

方差、标准差1.假设一组数据是x1,x2,…,xn,用

表示这组数据的平均数.我们用每个数据与平均数的差的绝对值作为“距离”,即|xi-|(i=1,2,…,n)作为xi到

的“距离”.可以得到这组数据x1,x2,…,xn到

的“平均距离”为

.为了避免式中含有绝对值,通常改用平方来代替,即,我们称此式为这组数据的方差.

由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开平方,取它的算术平方根,即,我们称此式为这组数据的

.

标准差

2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称

为总体方差,

为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为

.

3.如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称

为样本方差,

为样本标准差.

4.方差的重要结论(1)若x1,x2,…,xn的方差是s2,则mx1+a,mx2+a,…,mxn+a的方差是

.

(2)方差的简化公式:,即方差等于原数据平方的平均数减去平均数的平方.m2s2名师点睛1.样本标准差反映了各样本数据聚集于样本平均数周围的程度,标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的周围越分散.2.若样本数据都相等,则s=0.3.当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.4.数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感;方差则反映了一组数据围绕平均数波动的大小.过关自诊1.判断正误.(正确的画√,错误的画×)(1)若一组数据的值大小相等,没有波动变化,则标准差为0.(

)(2)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散.(

)2.现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?√×提示

通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.3.[苏教版教材例题]甲、乙两种水稻试验品种连续5年的平均单位面积产量(单位:t/hm2)如表所示,试根据这组数据估计哪一种水稻品种的产量比较稳定.品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8解

甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.244.因为0.244>0.02,所以由这组数据可以认为甲种水稻的产量比较稳定.重难探究·能力素养全提升探究点一平均数、众数、中位数的求法【例1】

对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为(

)A.1 B.2 C.3 D.4A解析

在这一组数据中,3出现次数最多,有6次,故众数是3;将数据按从小到大顺序排列后,最中间的数据是3,故中位数是3;平均数规律方法

平均数、众数、中位数的求解策略(1)求平均数时要注意数据的个数,不要重计或漏计.(2)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两数据的平均数.(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.变式训练1从某中学高三年级甲、乙两个班各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)如下,成绩已按大小排序:甲:79

78

80

x

85

92

96乙:72

81

81

y

91

91

96其中甲班学生成绩的平均分和乙班学生成绩的中位数都是85,则x+y的值为(

)A.152 B.168

C.190

D.170D解析

由数据知,乙班成绩的中位数是y=85.又甲班学生成绩的平均分为85,即79+78+80+x+85+92+96=85×7,解得x=85,∴x+y=170.故选D.探究点二方差和标准差的计算及应用【例2】

甲、乙两机床同时加工直径为100cm的零件,为检验质量,从中抽取6件测量数据为:甲:99

100

98

100

100

103乙:99

100

102

99

100

100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.【例3】

甲、乙两支田径队的体检结果为:甲队队员体重的平均数为60kg,方差为200,乙队队员体重的平均数为70kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?规律方法

方差的计算与性质的应用(1)在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.(2)计算分层随机抽样的方差s2的步骤:变式训练2某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲127138130137135131乙133129138134128136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一人参加数学竞赛.探究点三频率分布直方图(折线图)中的“隐藏”的数据信息【例4】

如图为学生身高频率分布直方图.(1)如何在样本数据的频率分布直方图中估计出众数的值?(2)如何在样本数据的频率分布直方图中估计出中位数的值?(3)如何在样本数据的频率分布直方图中估计出平均数的值?(4)从样本数据可知,该样本的众数是166,172,中位数是171,平均数是170.1,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?解

(1)众数大致的值就是样本数据的频率分布直方图中最高小长方形的中点的横坐标.由直方图可估计学生身高众数应为174.5.(2)在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数使得在它左边和右边的直方图的面积相等,由此可以估计中位数的值,如图,由于0.08+0.22=0.3,0.08+0.22+0.22=0.52,所以中位数落在区间[167,172)内.设中位数是x,由0.08+0.22+(x-167)×=0.5,解得x≈171.55.所以学生身高的中位数约为171.55.(3)平均数是频率分布直方图的“重心”,是频率分布直方图的平衡点,因此,每个小长方形的面积与小长方形底边中点的横坐标的乘积之和为平均数.由159.5×0.08+164.5×0.22+169.5×0.22+174.5×0.36+179.5×0.12=170.6,得学生身高的平均数为170.6.(4)因为样本数据频率分布直方图只是直观地表明分布的形状,从直方图本身得不出原始的数据内容,也就是说频率分布直方图损失了一些样本数据的信息,得到的是一个估计值,且所得估计值与数据分组有关,所以估计的值有一定的偏差.规律方法

1.利用直方图或折线图求得的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.2.利用频率分布直方图求数字特征的近似值:(1)众数是最高小长方形的底边中点的横坐标;(2)中位数使得在它左、右两侧直方图的面积相等;(3)平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和.变式训练3甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示.请从下列四个不同的角度对这次测试结果进行分析.(1)从平均数和方差相结合看(分析谁的成绩好些);(2)从平均数和中位数相结合看(分析谁的成绩好些);(3)从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);(4)从折线图上两人射击命中环数的走势看(分析谁更有潜力).解

根据各问情况作如下统计表.类别平均数方差中位数命中9环及9环以上次数甲71.271乙75.47.53(2)∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好.(3)∵平均数相同,且乙命中9环及9环以上次数比甲多,∴乙的成绩比甲好.(4)∵甲的成绩在平均线上下波动;而乙处于上升趋势,从第四次以后就没有比甲少的情况发生,∴乙更有潜力.本节要点归纳1.知识清单:(1)平均数、众数、中位数的求法.(2)方差和标准差的计算及应用.(3)利用频率分布直方图(折线图)估计样本的数据特征.2.方法归纳:数据分析.3.常见误区:(1)平均数与中位数易混淆.(2)方差与标准差易混淆.成果验收·课堂达标检测12345678910111213141516171819A级必备知识基础练1.[探究点一]某趟车某时刻从始发站驶往终点站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、中位数、平均数的和为(

)A.170 B.165

C.160

D.150D解析

数据70,60,60,50,60,40,40,30,30,10的众数是60,中位数是45,平均数是45,故众数、中位数、平均数的和为150,故选D.123456789101112131415161718192.[探究点三]一组样本数据的频率分布直方图如图所示,则依据图形中的数据,可以估计总体的平均数与中位数分别是(

)A.12.5,12.5 B.13.5,13C.13.5,12.5 D.13,13D123456789101112131415161718193.[探究点二]某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为

和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为(

)D123456789101112131415161718194.[探究点三]某学校在7月1日前,开展了“奋斗百年路,启航新征程”历史知识竞赛.工作人员将进入决赛的100名学生的分数(满分100分且每人的分值为整数)分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]得到如图所示的频率分布直方图,则下列关于这100名学生的分数说法错误的是(

)A.分数的中位数一定落在区间[85,90)内B.分数落在区间[80,100]内的人数为70C.分数落在区间[80,85)内的人数为25D.分数的平均数约为85B123456789101112131415161718195.[探究点二]抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第一次第二次第三次第四次第五次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为

.

2123456789101112131415161718196.[探究点三]某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.12345678910111213141516171819分组频数频率[40,50)

[50,60)25p[60,70)s0.30[70,80)mn[80,90)100.10[90,100]

合计M1(1)求出表中M,p及图中a的值;(2)估计该校学生阅读素养的成绩中位数以及平均数(精确到0.1).12345678910111213141516171819解

(1)M=10÷0.10=100;p=25÷100=0.25;(0.005+0.025+0.030+a+0.010+0.010)×10=1,解得a=0.02.(2)设中位数为x,则0.005×10+0.025×10+(x-60)×0.03=0.5,解得平均数为(45×0.005+55×0.025+65×0.03+75×0.02+85×0.01+95×0.01)×10=68.5.12345678910111213141516171819B级关键能力提升练7.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格.若同一组中的数据用该组区间中点值为代表,则下列说法中不正确的是(

)A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75D123456789101112131415161718198.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到0.01)分别是(

)A.2.20

2.25 B.2.29

2.20C.2.29

2.25 D.2.25

2.25C12345678910111213141516171819B123456789101112131415161718191234567891011121314151617181910.下列说法正确的是(

)A.有甲、乙、丙三种个体按3∶1∶2的比例分层随机抽样调查,如果抽取的甲个体数为9,则样本容量为30B.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是甲C.数据1,2,3,4,4,5的平均数、众数、中位数相同D.某单位A,B,C三个部门平均年龄为38岁、24岁和42岁,又A,B两部门人员平均年龄为30岁,B,C两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为35岁D1234567891011121314151617181911.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为(

)A.s=s1

B.s<s1

C.s>s1

D.不能确定C123456789101112131415161718191234567891011121314151617181912.(多选题)若数据x1,x2,…,x10的平均数为2,方差为3,则(

)A.数据3x1+2,3x2+2,…,3x10+2的平均数为20BCD123456789101112131415161718191234567891011121314151617181913.(多选题)如图是甲、乙两人在射击测试中6次命中环数的折线图,则(

)C.乙射击成绩的中位数小于甲射击成绩的中位数D.乙比甲的射击成绩稳定CD123456789101112131415161718191234567891011121314151617181914.(多选题)某综艺节目为比较甲、乙两名选手的各项能力(每项能力的指标值满分均为5分,分值高者为优),绘制如图所示的六维能力雷达图,图中点A表示甲的创造能力指标值为4,点B表示乙的空间能力指标值为3,则下列叙述正确的是(

)A.乙的记忆能力优于甲B.乙的观察能力优于创造能力C.甲的六大能力整体水平优于乙D.甲的六大能力比乙均衡BCD12345678910111213141516171819解析

由六维能力雷达图,知乙的记忆能力指标值是4,甲的记忆能力指标值是5,故甲的记忆能力优于乙的记忆能力,故A错误;乙的创造能力指标值是3,观察能力指标值是4,故乙的观察能力优于创造能力,故B正确;甲的六大能力之和为25,乙的六大能力之和为24,所以甲的六大能力整体水平优于乙,故C正确;甲的六大能力指标值的方差大于乙的六大能力指标值的方差,所以甲的六大能力比乙均衡,D正确.1234567891011121314151617181941234567891011121314151617181916.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为

.

4123456789101112131415161718191234567891011121314151617181917.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现用分层随机抽样的方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为

;测试结果为第一、二、三分厂取出的产品的平均使用寿命分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论