《总体集中趋势的估计》课件_第1页
《总体集中趋势的估计》课件_第2页
《总体集中趋势的估计》课件_第3页
《总体集中趋势的估计》课件_第4页
《总体集中趋势的估计》课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章统计案例9.2.3

总体集中趋势的估计一、众数、中位数、平均数的概念2.中位数:将一组数据按大小依次排列后处在最中间位置的一个数据(或最中间两个数据的平均数)

1.众数:在一组数据中,出现次数最多的数据

3.平均数:反映所有数据的平均水平1、求下列各组数据的众数(1)1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)1,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的中位数(1)1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4学以致用:例4.利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.解:思考:小明用统计软件计算了100户居民月用水量的平均数和中位数,但录入数据时把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较.哪个量的值变化更大?你能解释其中的原因吗?

解:通过计算可以发现,平均数由8.79t变为9.483t,中位数没有变化,还是6.6t.

这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.因此,与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感。平均数和中位数都描述了数据的集中趋势它们的大小关系和数据分布的形态有关(1)平均数和中位数应该大体上差不多;(2)平均数大于中位数;(右边”拖尾”)(3)平均数小于中位数.(左边”拖尾”)在直方图中,平均数总在“长尾巴”那边例5.某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如下表所示如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.解:为了更直观地观察数据的特征,我们用条形图表示表中的数据(如下图).由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.校服规格155160165170175合计频数39641679026386

可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.引入新知:

众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少的一部分,对极端值也不敏感.

一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.二、由频率分布直方图估计平均数、众数、中位数(1)平均数的估计月均用水量/t频率/组距0.021.24.27.210.213.216.219.222.225.228.200.040.060.080.10.120.0770.1070.0430.0300.0300.0170.0100.0130.007样本平均数可以表示为数据与它的频率的乘积之和.所以样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积相等.因此中位数落在区间内。设中位数是,由这个结果与根据原始数据求得的中位数6.6相差不大.(2)中位数的估计6.71在频率分布直方图中,月均用水量在区间内的居民最多,可以将这个区间的中点5.7作为众数的估计值.众数常用在描述分类型数据中,众数5.7让我们知道月均用水量在区间的居民用户最多.这个信息具有实际意义。(3)众数的估计人员经理管理人员高级技工工人学徒合计日工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中日工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?解:(1)众数为200,中位数为220,平均数为300.(2)因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.

把一组数据按大小顺序排列,处在最中间的一个数据(或两个数据的平均数);从频率分布直方图中估计中位数左右两边的直方图的面积相等.

一组数据中重复出现次数最多的数;从频率分布直方图中估计众数是最高的矩形的中点.1.众数:2.中位数:三、课堂小结3.平均数:如果有n个数据那么这n个数的平均数平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中的横坐标之和.12345678910111213141516171819A级必备知识基础练1.[探究点一]某趟车某时刻从始发站驶往终点站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、中位数、平均数的和为(

)A.170 B.165

C.160

D.150D解析

数据70,60,60,50,60,40,40,30,30,10的众数是60,中位数是45,平均数是45,故众数、中位数、平均数的和为150,故选D.123456789101112131415161718192.[探究点三]一组样本数据的频率分布直方图如图所示,则依据图形中的数据,可以估计总体的平均数与中位数分别是(

)A.12.5,12.5 B.13.5,13C.13.5,12.5 D.13,13D解析

根据频率分布直方图可以得到第一组的频率为0.2,第二组的频率为0.5,则第三组的频率为0.3,则平均数为7.5×0.2+12.5×0.5+17.5×0.3=13,由中位数的概念可以得到中位数在第二组区间[10,15)内,设为x,则0.2+(x-10)×0.1=0.5,解得x=13,故选D.12345678910111213141516171819123456789101112131415161718193.[探究点二]某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为

和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为(

)D12345678910111213141516171819123456789101112131415161718194.[探究点三]某学校在7月1日前,开展了“奋斗百年路,启航新征程”历史知识竞赛.工作人员将进入决赛的100名学生的分数(满分100分且每人的分值为整数)分成6组:[70,75),[75,80),[80,85),[85,90),[90,95),[95,100]得到如图所示的频率分布直方图,则下列关于这100名学生的分数说法错误的是(

)A.分数的中位数一定落在区间[85,90)内B.分数落在区间[80,100]内的人数为70C.分数落在区间[80,85)内的人数为25D.分数的平均数约为85B12345678910111213141516171819解析

由频率分布直方图可得(0.01+0.02×2+0.03+b+0.07)×5=1,解得b=0.05,前三组的概率为(0.02×2+0.05)×5=0.45<0.5,前四组的概率为(0.02×2+0.05+0.07)×5=0.8>0.5,所以分数的中位数一定落在第四组[85,90)内,故A正确;分数落在区间[80,100]内的人数为(0.05+0.07+0.03+0.01)×5×100=80,故B错误;分数落在区间[80,85)内的人数约为0.05×5×100=25,故C正确;分数的平均数为72.5×0.02×5+77.5×0.02×5+82.5×0.05×5+87.5×0.07×5+92.5×0.03×5+97.5×0.01×5=85,故D正确.故选B.123456789101112131415161718195.[探究点二]抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第一次第二次第三次第四次第五次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为

.

212345678910111213141516171819123456789101112131415161718196.[探究点三]某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了M名学生进行检测,实行百分制,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.12345678910111213141516171819分组频数频率[40,50)

[50,60)25p[60,70)s0.30[70,80)mn[80,90)100.10[90,100]

合计M1(1)求出表中M,p及图中a的值;(2)估计该校学生阅读素养的成绩中位数以及平均数(精确到0.1).12345678910111213141516171819解

(1)M=10÷0.10=100;p=25÷100=0.25;(0.005+0.025+0.030+a+0.010+0.010)×10=1,解得a=0.02.(2)设中位数为x,则0.005×10+0.025×10+(x-60)×0.03=0.5,解得平均数为(45×0.005+55×0.025+65×0.03+75×0.02+85×0.01+95×0.01)×10=68.5.12345678910111213141516171819B级关键能力提升练7.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格.若同一组中的数据用该组区间中点值为代表,则下列说法中不正确的是(

)A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75D12345678910111213141516171819解析

由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在[40,60)内的频率为0.25,因此,不及格的人数为4

000×0.25=1

000,故B正确;由频率分布直方图可得,平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为0.45,[70,80)内的频率为0.3,所以中位数为70+10×≈71.67,故D错误.123456789101112131415161718198.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图.根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到0.01)分别是(

)A.2.20

2.25 B.2.29

2.20C.2.29

2.25 D.2.25

2.25C12345678910111213141516171819解析

由频率分布直方图得,自学时间在[0.5,2)内的频率为(0.16+0.2+0.34)×0.5=0.35,自学时间在[2,2.5)内的频率为0.52×0.5=0.26,12345678910111213141516171819B123456789101112131415161718191234567891011121314151617181910.下列说法正确的是(

)A.有甲、乙、丙三种个体按3∶1∶2的比例分层随机抽样调查,如果抽取的甲个体数为9,则样本容量为30B.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是甲C.数据1,2,3,4,4,5的平均数、众数、中位数相同D.某单位A,B,C三个部门平均年龄为38岁、24岁和42岁,又A,B两部门人员平均年龄为30岁,B,C两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为35岁D12345678910111213141516171819因为乙组数据的方差比甲组数据的方差小,所以这两组数据中较稳定的是乙,故选项B说法错误;123456789101112131415161718191234567891011121314151617181911.某市有15个旅游景点,经计算,黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为(

)A.s=s1

B.s<s1

C.s>s1

D.不能确定C123456789101112131415161718191234567891011121314151617181912.(多选题)若数据x1,x2,…,x10的平均数为2,方差为3,则(

)A.数据3x1+2,3x2+2,…,3x10+2的平均数为20BCD123456789101112131415161718191234567891011121314151617181913.(多选题)如图是甲、乙两人在射击测试中6次命中环数的折线图,则(

)C.乙射击成绩的中位数小于甲射击成绩的中位数D.乙比甲的射击成绩稳定CD123456789101112131415161718191234567891011121314151617181914.(多选题)某综艺节目为比较甲、乙两名选手的各项能力(每项能力的指标值满分均为5分,分值高者为优),绘制如图所示的六维能力雷达图,图中点A表示甲的创造能力指标值为4,点B表示乙的空间能力指标值为3,则下列叙述正确的是(

)A.乙的记忆能力优于甲B.乙的观察能力优于创造能力C.甲的六大能力整体水平优于乙D.甲的六大能力比乙均衡BCD12345678910111213141516171819解析

由六维能力雷达图,知乙的记忆能力指标值是4,甲的记忆能力指标值是5,故甲的记忆能力优于乙的记忆能力,故A错误;乙的创造能力指标值是3,观察能力指标值是4,故乙的观察能力优于创造能力,故B正确;甲的六大能力之和为25,乙的六大能力之和为24,所以甲的六大能力整体水平优于乙,故C正确;甲的六大能力指标值的方差大于乙的六大能力指标值的方差,所以甲的六大能力比乙均衡,D正确.1234567891011121314151617181941234567891011121314151617181916.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为

.

4123456789101112131415161718191234567891011121314151617181917.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现用分层随机抽样的方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为

;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1020小时,980小时,1030小时,估计这个企业生产的产品的平均使用寿命为

小时.

501015解析

由分层随机抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1

020×50%+980×20%+1

030×30%=1

015(小时).123456789101112131415161718191234567891011121314151617181918.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,求这组数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论