众数、中位数、平均数(1)标准差、方差_第1页
众数、中位数、平均数(1)标准差、方差_第2页
众数、中位数、平均数(1)标准差、方差_第3页
众数、中位数、平均数(1)标准差、方差_第4页
众数、中位数、平均数(1)标准差、方差_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本的数字特征估计总体的数字特征,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组数=极差/组距,三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,五、画出频率分布直方图(纵轴表示频率组距),复习回顾,画频率分布直方图的步骤:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,画茎叶图的步骤:,(1)将每个数据分为茎(高位)和叶(低位)两部分;,(2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一

2、侧;,(3)将各个数据的叶按大小次序写在其茎的另一侧.,练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,分别求这些运动员成绩的众数,中位数与平均数,用样本的数字特征估计总体的数字特征,中位数 众数 平均数,众数、中位数、平均数的概念,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数: 一组数据的算术平均数,即 x=,二、众数、中位数、平均数与频率分布直方图的关系,例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分

3、布直方图可以看出众数、中位数、平均数为多少?,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,众数,众数,众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.,特点:,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02这个中位数的估计值,与样本的中位数值2.0不一样,为什么?,?,因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不

4、出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,左边和右边的直方图的面积应该相等,由此可以估计中位数的值。,中位数:,2、中位数不受少数几个极端值的影响,1、中位数易计算,能较好地表现数据信息,3、常用于计算数据质量较差时,特点:,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和,平均数,3、平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,1、平均数与每一个样本的数据有关,所

5、以任何一个样本数据的改变都会引起平均数的改变,2、平均数可以反映出更多的关于样本数据全体的信息,特点:,练习:,有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲:,乙: ,如果你是教练,你应当如何对这次射击作出评价?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,考察样本数据的分散程度的大小,,所谓“平均距离”,其含义可作如下理解:,标准差是样本数据到平均数的一种平均距离, 一般用s表示,标准差,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,探究提高 (1)平均数与方差都是重要的数字特征, 是

6、对总体的一种简明的描述,它们所反映的情况有 着重要的实际意义,平均数、中位数、众数描述其 集中趋势,方差和标准差描述波动大小. (2)平均数、方差的公式推广 若数据x1,x2,xn的平均数为 ,那么 mx1+a,mx2+a,mx3+a,mxn+a的平均数是. 数据x1,x2,xn的方差为s2. a.s2= b.数据x1+a,x2+a,xn+a的方差为 ; c.数据ax1,ax2,axn的方差为 .,知识补充,1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.,2.现实中的总体所包含的个体数往往很多,总体的平均数

7、与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.,例4 在去年的足球甲A联赛中,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4.你认为下列说法是否正确,为什么? (1)平均来说甲队比乙队防守技术好; (2)乙队比甲队技术水平更稳定; (3)甲队有时表现很差,有时表现又非常 好; (4)乙队很少不失球.,例题分析,例1 画出下列四组样本数据的条形图, 说明他们的异同点. (1) ,; (2) ,;,(3) ,; (4) ,.,2.已知一组数据按从小到大的顺序排

8、列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为() A.5,24 B.5,24 C.4,25 D.4,25 解析 中位数为5,5= ,x=6. s2= (5+1)2+(5-0)2+(5-4)2+(5-6)2+(5-7)2+(5-14)2=24 .,A,9.(2009福建)某校开展“爱我海西、爱我家乡”摄 影比赛,9位评委为参赛作品A给出的分数如茎叶图所 示.记分员在去掉一个最高分和一个最低分后,算得 平均分为91,复核员在复核时,发现有一个数字(茎 叶图中的x)无法看清,若记分员计算无误,则数字x 应该是 . 解析 当x4时, x4,则 =91,x=1.,1,1

9、1.下图是某市有关部门根据该市干部的月收入情 况,作抽样调查后画出的样本频率分布直方图, 已知图中第一组的频数为4 000,请根据该图提供 的信息解答下列问题:(图中每组包括左端点, 不包 括右端点,如第一组表示收入在1 000,1 500),(1)求样本中月收入在2 500,3 500)的人数; (2)为了分析干部的收入与年龄、职业等方面的关 系,必须从样本的各组中按月收入再用分层抽样方 法抽出100人作进一步分析,则月收入在1 500, 2 000)的这段应抽多少人? (3)试估计样本数据的中位数. 解 (1)月收入在1 000,1 500)的概率为 0.000 8500=0.4,且有4

10、000人, 样本的容量n= =10 000; 月收入在1 500,2 000)的频率为0.000 4500 =0.2;,月收入在2 000,2 500)的频率为0.000 3500= 0.15; 月收入在3 500,4 000)的频率为0.000 1500= 0.05. 月收入在2 500,3 500)的频率为 1-(0.4+0.2+0.15+0.05)=0.2. 样本中月收入在2 500,3 500)的人数为 0.210 000=2 000. (2)月收入在1 500,2 000)的人数为 0.210 000=2 000,,再从10 000人中用分层抽样方法抽出100人,则月 收入在1 500,2 000)的这段应抽取100 =20(人). (3)由(1)知月收入在1 000,2 000)的频率为 0.4+0.2=0.60.5, 样本数据的中位数为 1 500+ =1 500+250=1 750(元).,三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.,2、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。,3、由于平均数与每一个样本的数据有关,所以任

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论