数据的数字特征新课件_第1页
数据的数字特征新课件_第2页
数据的数字特征新课件_第3页
数据的数字特征新课件_第4页
数据的数字特征新课件_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据的数字特征 Datas characteristic,小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成,工作人员由五个领工和十个工人组成.工厂经营的很顺利,需增加一个新工人,小亮需要一份工作,应征而来与小明交谈.小明说:“我们这里报酬不错,平均薪金是每周300元.你在学徒期每周75元,不过很快就可以加工资了.”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小明说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表.”,工资表如下:,这到底是怎么了?小明有没有欺骗小亮 ?

2、,数据的信息除了通过前面介绍的用各种统计图表来加以整理和表达之外,还可以通过一些统计量来表述,请同学们回忆在初中我们学习过哪些统计量?,1.什么叫平均数?有什么意义? 2.什么叫中位数?有什么意义? 3.什么叫众数?有什么意义? 4.什么叫极差?有什么意义? 5.什么叫方差?有什么意义?,平均数:就是一组数据的平均,设有n个数据,x1 ,x2, ,xn,这组数据的平均数为:,特别地,如果上面n个数据中不同数据x1,x2,xn的个数分别为k1,k2,kn,那么它们的平均数为,平均数对数据有“取齐”的作用,代表该组数据的平均水平.,中位数:就是一组数据按照从小到大或从大到小的顺序进行排列时,处于中

3、间位置的数,奇数个数时,中位数有1个,,偶数个数时,中位数有2个,一组数据的中位数是唯一的,反映了数据的集中趋势.,众数:就是一组数据中出现次数最多的数,一组数据中的众数可能不止一个,也可能没有, 反映了数据的集中趋势.,极差:就是一组数据中最大数与最小数之间的差,方差:就是一组数据中所有数与平均数的差的平方和的平均数设有n个数据x1,x2,xn,这组数据的方差为:,表示该组数据之间的差异情况.,反映了数据的离散程度.方差越大,数据的离散程度越大, 方差越小,数据的离散程度越小.,例1某公司员工的月工资情况如表:,(1)分别计算该公司员工月工资的平均数、中位数和众数。 (2)公司经理会选取上面

4、哪个来代表该公司员工的月工资情况,税务官呢?工会领导呢?(结果取整数),分析:1.根据平均数、中位数的计算公式,可以算出平均数为:1373元,中位数为:800元,众数为:700元,2.不同身份的人代表不同阶层人的利益。公司经理维护的是公司的利益,税务官关心的是国家制定的税收是否对绝大多数人有利,工会领导维护的是基层员工的利益,因此对公司领导而言平均数比较好,对税务官而言中位数比较好,对工会领导而言众数即是他的选择。,如果你应聘该公司,你怎样看待公司员工的收入情况?,平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比

5、这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用,问:1甲乙两组数据的中位数、众数、极差分别是多少?,例2 在上一节中,从甲乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示如下,问2:你能从上图中分别比较甲乙两组数据的平均数和方差的大小吗?,甲的中位数20(18 ,22) 众数:10 18 30 极差:53 乙的中位数:29(27 ,31) 众数:23 34 极差:38,甲的平均数:22.8 方差:210.9 乙的平均数:28.6 方差:115.2,总结:平均数、中位数或众数刻画了一组数据的集中趋势,极差和方

6、差刻画了一组数据的离散程度。它们作为一组数据的代表各有优缺点,也各有各的用处,从不同的角度出发,不同的人会选取不同的统计量来表达同一组数据的信息。,例3 甲乙两台机床同时生产直径为40mm的零件,为了检验产品的质量,从两台机床生产的产品中各抽取10件进行测量,结果如下:,问1:你能选择适当的数分别表示这两组数据的离散程度吗?,甲:蓝色 乙:红色,方法1(极差) 甲:40.2-39.80.4 乙:40.1-39.90.2,方法2(方差) 甲:,0.026(m),乙,0.006(m),方法3 绝对差,甲,乙,方法4 绝对差的立方,甲,乙,刻画数据离散程度的度量,其理想的形式应满足以下三条原则 :,

7、1应充分利用数据,以便提供更确切的信息,2仅用一个数据来刻画数据的离散程度,3对于不同的数据,当离散程度大时,该数亦大,问题2:根据以上三条原则,比较本例中的四种方法,哪种方法最合适?,方法1(即极差)因为极差只是利用了数据中最大和最小的两个值, 显然不满足第一条原则,而且它对极值过于敏感。,方法2(方差),方法3(绝对差),方法4(绝对差的立方) 这三种方法都满足理想形式的三条原则。它们都可以刻画据的离 散程度。 但是方法2( 方差)有局限性,它与原始数据单位不同,平方后可能夸大了数据偏差的程度;方法4(绝对差的立方)的单位也与原始数据单位不同,立方后也可能夸大了数据偏差的程度。 方法3(即

8、绝对差)满足理想形式的三条原则,它也是刻画数据离散程度的一种方法,但是在实际中,人们更多使用的是标准差 。,其主要原因是:从数学上来看,二次函数的性质比绝对值函数的要好,比较方便运算。标准差的单位与原始数据单位相同,解决了方差的局限性。,标准差:方差的正的平方根,问题3 分别计算上题中的甲乙车床的标准差?,根据标准差计算公式,甲:s0.16(mm) 乙:s0.077(mm),因为甲的标准差比乙大,因此乙更稳定,标准差 (方差)越大,波动越大,稳定性越差; 标准差(方差)越小,波动越小,稳定性越好,小结: 本节课我们通过三个例子学习了用合适的统计量来刻画数据的数字特征,平均数、众数、中位数、极差

9、、方差、标准差都可以刻画数据的数字特征。在实际问题中要根据问题的实际情况选择合适的统计量来刻画数据的数字特征。,1某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均分、众数、中位数分别是() A85、85、85B87、85、86 C87、85、85 D87、85、90,答案:C,练习,2高一(3)班有男同学27名,女同学21名,在一次语文测 验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分 (1)求这次测验全班平均分(精确到0.01); (2)估计全班成绩在80分以下(含

10、80分)的同学至少有多 少人; (3)分析男同学的平均分与中位数相差较大的主要原因是什么,3 甲、乙两支篮球队在一次联赛中,各进行10次比赛,得分如下: 甲队:100,97,99,96,102,103,104,101,101,100. 乙队:97,97,99,95,102,100,104,104,103,102. 请计算甲、乙两队的方差与标准差,并判断哪支球队发挥更为稳定? 思路点拨直接利用方差、标准差的公式计算,然后通过比较方差或标准差的大小得出结论,一点通在实际问题中,仅靠平均数不能完全反映问题,还要研究方差(标准差),方差(标准差)描述了数据相对平均数的离散程度,在平均数相同的情况下,方

11、差(标准差)越大,数据波动性越大,稳定性越差;方差(标准差)越小,数据波动性越小,稳定性越好,作业: 1、课本31页 习题1-4 第1、2题 2、优化设计:第11页-13页 3、活页:第5页,1众数、中位数与平均数的异同: (1)众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量 (2)平均数的大小与一组数据里每个数据均有关系 (3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时其众数往往更能反映问题,(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论