3-频数分布的概略度量.ppt_第1页
3-频数分布的概略度量.ppt_第2页
3-频数分布的概略度量.ppt_第3页
3-频数分布的概略度量.ppt_第4页
3-频数分布的概略度量.ppt_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计整理,117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121,【例2.1】为了解某生产车间50名工人日加工零件情况,搜集资料如下(单位:个),等距分组表,直方图、曲线图(直方图的绘制),频数(人),15,12,9,6,3,日加工零件数(个),图2-1某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在120125之间!,若从利润多少大小方面考虑,你会倾向饲养哪种肉牛?,某个牧场的管理者过去每年饲养600头牛,现有一种新品种的小型肉牛,预计在同样面积的牧场上可以饲养750头,这种肉牛吃草量较原肉牛少,销售后平均利润也比原肉牛少。牧场管理者已知两种肉牛的净利润分布如下:,第三章频数分布的概略度量,频数分布的特征,3频数分布的概略度量(教学内容),变量数列分布中心位置的度量变量数列分布离散程度的度量变量数列分布偏度和峰度的度量是非标志数列的度量,频数分布的特征和测度(指标),3.1变量数列集中趋势的度量,数据特征分布的测度(本节位置),集中趋势(Centraltendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值反应总体分布的集中趋势、一般水平数值平均数和位置平均数,3.1.1算术平均数,算术平均数(概念要点),最常用的测度值集中趋势的测度值之一一般水平,代表值,集中趋势一组数据的均衡点所在,算术平均数,基本计算公式算术平均数=总体标志总量/总体单位总数根据资料的不同,又分为简单式和加权式。,简单算术平均数(算例),原始数据:10591368,加权算术平均数,当数据已经加以分组得出频数分布数列时,需先求每组的标志总量并加总,求得总体标志总量,然后再计算算术平均数计算公式为:,加权算术平均数(单项式分组),某车间200个工人按日产量分组资料,加权算术平均数(组距式分组),根据上一章例中的数据,计算50名工人日加工零件数的均值。,例3-4,权数的选择,算术平均数(数学性质),各变量值与算术平均数的离差之和等于零各变量值与算术平均数的离差平方和最小,算术平均数(特点),容易理解,便于计算。计算中考虑了每个标志值的影响,故算术平均数具有一定的全面性。易受极端值的影响。若标志值中有极大或极小值,则计算出的算术平均数可能偏离数据的集中趋势。,灵活计算算术平均数,两个地区人口数基本相同,调查甲区100户,人均收入为5000元;乙区200户,人均收入3000元。问:甲乙两地区的人均收入?,答案,根据算术平均数基本公式,设两个地区人口数分别为A人,则两地区人均收入(元)为(5000A+3000A)/2A=4000,准确计算加权算术平均数,某企业三个生产不同产品的车间,废品率、产量、工时资料如下,计算企业平均废品率。,答案,首先确定变量-废品率然后确定权数-工时代数入公式-加权算术平均数,某工厂的工人劳动生产率、实际工时资料如下:,计算该厂工人平均劳动生产率。,计算步骤,首先确定变量-劳动生产率然后确定权数-实际工时代入公式-加权算术平均数,3.1.2调和平均数,调和平均数,含义变量值倒数的算术平均数的倒数例:求变量值5,6,7,8的调和平均数步骤:求各变量值的倒数求各变量值倒数的算术平均数求倒数的算术平均数的倒数(第二步的倒数),调和平均数(概念要点),集中趋势的测度值之一均值的另一种表现形式易受极端值的影响,调和平均数,简单式加权式当m=xf时,调和平均数就转化为算术平均数p46,例3-5,调和平均数(算例),某种蔬菜三家批发市场的日成交数据如表3-3,计算该种蔬菜该日的平均批发价格。,调和平均数(例解题),某集贸市场上市的5种活鱼的每斤价格分别为:4元,5元,8元,9元,11元,试计算:(1)5种活鱼各买一斤,平均每斤多少钱?(2)5种活鱼各买10元,平均每斤多少钱?,例题,某厂开展增产节约运动后,1月份总成本为10000元,平均成本为10元;2月份总成本为30000元,平均成本为8元;3月份总成本为35000元,平均成本为7.2元。试问,第一季度该厂平均单位成本为多少元?,调和平均数(算例),3.1.3几何平均数,几何平均数(概念要点),集中趋势的测度值之一n个变量值乘积的n次方根主要用于计算平均比率、平均发展速度计算公式为例3-6,3-7,几何平均数(算例),一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.84%-1=3.84%,例题,某机械厂有4个连续作业的车间,各车间产品合格率分别为:毛坯车间95%、粗加工车间90%、精加工车间92%、装配车间85%,求四个车间的平均废品率。,解题思路,设G为平均合格率,用G作为一般水平的代表值,有G=(G1G2G3G4)1/4则平均废品率=1-平均合格率,3.1.4中位数、分位数、众数,中位数(概念要点),集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响,中位数(变量数列-位置的确定),未分组数据:,组距分组数据:,未分组数据的中位数(5个数据的算例),原始数据:2422212620排序:2021222426位置:12345,中位数=22,未分组数据的中位数(6个数据的算例),原始数据:10591268排序:56891012位置:123456,分组数据的中位数(算例),根据表3-6中的数据,计算50名工人日加工零件数的中位数。,确定中位数所在的组采用下列近似公式计算:,该公式假定中位数组的频数在该组内均匀分布,组距数列的中位数(要点及计算公式),品质数列的中位数(算例),根据表3-7中的数据,计算甲城市家庭对住房满意状况评价的中位数。,解:中位数的位置为:300/2150从累计频数看,中位数的位置在“一般”这一组别中。因此Me一般,四分位数(概念要点),集中趋势的测度值之一将全部数据从小到大排列,再将数据四等分,分位点所对应的数据称为四分位数不受极端值的影响,组距数列的四分位数(算例),QL位置50/412.5,QU位置503/437.5,根据表3-8中的数据,计算50名工人日加工零件数的四分位数。,3.1.5众数,众数(概念要点),集中趋势的测度值之一出现频数最多的变量值不受极端值的影响可能没有众数或有几个众数,众数(众数的不唯一性),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,品质数列的众数(算例),根据表3-9中的数据,计算众数。,解:这里的变量为“广告类型”,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即Mo商品广告,组距数列的众数(算例),根据表3-10中的数据,计算50名工人日加工零件数的众数,组距数列的众数(计算公式),3.1.6众数、中位数和均值的比较,众数、中位数和均值的关系,3.2频数分布离散程度的度量,3.2变量数列离散程度的度量-描述平均数的代表性,假设某车间两个小组工人的月工资资料如下(元)甲组:800、900、1000、1100、1200乙组:900、950、1000、1050、1100,离中趋势,反映各变量值远离其中心值的程度数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述从另一个侧面说明了集中趋势测度值的代表程度不同类型的平均指标有不同的离散程度测度值,频数分布的特征和测度(本节位置),3.2.1极差(全距),极差(概念要点及计算公式),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,未分组数据R=max(Xi)-min(Xi),计算公式为,3.2.2平均差,平均差(计算公式),计算公式为,未分组数据,组距分组数据,3.2.3方差和标准差,总体方差和标准差(计算公式),未分组数据,分组数据,标准差(计算过程及结果),根据表3-11中的数据,计算工人日加工零件数的标准差。,标准差(计算过程及结果),3.2.4标准差系数,标准差系数V,例:10根火柴,平均长度3cm,=1cm10根钢管,平均长度100m,=1cm标准差系数V是将标准差与其对应的平均数对比而得,用于比较具有不同平均水平数列的离散程度,标准差系数(实例和计算过程),某管理局抽查了所属的8家企业,其产品销售数据如表3-12,试比较产品销售额与销售利润的离散程度。,标准差系数(计算结果),结论:计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度,有甲乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为9.6件。乙组工人日产量资料如下:,(1)计算乙组平均每个工人的日产量和标准差。(2)比较甲乙两个生产小组哪个组的日产量差异程度大?,(1)乙组平均每个工人的日产量和标准差,(2),说明甲组日产量差异程度小于乙组,3.2.5四分位差,四分位差(概念要点),离散程度的测度值之一上四分位数与下四分位数之差的一半QD=(QU-QL)/2反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性,3.2.6异众比率,异众比率(概念要点),离散程度的测度值之一非众数组的频数占总频数的比率计算公式为,用于衡量众数的代表性,3.3偏度与峰度,描述数据分布偏斜尖峭程度的统计量可以用来初步判断是否是正态分布,偏度-偏度系数,正态分布的偏度系数是?,峰度-峰度系数,标准正态分布的峰度系数是?-3,3.4是非标志数列分布的概略度量,是非标志的概念是非标志数列分布的数字特征,3.4.1是非标志的概念,如果总体按其性质只能区分为两种不同的属性,则可以按是否具有某种属性将总体区分为“是”“非”两类,这种具有肯定或否定两种表现的标志称为是非标志是非标志可以是品质标志也可以是数量标志通常用成数来分析总体中各类现象的结构情况,成数,成数(P)是指总体中具有某种属性的单位占总体单位数的比重,说明总体中“是”或“非”性质的单位构成情况,并且代表该种属性单位出现的频率,3.4.2是非标志数列分布的数字特征,是非标志的属性特征不能直接用数字来表示,而是借助文字加以描述,给数量运算和统计分析带来许多困难由于是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论