数据特征测度4变异指标ppt课件_第1页
数据特征测度4变异指标ppt课件_第2页
数据特征测度4变异指标ppt课件_第3页
数据特征测度4变异指标ppt课件_第4页
数据特征测度4变异指标ppt课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据特征测度4变异指标,1,4.4 标志变异指标-离散程度的测度(Dispession),分类数据:异众比率 顺序数据:四分位差 数值型数据:方差及标准差 相对位置的测量:标准分数 相对离散程度:离散系数,数据特征测度4变异指标,2,数据的特征和测度 (本节位置),数据特征测度4变异指标,3,离中趋势(离散趋势),数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值,数据特征测度4变异指标,4,一、标志变异指标的概念和作用,1概念 标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。 2作

2、用 (1)反映变量分布的离散趋势; (2)是对平均数的代表性程度的量度; (3)是对事物发展均衡性的量度。,数据特征测度4变异指标,5,二、标志变异指标的计算,(一)极差(全距) (二)平均差 (三)标准差和方差 (四)离散系数 (五)离中趋势的其他测度量 异众比率 四分位差,数值性数据,分类数据,顺序数据,标准分数 相对位置的测量,数据特征测度4变异指标,6,(一)极差(range),一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布,R = max(xi) - min(xi),计算公式为,数据特征测度4变异指标,7,(二)平均差(mean deviati

3、on),各变量值与其均值离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少,计算公式为,未分组数据,组距分组数据,数据特征测度4变异指标,8,平均差 (例题分析),数据特征测度4变异指标,9,平均差 (例题分析),含义:每一天的销售量平均数相比, 平均相差17台,数据特征测度4变异指标,10,(三)标准差和方差 (standard deviation and variance),标准差是各变量值与其均值离差平方的算术平均数的平方根。标准差的平方为方差。 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或标准差;根据样本数据

4、计算的,称为样本方差或标准差,数据特征测度4变异指标,11,总体方差和标准差 (population variance and standard deviation),方差的计算公式,未分组数据:,组距分组数据:,组距分组数据:,未分组数据:,标准差的计算公式,数据特征测度4变异指标,12,样本方差和标准差 (simple variance and standard deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,注意: 样本方差用自由度n-1去除!,数据特征测度4变异指标,13,样本方差 自由度(degree of free

5、dom),一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差2时, s2是2的无偏估计量,数据特征测度4变异指标,14,样本标准差 (例题分析),数据特征测度4变异指标,15,样

6、本标准差 (例题分析),含义:每一天的销售量与平均数相比, 平均相差21.58台,数据特征测度4变异指标,16,方差或标准差是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此能准确地反映出数据的离散程度。此外方差具有许多优良的数学性质。,数据特征测度4变异指标,17,(四)离散系数(coefficient of variation),1. 标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 4. 用于对不同组别数据离散程度的比较 5. 计算公式为,数据特征测度4变异指标,18,离散系数 (例题分析),【 例 】某管理局抽查了所属的8家企业

7、,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,数据特征测度4变异指标,19,离散系数 (例题分析),结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,数据特征测度4变异指标,20,数据特征测度4变异指标,21,顺序数据:四分位差,(五)离中趋势的其他测度量,定类数据:异众比率,相对位置的测量:标准分数,数据特征测度4变异指标,22,1. 异众比率 (variation ratio),1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比率 3. 计算公式为,4. 用于衡量众数的代表性,数据特征测度4变异指标,23,异众比率 (例题分析),解

8、: 在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好,数据特征测度4变异指标,24,2. 四分位差 (quartile deviation),对顺序数据离散程度的测度 也称为内距或四分间距 上四分位数与下四分位数之差 QD = QU QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性,数据特征测度4变异指标,25,四分位差 (例题分析),解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差:

9、QD = QU = QL = 3 2 = 1,数据特征测度4变异指标,26,3. 标准分数 (standard score),1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量 3. 可用于判断一组数据是否有离群点 4. 用于对变量的标准化处理 5. 计算公式为,数据特征测度4变异指标,27,标准分数 (性质),均值等于0 2. 方差等于1,数据特征测度4变异指标,28,标准分数 (性质),z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1。,数据特征测度4变异指标,29,标准分数 (意义举例),甲班三位学生的期末考试语文、数学、外语三门科目的成绩为例。见下表。,数据特征测度4变异指标,30,标准分数 (意义举例),下表是一名学生的数学、语文的期中、期末成 绩。,数据特征测度4变异指标,31,标准化值 (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论