数据分布离中趋势_第1页
数据分布离中趋势_第2页
数据分布离中趋势_第3页
数据分布离中趋势_第4页
数据分布离中趋势_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分布离中趋势第1页,共53页,2023年,2月20日,星期五身高人数(CM)(人)

152115421552156415711582159216012161716281634身高人数(CM)(人)

1643165816651673168716911705171217231741总计

83152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174[例4-14]某班学生的身高如下左所示,求众数2、众数的计算与应用第2页,共53页,2023年,2月20日,星期五众数的确定方法[例5-15]某年级83名女生身高资料

身高人数(CM)(人)

152115421552156415711582159216012161716281634

身高人数(CM)(人)

1643165816651673168716911705171217231741总计

83第3页,共53页,2023年,2月20日,星期五

身高人数比重(CM)(人)(%)

150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25

总计83100某年级83名女生身高资料众数的确定方法概约众数:众数所在组的组中值,在本例为162.5cm第4页,共53页,2023年,2月20日,星期五日产量(件)工人人数(人)101112131470100380150100合计800【例5-16】已知某企业某日工人的日产量资料如下:众数的确定1、单值数列计算该企业该日全部工人日产量的众数。第5页,共53页,2023年,2月20日,星期五众数的确定2、组距数列【例B】某车间50名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—计算该车间工人月产量的众数。概约众数:众数所在组的组中值,在本例为500件第6页,共53页,2023年,2月20日,星期五众数的原理及应用83名女生身高原始数据83名女生身高组距数列第7页,共53页,2023年,2月20日,星期五当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;众数的原理及应用第8页,共53页,2023年,2月20日,星期五出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200没有突出地集中在某个年份413名学生出生时间分布直方图众数的原理及应用(无众数)第9页,共53页,2023年,2月20日,星期五192.5190.5188.5186.5184.5182.5180.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100413名学生的身高分布直方图(双众数)当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。出现了两个明显的分布中心第10页,共53页,2023年,2月20日,星期五集中趋势弱、离散趋势强集中趋势强、离散趋势弱第11页,共53页,2023年,2月20日,星期五3、众数的优点和局限性1、不受极端值的影响。2、对品质标志指标可以用众数3、可用于开口组的分组数据资料局限性1、只适合于总体单位多,集中趋势明显的数据2、当数据重复时,会存在多个众数。3、对分组数据资料,只使用了众数组信息,缺乏敏感性第12页,共53页,2023年,2月20日,星期五左偏分布均值

中位数

众数对称分布

均值=中位数=

众数右偏分布众数

中位数均值三、众数、中位数和算术平均数的比较(一)众数、中位数和算术平均数的关系第13页,共53页,2023年,2月20日,星期五(二)众数、中位数和算术平均值的特点和应用1、中位数不受极端值影响数据分布偏斜程度较大时应用2、均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用3、众数不受极端值影响具有不唯一性数据分布偏斜程度较大时应用第14页,共53页,2023年,2月20日,星期五四、正确运用集中趋势指标的原则1、统计平均数只能用于同质的总体2、使用统计平均数应和次数分布结合3、使用统计平均数应和分组法结合,用组平均数或组中值补充说明总平均数第15页,共53页,2023年,2月20日,星期五目的:掌握变异度指标的概念、特点、计算重点:极差、平均差、标准差、方差难点:标准差系数第六章变异度指标第16页,共53页,2023年,2月20日,星期五第一节变异度指标

(一)变异度指标概念统计上用来反映总体各单位标志值之间差异程度大小的综合指标,也称做离中趋势指标。

平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。但总体各单位之间的差异是客观存在的,这种差异也是统计总体的重要特征之一。因此,要全面反映一个总体的特征,还必须测定总体各单位之间差异程度。

一、变异度指标概述第17页,共53页,2023年,2月20日,星期五(二)、变异度指标作用2、衡量平均数代表性的大小3、反映社会经济活动过程的均衡性和稳定性1、说明数据分布的离散程度4、确定统计推断的准确程度第18页,共53页,2023年,2月20日,星期五测定标志变异度的绝对量指标(与原变量值名数相同)测定标志变异度的相对量指标(表现为无名数)极差平均差标准差全距系数平均差系数标准差系数变异度指标的种类第19页,共53页,2023年,2月20日,星期五指所研究的数据中,最大值与最小值之差,又称全距。(一)极差最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则二、变异度指标的的计算与应用第20页,共53页,2023年,2月20日,星期五【例B】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900计算该公司该季度计划完成程度的全距。第21页,共53页,2023年,2月20日,星期五优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往往应用于生产过程的质量控制中极差的特点第22页,共53页,2023年,2月20日,星期五⑴简单平均差——适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用A.D

表示平均差计算公式:总体算术平均数总体单位总数第

个单位的变量值(二)平均差第23页,共53页,2023年,2月20日,星期五【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。解:即该售货小组5个人销售额的平均差为93.6元第24页,共53页,2023年,2月20日,星期五⑵加权平均差——适用于分组资料平均差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值第25页,共53页,2023年,2月20日,星期五【例B】计算表中某公司职工月工资的平均差月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000第26页,共53页,2023年,2月20日,星期五解:即该公司职工月工资的平均差为138.95元第27页,共53页,2023年,2月20日,星期五优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。3、平均差的特点一般情况下都是通过计算另一种标志变异指标——标准差,来反映总体内部各单位标志值的差异状况第28页,共53页,2023年,2月20日,星期五⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。标准差计算公式:总体单位总数第个单位的变量值总体算术平均数(三)标准差和方差第29页,共53页,2023年,2月20日,星期五【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:(比较:其销售额的平均差为93.6元)即该售货小组销售额的标准差为109.62元。第30页,共53页,2023年,2月20日,星期五⑵加权标准差——适用于分组资料标准差的计算公式总体算术平均数第组变量值出现的次数第组的变量值或组中值第31页,共53页,2023年,2月20日,星期五【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000第32页,共53页,2023年,2月20日,星期五解:(比较:其工资的平均差为138.95元)即该公司职工月工资的标准差为167.9元。第33页,共53页,2023年,2月20日,星期五由同一资料计算的标准差的结果一般要略大于平均差。证明:当a,b,c≥0时,有标准差的特点能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.第34页,共53页,2023年,2月20日,星期五简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的出现目的:变量值平方的平均数变量值平均数的平方第35页,共53页,2023年,2月20日,星期五测定标志变异度的绝对量指标(与原变量值名数相同)测定标志变异度的相对量指标(表现为无名数)全距平均差标准差全距系数平均差系数标准差系数标志变异指标的种类第36页,共53页,2023年,2月20日,星期五可比标准差系数指标第37页,共53页,2023年,2月20日,星期五身高的差异水平:cm体重的差异水平:kg用离散系数可以相互比较可比(四)标准差系数第38页,共53页,2023年,2月20日,星期五平均差系数标准差系数离散系数用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小:——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:各种变异指标与其算术平均数之比。一般用V表示。第39页,共53页,2023年,2月20日,星期五【例A】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。解:一班成绩的标准差系数为:二班成绩的标准差系数为:因为,所以一班平均成绩的代表性比二班大。第40页,共53页,2023年,2月20日,星期五是非标志总体分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志性别:男、女(非男)产品质量:合格、不合格1010第41页,共53页,2023年,2月20日,星期五是非标志总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数第42页,共53页,2023年,2月20日,星期五是非标志总体的指标平均数标准差第43页,共53页,2023年,2月20日,星期五是非标志总体的指标方差标准差系数第44页,共53页,2023年,2月20日,星期五【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。是非标志总体的指标解:第45页,共53页,2023年,2月20日,星期五非对称的,偏斜的分布对称的、高度适中的分布既偏斜又低平的分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论