版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节集中趋势的测度集中趋势(CentralTendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。在统计学中用平均指标来测度数据的集中趋势。从不同角度考虑,集中趋势的测度值有多个,本节介绍几个主要测度值的计算方法、特点及应用场合。一、平均指标的概述平均指标又叫平均数,是社会经济统计广泛应用的一种综合指标,在统计学中有着重要的地位。它是反映同质总体内各单位某一数量标志值在一定时间、地点条件下所达到的一般水平,是总体内各单位参差不齐的标志值的代表值。例如,当人们要了解目前国内人口的年龄状况时,往往运用人口的平均年龄来说明。下一页返回第一节集中趋势的测度平均指标通常分为数值平均数和位置平均数两大类。其中,数值平均数主要包括算术平均数、调和平均数、几何平均数等,位置平均数主要包括中位数、众数。二、集中趋势测度的统计指标(一)算术平均数算术平均数是平均数最普遍的形式,平时人们谈到平均数而又未特别说明其形式时,通常指的就是算术平均数,其基本计算公式为上一页下一页返回第一节集中趋势的测度1.简单算术平均数根据未分组的原始统计资料,将总体各单位的标志值简单相加得到总体标志值总量,然后除以总体单位总量,这种方法称为简单算术平均法。2.加权算术平均数设原始数据被分为k组,各组的变量值或组中值为x1,x2,…,xk,各组变量值出现的频数分别为f1,f2,…,fk,则加权算术平均数x的计算公式为上一页下一页返回第一节集中趋势的测度(二)调和平均数调和平均数是总体各单位标志值倒数的算术平均数的倒数,又称倒数平均数(或调和均值)。统计中的调和平均数,主要是作为算术平均数的变形来使用的。两者在本质上是一致的,区别是计算时使用了不同的数据。调和平均数也分简单调和平均数和加权调和平均数两种计算形式。1.简单调和平均数简单调平均数是先计算总体中各单位标志值倒数的简单算术平均数,然后将其结果求倒数。其计算公式为上一页下一页返回第一节集中趋势的测度2.加权调和平均数加权调和平均数是总体各单位标志值倒数的加权算术平均数的倒数。其计算公式为(三)几何平均数几何平均数是n个变量值的n,主要用于计算平均比率和平均速度。因为这类变量值的连乘积等于总比率或总速度,故不能用算术平均法,而只能用几何平均法求其平均值。上一页下一页返回第一节集中趋势的测度1.简单几何平均数简单几何平均数是根据未分组资料计算的几何平均数。其计算公式为2.加权几何平均数如果各个标志值出现的次数不同,则计算几何平均数采用加权的形式。加权几何平均数的计算公式如下:上一页下一页返回第一节集中趋势的测度(四)中位数中位数与前面讲过的三种数值平均数的不同之处在于:它不是根据总体的全部标志值计算的,而是根据其在分配数列中所处的位置确定的,因此被称为位置平均数。中位数的确定方法,是将总体各单位标志值按大小顺序排列,处于数列中点位置的即中位数,常用字母Mi表示。由于中位数位置居中,不受极端值的影响,因此当数列存在异常波动时,特别是存在极端值时,以中位数代替算术平均数作为集中趋势的测度值较为准确。许多国家政府发布的个人收入、人口年龄的平均值,往往用中位数代替,因为它能够较准确地代表总体各单位的一般水平,在实际应用中较为普遍。上一页下一页返回第一节集中趋势的测度(1)对于未分组资料,假如N个变量值已按大小顺序排列,则有中位数:(2)对于组距式数列,需依据各组变量值在组内均匀分布的假定,先根据累计频数及(f/2)求出中位数所在的组,然后根据中位数所在组频数占全组频数的比例来推算中位数所在位置的变量值。由于累计频数有由小到大和由大到小两种,因此中位数的计算公式也有两种:上一页下一页返回第一节集中趋势的测度(五)众数众数是总体中出现次数最多的标志值,常用字母MO表示。由于它出现的次数最多,所以可以用众数作为各标志值的代表值,代表总体单位的一般水平,反映数据分布的集中趋势。众数通常按分组资料确定,根据变量数列的不同,确定众数可以采用不同的方法。1.由单项式变量数列确定众数由单项式变量数列确定众数比较简单,只要找出次数最多的标志值即可。上一页下一页返回第一节集中趋势的测度2.由组距式变量数列确定众数对于组距式变量数列,首先确定出现次数最多的组,即众数所在组,然后用下式计算众数:三、众数、中位数和均值的关系众数、中位数和均值是集中趋势的三个主要测度值,它们有不同的特点与应用场合。众数、中位数和均值三者之间的关系如图4-1所示。上一页下一页返回第一节集中趋势的测度四、应用平均指标需注意的问题1.注意社会经济现象的同质性同质性,就是总体各单位在被平均的标志上具有同类性,这是应用平均指标的基本原则。如果各单位在类型上是不同的,特别是在社会生产关系上存在着根本差别,那么这样的平均数不仅不能反映事物的本质和内存规律性,而且还会歪曲事物本质,掩盖事实真相,即使算出平均数的数值,也只是“虚构的”“不真实的”。例如,在研究农民收入水平的变化时,如果把长期在外打工和长期从事非农业生产劳动的农民,如从事工业、建筑业、商业的农民的收入与从事农业生产劳动的农民的收入合在一起来计算“农民的收入”,则平均的结果不能真实反映农民收入水平的真实变化,因为两者的收入无论是在构成上还是在使用的性质上都存在着显著的差异。上一页下一页返回第一节集中趋势的测度2.注意用组平均数补充说明总体平均数平均指标反映了总体单位某一数量标志值的一般水平,但却掩盖了各组之间的差异。总体各组之间及组内各单位之间的差异往往影响总体的特征和分布规律,各组结构变动也会对总体变动产生影响。为了全面认识总体的特征和分布规律,需要将平均指标与统计分组结合起来,用组平均数补充说明总体平均数。3.注意用分配数列补充说明总体平均数平均指标的重要特征是把总体各单位的数量差异抽象化,掩盖各单位的数量差异及其分布情况。因此,需要用分配数列补充说明总体平均数。上一页返回第二节离散程度的测度一、离散指标的概述(一)标志变异指标的概念集中趋势只是数据分布的一个特征,所反映的是各变量值向中心值聚集的程度,仅靠它描述数据是不充分的。例如,我们要检测厚度为3mm的塑料布,若随机从工厂产品中选择100张,发现其平均厚度为3mm,这能说明所有的塑料布厚度如我们希望的3mm吗?有可能出现这样的情况,即有50张塑料布的厚度为1mm,其余50张为5mm,此时得到平均厚度也为3mm。因此,我们需要确定塑料布的厚度是如何在均值3mm的周围分散的,即分析各变量值之间的差异状况,这就需要考察数据的分散程度。数据分散程度是数据分布的另一个重要特征,所反映的是各变量值远离其中心值的程度,因此也称为离中趋势。下一页返回第二节离散程度的测度(二)标志变异指标的作用1.标志变异指标反映总体数据分布的离中趋势现象总体数据总是围绕着总体平均数变动,平均数是个变动中心,统计平均数反映数据的集中趋势。而标志变异指标表明总体各单位数据的分散程度,反映总体数据相对于变动中心来说的离中趋势。总体数据变动差异越大,变异指标数值越大,表明总体数据的离中趋势越大;反之,变异指标数值越小,表明总体数据的离中趋势越小。所以说标志变异指标反映总体数据分布的离中趋势。上一页下一页返回第二节离散程度的测度2.标志变异指标可以衡量平均数的代表性平均指标作为数据分布的代表值,其代表性如何,取决于各变量值之间的差异程度。这种关系表现为:变异指标越大,平均指标的代表性越小;反之,变异指标越小,平均指标的代表性就越大。3.标志变异指标可以说明现象总体变动的均衡性、稳定性计算同类总体的标志变异并进行比较,可以观察标志值变动的稳定程度或均衡状态。例如,观察工业企业的生产情况,在研究生产计划完成程度的基础上,利用标志变异指标可以测定生产过程的均衡性;另外,测定产品质量的稳定性也需要利用标志变异指标。上一页下一页返回第二节离散程度的测度标志变异指标还是衡量投资风险程度的尺度,如果投资收益的标准差大,则说明投资收益的不确定性大,即风险大;如果投资收益的标准差小,则说明投资收益的风险小。4.标志变异指标是确定必要抽样单位数的必要依据进行抽样调查时,为了合理地利用人力、物力、财力和时间,应正确地确定必要的样本单位数(具体内容见第八章抽样推断),抽取的样本单位数过多或过少都会影响样本平均指标的代表性,而标志变异指标的大小可以帮助我们正确地确定必要的样本单位数。上一页下一页返回第二节离散程度的测度二、标志变异指标的计算(一)极差极差(Range)也称全距,是一组数据的最大值与最小值之差,用来反映数据的最大变动范围。其计算公式为R=最大标志值-最小标志值(二)平均差平均差是各单位标志值与其算术平均数的离差绝对值的算术平均数,一般用符号A.D表示,用来反映总体分布的离中趋势。由于各标志值与算术平均数的离差之和等于零,因此计算平均差时,采用离差的绝对值。平均差越大,表明总体分布的离中趋势越大,标志变异程度也越大,平均数代表越低;反之,平均差越小,平均数代表越高。上一页下一页返回第二节离散程度的测度(五)方差与标准差标准差又称均方差,是总体各单位标志值与其算术平均数的离差平方的算术平均数的平方根。它是标志变异指标中最重要、最常用的指标,通常以符号“σ”表示。标准差的平方称为方差,用符号σ2表示。1.变量标准差的计算根据所掌握资料的不同,变量标准差的计算有简单平均法和加权平均法两种。(1)未经分组整理的原始数据,采用简单平均法计算标准差。其计算公式为上一页下一页返回第二节离散程度的测度(2)经过分组整理后的变量数列,采用加权平均法计算标准差。其计算公式为2.是非标志标准差的计算有些品质标志的表现可分为具有某种属性和不具有某种属性两种。比如,将全部产品分为合格品与不合格品两组;在评审企业内部控制系统时,将评审结果分为评审过关和不过关两组。这种用“是”与“否”、“有”与“无”来表示的标志称为是非标志或交替标志。上一页下一页返回第二节离散程度的测度为方便对是非标志表现进行离散状况分析,一般对是非标志的表现进行量化处理,以0表示不具有某种属性的标志值,以1表示具有某种属性的标志值。(六)离散系数上面介绍的全距、平均差和标准差都是反映总体中各单位标志值分散程度的绝对值,与平均指标有相同的计量单位。数值的大小,不仅受各单位标志值差异程度的影响,还要受到数列水平高低的影响,也就是说,上述离散程度测度值的大小与数列本身平均水平的高低有关。平均水平越高,标志值的绝对差异程度越大;平均水平越低,标志值的绝对差异程度越小。所以上述离散程度的测度值,只适用于平均水平相同的数列进行比较。若对比不同水平或不同计量单位的变量数列之间的标志变异程度,就不能直接用上述指标进行比较。上一页下一页返回第二节离散程度的测度离散系数又称变异系数,是变异指标和平均指标的比值,用来反映总体分布的离散趋势。它消除了总体平均水平高低和计量单位不同对离散程度测度值的影响,可用于对不同类总体或不同水平总体的分布差异程度进行比较分析。变异系数主要有全距系数、平均差系数、标准差系数等,其中最常用的是标准差系数。标准差系数是标准差与其相应的均值之比,用Vσ表示,是反映数据离散程度的相对指标。其计算公式为上一页返回第三节偏态与峰度的测度一、偏态及其测度偏度是对分布偏斜方向及程度的测定。前面曾经讲到,在完全对称的分布中,算术平均数、中位数与众数是合而为一的。但在偏态分布中,三者的位置就分离了。其中算术平均数与众数分居两边,中位数居中。如果偏斜程度加大,则众数与算术平均数之间的距离越大。因此,算术平均数与众数之间的距离可以作为测定偏态的一个尺度。这是偏态绝对数,其单位与原数据的单位相同,单位不同的次数分布不能用偏态的绝对数进行比较,即使两数列单位相同,但如果平均水平不同的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025安徽省生态环境产业集团财务信息化岗位拟录用人员笔试历年参考题库附带答案详解
- 2025安徽六安市文化旅游产业发展投资有限公司招聘笔试及笔试历年参考题库附带答案详解
- 2025四川长虹美菱中国区营销总部招聘空调营销事业部市场部新媒体运营岗位拟录用人员笔试历年参考题库附带答案详解
- 2025四川绵阳富诚投资集团有限公司招聘项目制聘用人员11人笔试历年参考题库附带答案详解
- 2025四川南溪华西绿舍亿丰管桩有限公司招聘笔试历年参考题库附带答案详解
- 2025四川乐山峨边彝族自治县国有资产监督管理局招聘县属国企工作人员结论笔试历年参考题库附带答案详解
- 2025内蒙古呼和浩特市慧达投资发展有限责任公司招聘2人笔试历年参考题库附带答案详解
- 2025云南临沧沧源佤族自治县国有资本投资运营集团有限责任公司招聘笔试人员笔试历年参考题库附带答案详解
- 2025中化集团招聘聚氨酯业务岗1人(天津)笔试历年参考题库附带答案详解
- 城市轨道交通消防与环控系统检修课件 项目二 任务五 通风空调系统故障检修
- CSC-300系列发变组保护调试说明
- 全航速减摇鳍
- 劳动纠纷应急预案
- 外科学第二十三章 颅内和椎管内血管性疾病
- YY 0777-2023射频热疗设备
- 沈阳地铁6号线一期工程环评报告
- 河南建设工程项目安全生产综合评定表
- 2020中国大学慕课超星尔雅工程伦理2020章节测验答案
- -NSF-PROD-NF-V5.6-产品规格说明书-V1.1
- 测绘生产困难类别细则及工日定额
- QCDSM管理目标五大要素
评论
0/150
提交评论