ch4 数据的描述性分析_第1页
ch4 数据的描述性分析_第2页
ch4 数据的描述性分析_第3页
ch4 数据的描述性分析_第4页
ch4 数据的描述性分析_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京财经大学统计学系第四章

数据的描述性分析高等教育出版社高等教育电子音像出版社本章内容一、相对程度的描述二、集中趋势的描述三、离散程度的描述四、分布的偏度与峰度单变量截面数据有限总体与样本1、计划完成程度相对指标2、结构相对指标3、比例相对指标4、比较相对指标5、动态相对指标6、强度相对指标7、相对指标应用的原则

一、相对程度的描述数值平均数1.算术平均数2.调和平均数3.几何平均数二、集中趋势的描述位置平均数1.中位数2.众数对比绝对指标

1.极差与四分位差

2.平均绝对差

3.标准差与方差相对指标---离散系数三、离散程度的描述数据标准化

无量纲,不改变次序;

离群点,异常点一个特殊的均值和方差(0-1标志,贝努利分布)原点距中心距四、分布的偏态与峰度分布的偏度分布的峰度用以描述分布的形状一招制敌:Excel的数据分析工具—描述统计的使用相对程度的概念相对程度是指由两个有联系的指标之比值。其表现形式有两种:1、无名数(即无计量单位)2、有名数公斤/人,人/平方公里无名数又分为系数和倍数、成数、百分数、千分数等。计划完成程度相对指标计划完成程度相对指标是实际完成数与计划任务数之比。计划任务为绝对数或平均数时,可直接用实际数与计划数对比;如果计划任务为相对数时,则需要考虑上期的实际水平。

结构相对指标结构相对指标是指同一总体中,部分与总体之比。反映部分在总体中所占的份额。其特点是:1、分子分母不能互换;2、各部分数值之和等于1或100%。比例相对指标比例相对指标是指同一总体中,部分与部分之比。反映总体内部不同部分之间的比例关系。其特点是:1、分子分母可以互换2、多用几比几表示比较相对指标比较相对指标是指同一时间,不同总体的同一指标之比,反映同类事物在不同空间的对比关系。其特点是:1、分子分母可以互换2、多用几比几表示动态相对指标动态相对指标是指同一总体的不同时间的同一指标之比,反映同一现象在不同时间上的发展变化情况。其特点是:1、分子分母不能互换2、多以%表示基期:作为比较标准或参照的时期报告期:当期,本期,感兴趣或所关心的时期强度相对指标强度相对指标是指两个性质不同但有联系的不同指标之比,用以反映两个有联系的总量指标之间的强度、密度和普遍程度。其特点是:1、唯一使用有名数2、分子分母可以互换,并形成强度相对指标的正、逆指标相对指标应用的原则1、可比性原则(1)正确选择对比基数(2)保持对比指标的可比性2、相对指标与总量指标结合运用原则3、多种相对指标结合运用原则集中趋势集中趋势(CentralTendency)反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。描述集中趋势的指标分为:

数值平均数和位置平均数算术平均数算术平均数(Arithmeticmean)是总体或样本中所有个体的某数量标志的总和与个体总数的比值,一般用符号表示。

◆简单算术平均数(对不分组数据)◆加权算术平均数(对分组数据)◆算术平均数的数学性质

简单算术平均数AVERAGE函数样本均值加权算术平均数权数单项数列组距数列加权算术平均数与简单算术平均数没有本质区别,只是表达形式不同而已!单项数列的算术平均数该班同学的平均年龄.下表算术平均数的数学性质权数

次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。权重调和平均数调和平均数(Harmonicmean)是各变量值倒数的算术平均数的倒数。由于它是根据变量值倒数计算的,所以又称作倒数平均数,通常用表示。◆简单调和平均数◆加权调和平均数◆调和平均数是算术平均数的变形HARMEAN函数简单调和平均数加权调和平均数调和平均数是算术平均数的变形

必须结合问题的实际背景来理解!不能死套公式!本质上与算术平均数相同,只是已知数据不同而带来的表达形式的不同而已!几何平均数几何平均数(Geometricmean)是n个变量值连乘积的n次方根。几何平均数是计算平均比率和平均发展速度最适用的一种方法。通常用表示。◆简单几何平均数◆加权几何平均数GEOMEAN函数简单几何平均数加权几何平均数注意:不能直接求平均增长速度中位数中位数(Median)是一组数据按大小顺序排列后,处于中间位置的那个变量值,通常用表示。其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值:一半数值小于中位数,另一半数值大于中位数。中位数是一个位置代表值,因此它受极端变量值的影响较小。◆未分组数据的中位数◆单项数列的中位数◆组距数列的中位数(略)分位数由未分组数据确定中位数对未分组数据资料,先将各变量值按大小顺序排列,并根据数据个数n的奇偶性确定中位数的位置。若序列的项数为奇数时,则处于序列中间位置的变量值就是中位数。(n+1)/2例:7、6、8、2、3

若序列的项数是偶数时,则应取中间位置上的两个数的中点作为中位数,即取中间两个变量值的平均数为中位数。

n/2和n/2+1例:2、5、7、8、11、12

MEDIAN函数由单项数列确定中位数先计算总次数(即数据总数),根据其奇偶性确定中位数所在位置(类上),并对照向上累积数确定中位数所在的组,进而确定中位数。分位数四分位数:三个数值可以将变量数列划分为项数相等的四部分,这三个数值就定义为四分位数(Quartiles)。十分位数:十等分百分位数(Percentile):一百等分p分位数众数众数(Mode)是一组数据中出现次数最多的那个变量值,通常用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论