数据模型第二章数据及其描述分析.ppt_第1页
数据模型第二章数据及其描述分析.ppt_第2页
数据模型第二章数据及其描述分析.ppt_第3页
数据模型第二章数据及其描述分析.ppt_第4页
数据模型第二章数据及其描述分析.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲,数据及其描述分析,本讲内容,一、统计学中的常见概念 二、数据类型 三、主要统计指标 四、时间序列 五、统计图表,一、统计学中的常见概念,1、总体:研究对象的集合 2、个体(总体单位):研究对象集合中的每 一个个体 3、标志:反映总体单位特征的名称,如工资、利润、企业类型等,有数量标志和品质标志 4、指标:反映总体数量特征的名称,如产量,续:,5、变量:指可以变化的量,指标和数量标志因其值是可变的,因而也称为变量 6、样本:从总体中抽出部分个体组成的集合 7、数据:指标或标志的取值,二、数据类型,1、数值型和属性型数据,数值型数据如收入、利润、成本、企业数等。 不能用数值表示的数据称为属性数据,如职工性别、企业类型等。,2、静态数据和动态数据,根据数据是否随时间变化,可以分为静态数据和动态数据。,3、时间序列数据和截面数据,如下表,表示从1978年到2009年,城乡家庭恩格尔系数的变化:时间序列数据,续:,如下表,表示2008年这一时间段内5个城市空气质量的主要指标。(截面数据),4、定类数据、定序数据、定距数据和定比数据,定类数据:马鞍山市不同企业的名称。(不可加减乘除,比较也没有意义) 定序数据:企业的产品质量等级。(可以比较) 定距数据:各城市一年的平均气温。(可加减) 定比数据:09年全国大城市房地产价格指数。(可进行任何计算),三、主要统计指标,统计指标分为四大类: 总量指标 相对指标 平均指标 变异指标,1、总量指标,价值量,实物量,产值:1亿元,货运量:1亿吨,产值:1亿元,固定资产:1亿元,注:ROE=净利润/平均净资产,2、相对指标,3、平均指标,(1)算术平均数,平均数衡量数据的平均水平,也可指中心。 数据来自于未分组资料,平均数公式为: 数据来自于分组资料,平均数定义为,简单算术平均数,加权算术平均数,注:为克服异常数据,常去掉几个最大值和最小值,称为修剪平均数,(2)中位数,将所有数据按从小到大排序,位于中央的数据为中位数,它是数据的位置中心。,(3)众数、几何平均数,众数:是频率出现最高的数 几何平均数:主要用于利率等数据平均数的计算 公式为:,案例:房屋租金,以下是来自某地区房屋租金的实际数据,试运用Excel计算其 平均租金、租金的中位数和众数,Excel主要操作步骤,Excel计算步骤如下: 1、将70个原始数据输入到Excel工作表的A1:J7单元格中。 2、在开始菜单中选择编辑菜单中的数据计算。 3、选择需要计算的函数名。 4、出现对话框时,在“输入区域”方框内键入A1:J7,最后选择“确定”。,4、标志变异指标,(1)全距,全距是数据中最大与最小间的差距 是衡量数据变异程度最简单的描述 全距对最大与最小数据的值的敏感性很强,(2)方差,方差是度量数据分散程度的指标,也可以认为是不均衡程度、风险程度,其计算公式为:,(3)标准差、变异系数,标准差为方差的正平方根 变异系数是标准差相对于平均数的大小的度量,计算公式为:,房屋租金例,续:,Variance 方差 Standard Deviation 标准差 Coefficient of Variation 变异系数,四、时间序列,1、发展水平 2、发展速度:定基发展速度、环比发展速度 3、增长速度:定基增长速度、环比增长速度 4、百分之一增长量,1、发展水平,时间序列:指按照时间先后顺序排列形成的一列数,数列中的每一个数称为该期的发展水平。,初期,末期,2、发展速度,定基发展速度:以某一期为基期,所有其它期发展水平与此相比得到的。 环比发展速度:以上一期为基期,下一期发展水平与此相比得到的。,3、增长速度,增长速度=发展速度-1 (定基增长速度、环比增长速度) 平均增长速度: 平均增长速度=平均发展速度1,4、百分之一增长量、同期增长,百分之一增长量公式为: 同期增长:本年与上年同期相比的值,五、统计图表,表1 2006-2008我国GDP,1、饼图,饼图是常用于描述总体内部结构的图形方法,2、柱状图,3、直方图,直方图是描述在一个频数、相对频数或百分数频数分布中汇总的品质数据的图形方法。 以下数据来自一次关于产品质量的调查结果,表2 产品质量调查结果汇总表,续:,4、散点图,频数分布,确定无重叠的组别数 一般分为5-20个组 大量元素数据分较多的组 小量元素数据分较少的组 确定每一组的宽度 每一组别的宽度相同 近似组宽为,频数分布,汽车修理问题,实际举例,频数分布,如果分为6组 组宽约 = (109 - 52)/6 = 9.5 10 Cost ($) Frequency 50-59 2 60-69 13 70-79 16 80-89 7 90-99 7 100-109 5 Total 50,实际举例,相对频数,一组的相对频数 = 一组的频数 n n = 元素个数,相对频数和百分数频数,Relative Percent Cost ($) Frequency Frequency 50-59 .04 4 60-69 .26 26 70-79 .32 32 80-89 .14 14 90-99 .14 14 100-109 .10 10 Total 1.00 100,躬形图,穹形图是一种累积频数分布或累积相对频数分布的图形 数据值列示在横轴上 纵轴为累积频数或相对累积频数,穹形图,实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论