连续变量的统计描述与参数估计.ppt_第1页
连续变量的统计描述与参数估计.ppt_第2页
连续变量的统计描述与参数估计.ppt_第3页
连续变量的统计描述与参数估计.ppt_第4页
连续变量的统计描述与参数估计.ppt_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章 连续变量的统计描述与参数估计,石彤 2013.10,统计分析的目的是研究总体特征; 统计方法分为描述性统计分析和推断性统计分析: 描述性统计分析对数据进行描述的统计方法; 推断性统计分析从样本信息回推总体特征的统计方法。,各种统计描述指标(统计量,summary statistic),也称汇总统计量或概括统计量,用少量数据概括大量数据的技术。 针对不同测量类型的变量,有不同的描述指标体系和统计图形与之对应。 分类变量的描述统计量,如频数、频率;连续变量的描述统计量,如均数、标准差。,5.1 连续变量的统计描述指标体系,统计指标: 集中趋势 离散趋势 分布特征 其他趋势 图5.1 CCSS数据中S3绘制的直方图,5.1.1 集中趋势的描述指标 集中趋势(Central Tendency),又称“位置统计量”(Location Statistic),即数据分布的中心位置的统计量,包括算术均数、中位数、众数、截尾均数。,截尾均数: 由于均数较易受极端值的影响,因此可以考虑将数据进行排序后,按照一定比例去掉最两端的数据,包括中部的数据来求均数。 如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消。 常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。 在SPSS中“探索”(Explore)过程可以自动计算5%截尾均数。,5.1.2 离散趋势的描述指标 离散趋势(Dispersion Tendency),又称“尺度统计量”(Scale Statistic),即可以反映数据波动范围的大小的统计量,包括全距、方差、标准差、百分位数、四分位数、四分位间距、变异系数。,变异系数: 当需要比较两组数据离散程度大小的时候,往往直接使用标准差来进行比较并不合适。这可以被分为两种情况:一是测量尺度相差太大;二是数据量纲不同 。 变异系数(coefficient of variation,简称CV ) 可以消除测量尺度和量纲的影响 。它是标准差与其平均数的比率。计算出的变异系数没有量纲,同时又按照其均数大小进行了标化,这样就可以进行客观的比较。,5.1.3 分布特征、其他趋势的描述指标 分布特征(Distribution Tendency),又称“形态统计量”,即描述数据偏离分布程度的统计量,包括偏度、峰度。 其他趋势,是统计描述的其他指标,包括单峰或双峰分布、M统计量、极端值列表等。,5.1.4 SPSS中的相应功能 用于连续变量统计描述的过程,均集中在“描述统计”(Descriptive Statistics) 子菜单中: 1.频率过程(Frequencies) 该过程特色是产生原始数据的频数表,并能计算各种百分位数,描述指标包括集中趋势、离散趋势、百分位数和分布指标四部分,能绘制统计图。,2.描述过程(Descriptives) 该过程适用于对服从正态分布的连续性变量进行描述,它不能绘制统计图、所能计算的统计量较少,使用频率很高。 3.探索过程(Explore) 该过程用于对连续变量分布状况不清楚的探索性分析,可计算许多描述性统计量(如均数、百分位数、截尾均数、极端值列表),绘制统计图和参数估计; 4.比率过程(Ratio) 该过程用于对两个连续变量计算相对比指标,可计算专业的相对比描述指标。,5.2 连续变量的参数估计指标体系,5.2.1 正态分布 1.正态分布的定义 2.标准正态分布 5.2.2 参数的点估计 1.矩法 2.极大似然法 3.稳健估计值 M估计、R估计,5.2.3 参数的区间估计 1.标准误 样本均数的标准差,称均数标准误,或称标准误差。 2.区间估计的计算 可信度或置信度(1-); 可信区间或置信区间; 显著度或显著性水平( )。,5.2.4 SPSS中的相应功能 SPSS的许多过程均可完成连续变量参数估计的任务,针对性较强的是描述统计子菜单中的过程: 1.描述过程 将原变量转换为标准正态分布的得分,选择“将标准化得分另存为变量”复选框。,2.探索过程 可计算标准误,还可以直接给出均数95%可信区间,以及提供稳健估计值。 3.P-P图和Q-Q图 用图形方式直接观察样本数据分布是否服从所假设的理论分布,如正态分布。,5.3 案例:信心指数的统计描述,5.3.1 使用频率过程进行分析 例5.1 对CCSS数据中的消费者信心总值数index1、现状指数index1a和预期指数index1b进行统计描述,并计算出95%个体参考值范围。 1.界面说明 2.操作说明与结果解释,5.3.2 使用描述过程进行分析 1.界面说明 2.操作说明与结果解释 5.3.3 使用探索过程进行分析 例5.2 分月份对总指数index1进行描述 1.界面说明 2.基本输出结果 3.M-统计量 4.极端值列表 5.百分位数,5.4 Bootstrap方法,5.4.1 模型 1.基本原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论