




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据探查 数据整理 三 马敬东华中科技大学同济医学院医药卫生管理学院 1 数据探查的目的 错误识别设计缺陷被调查者数据录入探查数据为检验假设作准备 2 数据探查的方法 频数表探查法非期望值编码或许表明数据输入或编码有误异常但可能正确的记录值图式探查法将数据以图的方式表示出来 可以对数据从大致分布 总体情况 趋势的走向等方面有一个直观的认识 3 4 数据探查的方法 极端值探查法极端值 就是与其它数值相距甚远的值交叉表探查法数据输入时产生的不能用频数表 图 极值表找出的误差和异常值有时可用交叉表识别出来 5 6 数据的初步分析 一 频数分析 描述统计量 马敬东华中科技大学同济医学院医药卫生管理学院 7 频数分析 Frequencies过程产生频数表 集中趋势 离散度指标 直方图和条图 用户可按数值或频数对频数表进行排序 从菜单中选择 Analyze DescriptiveStatistics Frequencies 此即打开了Frequencies对话框 如下图所示 8 9 10 频数分析 频数的描述统计量在上对话框中选择Statistics 键 就进入FrequenciesStatistics对话框 如图所示 PercentileValues 百分数值 用户可选用以下一个或多个选项 Quartiles输出第25 50 75个百分位数 Cutpointsfornequalgroups输出将样本等分成n组的百分位数值 缺省的组数是10 Percentile s 用户定义的百分位数值 这些值按顺序出现在百分位数列表中 11 12 频数分析 Dispersion 离散趋势指标 用户可选用以下一个或多个选项 Stddeviation标准差 Variance方差 即标准差的平方 Range极差 最大值和最小值之间的差值 Minimum最小值 Maximum最大值 S E mean均值的标准差 测量样本均值的变异性 13 频数分析 CentralTendency 集中趋势指标 Mean算数平均值 Median中位数 Mode众数 Sum总和 Distribution 分布系数 Skewness偏度 分布不对称程度的一个指标 Kurtosis峰度 观测值集中于中心点程度的一个指标 Valuesaregroupmidpoints当输出的数据为分组频数数据 并且具体数据是组中值 选中该复选框通知SPSS 14 频数分析 频数图表欲获得条图或直方图 按下Frequencies对话框中的Charts 即打开了FrequenciesCharts对话框 如下图所示 15 16 频数分析 CharttypeNone此为缺省设置 表示不获得图形 BarCharts 条形图 大小由要画出的最大频数栏决定 Piecharts 饼图 Histograms 直方图 直方图只适用于数值变量 可画出的区间数为21 Withnormalcurve这一选项在直方图上加一条正态曲线 ChartvalueFrequenciesPercentages 17 频数分析 频数格式欲修改频数表输出格式 选用Frequencies对话框中的Displayfrequencytables选项并按下Format 即打开了FrequenciesFormat对话框 如下图所示 18 19 频数分析 Orderby这一顺序选项决定数据值在频数表中排序和显示的方式 Ascendingvalues按值的升序排列各类别 Descendingvalued按值的降序排列各类别 Ascendingcounts按频数的升序排列各类别 Descendingcounts按频数的降序排列各类别 MultipleVariablesComparevariablesOrganizeoutputbyvariablesSuppresstablewithmorethan categories 20 描述统计量 概述统计量按其量化特征 这些统计量可分成三类 集中趋势 离散度和形状 我们已知道可通过频数 Frequencies 过程来得到某个变量的统计量 这里我们学习怎样通过描述 Descriptive 过程来获得描述统计量 21 22 2020 2 4 23 描述统计量 欲获取描述统计量 从菜单中选用 Analyze DescriptiveStatistics Descriptives 此即打开了Descriptives对话框了 如下图所示 24 25 描述统计量 Savestandardizedvaluesasvariables此生成每个变量的Z分数 标准分 变量 新变量名以在原变量的前7个字符前加Z字母生成 例如 ZX即是X的Z分数变量 Z分数变量的变量标识通过在原变量标识的前31各字符前加zscore生成 26 描述统计量 描述统计选项欲获得更多的描述统计量或者项控制变量出现在输出窗口的顺序 按下Descriptives对话框中的Options 此即打开了DescriptivesOptions对话框 如下图所示 其基本操作和基本功能与Frequences过程大致相同 27 28 29 统计描述与统计推断 统计学知识复习之二 30 统计描述 计量资料的描述性统计计数资料的描述性统计 31 计量资料的描述性统计 集中趋势指标离散趋势指标 32 集中趋势指标 平均数用于描述一组同质计量资料的集中趋势 反映一组观察值的平均水平或者一个分布的平均位置的指标平均数的种类算术平均数几何平均数中位数众数 调和平均数 33 集中趋势指标 算术平均数定义 是一群已知性质相同的数值之和除以数值个数的商数 适用条件 资料呈正态分布 近似正态分布 计算方法直接计算法加权计算法注意事项同质对称 34 集中趋势指标 几何平均数适用条件 不呈正态分布 差距较大 数值顺序排列后 呈倍数关系 计算方法直接法加权法注意事项观察值不能小于或等于零观察值不能同时有正值和负值同一组资料求得的几何均数小于算术均数 35 中位数定义 把一组观察值 按大小次序排列 居于中间位置的那个数值 适用条件 明显偏态分布 分布的一端或两端无确定数值 资料的分布情况不清楚 计算方法直接法加权法 集中趋势指标 36 离散趋势指标 变异性 同质条件下的观察单位 其同一标志的数据间的差异性 变异指标 用以表述一组计量资料观察值之间参差不齐程度的指标 变异指标的种类全局 极差四分位数间距方差与标准差变异系数 37 方差与标准差定义方差 离均差平方和的均数 标准差 方差的平方根 计算方法直接法加权法标准差的应用表示离散程度 计算变异系数 求正常值的范围 计算标准误 离散趋势指标 38 变异系数亦称离散系数 即标准差与均数之比用百分数表示 应用范围比较均数相差悬殊的几组资料的变异度 比较度量衡单位不同的几组资料的变异度 离散趋势指标 39 计数资料的描述性统计 相对数 两个有关联的数据之比 用以说明事物的相对关系 便于对比分析 相对数的种类 率构成比相对比 40 率表示特定条件下 某现象实际发生例数与可能发生该现象的总例数之比 用来说明某现象发生的强度与频率 比两事物数量的比值 以反映相对比例 比重或倍数 构成比 事物内部某一构成在全部构成中所占的比例或比重 常以100为比例基数 相对比 两个有关指标之比 反映两者之间的差别 计数资料的描述性统计 41 统计推断 抽样误差总体参数估计 略 总体参数比较 42 抽样误差 误差定义分类系统误差随机误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论