




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章描述统计分析 利用正确的统计方法对数据进行适当的整理和显示 描述探索出数据内在数据规律性 掌握统计思想 培养学生学习统计学的兴趣 为继续学习推论统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础 3 1基本统计分析概述一 基本统计分析包括的内容 频度分析Frequencies 统计描述Descriptives 探索分析Explore 多维频数分布交叉列联表Crosstable 摘要报告表Summarize 行形式的输出报告ReportSummariesinRow 列形式的输出报告ReportSummariesinColumn二 统计分析的特殊图形箱图Boxplot茎叶图Stem andLeafPlot 集中趋势组 centralTendency 平均值Mean 中位数Median 众数Mode 求和Sum离中趋势组 dispersion 标准差Std deviation 方差Variance 跨度Range 最小值Minimum 最大值Maximum 平均值的标准误S E Mean 3 2单变量的统计描述一 频数分布 某变量各种取值出现的次数或频数 二 集中趋势的度量 平均值 Mean 中位数 Median表示位于数据数列中心位置的那一项的大小 奇个数 第 n 1 2个数的值偶个数 第n 2与第 n 2 1两个数的均值 众数 Mode数据中重复出现次数最多的数值 三 离中趋势的度量描述数据个性方面的特征 即数据的分散程度或差异程度 全距 range 最大值与最小值之差 方差 Variance 标准差 Standarddeviation 方差的平方根 偏 斜 度 Skewness 描述分布偏离正态分布的程度 即偏离对称的程度 SkewnessSkewness 0 正偏离Skewness0分布集中趋势强Kurtosis 0分布离心趋势强 变异系数 CV S M S 标准差M 平均值 标准分数 Z分数以标准差为单位表示一个分数在群体中所处的相对位置 百分位数和N等分百分位数 percetileNtile 百分位数和N等分百分位数能够度量全部观测值对中心位置的平均偏差 从而对数据的离散性做出最综合的说明 百分位数的数值是给出对应不同百分比的数值 例如 50 对应85 表明50 的样本取值在85及其以下 N等分百分位数是将总体样本数等份成N等份 产生的N 1个百分比对应N 1个数值 分别表示不同比例的样本取值在给定数值及其以下 操作原理 1 描述统计分析模块概述 1 Frequencies频数分布过程 产生频数分布表 2 Descriptive描述统计量分析过程 3 Explore探索分析过程 用于对数据分布状况不清时的探索性分析 4 Ratio比例统计量 5 Means平均数分析 此过程主要用于分组计算各统计指标 3 3频度分析一 频度分布的描述方式 描述某变量取值的情况可以用数表和图形 二 操作步骤 选择Analyze DescriptiveStatistics Frequencies Frequencies对话框 选择分析变量 回答变量名 可以多个 选项 Displayfrequencytable 决定是否显示频数分布表 Statistics 描述统计量的计算 百分位数组 PercentileValue Quartiles 四分位数 Cutpointsnequal n等分百分位数 Percentile 指定的百分位数 Chart 选择统计图形 Barcharts 条形图 按照个案的取值 用条形的长度来表达的图形 Piecharts 饼图 按照样本各类取值分组的百分比生成的圆形图形 Histograms 直方图 按照个案的分组取值 用条形的长度来表达各个组的取值的图形 只适用于数值型变量 若选择了 Withnormalcurve 可附带一条用于对照的正态曲线 对于图形的标度可以用频数 也可以用百分比数 Chart统计图子对话框 Format 设置频数表格式 排序方式Orderby Ascendingvalues 按照变量值的升序排列 Descendingvalues 按照变量值的降序排列 AscendingCounts 按照频数升序排列 DescendingCounts 按照频数降序排列 多变量图形输出设置 Comparevariables 多变量图形输出在同一张图中可以有多个变量的输出结果 Organizeoutputbyvariable 单变量图形输出在一张图中只能有一个变量的输出结果 压缩表格格式Suppresstableswithmorethanncategories压缩表格表示频数类别将限制在n以内 超过n类的将不显示 压缩表格式将只显示变量值 频度 百分比和累计百分比 3 4描述分析操作步骤 选择Analyze DescriptiveStatistics Descriptives 先从左边框中选择要分析的变量 放入右框中 2 左下方 Savestandardizedvaluesasvariables把标准化后的变量作为变量保存 3 Options选项 设置排序的方法 Displayorder Variablelist 按原始变量值排列 Alphabetic 按字母顺序排列 Ascendingmeans 按均值的升序排列 Descendingmeans 按均值的降序排列 1 探索分析的内容包括下面几个方面 检查数据是否有错误 过大或过小的数据均有可能是奇异值 影响点或错误数据 要找出这样的数据 并分析原因 然后决定是否从分析中删除这些数据 因为奇异值和影响点往往对分析的影响较大 不能真实反映数据的总体特征 对数据规律的初步观察 通过初步观察获得数据的一些内部规律 例如 两个变量间是否线性相关 3 5探索分析 2 探索分析的考察方法 探索分析一般通过数据文件在分组与不分组的情况下 获得常用统计量和图形 一般以图形方式输出 直观帮助用户确定奇异值 影响点 进行假设检验 以及确定用户要使用的某种统计方式是否合适 3 正态分布检验 常用的正态分布检验是Q Q图 4 方差齐次性检验 对数据分析不仅需要进行正态分布检验 有时候还需要比较各个分组的方差是否相同 这就要进行方差齐次性检验 例如 在进行独立右边的T检验之前 就需要事先确定两个数据的方差是否相同 如果通过分析发现各个方差不同 还需要对数据进行方差分析 那么就需要对数据进行转换使得方差尽可能相同 在探索分析中可以使用Levene检验 Levene检验对数据进行方差齐次性检验时 不强求数据必须服从正态分布 它先计算出各个观测值减去组内均值的差 然后再通过这些差值的绝对值进行单因素方差分析 如果得到显著性水平小于0 05 那么就可以拒绝方差相同的假设 操作步骤 选择Analyze DescriptiveStatistics Explore Dependentlist 选择分析变量 因变量 到该框中Factorlist 选择分组变量 因素或自变量 到该框中Labelcaseby 选择标识变量 若不选此项 则在输出过程中用个案标号标识个案 Display 选择输出形式 Both 二者都有输出 Statistics 输出描述统计量 Plots 输出图形 Statistics 选择描述统计量Descriptive 输出基本统计量Confidenceintervalfor95 系统默认的置信区M estimators 反应集中趋势的四种最大似然估计量 Hurber s Andrew s Hampel s Tukey s Outliers 输出5个最大值和5个最小值 Percentile 可以输出5 10 25 50 75 90 95 的百分位数 Plot 选择特殊统计图形Boxplot 生成箱图 Factorlevelstogether 在同一张图上只显示一个变量 不同水平同时显示 Dependenttogether 所有变量显示在同一张图上 None 不显示箱图 箱图Box主体 由大于25 的百分位数到小于75 的百分位数的样本组成 中间的黑色横线表示中位数 箱图Box本体 由上触须线和下触须线包括的范围组成 其意义是除去奇异值和极端值后的全部样本观测值 奇异值 数据点到主体边缘的距离超过箱高的1 5倍 上奇异值 75 百分位数 25 百分位数 1 5 75 百分位数下奇异值 75 百分位数 25 百分位数 3 75 百分位数下极端值 25 百分位数 75 百分位数 25 百分位数 3 DescriptiveStem and leaf 生成箱图Histogram 生成直方图 表现频度分布 茎叶图Stem and LeafPlotFrequencyStem Leaf 006 1 006 21 006 53 006 6673 006 8897 007 00011117 007 22233339 007 4444555558 007 6666777712 007 88888999999913 008 000000001111111 008 222223333336 008 4444556 008 6667775 008 889993 009 0012 009 231 009 41 009 61 00Extremes 98 Stemwidth 10 00Eachleaf 1case s 第一列频数Frequency 表示样本的频数 第二列茎Stem 表达整数第三列叶Leaf 每片叶表示小数的量级 Stemwidth表示茎宽 即倍率 例如茎宽 10 00当茎stem 9时 表示90Eachleaf表示每片叶表示样本数 例如当Eachleaf 2case s 时 每片叶子代表的样本数为2个样本 例如在上述例子中 第六行中的数据表示共有七个样本 其中70的样本有三个 最后一行中的数据表示共有一个样本 该样本为极端值 大于等于98 Normalityplotwithtest 正态分布检验并给出正态分布Q Q图 Spreadvs LevelwithLevenetest方差齐性检验及分布水平散点图None 不输出方差齐性检验及分布水平散点图Powerestimation 数据转换所得方差齐性的力度估计 可帮助决定是否需要做数据转换 Transformedpower 对转换后数据做方差齐性检验及分布水平散点图 Untransformed 不做数据转换 Option 缺失值处理选项ExcludecasesListwise 对于选入目标变量列表中的有缺失值的变量 无论其参与不参与当前运算 相应个案将被排除 ExcludecasesPairwise 对于选入目标变量列表中的有缺失值的变量 如果其参与运算 相应个案将被排除 ReportValue 把分组变量中含缺失值的个案单独分为一组 3 6Ratio比例统计量 操作步骤 选择Analyze DescriptiveStatistics Ratio Numerator 选入作为相对比分子的变量Denominator 选择作为相对比分母的变量GroupVariable 选入分组变量Sortbygroupvariable 将数据按照分组变量排序 Displayresults 在结果窗口输出分析结果 系统默认 Saveresultstoexternalfile 将分析结果存为外部数据文件 Ascendingorder 升序排列 Descendingorder 降序排列 Statistics 按钮CentralTendency 集中趋势 Dispersion 离散趋势AAD 平均绝对离差 全部比例 比例中位数 nCOD 离散系数 AAD 比例的中位数PRD 价格相关微分 均值 加权均值MediancenteredCOV 基于中位数的变异系数 SQRT 全部比例 比例中位数 中位数MeancenteredCOV 基于均值的变异系数 标准差 均值Concentrationindex 计算集中系数Ratiobetween 自定义区间上下界Ratio ofmedian Ratiobetween 3 7Mean平均数分析 Means过程用于统计分组变量的的基本统计量 这些基本统计量包括 均值 Mean 标准差 StandardDeviation 观察量数目 NumberofCases 方差 Variance Means过程还可以列出方差表和线性检验结果 操作步骤 选择Analyze Comparemeans Means 1 设置分析变量从左边的变量列表中选中要分析变量后 放入到因子变量列表 DependentList 框里 可以从左边变量列表里选择一个或多个变量进行统计 从左边的变量列表中选中分组变量 放入 IndependentList 分组变量框里 可以从左边变量列表里选择一个或多个分组变量 Layer1of1 多个分组变量既可放在一层 又可放在不同层 利用图中的 Previous 和 Next 按钮可以在不同层之间切换 2 选择输出统计量单击 Options 按钮 在 Options 对话框中 Statistics 框中列出了SPSS可求的统计量 在 CellStatistics 框中列出了已选中的统计量 从 Statistics 框中选择要生成的统计量 StatisticsforFirstLayer 框中列出了第一层分组的另外两个统计量 Anovatableandeta 选中将给出方差分析表和eta统计量 eta统计量为分组变量与生成统计量的变量关系紧密程度的度量 TestforIinearity 选中给出分析变量和分组变量的线性关系参数 其前提条件为 分组变量和分析变量线性相关 3 8交叉列联表利用频数或相对频数研究变量与变量之间的关系 一 交叉列联表结构定义 行变量和列变量例如 考试成绩数据 定义年龄为行变量 分3个水平 定义成绩为列变量 分5个水平 从而产生一个3 5的交叉列联表 每个单元格中的数据可以为频度 频率 期望值或残差等 最后一行和最后一列有本行 本列的频度求和以及频率求和 二 交叉列联表中变量的定义 fij 第i行第j列的值 频数 f12 3 f23 3 f31 1fi 第i行累计行边缘频数 fi f1 5 f3 6f j 第j列累计列边缘频数 f j f 3 4 f 2 8Total 总频数 ExpectedCount期望值 fi f j total within行变量行频率 fij fi within列变量列频率 fij f j ofTotal总频率 fij totalResidual残差 fij Expecte
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- IT服务行业云服务与数据安全保障技术方案
- 零售药店安全管理岗位职责
- 2025年招聘面试实战演练行业协会财务岗位模拟题及答案
- 2026届云南省宣威五中化学高三第一学期期末复习检测试题含解析
- 2025年运动康复技术高级面试题详解
- 幼儿园中班体格锻炼设备采购计划
- 电力系统安全生产措施
- 建筑工程施工应急预案
- 全科教研室职责与课堂教学质量提升
- (2025年标准)股权代管协议书
- 咖啡学概论智慧树知到期末考试答案章节答案2024年华南理工大学
- 2023房屋安全鉴定服务规范
- 床垫营销方案
- 促销方法与促销技巧
- 2024年贵州水投水务集团有限公司招聘笔试参考题库含答案解析
- 《品质改善报告》课件
- 《肖申克的救赎》完整中英文对照剧本
- 物料传送控制系统组态设计与调试全套教学课件
- 重大事故隐患专项排查检查表
- 中金公司行业研究培训(修订版)
- 文献检索与毕业论文写作PPT完整全套教学课件
评论
0/150
提交评论