第六章 均值比较与检验_第1页
第六章 均值比较与检验_第2页
第六章 均值比较与检验_第3页
第六章 均值比较与检验_第4页
第六章 均值比较与检验_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章双变量的统计分析之二 均值比较与检验 主要内容 MEANS过程单一样本T检验 One SampleTTest 独立样本T检验 Independent SampleTTest 配对样本T检验 Paired SampleTTest 方差分析 One WayANOVA MEANS过程 一 Means过程该过程实际上更倾向于对样本进行描述 可以对需要比较的各组计算描述指标 包括均值 标准差 总和 观测量数 方差等一系列单变量统计量 二 完全窗口分析按Analyze CompareMeans Means顺序 打开Means主对话框 如图6 1 图6 1Means主对话框 该框的变量为因变量 即用于分析的变量 该框的变量为自变量 必须至少有一个变量 单击此按钮 进入下一层 返回则按Previous按钮 见图6 2 Statistics框 供选择的统计量 StatisticsforFirstLayer复选框 Anovatableandeta 进行分组变量的单因方差分析并计算eta统计量 Testforlinearity 产生第一层最后一个变量的R和R2 图6 2Options对话框 CellStatistics框 选入的描述统计量 默认为均值 样本数 标准差 三 例题分析某医生测得如下血红蛋白值 g 用Means过程对其做基本的描述性统计分析 表5 1血红蛋白值 g 1 操作步骤 1 打开数据文件 Means过程 sav 2 按顺序AnalyzeCompareMeansMeans打开主对话框 3 单击Option 打开Options对话框 选择统计项目 4 单击OK完成 选hbsex 按Next 进入layer2of2 选age 图6 3在主对话框选送变量 图6 4第二层变量框 选择统计项目 按此按钮 复选此2项 第一层次分组选择计算方差分析和线性检验 图6 5Options对话框 表6 1观测量摘要表 表6 1是观测量摘要表 观测量总个数为40 其中有效值为40个 无效值0 2 结果及分析 表6 2分组描述统计量 表6 2分三部分 第一 二部分先按性别分组 再按年龄分组计算观测值合计 均数 标准差 方差和个数 第三部分只按年龄分组 最后一行为合计 表6 4按年龄分组的描述统计量 表6 3按性别分组的描述性统计量 血红蛋白 性别 血红蛋白 年龄 表6 3 4是将sex和age一起放在layer1of1中 分别计算男 女 不作年龄分组 年龄分三组 不作性别分组 的观测值合计 均数 标准差 方差和个数 表6 5方差分析表 表6 5是方差分析表 共6列 第一列方差来源 组间的 组内的 总的方差 第二列为平方和 第三列为自由度 第四列为均方 第五列为F值 第六列为F统计量的显著值 显著值小于0 05 所以性别对血红蛋白值有显著影响 表6 6eta统计量 表6 6是eta统计量表 统计量表明因变量和自变量之间联系的强度 0 567的值处于中等水平 2是因变量中不同组间差异所解释的方差比 是组间平方和与总平方和之比 即由64 5256除以200 787得到 表6 7按年龄分组的方差分析表 表6 7是将年龄作为第一层自变量得到的方差分析表 Linearity是假设因变量均值是第一层自变量值的线性函数 DeviationfromLinearity是不能由线性模型解释的部分 表6 8按年龄分组的eta统计量 表6 8是将年龄作为第一层自变量得到的eta统计量表 R和R2测度线性拟合的良好度 R是观测值与预测值之间的相关系数 一 简介用于检验单个变量的均值与假设检验值 给定的常数 之间是否存在差异 二 完全窗口分析按Analyze CompareMeans One SampleTTest顺序 打开One SampleTTest主对话框 如图5 1 一 单一样本T检验 图6 6One SampleTTest主对话框 图6 7Options对话框 TestVariables框 用于选取需要分析的变量 TestValue 输入已知的总体均值 默认0 ConfidenceInterval 输入置信区间 一般取90 95 99等 MissingValues 在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算 三 例题分析仍以表5 1的资料来说明 已知另一地区16 18岁的少年血红蛋白平均值为11 657g 检验这一地区16 18岁少年血红蛋白值是否与另一地区的平均值相等 1 操作步骤1 按Analyze CompareMeans OneSampleTTest顺序 打开主对话框 打开数据文件 Means过程 sav 2 将变量hb选入TestVariable框 3 在TestValue中输入11 657 后单击OK 2 结果分析 表5 9单个样本统计量 表5 9是血红蛋白值的观测量个数 均值 标准差和均值的标准误等统计量 表5 10单个样本检验 从表5 10可看出 t值为 0 592 自由度39 显著值为0 558 样本均值与检验值的差为 0 2122 该差值95 的置信区间是0 9379 0 5134 一 简介用于检验对于两组来自独立总体的样本 其独立总体的均值或中心位置是否一样 如果两组样本彼此不独立 应使用配对T检验 Paired SampleTTest 如果分组不止一个 应使用One WayANOVA过程进行单变量方差分析 如果想比较的变量是分类变量 应使用Crosstabs功能 独立样本T检验还要求总体服从正态分布 如果总体明显不服从正态分布 则应使用非参数检验过程 Nonparametrictest 二 完全窗口分析按Analyze CompareMeans Independent SampleTTest顺序 打开Independent SampleTTest主对话框 如图5 10 二 独立样本T检验 图5 10独立样本T检验主对话框 图5 11DefineGroups主对话框 从源变量框中选取要作检验的变量 为分组变量 只能有一个 分别输入分组变量的取值条件 如1为男 2为女等 输入分界点值 如体重60公斤等 在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算 输入置信区间 一般取90 95 99等 图5 9Independent SampleTTest的Options对话框 三 例题分析仍以表5 1的资料来说明 1 操作步骤1 按Analyze CompareMeans Independent SampleTTest顺序 打开主对话框 打开数据文件 Means过程 sav 2 将变量hb选入TestVariable框 3 在sex选入GroupingVariable框中作为检验变量 4 打开DefineGroups对话框 在Group1输入1 Group2输入2 单击Continue 再单击OK 2 结果分析 表5 11是血红蛋白值的观测量个数 均值 标准差和均值的标准误等统计量 表5 11分组统计量 表5 12独立样本T检验结果 从表5 12可看出 Equalvariancesassumed行是假设方差相等进行的检验 当方差相等时考察这一行的结果 Equalvariancesnotassumed行是假设方差不等进行的检验 当方差不等时考察这一行的结果 在Levene sTestforEqualityofVariance列中 显著值为0 544 0 15 可认为方差是相等的 所以应考察第一行的结果 可看出 显著值为0 000 0 05 所以认为均值是不等的 一 简介用于检验两个相关的样本是否来自具有相同均值的总体 二 完全窗口分析1 主对话框按Analyze CompareMeans Paired SampleTTest顺序 打开Paired SampleTTest主对话框 如图5 1 三 配对样本T检验 从源变量框中选取成对变量移入 所选变量 同图5 9 图5 10Paired SampleTTest对话框 三 例题分析某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系 将大白鼠按性别 体重等配为8对 每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料 一段时期后测定其肝中维生素A含量 mol L 如下 现在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响 表5 12配对样本T检验数据 1 操作步骤1 输入数据并定义变量名 正常饲料组测定值为x1 维生素E缺乏饲料组测定值为x2 数据文件 饲料 配对T检验 sav 2 按Analyze CompareMeans Paired SampleTTest顺序 打开主对话框 3 单击变量x1 再单击x2 将x1 x2送入Variables框 左下方CurrentSelections框中出现Variable1 Variable24 单击OK 2 输出结果及分析 表5 13配对样本T检验描述统计量 表5 13可看出 变量x1的均数 标准差 标准误分别为34 750 6 649 2 351 变量x2的均数 标准差 标准误分别为26 238 5 821 2 058 表5 14配对样本T检验相关性 表5 14可看出 本例共有8对观测值 相关系数为0 586 相关系数的显著性检验表明显著值为0 127 表5 15配对样本T检验结果 表5 16说明变量x1 x2两两相减的差值均数 标准差 差值均数的标准误差分别为8 513 5 719 2 022 95 可信区间为3 731 13 292 配对检验结果表明t为4 21 自由度为7 显著值为0 004 差别具高度显著性意义 即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响 方差分析简介方差分析的核心就是方差可分解 这里的方差是通过计算各观测值偏离均值的平方和再除以n 1 样本量减1 而得到的 这样给定n值的情况下 方差就是离差平方和 SS 方差的分解按表6 1进行 方差分析的目的是检验均数 组间或变量间 差别是否具有统计学意义 即将总变异分解为由随机误差造成的变异 组内SS 与由均数差异造成的变异 组间SS 两个部分 如果后者大于前者 且具有统计学意义 我们将拒绝零假设 即认为总体中均数间存在差异 一 简介单因素方差分析是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题 如果各组之间有显著差异 说明这个因素 分类变量 对因变量是有显著影响的 因素的不同水平会影响到因变量的取值 二 完全窗口分析按Analyze ComparedMeans One WayAnova顺序单击 打开One WayAnova主对话框 如图 四 单因素方差分析 选入因变量 可有多个变量 选入分组变量 必须满足只取有限个水平的条件 One WayAnova主对话框 见图6 2 见图6 3 见图6 4 见图6 2多项式比较对话框 进行军制的多项式比较 并在其后的参数框中选定阶数 如一阶 Linear 二阶 Quadratic 三阶 Cubic 最高可达五阶 输入多项式各组均值的系数 输入一个系数单击Add按钮 系数进入下面方框 依次输入各组均值的系数 如果多项式中只包括第一与第四组的均值的系数 必须把第二 第三个系数输入为0 如果只包括第一与第二组的均值 则第三 第四个可不输入 可同时建多个多项式 输入一组后按Next按钮 如果要修改则按Previous按钮 修改后按Change按钮 删除按Remove按钮 显示每组系数的总和 6 3PostHoc对话框 在此对话框中选择进行多重比较的方法 1 用t检验完成组间成对均值的比较 对多重比较错误率不进行调整2 同上 但通过设置每个检验的误差率来控制整个误差率3 用t检验完成多重配对比较 为多重比较调整显著值 但比2的界限要小4 对所有可能的组合进行同步进入的均值配对比较5 用F检验进行多重比较6 在StudentizedRange分布下进行多重比较7 用StudentizedRange分布进行所有各组均值间的配对比较8 用StudentizedRange统计量进行所有组间均值的配对比较 用所有配对比较集合的误差率作为试验误差率9 同8 但 其临界值是TUKEY和S N K的相应值的平均值10 进行配对比较时 使用的逐步顺序与Student Newman Keuls检验的顺序一样 但并不是给每个检验设定一个误差率 而是给所有检验的误差率设定一个临界值11 用Studentized最大系数进行比较检验和范围检验12 用Studentized最大系数进行配对比较检验13 用Studentized最大系数进行比较检验 使用贝叶斯逼近 14 用t检验进行配对比较 1 用t检验进行配对比较 2 用Studentized最大系数进行配对比较检验3 同上 这种方法有时比较自由4 用StudentizedRange统计量进行配对比较检验 规定显著性水平 默认为0 05 图6 4Options对话框 选择缺失值的处置方式 在检验变量中含有缺失值的观测将不被计算在任何一个变量中含有缺失值的观测都将不被计算 规定输出的统计量 输出描述统计量 包括观测量数目 均值 最小值 最大值 标准差 标准误差 各组中每个因变量的95 的置信区间用Levene检验进行方差一致性检验 输出均数分布图 三 例题分析例1某灯泡厂用四种不同配料方案制成的灯丝 生产了四批灯泡 每批灯泡中随机抽取若干个灯泡测其使用寿命 单位 小时 数据如表6 2 求四种灯丝的灯泡的使用寿命有无显著差异 表6 1灯泡使用寿命 在该例中 设灯泡的使用寿命为因变量 灯丝的配料为因子 四种配料方案为四水平 为单因子四水平的实验 数据文件 灯泡使用 单因素方差 sav 1 不使用选择项操作步骤1 定义两个变量 Filament变量 取值1 2 3 4分别代表甲 乙 丙 丁 标签为 灯丝 Hours变量其值为灯泡的使用寿命 标签为 灯泡使用寿命 2 按Analyze ComparedMeans One WayAnova顺序打开 单因素分析 主对话框 3 从源变量框中选取hours入DependentList框中 选取filament变量入Factor框中 单击 OK 运行 4 输出结果及分析 表6 2灯泡使用寿命的单因素方差分析结果 表6 2说明 第一列 方差来源 第二列 离差平方和 第三列 自由度 第四列 均方 第五列 F值 第六列 显著值 是F统计量的P值 2 使用选择项操作步骤1 定义变量和选取变量同1的操作步骤2 在主对话框中单击 Contrast 在Contrast对话框中选择多项式比较 选择一次多项式比较各组均值 共指定两组多项式系数 3 输出结果及分析 2 在主对话框中单击 Contrast 在Contrast对话框中选择多项式比较 选择一次多项式比较各组均值 共指定两组多项式系数 系数依次为1 1 1 1 这是检验灯丝对灯泡使用寿命的影响及甲 丁效应和与乙 丙效应和是否有显著差异系数依次为1 1 1 1 这是检验灯丝对灯泡使用寿命的影响及甲 丙效应和与乙 丁效应和是否有显著差异3 打开PostHocMultipleComparisons对话框 选择多重比较 在EqualVarianceAss

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论