




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章均值比较与T检验 统计分析常常采取抽样研究的方法 即从总体中随机抽取一定数量的样本进行研究来推论总体的特性 由于总体中的每个个体间均存在差异 即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同 由此可以得出这样的认识 均值不相等的两个样本不一定来自均值不同的总体 能否用样本均数估计总体均数 两个变量均数接近的样本是否来自均值相同的总体 换句话说 两个样本某变量均值不同 其差异是否具有统计意义 能否说明总体差异 这是各种研究工作中经常提出的问题 这就要进行均值比较 对来自正态总体的两个样本进行均值比较常使用T检验的方法 T检验要求两个被比较的样本来自正态总体 两个样本方差相等与不等时使用的计算t值的公式不同 进行方差齐次性检验使用F检验 对应的零假设是 两组样本方差相等 p值小于0 05说明在该水平上否定原假设 方差不齐 否则两组方差无显著性差异 F值的计算公式是 F S12 较大 S22 较小 进行均值比较及检验的过程 MEANS过程Ttest过程单一样本T检验独立样本的T检验配对样本的T检验单因素方差分析 一 MEANS过程 MEANS过程计算指定变量的综合描述统计量 当观测量按一个分类变量分组时 MEANS过程可以进行分组计算 例如要计算学生的平均身高 SEX变量把学生按性别分为男 女生两组 MEANS过程可以分别计算男 女生平均身高 用于形成分组的变量应该是其值数量少且能明确表明其特征的变量 使用MEANS过程求若干组的描述统计量 目的在于比较 因此必须分组求均值 这是与Descriptives过程不同之处 MEANS过程的基本功能是分组计算指定变量的描述统计量 包括均值 标准差 总和 观测量数 方差等一系列单变量描述统计量 还可以给出方差分析表和线性检验结果 Mean过程的数据文件要求 至少有一个连续变量 一个分类变量 离散变量 对连续变量求其基本描述统计量 分类变量用来分组 以27个学生的身高为例说明操作步骤 data11 01 变量no编号 sex性别 age年龄 h身高 w体重 ANOVAtableandeta 输出第一层控制变量给出的方差分析表和eta统计值 和 2 统计量表明因变量和自变量之间联系的强度 2是组间平方和与总平方和之比 Testforlinearity 线性检验 输出R和R2 只有在控制变量有基本的控制级 且自变量有三个水平以上时才能选用 对第一层变量的方差分析结果 身高 年龄 方差分析的变量信息 说明是分析不同年龄的身高均值间是否存在显著性差异 SumofSquares 偏差平方和 df 自由度 Meansquare 均方 F 方差值 sig P值 BetweenGroups 组间偏差平方和 由两部分组成 Linearity是由因变量与控制变量之间的线性关系引起的 Deviationfromlinearity不是由因变量与控制变量之间的线性关系引起的 WithinGroups 组内偏差平方和 各组内的变异相对于组均值的变异 Total 偏差平方和的总和 为组间偏差平方和与组内偏差平方和之和 线性检验结果 R是因变量身高的观测值与预测值之间的的相关系数 R值越接近1表明回归方程的预测性越好 Eta 即 值 0 1 说明因变量与自变量之间的联系程度 EtaSquared 2为组间偏差平方和与偏差平方和总和之比 练习题 已知97个被调查幼儿的体健资料并建立了CHILD sav数据文件 试按性别 X2 对身高 X5 与体重 X4 做平均数分析 CHILD sav数据文件在SP11DATA文件夹下 二 Ttest过程 1 单一样本T检验 One sampleTTest 检验单个变量的均值是否与给定的常数 一般为理论值 标准值或经过大量观察所得的稳定值等 之间存在差异 样本均数与总体均数之间的差异显著性检验属于单一样本T检验 举例 已知某地区12岁男孩平均身高为142 3cm 1973年某市测量120名12岁男孩身高资料 分析该市12岁男孩的身高与该地区平均身高有无明显差异 建立数据库 data11 02 Confidenceinterval 95 置信区间项 可以自定义 MissingValues 选择对缺失值的处理方法Excludecasesanalysisbyanalysis 带有缺失值的观测值当它与分析有关时才被剔除 Excludecaseslistwise 剔除所有列在Test Grouping矩形框中的变量带缺失值的项 身高基本描述统计量 单样本T检验分析结果 95 ConfidenceIntervaloftheDifference 差值的95 置信区间 95 的置信区间 均值 1 96标准误 根据上表95 置信区间是143 048 1 96 0 531即142 0 144 1之间 由此推出 改范围与总体均数之差为142 0 142 3 144 1 142 3 即表中 0 304和1 800的含义 实际上样本均值与总体均值142 3之间的差值落在 0 301 1 800之间的占95 的范围包括0 由此得出样本均数与总体均数无显著性差异 也就是样本均数与总体均数之差与0无显著性差异 练习题 已知某水样中含CaCO3的真值为20 7mg L 现用某方法重复测定该水样11次CaCO3的含量 mg L 为 20 99 20 41 20 10 20 00 20 91 22 60 20 99 20 41 20 00 23 00 22 00 问该方法测得的均值是否偏高 2 IndependentSampleTtest 独立样本T检验 独立样本的T检验用于检验是否两个不相关的样本来自具有相同均值的总体 必须注意使用这种检验的条件是必须具有来自两个不相关组 非配对 的观测量 其均值必须是对你想在两组中都计算的变量的综合测度 如果分组样本彼此不独立 例如测量的是研究对象用药前后某项指标 要求比较用药前后某项指标均值是否有显著性差异 应该使用配对T检验的功能 PairedSampleTtest 如果分组不止两个 应该使用One WayANOV过程进行单变量方差分析 如果你试图比较的变量明显不是正态分布的 则应该考虑使用一种非参数检验过程 Nonparametrictest 如果想比较的变量是分类变量 应该使用Crosstabs功能 Usespecialvalues 按分组变量的值进行分组Cutpoint 当分组变量为连续变量时 选择该选项后 在后面的矩形框中输入一个连续变量值 将观测量分为大于该值和小于该值的两个组 检验在这两个组之间进行 比较其因变量在两组的均数间是否有显著性差异 Confidenceinterval 95 置信区间项 可以自定义 MissingValues 选择对缺失值的处理方法Excludecasesanalysisbyanalysis 带有缺失值的观测值当它与分析有关时才被剔除 Excludecaseslistwise 剔除所有列在Test Grouping矩形框中的变量带缺失值的项 例题一 现有银行雇员工资为例 检验男女雇员现工资是否有显著差异 一个是要比较salary变量的均值 另一个是gender变量作为分水平变量 data09 03 分析变量的简单描述性统计量 左第一栏为分析变量标签和分类变量标签N观测量数目Mean均值Std Deviation标准差Std ErrorMean标准误 独立样本T检验结果 Levene sTestforEqualityofVariances 方差齐性检验结果 F方差值119 669Sig P值为0 t testforEqualityofMeans为T检验结果栏t t值 df 自由度 Sig 显著性概率即P值 MeanDifference 两组均值之差 表现平均当前工资女性低于男性15409 86元 Std ErrorDifference 差值的标准误为131 40 95 ConfidenceIntervaloftheDifference 差值的95 置信区间 在12816 7 18003 0之间 不包括0即两组均值之差与0有显著性差异 例题二 有29名13岁男生的身高 体重 肺活量数据 试分析大于等于155cm的与身高小于155cm的两组男生的体重和肺活量均值是否有显著差异 无效假设H0 身高大于等于155cm的与身高小于155cm的两组男生的体重平均值在99 水平上具有显著差异 身高大于等于155cm的与身高小于155cm的两组男生的肺活量平均值在99 水平上无显著差异 在options框中 confidence输入99 练习题 某克山病区测得11例急性克山病患者与13名健康人的血磷值如下 患者 2 60 3 24 3 73 3 73 4 32 5 18 4 73 5 58 5 78 6 40 6 53健康人 1 67 1 98 1 98 2 33 2 34 2 50 3 60 3 73 4 14 4 17 4 57 4 82 5 78问该地区急性克山病患者与健康人的血鳞值是否不同 三 配对样本T检验 配对样本T检验 PairedSampleTtest 用于检验两个相关的样本是否来自具有相同均值的总体 这种相关的或配对的样本常常来自这样的实验结果 在实验中被观测对象在实验前后均被观测 两个变量可以是beforeafter 配对分析的测度也不是必须来自同一个观测对象 一对可以两者组合而成 进行配对样本的T检验要求被比较的两个样本有配对关系 要求两个样本均来自正态总体 而且均值是对于检验有意义的描述统计量 均值的配对比较是比较常见 见以下几个例子 同一窝实验用白鼠按性别 体重相同的配对 再随机分到实验组和对照组 分别喂加入海藻的饲料和普通饲料 三个月后 分别将每对白鼠置于水中 测量其到溺死前的游泳时间 比较两组白鼠游泳时间均值 从而比较两种饲料对抗疲劳的作用 同一组高血压病人在进行体育疗法前后 测量其血压 每个病人在体育疗法前后的血压测量值构成观测量对 可以求这组病人体育疗法前后血压平均值 进行配对T检验 分析体育疗法对降血压的疗效 在研究人体各部位体温是否有差别 一个人的两个部位的温度构成一对数据 测量若干人的同样两个部位的温度数据 可以比较这两个部位平均温度是否有显著性差异 使用配对t检验 配对样本T检验实际上是先求出每对测量值之差值 对差值求均值 检验配对变量均值之间差异是否显著 其实质检验的假设实际上是差值的均值与零均值之间差异的显著性 如果差值均值与O均值无显著性差异说明配对变量均值之间无显著性差异 配对样本T检验与独立样本T检验均使用T TEST过程 但调用该过程的菜单不同 对数据文件结构的要求不同和所使用的命令语句也有区别 进行配对样本T检验的数据文件中一对数据必须作为同一个观测量中两个变量值 例题一 现以体育疗法治疗高血压的数据 pretreat 治疗前舒张压 mmHg posttreat 治疗后舒张压 mmHg 要求判断体育疗法对降低血压是否有疗效 data11 03 治疗前后舒张压的单变量描述统计量 变量名标签 列出配对变量的变量标签 对数为1 均值 分别给出治疗前后的舒张压均值 119 50 102 50观察量数目标准差 10 069 11 1118标准误 3 184 3 516 配对变量之间的相关性 Correlation 相关系数 0 599 Sig 为不相关的概率 0 067 相对于治疗前后舒张压的相关系数为0的假设成立概率为0 067大于0 05 可以得出结论治疗前后舒张压没有明显的线性关系 T检验结果 Mean 均值之间的差值 17 00 Std Deviation 差值的标准误 9 534 95 的置信区间 10 18 23 82 T值 5 639 df 自由度 Sig 显著性概率 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 滁州互联网营销方案策划
- 政策咨询专家座谈方案
- 咨询公司薪资方案
- 淘宝超市开业活动方案策划
- 无锡全方案活动策划预算
- 双十一营销方案活动背景
- 广平排水板施工方案
- 郑州瀑布施工方案价格
- 合同法试题及答案
- 智能制造工艺流程及市场分析
- 【7年级-上】2024新版教材
- 《上海产业结构》课件
- 《立在地球边上放号》《峨日朵雪峰之侧》比较阅读教案2024-2025学年高中语文必修上册
- 《视觉基础》课件
- TSG+81-2022+场(厂)内专用机动车辆安全技术规程
- 柴油发电机系统维修保养记录表
- 《MEDDIC销售培训》课件
- 计算机网络-第5版-严伟-潘爱民-课后答案
- EOS 佳能6D单反相机 基本使用说明书
- 《无人机培训教材》课件
- 废旧物资处理及处置招标公告
评论
0/150
提交评论