第八章 假设检验.ppt_第1页
第八章 假设检验.ppt_第2页
第八章 假设检验.ppt_第3页
第八章 假设检验.ppt_第4页
第八章 假设检验.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章假设检验 李金德 第一节假设检验的原理第二节平均数的显著性检验第三节平均数差异的显著性检验第四节方差的差异检验第五节相关系数的显著性检验第六节比率的显著性检验 第一节假设检验的原理 在统计学中 通过样本统计量得出的差异做出一般性结论 判断总体参数之间是否存在差异 这种推论过程称作假设检验 hypothesistesting 假设检验分为参数检验和非参数检验 前者指的是总体分布已知 需要对总体的未知参数做假设检验 后者指的是总体分布知之甚少 对总体的函数形式和特征进行假设检验 假设检验是推论统计中最重要的内容 B总体 A样本 样本有差异 A总体 B样本 总体有差异 推论 第一节假设检验的原理 先看一个例子 例 张老师有一个已经测试过千名大学生的人格测验 得到平均分为50 标准差为12 且该测验分数呈正态分布 他认为心理学专业学生的性格与其他大学生不同 因此他用这人格测验测试了16名心理学专业的大学生 结果他们的平均分为58 张老师声称这就是心理学专业与其他专业性格不同的证据 他的说法合理吗 分析这个例子 这种判断是基于样本平均数对心理学专业学生总体的平均数与目标总体平均数差异的推断 因为这个16名学生的平均分高于性格测验的平均分 58 50 故张老师认为心理学专业的总体比一般大学生性格分数更高 他的推断的假设 心理学专业学生总体的平均分和这个样本的平均分是一样的 高于一般大学生在性格测试上的平均分 总体均值的可能情形 总体均值有三种可能 1 心理学专业总体均分与其他专业相同 都是50分2 心理学专业总体均分高于50 正如张老师所暗示3 心理学专业总体均分低于50所以 仅仅基于样本平均数 就推断总体与一般学生的有不同 是考虑不全面的 必须经过必要检验 如何进行检验 1 张老师认为 心理学与一般大学生的性格测试平均数不同 假设12 与假设1相对的假设是 心理学与一般大学生的性格测验平均数相同 假设03 假设1 H1 与假设0 H0 是互斥的 若H1 则H0 若H1 则H0 一 备择假设与虚无假设 一 备择假设1 就是实验人员希望证实的假设 也称研究假设 2 性质 假设两个样本统计 或两个总体参数 之间 又或者是样本统计量与总体参数之间存在真实的差异 是一种有差假设 用H1表示 3 表达方式 如 H1 或 或 二 虚无假设 1 研究人员为了证实研究假设是真的而利用概率论的反证法所进行的假设 即从研究假设的反面进行假设 2 性质 虚无假设是假设两个总体参数之间或样本统计量与总体参数之间不存在真正的差异 其现存的表面差异是由抽样所造成的误差 是一种无差假设 又称零假设或原假设 用H0符号表示 表达方式 H0 或 或 三 备择假设和虚无假设的关系 H0 零假设 心理学专业 50H1 备择假设 心理学专业 50H1是想要的结果 但是无法直接验证只能通过证明H0 反证H1的正确与否结论 找到证明H0正确与否的依据就是假设检验的关键 四 零假设检验依据 抽样分布 根据均值的样本分布原理可计算 在一个平均数为50的总体中 抽取一个16名学生的样本 其样本平均数为58的概率 有1 的概率可能等于或大于58 1 的概率意味着什么 小概率事件 14263850627486 41444750535661 58 五 小概率事件 统计学上小概率事件是指是指在一次试验中几乎不可能发生的 如果发生了则该事件被认为是不合理的 传统上 将不超过0 05的事件当做 小概率事件 有时也定0 01和0 001 回到问题 在一次从总体 50 12 的抽样中 n 16 有1 的可能性 样本的均值为58 意味着小概率事件发生了 即58这个数不是从这个总体中抽出来的 张老师的判断是对的 二 显著性水平 1 含义 指为拒绝虚无假设 零假设 而设定的小概率值 2 零假设与显著性水平的关系 如果零假设正确的可能性只有5 我们就排除零假设 还可以把这临界值设置在1 或者0 1 这种临界概率就称为显著性水平 显然通过显著性水平可以判断是否接受零假设 3 显著性水平与拒绝和接受域因为5 的显著性水平在正态分布上对应的Z值为 1 96 所以当检验值落在 1 96 1 96 时 我们认为零假设有95 是对的 接受它 则该区域为接受域 而当检验值落在 1 96 或 1 96 时 我们认为零假设只有5 是对的 拒绝它 则该区域为拒绝域 1 961 96 接受H0 拒绝H0 拒绝H0 95 0 025 0 025 4 差异显著判断规则 正态检验 虽然我们比较习惯取 0 05和 0 01 但也可以取其它的显著性水平值 如0 005或0 001 三 假设检验中的两类错误 一 定义 错误 I型错误 H0为真时却被拒绝 弃真错误 错误是指虚无假设本身是正确的 但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域 致使我们作出了拒绝虚无假设的结论 错误 II型错误 H0为假时却被接受 取伪错误 错误是指虚无假设本身不正确 但由于抽样的随机性而使检验值落入了接受虚无假设的区域 致使我们作出了接受虚无假设的结论 说明事物之间没有显著的差异 表解两类错误 表8 2假设检验的各种可能结果 二 两类错误的关系 1 1原因 与 是两个前提下的概率 即 是拒绝原假设H0时犯错误的概率 这时前提是H0为真 是接受原假设H0时犯错误的概率 这时前提是H0为伪 1 H0为真 即 0 1的分布 0 1 H1为真 即 0 1的分布 2 在其他条件不变情况下 和 不能同时减小或增大 当 减小的时候 一定增大 当 增大的时候 一定减少 想要 和 同时降低 需要改变数据分布 即要增大抽样的样本 0 1 0 1 3 统计检验力 1 0 1 四 单侧与双侧检验 1 双侧检验 只强调差异 不管大小 检验假设为 H0 零假设 1 0H1 备择假设 1 0 0 025 0 025 0 2 单侧检验 强调大小 检验假设形式一 H0 零假设 1 0H1 备择假设 1 0 0 05 0 2 单侧检验 强调大小 检验假设形式二 H0 零假设 1 0H1 备择假设 1 0 0 05 0 五 假设检验的步骤 提出原假设和备择假设 三种 确定适当的检验统计量 Z t F 指定检验中的显著性水平 利用显著性水平 建立拒绝H0原则计算样本统计量的值作出统计决策 两种方法 1 将检验统计量的值与拒绝规则所指定的临界值相比较 确定是否拒绝原假设 2 由检验统计量计算p值 利用p值确定是否拒绝原假设 例题8 1 某校一个心理班进行比奈智力测验 M 110 班级人数n 50 该测验常模 0 100 0 16 该班智力水平 1 不是这一次测验结果 是否与常模水平有显著差异 正解 1 提出零假设和备择假设备择假设 用H1表示 即研究假设 希望证实的假设 H1 1 0 该班智力水平确实与常模有差异 1 100零假设 用H0表示 即虚无假设 原假设 无差异假设 H0 1 0 1 100 2 确定适当的检验统计量用于假设检验问题的统计量称为检验统计量 与参数估计相同 需要考虑 总体是否正态分布 大样本还是小样本 总体方差已知还是未知 本例中总体正态 样本容量大于等于30 检验统计量为Z分布 3 指定检验中的显著性水平显著性水平就是指当假设正确时人们却把它拒绝了的概率或风险 用 表示 通常取 0 05或 0 01或 0 001 那么 接受原假设时正确的可能性 概率 为 95 99 99 9 这里取 0 05 因为是Z检验 所以临界值是 1 96 4 利用显著性水平 建立拒绝H0的规则 1 961 96 接受H0 拒绝H0 拒绝H0 0 025 0 025 5 计算样本统计量的值6 作出统计决策Z 4 42 1 96 所以Z落入拒绝区域 应推翻H0 接受H1 即该班的智力水平与常模有显著差异 第二节平均数的显著性检验 一 检验方法平均数的显著性检验是指检验一个样本均数与相应总体均数之差 即 是否显著的统计方法 二 条件分析 1 确定是双尾检验 还是单尾检验 2 明确总体方差 2是已知的 还是未知的 3 分析总体分布是正态的 还是非正态的 4 决定是采用Z检验 还是t检验 又或是Z 检验 三 综合训练 例8 2 全区统一考试物理平均分为50分 标准差为10分 某校的一个班 人数为41人 平均成绩为52 5分 问该班成绩与全区平均成绩差异是否显著 假设全区考生成绩为正态分布 条件分析由题目条件可知 总体分布为正态 总体方差已知 样本容量大于30 且为双侧检验 故应选择Z检验 解 1 建立假设Ho 即该班成绩与全区成绩没有差异H1 即该班成绩与全区成绩有差异 2 计算标准误和检验值标准误 检验值 3 比较与决策因为Z0 05 2 1 96 Z 1 6 接受Ho 拒绝H1 1 961 96 接受H0 拒绝H0 拒绝H0 0 025 0 025 1 6 例8 3 有人研究早期教育对儿童智力发展的影响 从受过良好教育的儿童中随机抽取70人进行韦氏儿童智力测验 0 100 0 15 结果X 103 3 能否认为受过良好早期教育的儿童智力高于一般水平 条件分析总体正态 方差已知 样本 30 单侧检验 Z检验 解 1 建立假设Ho 早期教育儿童智力低于一般儿童H1 早期教育儿童智力高于一般儿童 2 计算标准误和检验值标准误 检验值 3 比较与决策因为Z 1 84 Z0 05 1 645 拒绝Ho 接受H1 1 84 接受H0 拒绝H0 p 0 05 1 645 例8 4 某心理学家认为一般汽车司机的视反应时平均175毫秒 有人随机抽取36名汽车司机作为研究样本进行了测定 结果平均值为180毫秒 标准差25毫秒 能否根据测试结果否定该心理学家的结论 假定人的视反应时符合正态分布 条件分析已知总体正态分布 总体方差未知 故选择t检验 1 建立假设 2 计算标准误和统计量 3 查t分布表 双侧 当df 35 t0 05 2 2 03 1 18 接受H0 2 032 03 接受H0 拒绝H0 拒绝H0 0 025 0 025 1 18 课堂练习 练习1 根据某标准化阅读理解测验的规则 8年级的学生的平均应达到73 2分 标准差为8 6分 如果从某校区随即抽取45个样本 其均数为76 7 试问该校区的阅读理解测验的平均成绩是否显著高于全体8年级学生的成绩 练习2 在一项空间知觉能力测试后 随机抽取6名被试的成绩为1 4 1 8 1 1 1 9 2 2 1 21 这些数值是否能证明 这种能力测试平均数一般为1 5 的论断 第三节平均数差异的显著性检验 一 均数之差标准误的基本公式随机从总体中抽取两个容量为n1和n2的一切可能样本时 两个样本的均数之差也会形成一种抽样分布 两均数之差D在抽样分布上的标准差称两均数之差的标准误 记为 只是根据不同的具体条件 公式有所不同 一 总体正态 2已知时的标准误 1 相关样本因为是相关样本n1 n2 n 则公式可以写为 2 独立样本如果n1 n2 则公式可以写为 二 总体正态 2未知 1 样本独立 但 1 2 0因为 0未知 只能用样本值估计值标准误 为联合方差因为所以 二 总体正态 2未知 2 样本独立 方差不齐性 不相等 因为 0未知 只能用样本值估计值标准误 二 总体正态 2未知 3 样本相关 相关系数已知因为样本相关 所以你n1 n2 n 二 总体正态 2未知 4 样本相关 相关系数未知 二 综合练习 例8 6 从某地区的六岁儿童中随机抽取男生30人 身高平均为1114cm 抽取女生27人平均身高112 5cm 根据以往资料 该地区六岁男童身高的标准差5cm 女童身高标准差6 5cm 能否根据这一次抽样测量的结果下结论 该地区六岁男女童身高有显著差异 分析 根据题意 两总体正态分布 总体方差已知 故用Z检验 解 1 建立假设 2 计算标准误和统计量 因为假设 比较与决策0 96 1 96 接受H0 拒绝H1 答 该地区六岁儿童男女身高差异不显著 例8 7 幼儿园在儿童入园时对49名儿童进行了比奈智力测验 16 结果平均智商M 106 一年后再对同组被试施测 结果X2 110 已知两次测验结果的相关系数r 0 74 问能否说随着年龄增长与一年的教育 儿童智商有了显著提高 分析 正态 方差已知 样本相关 单侧 Z检验 解 1 建立假设 2 计算标准误和检验值 3 比较与决策0 01水平值单侧临界值为Z 2 32 2 34 拒绝H0 接受H1 即一年后儿童智力有了非常显著的提高 例8 8 在一项关于反馈对知觉判断的影响的研究中 将被试随机分成两组 其中一组60人作为实验组 每一次判断后将结果告诉被试 实验的平均结果M 80 标准差S 18 另一组52人作为控制组 实验过程中每一次判断后不让被试知道结果 实验的平均结果M 73 S 15 试问实验组与控制组的平均结果是否有显著差异 分析 总体正态 方差未知 假设齐性 样本独立 t 解 1 建立假设 2 计算统计量 3 决策根据题意 应进行双侧检验 查t表 当df 60 52 2 110 1 98 2 19 拒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论