假设检验.pdf_第1页
假设检验.pdf_第2页
假设检验.pdf_第3页
假设检验.pdf_第4页
假设检验.pdf_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第六章 假设检验 第 1 页 目录 第六章第六章假设检验假设检验 2 第一节第一节 假设检验概述假设检验概述 3 一 假设检验的基本思想 3 二 假设检验的步骤 4 三 两类错误和假设检验的规则 4 第二节第二节 总体均值的检验总体均值的检验 5 一 单个正态总体均值的检验 5 二 两个正态总体均值之差的检验 8 三 两个非正态总体均值之差的检验 10 第三节第三节 总体成数的检验总体成数的检验 12 一 单个总体成数的检验 12 二 两个总体成数之差的检验 13 第四节第四节 总体方差的检总体方差的检验验 14 一 一个正态总体方差的检验 14 二 两个正态总体方差之比的检验 15 英文摘要与关键词英文摘要与关键词 17 习习 题题 17 统计学第六章 假设检验 第 2 页 第六第六章章假设检验假设检验 通过本章的学习 我们应该知道 1 假设检验的基本思想与步骤 2 在各种条件下做均值检验 3 在各种条件下做成数检验 4 在各种统计下做方差检验 5 Excel 中有关假设检验的功能 统计学第六章 假设检验 第 3 页 假设检验是与参数估计同等重要的又一类统计推断问题 假设检验技术不仅可以对总体分布的某些参 数 而且也可以对总体本身的分布做出假设 通过对样本的统计分析来判定该假设是否成立 从而对总体 分布给以进一步的确认 本章在简要介绍假设检验原理的基础上 重点讨论总体参数的假设检验问题 第一节第一节 假设检验概述假设检验概述 一 假设检验的基本思想 所谓假设检验就是对一个关于总体参数或总体分布形式的假设 利用样本资料来检验其真或伪的可能 性 具体来说 就是利用样本资料计算出有关的检验统计量 再根据该统计量的抽样分布理论来判断样本 资料对原假设是否有显著的支持性或排斥性 即在一定的概率下判断原假设是否合理 从而决定应接受或 否定原假设 所以 假设检验也称为显著性检验 对总体参数 平均数 成数 方差等 所作的假设进行检 验称为参数假设检验 简称参数检验 parametric tests 对总体分布形式的假设进行检验一般称为非 参数检验或自由分布检验 这里只讨论总体参数的假设检验 即参数检验 非参数检验在第八章中研究 我们再回到第五章开篇的例子上来说明假设检验的基本原理 例 6 1 假如雪碧瓶的标签上标明的容量为 500 毫升 如果你从市场上随机抽取 25 瓶 测得其平均 含量为 499 5 毫升 标准差为 2 63 毫升 据此 可否断定饮料厂商欺骗了消费者 假定饮料的容量服 从正态分布 2 N 分析 样本平均含量低于厂商声称的平均含量 其原因不外乎有两种 一是由抽样误差引起的 如 果样本平均数与总体平均数之差不大 未超出抽样误差范围 则可认为两者之差就是由抽样误差引起的 饮料厂商不存在欺诈行为 二是由饮料厂商短斤少两引起的 即饮料厂商存在欺诈行为 在这种情况下 样本平均数与总体平均数之差就会超出抽样误差范围 因为其差异是厂商的有意行为 我们知道 抽样误差范围是与置信水平相联系的 对于正态分布总体 若取置信水平为 99 注意到 实际的样本均值小于总体均值 则样本平均数x与总体平均数的真值 0 之差小于抽样平均误差 x u的 2 33 倍这一情况发生的概率只有 1 即 x ux33 2 0 或33 2 0 x u x 发生的概率只有 1 如图 7 1 因 此 33 2 0 x u x 是一个小概率事件 这一事件在 100 次抽样中只发生一次 而对于一次抽样而言 可 认为小概率事件实际上不会发生 图 7 11 概率示意图 0 01 解 在本例中 x 499 5 s 2 63 n 50 假设 0 500 33 2 9506 0 2563 2 500 5 499 00 ns x u x t x 也就是说 对于一次抽样的结果 如果小概率事件发生了 这是不合常理的 可认为原假设不成立 即雪 碧容量小于 500 毫升 但对于本例 由于这次抽样的结果33 29506 0 0 x u x 小概率事件没有发 统计学第六章 假设检验 第 4 页 生 所以没有充分的理由认为总体平均数500 这一假设成立 故没有充分的证据证明瓶装雪碧饮料的 容量不足 500 毫升 即没有充分的证据证明厂商存在故意欺诈 通过这个例子可见 假设检验的基本思想是 先做出一个假设 然后依据小概率事件在一次抽样中实 际上不会发生的推断原则 看这一假设是否会导致不合理的结果 从而判断是否拒绝原假设 二 假设检验的步骤 1 1 提出原假设提出原假设 Null HypothesisNull Hypothesis 0 H和备择假设和备择假设 Alternative Hypothesis Alternative Hypothesis 1 H 原假设又称零假设 是对未知总体参数做出的 正待检验的假设 备择假设是对立假设 其含义是 一旦否定原假设 0 H 这个假设 1 H供你选择 例 6 1 中 原假设 0 H 500 而备择假设 1 H 500 一般而言 若原假设 0 H 0 为总体某个参数 根据具体问题 备择假设可由三种选择 1 备择假设 1 H 0 这种类型的假设检验称为双侧检验 2 备择假设 1 H 0 这种类型的假设检验称为右侧检验 3 备择假设 1 H 0 这种类型的假设检验称为左侧检验 右侧检验和左侧检验统称为单侧检验 采用双侧检验还是单侧检验 应视所研究的问题的性质而定 2 2 设计检验统计量设计检验统计量 所设计的检验统计量应与原假设相关 与待检验参数的估计量相关 但不能包含待检验的未知参数 且能够知道当原假设 0 H为真时该统计量的具体分布 上例中 检验统计量为 ns xx t x 00 它服 从自由度为 49 的 t 分布 3 3 给定显著性水平和确定相应的临界值给定显著性水平和确定相应的临界值 显著性水平表示假设 0 H为真时拒绝原假设的概率 也就是拒绝原假设所冒的风险 用 表示 一 般取值很小 常取 0 1 0 05 0 01 给定了显著性水平 也就确定了原假设 0 H的接受区域和拒绝 区域 这两个区域的交界点就是临界值 比如取 0 05 则意味着原假设 0 H为真时 检验统计量落在 其拒绝区域内的概率只有 5 而落入其接受区域内的概率为 95 应当指出 对于同一的显著性水平 选择不同的检验统计量 得到的临界值是不同的 对于同一的显著性水平 和同一的统计量 双侧检验和 单侧检验的临界值也是不同的 如图 6 2 双侧 左侧 右侧 图 6 2双侧检验和单侧检验的临界值 4 4 依据假设检验的规则依据假设检验的规则 由样本资料计算出检验统计量的实际值由样本资料计算出检验统计量的实际值 与临界值比较与临界值比较 视实际值落入接受视实际值落入接受 区域还是拒绝区域区域还是拒绝区域 做出接受或拒绝原假设做出接受或拒绝原假设 0 H的结论的结论 三 两类错误和假设检验的规则 通过假设检验 拒绝原假设 0 H是在认为小概率事件在一次抽样中实际上不会发生的前提下做出的 事实上小概率事件有时也可能发生 接受原假设 0 H 是因为拒绝它的理由还不充分 并非认为它绝对正 统计学第六章 假设检验 第 5 页 确 因此 由假设检验做出的判断不可能百分之百正确 一般来说 决策结果可归纳为表 6 1 表现的四种 情况 表 6 1假设检验决策结果表 0 H是真实的 0 H是不真实的 拒绝 0 H第 类错误 正确 接受 0 H正确第 类错误 由假设检验做出的决策既可能犯 弃真错误 又可能犯 取伪错误 弃真错误 称作假设检验的 第 类错误 取伪错误 称作假设检验的 第 类错误 假设检验犯第 类错误的原因是 在原假设为 真的情况下 检验统计量不巧刚好落入小概率的拒绝区域 从而导致拒绝了原假设 因而 第 类错误发 生的概率就是显著性水平 第 类错误发生的概率记为 概率 与 是密切相关的 在样本一定的条件下 减小 就增大了 反之 增大 就减小了 见示意图 6 3 图 6 3 假设检验中犯两类错误情况示意图 这里用法庭对被告进行审判的实例来说明 由于法庭采用无罪推定的审判准则 在证明被告有罪之前 先假定他是无罪的 即原假设 0 H 被告无罪 备择假设 1 H 被告有罪 法庭可能犯的第 类错误是 被 告无罪但判他有罪 即冤枉了好人 第 类错误是 被告有罪但判他无罪 即放过了坏人 为了减少冤枉 好人的概率 应尽可能接受原假设 判被告无罪 而这有可能增大了放过坏人的概率 反过来 为了 不放过坏人 减少放过坏人的概率 相应地就又增加了冤枉好人的可能性 当然 这只是在一定的证 据下的两难选择 如果进一步收集有关的证据 在充分的证据下 就有可能做到既不冤枉好人 又不放过 坏人 鉴于犯第 类与第 类错误的概率 与 的相互关系 在一定的样本容量下 期望两者都非常小是困 难的 从而 在假设检验中 内曼 J Neyman 和皮尔生 Egon S Pearson 提出了一个原则 即在控制 犯第 类错误的概率 的条件下 尽可能使犯第 类错误的概率 减小 在假设检验实践中 该原则的含 义是 原假设要受到维护 使它不致被轻易否定 若要否定原假设 必须有充分的理由 第二节第二节 总体均值的检验总体均值的检验 一 单个正态总体均值的检验 样本 n xxx 21 来自正态总体 2 N 一一 如果总体方差如果总体方差 2 已知已知 z检验检验 构造检验统计量 检验统计量在原假检验统计量在原假 设下的分布密度设下的分布密度 检验统计量在备检验统计量在备 择假设下的分布择假设下的分布 统计学第六章 假设检验 第 6 页 n x z 0 6 1 当 0 时 z服从 1 0N 给定显著性水平 则有 1 00 H 01 H 检验规则为 当 2 zz 时 拒绝 0 H 当 2 zz 时 不能拒绝 0 H 2 00 H 01 H 检验规则为 当 zz 时 拒绝 0 H 当 zz 时 不能拒绝 0 H 3 00 H 01 H 检验规则为 当 zz 时 拒绝 0 H 当 zz 时 不能拒绝 0 H 以上三个假设检验的拒绝区域如图 6 2 所示 拒绝区域的面积为 例 6 2 某企业从长期实践得知 其产品直径 X 服从正态分布 2 2 0 15N 从某日产品中随机抽取 10 个 测得其直径分别为 14 8 15 3 15 1 15 0 14 7 15 1 15 6 15 3 15 5 15 1 单位 厘 米 问在显著性水平 0 05 时 该产品直径是否符合直径为 15 0 厘米的质量标准 解 依题意建立假设 0 H 15 0 1 H 15 0 根据检验统计量 6 1 37 2 102 0 0 1515 15 0 n x z 若取显著性水平 0 05 则由标准正态分布表 见附表二 得96 1 025 0 z 从而拒绝 0 H 即认为 直径不符合质量标准 若取显著性水平 0 01 则由标准正态分布表 得58 2 005 0 z 从而不能拒绝 0 H 即认为没有充分的理由说明直径不符合质量标准 教师 这个题目实际上就是第五章习题中的第一题 当我们以 95 的置信度进行区间估计时 结果是 15 03 15 27 厘米之间 显然 15 不在其范围之内 这和我们这里的 拒绝 是一个意 思 如果我们以 99 的置信度 则结果是 14 09 15 31 厘米之间 显然 15 是在其范围之内 的 这又和我们这里的 不能拒绝 同义 其实参数估计和假设检验都是以抽样分布为理论 依据 根据样本信息对总体参数进行推断 对某一具体问题而言 两者是可以相互转换的 统计学第六章 假设检验 第 7 页 例 6 3 某企业职工上月平均奖金为 402 元 本月随机抽取 50 人来调查 其平均奖金为 412 4 元 现假定本月职工收入服从正态分布 2 35 N 问在 0 05 的显著性水平下 能否认为该企业职工平均奖金 本月比上月有明显提高 解 依题意建立假设 0 H 402 1 H 402 检验统计量 101 2 5035 4024 412 0 n x z 显著性水平 0 05 则由标准正态分布表 得65 1 05 0 z 从而拒绝 0 H 即认为该企业职工平均 奖金本月比上月有明显提高 教师 这里特别要提醒的是 对应同一张标准正态分布表 在同一个显著性水平上 单侧和 双侧是不同的 以我们提供的表为例 0 05 时 如果是单侧检验 只要查 0 95 即 1 0 05 即可 如果是双侧检验 则需要查 0 975 即 1 0 05 2 为什么 你们画画图就能想通了 二二 如果总体方差如果总体方差 2 未知未知 t检验检验 构造检验统计量 ns x t 0 其中s是样本标准差 6 2 当 0 时 根据抽样分布理论 统计量t服从 1 nt t 分布表见附录三 df 表示自由度 给定 显著性水平 则有 1 00 H 01 H 检验规则为 当 1 2 ntt 时 拒绝 0 H 当 1 2 ntt 时 不能拒绝 0 H 2 00 H 01 H 检验规则为 当 1 ntt 时 拒绝 0 H 当 1 ntt 时 不能拒绝 0 H 3 00 H 01 H 检验规则为 当 1 ntt 时 拒绝 0 H 当 1 ntt 时 不能拒绝 0 H 以上三个假设检验的拒绝区域如图 6 2 所示 拒绝区域的面积为 因为 t 分布与正态分布很相似 当 n 大于 30 以后 两者就基本重合了 见图 6 4 统计学第六章 假设检验 第 8 页 图 6 4 t 分布与正态分布 例 6 4 抽取某地区粮食样品 9 个 测得其中六六六的平均值为 0 325mg kg 标准差为 0 068mg kg 国家卫生标准规定 粮食中六六六残留量 0 3mg kg 假定粮食中六六六残留量服从正态分布 问该地区 粮食中六六六残留量是否超标 解 依题意建立假设 0 H 0 3 1 H 0 3 根据检验统计量 6 2 1029 1 9068 0 3 0325 0 0 ns x t 若取显著性水平 0 05 则由 1 nt分布表 见附表三 得860 1 8 05 0 t 从而不能拒绝 0 H 即没有足够的证据说明该地区粮食中六六六残留量超标 假如我们增加样本容量 如抽取样品 25 个 还是得到一样的数据 那么 8382 1 25068 0 3 0325 0 0 ns x t 还取显著性水平 0 05 则由 1 nt分布表 得711 1 24 05 0 t 从而 拒绝 0 H 即说明该地区 粮食中六六六残留量超标 教师 从这个对比的例子中 有两个值发生了变化 一是实际的 t 值 它变大了 含义是它 倾向于拒绝原假设 二是 t 的临界值 它变小了 含义是拒绝区变大 这说明在样本量较小 的时候 我们把看似和备择假设一致的事实视作为是抽样造成的 显然这就保护了原假设 而当样本量增加以后 才认为有足够的证据证明这一事实 t 检验一般用于小样本检验 往往是已知服从正态总体但方差未知 随着样本容量 n 的增大 t 分布趋 近于标准正态分布 有些 t 分布表就编到 30 为止 超过 30 的就查正态分布表了 所以在大样本情形 下 总体方差未知时对总体均值的假设检验可近似采用 z 检验 对于非正态总体 大样本的情况下 在对 总体均值假设检验时 也可采用 z 检验 选择检验统计量为公式 6 1 如果 未知 可以用 s 替代 二 两个正态总体均值之差的检验 样本 1 21n xxx来自正态总体 2 11 N 2 21n yyy来自正态总体 2 22 N 统计学第六章 假设检验 第 9 页 一一 如果两个总体方差如果两个总体方差 2 1 和和 2 2 已知已知 构造检验统计量 2 2 2 1 2 1 nn yx z 6 3 当 21 时 z服从 1 0N 因此 采用z检验 例 6 5 假设某种羊毛的含脂率服从正态分布 且处理前后的方差均为 36 处理前采 10 个样 测 得平均含脂率为 27 3 处理后采 8 个样 测得平均含脂率为 13 75 问处理前后羊毛含脂率有无显著变化 05 0 解依题意建立假设 0 H 21 1 H 21 根据检验统计量 6 3 76 4 8 36 10 36 75 133 27 2 2 2 1 2 1 nn yx z 由标准正态分布表 得96 1 025 0 z 从而拒绝 0 H 即认为处理前后羊毛含脂率有显著变化 二二 如果两个总体方差如果两个总体方差 2 1 和和 2 2 未知但相等未知但相等 即即 2 2 2 1 2 构造检验统计量 21 11 nn s yx t p 6 4 其中 2 11 21 2 22 2 11 nn snsn sp 当 21 时 t服从 2 21 nnt 因此 采用t检验 例 6 6 某废水中的镉含量服从正态分布 现用标准方法与新方法同时测定该样本中镉含量 其中 新方法测定 10 次 平均测定结果为 5 28ug L 标准差为 1 11ug L 标准方法测定 9 次 平均测定结果为 4 03ug L 标准差为 1 04ug L 问两种测定结果有无显著性差异 解 依题意建立假设 统计学第六章 假设检验 第 10 页 0 H 21 1 H 21 08 116 1 2910 04 1811 19 2 11 22 21 2 22 2 11 nn snsn sp 根据检验统计量 6 4 53 2 9 1 10 1 08 1 03 4 28 5 11 21 nn s yx t p 取显著性水平 0 05 11 2 17 025 0 t 从而 拒绝 0 H 即认为两种测定结果有显著性差异 三 两个非正态总体均值之差的检验 样本 1 21n xxx和 2 21n yyy来自两个非正态总体 当样本容量 1 n和 2 n较大 30 时 构造 检验统计量 2 2 2 1 2 1 nn yx z 或 2 2 2 1 2 1 n s n s yx z 6 5 当 21 时 z近似服从 1 0N 因此 两个非正态总体均值之差的检验可采用z检验 例 6 7 根据数据集 03 整理出 256 名男职工和 214 名女职工的薪水资料 问能否认为男职工的年 薪比女职工的要高出 15000 元或高出 12000 元 0 05 解 依题意建立假设 0 H 15000 21 1 H 15000 21 这里的计算量比较大 我们可以让计算机来帮忙 ExcelExcel 解决方案解决方案 在数据集 03 中按性别分类摘出两列分性别的薪水资料 并计算两列数据的方差 选择菜单 工具 数据分析 打开 数据分析 对话框 见图 2 9 选择其中的 z 检验 双样本平均差检验 打开对话框 见图 6 5 正确填写相关信息后 点 确定 结果在 G7 到 I18 这个区域内显示 见图 6 6 图 6 5 z 检验 双样本平均差检验 分析工具对话框 统计学第六章 假设检验 第 11 页 图 6 6 z 检验 双样本平均差检验 结果截图 看 G7 到 I18 这个区域内的显示 z 0 1911 这就是我们计算的实际 z 值 由于本例是单侧检验 所以 看 z 单尾临界 这里显示的是 1 6448 和我们查表的结果一致 因而 我们不能拒绝 0 H 即认为没有充 分的理由说明男职工的年薪比女职工的高出 15000 元 若在图 6 5 的假设平均差处改为 12000 就是对 0 H 12000 21 1 H 12000 21 的检验了 我们看其在 G27 到 I32 中的结果 z 2 5192 而临界值还是 1 6448 因而 我们拒绝 0 H 即 认为男职工的年薪比女职工的高出 12000 元 学生 老师 在 z 单尾临界的上面一行 P Z z 单尾 是什么意思 有什么用 教师 P Z z 单尾 提供的是实际 z 值所对应的概率 即根据样本资料计算出来的拒绝原 假设所需的最低显著性水平 称为实测显著性水平 前面我们是根据给定的显著性水平 查 表得到临界值 然后实际值与临界值对比 如果实际值大于临界值就拒绝原假设 反之 则 接受原假设 我们也可以这样 根据计算得到的统计量的实际值 查表或用 Excel 的统计函 数 找出这个实际值所对应的概率 然后用这个概率与显著性水平比较 如果它大 则不能 拒绝原假设 如果它小 则拒绝原假设 后一种方法是目前国际上流行的利用统计软件进行 假设检验的格式 所以 我们也可以这样判断 对第一问的检验 由于 p 值为 0 4242 它大于 0 05 的显著性水平 故不 能拒绝 0 H 对第二问 由于 p 值为 0 0059 它小于 0 05 的显著性水平 故拒绝 0 H 如果我们把显著性 水平 定在 0 005 则又不能决绝 0 H了 Excel 还提供了三个有关 t 检验的分析工具 我们如果碰到大量的数据处理 就可以直接用这些工具 统计学第六章 假设检验 第 12 页 来解决问题 学生 这里有点复杂 我来总结一下 看对不对 1 根据题目的提问 设定原假设和备择假设 一般把提问放在备择假设上 以保护原假设 2 根据不同的已知条件选定不同的统计量 将样本数据代入 计算得到一个统计量的实际值 比较有两种方法 3 根据给定的显著性水平 查表或用 Excel 函数找到临界值 4 用实际值与临界值比较 实际值大 则拒绝原假设 实际值小 则不能拒绝原假设 或者 3 根据统计量的实际值 查表或用 Excel 函数找到其对应的概率值 4 用得到的这个概率值与临界值比较 若概率值大 不能拒绝原假设 若小 则拒绝原假设 教师 总结得好极了 不过用起来的时候要当心哦 表 6 2 列示了 Excel 中标准正态 分布和 t 分布的正反函数 表 6 2标准正态分布和 t 分布的正反函数 normsdist z 提供 z 值 返回标准正态分的概率值 normsinv probability 提供概率 返回标准正态分布的临界值 对应函数是 F z dze z z 2 2 2 1 Tdist x deg freedom tails 提供 t 值 自由度和类型 1 单侧 2 双侧 返回 t 分布的概率值 Tinv probability deg freedom 提供概率 自由度 返回 t 分布的临界值 重做例 6 2 例 6 3 和例 6 6 图 6 7 中 a 是单元格中输入的公式 b 是显示的结果 a b 图 6 7用 Excel 函数求实际值对应的概率值 对例 6 2 得到的概率值是 0 0178 因此当 0 05 时 是拒绝 0 H 而当 0 01 时 则不能拒绝 0 H 对例 6 3 得到的概率值是 0 0178 因此当 0 05 时 是拒绝 0 H 对例 6 6 得到的概率值是 0 0216 因此当 0 05 时 是拒绝 0 H 第三节第三节 总体成数的检验总体成数的检验 一 单个总体成数的检验 所谓成数是指具有某一特征的总体单位在总体中所占的比重 用 表示 如果将具有该特征的总体单 位赋值 1 不具有该特征的总体单位赋值 0 则总体成数即为总体均值 相应的总体方差为 1 统计学第六章 假设检验 第 13 页 同理 样本成数p是一种样本均值 在大样本情况下 并且5 np 5 nq 根据中心极限定理 p近 似服从 n N 1 如果要检验的假设为 000000 或HH 则我们可以 构造检验统计量 n p z 1 00 0 6 6 当 0 时 z近似服从标准正态分布 1 0N 因此 总体成数的大样本检验采用z检验 例 6 8 在过去的一年内 某公司的生意有 30 是赊账交易 70 是现金交易 最近一个含有 100 笔 交易的样本显示有 40 笔是赊账交易 若取显著性水平为 0 05 问该公司的赊账交易政策是否有所变化 解 依题意建立假设 0 H 30 1 H 30 由题意可得样本成数为 40 100 40 p 根据检验统计量 7 6 18 2 100 70 30 30 40 1 00 0 n p z 因为96 1 025 0 z 从而拒绝 0 H 即认为该公司的赊账交易政策已经有所变化 例 6 9 某公司负责人发现开出去的发票有大量笔误 而且断定这些发票中 错误的发票占 20 以上 随机检查 400 张 发现错误的发票占 25 这是否可以证明负责人的判断正确 显著性水平为 0 05 解 依题意建立假设 0 H 0 2 1 H 0 2 根据检验统计量 7 6 5 2 400 8 02 0 2 025 0 1 00 0 n p z 因为65 1 05 0 z 从而拒绝 0 H 即负责人的判断是正确的 二 两个总体成数之差的检验 在大样本条件下 两个样本成数之差的抽样分布近似为正态分布 若令 统计学第六章 假设检验 第 14 页 2 22 1 11 21 1 1 nn pp z 由于 z含有未知参数 1 和 2 所以不能成为检验统计量 当 1 2 时 1 和 2 的联合估计值为 21 2211 nn pnpn p 故 21 pp 标准差的估计值为 21 1 1 n pp n pp 取检验统计量 21 21 1 1 n pp n pp pp z 6 7 于是 在大样本条件下 当 1 2 时 z近似服从标准正态分布 1 0N 因此 两个总体成数之差的 检验可采用z检验 例 6 10 为了研究地势对小麦锈病发病率的影响 调查了低洼地麦田小麦 378 株 其中锈病株 342 株 还调查了高坡地麦田小麦 396 株 其中锈病株 313 株 若取显著性水平为 0 01 比较两块麦田小麦锈 病发病率是否有显著差异 解 依题意建立假设 0 H 21 1 H 21 905 0 378 342 1 p 790 0 396 313 2 p 846 0 396378 313342 21 2211 nn pnpn p 根据检验统计量 6 7 423 4 396 154 0 846 0 378 154 0 846 0 790 0 905 0 1 1 21 21 n pp n pp pp z 取 0 01 005 0 z 2 58 005 0 zz 从而拒绝 0 H 即认为两块麦田小麦锈病发病率有显著差异 第四节第四节 总体方差的检验总体方差的检验 一 一个正态总体方差的检验 总体方差 2 是用样本方差 2 s来估计的 根据抽样分布理论 检验统计量 统计学第六章 假设检验 第 15 页 2 0 2 2 1 sn 6 8 服从 1 2 n 2 分布表见附录四 给定显著性水平 则有 1 2 0 2 0 H 2 0 2 1 H 检验规则为 当 1 2 2 2 n 或 1 2 2 1 2 n 时拒绝 0 H 否则不能拒绝 0 H 2 2 0 2 0 H 2 0 2 1 H 检验规则为 当 1 22 n 时拒绝 0 H 否则不能拒绝 0 H 3 2 0 2 0 H 2 0 2 1 H 检验规则为 当 1 2 1 2 n 拒绝 0 H 否则不能拒绝 0 H 以上三个假设检验的拒绝区域如图 6 8 拒绝区域的面积为 双侧右侧左侧 图 6 8双侧检验和单侧检验的卡方临界值 例 6 11 根据设计要求 某零件的内径标准差不得超过 0 30 单位 厘米 现从该产品中随意抽验 了 25 件 测得样本标准差为 0 36 问检验结果是否说明该产品的标准差明显增大 显著性水平为 0 05 解 依题意建立假设 22 0 30 0 H 22 1 30 0 H 根据检验统计量 7 8 56 34 30 0 36 0 1251 2 2 2 0 2 2 sn 显著性水平05 0 1 2 n 36 4 因此 不能拒绝原假设 0 H 即没有理由认为该产品的标准 差超过了 0 30 厘米 二 两个正态总体方差之比的检验 根据抽样分布理论 检验统计量 统计学第六章 假设检验 第 16 页 2 2 2 1 s s F 6 9 服从 1 1 21 nnF F 分布表见附录五 给定显著性水平 则有 1 2 2 2 10 H 2 2 2 11 H 检验规则为 当 1 1 21 2 nnFF 或 1 1 21 2 1 nnFF 1 1 1 12 2 nnF 时拒绝 0 H 否则不能拒绝 0 H 2 2 2 2 10 H 2 2 2 11 H 检验规则为 当 1 1 21 nnFF 时拒绝 0 H 否则不能拒绝 0 H 3 2 2 2 10 H 2 2 2 11 H 检验规则为 当 F1 1 1 12 nnF 拒绝 0 H 否则不能拒绝 0 H 例 6 12 甲 乙两台机床加工产品的直径服从正态分布 现测得样本数据如下 9 1 n 17 0 2 1 s 6 2 n 14 0 2 2 s 问这两个正态分布的方差是否相等 0 1 解 建立假设 2 2 2 10 H 2 2 2 11 H 根据检验统计量 6 9 214 1 14 0 17 0 2 2 2 1 s s F 当 0 1 时 5 8 2 F 4 82 69 318 515 8 22 1 FF 0 27 由于 0 27 1 214 4 82 所以不能拒绝 0 H 即没有理由认为两个正态分布的方差不相等 统计学第六章 假设检验 第 17 页 英文摘要与关键词英文摘要与关键词 Hypothesis tests also address the uncertainty of the sample estimate However instead of providing an interval a hypothesis test attempts to refute a specific claim about a population parameter based on the sample data One of the major roles of statisticians in practice is to draw conclusions from a set of data This process is known as statistical inference In statistical inference instead of inferring the mean of the population from the mean of the sample one may select a hypothetical mean or other parameter for the population and then test the sample mean to discover if the sample mean differs significantly from the hypothetical mean of the population According to the principle of small probability based on a pre decided significance level one can make a decision whether he accepts the null hypothesis or not You always have the possibility of making a mistake whether you accept the null hypothesis or not The significance level measures the sensitivity of the test Avalue of 0 05 means that we inadvertently reject the null hypothesis 5 of the time when it is in fact true This is called a type I error The choice of is somewhat arbitrary although in practice values of 0 1 0 05 and 0 01 are commonly used The probability of accepting the null hypothesis when the alternative hypothesis is in fact true a type II error is calledand can only be computed for a specific alternative hypothesis The critical region encompasses those values of the test statistic that lead to a rejection of the null hypothesis Based on the distribution of the test statistic and the significance level a cut off value for the test statistic is computed Values either above or below or both depending on the direction of the test this cut off define the critical region To reject a hypothesis is to conclude that it is false However to accept a hypothesis does not mean that it is true only that we do not have evidence to believe otherwise Thus hypothesis tests are usually stated in terms of both a condition that is doubted null hypothesis and a condition that is believed alternative hypothesis Key Words Hypothesis testing null hypothesis alternative hypothesis type I error type II error 统计学第六章 假设检验 第 18 页 习习 题题 一一 单项选择题单项选择题 1 对总体参数提出某种假设 然后利用样本信息判断假设是否成立的过程称为 A 假设检验B 参数估计C 双边检验D 单边检验 2 研究者想收集证据予以支持的假设通常称为 A 原假设B 备择假设C 合理假设D 正常假设 3 在假设检验中 原假设与备择假设 A 都有可能被接受B 都有可能不被接受 C 只有一个被接受而且必有一个被接受D 原假设一定被接受 备择假设不一定被接受 4 在假设检验中 一般放在 A 原假设上B 备择假设上 C 可以放在原假设上 也可以放在备择假设上 D 有时放在原假设上 有时放在备择假设上 5 在假设检验中 不能拒绝原假设意味着 A 原假设肯定是正确的B 原假设肯定是错误的 C 没有证据证明原假设是正确的D 没有证据证明原假设是错误的 6 在假设检验中 通常犯第一类错误的概率称为 A 置信水平B 显著性水平C 取伪概率D 取真概率 7 拒绝域的大小与我们事先选定的 A 统计量有一定关系B 临界值有一定关系 C 置信水平有一定关系D 显著性水平有一定关系 8 在假设检验中 如果样本容量一定 则第一类错误和第二类错误 A 可以同时减小B 不能同时减小C 可以同时增大D 只能同时增大 二二 多项选择题多项选择题 1 假设检验和参数估计的联系与区别 下面五个判断正确的有 A 都是对总体某一数量特征的推断 都是运用概率估计来得到自己的结论 B 前者则需要事先对总体参数做出某种假设 然后根据已知的抽样分布规律确定可以接受的临界值 C 后者无须事先对总体数量特征做出假设 它是根据已知的抽样分布规律找出恰当的区间 给出总体 参数落在这一区间的概率 D 假设检验中的第二类错误就是参数估计中的第一类错误 E 假设检验中实测显著性水平就是参数估计中的置信系数 2 当我们根据样本资料对零假设做出接受或拒绝的决定时 可能出现的情况有 A 当零假设为真时接受它 B 当零假设为假时接受它 我们犯了第一类错误 C 当零假设为真时拒绝它 我们犯了第一类错误 D 当零假设为假时拒绝它 E 当零假设为假时接受它 我们犯了第二类错误 统计学第六章 假设检验 第 19 页 3 假设检验拒绝原假设 说明 A 原假设有逻辑上的错误B 原假设根本不存在 C 原假设成立的可能性很小D 备择假设成立的可能性很大E 备择假设成立的可能性很小 4 在假设检验中 犯第一类错误的概率 与犯第二类错误的概率 的关系是 A B 与 成正比例关系变化C 与 成反比例关系变化 D 当 值给定后 值随之确定E 当 值减小后 值会随之增大 5 假设检验中 下面五个判断正确的有 A 当零假设为假时接受它的概率就是备择假设为真时接受它的概率 B 当零假设为假时接受它的概率就是备择假设为真时拒绝它的概率 C 当零假设为真时接受它的概率就是备择假设为假时拒绝它的概率 D 当零假设为真时拒绝它的概率就是备择假设为假时接受它的概率 E 当备择假设为假时拒绝它的概率等于零假设为假时接受它的概率 三三 计算题计算题 1 设零件长度服从正态分布 要求其长度规格为 3 278mm 今取该批零件中的 10 个 测得长度 mm 如下 3 281 3 276 3 278 3 286 3 279 3 278 3 281 3 279 3 280 3 277 1 当 0 002 mm 时 该批零件平均长度与原规格有无明显差异 取 0 05 2 当 未知时 又怎样呢 取 0 05 2 某厂生产一种新型家用产品 厂家声称某市已有 20 以上的家庭在使用这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论