均值比较(第五讲).ppt_第1页
均值比较(第五讲).ppt_第2页
均值比较(第五讲).ppt_第3页
均值比较(第五讲).ppt_第4页
均值比较(第五讲).ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计基础 数学教研室雷玉洁 选修课 2012 4 13 第五讲均值比较 1 假设检验的基本思想 2 假设检验的常用方法 3 正态总体参数的假设检验 置信区间法 临界值法 值法 小概率事件 假设检验的一般步骤 两类错误 在实际问题中 经常会遇到根据样本所提供的信息 判断总体是否具有某种指定的特征 如判断总体分布是否服从某一类型的分布 这些都是假设检验 hypothesistesting 问题 一 问题的提出 第一节假设检验的基本思想 总体的某个参数与某定值是否有实质性差异 同类型的两个总体的某个参数是否相同 根据某种实际需要 预先对未知总体作出一些假设 然后再根据实测样本的信息去检验假设的合理性 以最后决定对该假设的取舍 处理假设的统计方法称为统计假设检验 简称假设检验 也称显著性检验 significancetest 这些关于总体的种种假设称为统计假设 已知总体分布类型 对其未知参数的假设作假设检验 未知总体分布类型 对其总体假设作假设检验 假设检验 参数检验 parametrictest 非参数检验 nonparametrictest 解 记药片中的有效成分含量为X 根据题设 问题归结为检验总体均值 与0 5是否有差异 根据第四章抽样分布可知 假设 0 5 统计量 双侧检验 假定药片有效成分含量服从标准差为0 01mg的正态分布 问这个厂家的产品是否符合要求 0 05 例1药物有效成分含量检验 规定 0 5mg 片方法 随机抽样 n 12 平均有效成分含量为0 4938mg 片 是一个小概率事件 即在 0 5成立下 统计量的100个取值中其绝对值超过1 96的约为5个 即在一次抽样中小概率事件就发生了 因为 0 05 即 我们有理由认为假设 0 5 有误 应予以拒绝 二 小概率原理 拒绝或接受统计检验假设 是以小概率原理为准则的 如 0 001 若重复进行10000次试验 如果已知在一项试验中 事件A发生的概率P A 很小 那么A发生10次左右 如只进行1次试验 则A几乎是不会发生的 平均说来每1000次试验中A只发生1次 小概率事件 在一次试验中几乎是不会发生的 如果我们作了一个假设 在所作假设的条件下正确地计算出某事件A发生的概率很小 可是在一次试验中 A竟然发生了 这就是小概率事件实际不可能原理 简称小概率原理 则可认为所作的假设不正确 从而拒绝所作的假设 1 统计假设 一般说来 我们应当同时存在两个假设 拒绝其中的一个假设就意味着接受另一个假设 零假设 备择假设 将其中的一个假设称作零假设或原假设 而另一个则成为备择假设 三 假设检验三要素 究竟将成对假设中哪一个作为零假设 哪一个作为备择假设呢 检验统计量的构造标准 1 检验统计量必须含有零假设的信息 例如 要检验某正态总体均值是否为零 检验统计量 2 检验统计量 零假设信息 2 当零假设成立时能确定统计量的分布或渐近分布 例如 要检验某正态总体均值是否为零 检验统计量 已知分布 3 能通过检验统计量确定拒绝域的形式 例如 要检验某正态总体均值是否为零 检验统计量 如果备择假设为真 说明总体均值不为零 则 要么偏大 正 要么偏小 负 将统计量的观测值记作T0 如果T0大于某适当的正常数 或小于某适当的负常数 我们应当认为零假设不成立 从而拒绝零假设 H1为真 T0应当与零有较大偏离 H0为真 T0应当接近于零 例如要检验某正态总体均值是否为零 根据刚才的分析知 也就是说 如果 或者 则 拒绝H0 如何确定C1和C2 拒绝域 接受域 3 检验法则 由于受随机因素的影响 任何检验都会出现误判 如果本来备择假设为真 检验却作出接受零假设的结论 我们称该检验犯了 型 纳伪 错误 定义 型错误 型错误 如果本来零假设为真 检验却作出拒绝零假设的结论 我们称该检验犯了 型 拒真 错误 即检验最基本的要求是犯 型错误应当尽可能少 犯 型错误的概率是小概率 事先给定一个充分小的正数 设某检验问题的检验统计量为 假定确定出的拒绝域为D 即 拒绝零假设 一般情况下 零假设是需要保护的对象 因此 在零假设为真的情况下不能轻易拒绝零假设 原则 控制犯 型错误的概率 例如要检验某正态总体均值是否为零 或 即 显著水平 则 在显著水平 下 数据支持拒绝零假设的结论 认为总体均值与零有显著差异 否则 在显著水平 下 数据支持接受零假设的结论 认为总体均值与零无显著差异 给定样本值 检验法则为 等价于 2 纳伪 错误 犯这类错误的概率记为 1 弃真 错误 犯这类错误的概率就是显著性水平 四 两类错误的直观表现 由于我们做决策依据的是一个样本 是以部分来推断总体 因此不可避免地会犯错误 由于犯第二类错误的概率计算较复杂 通常我们总是控制犯第一类错误的概率 这种只控制犯第一类错误的概率而不考虑犯第二类错误的检验称为显著性检验 犯两类错误的概率越小越好 但样本容量一定的前提下 不可能同时降低 和 注 犯第一类错误的概率 越小 则犯第二类错误的概率 越大 反之亦然 一 置信区间法 用置信区间进行假设检验H0 0的示意图 拒绝H0 拒绝H0 接受H0 第二节假设检验的常用方法 假定药片有效成分含量服从标准差为0 01mg的正态分布 问这个厂家的产品是否符合要求 0 05 例1药物有效成分含量检验规定 0 5mg 片方法 随机抽样 n 12 平均有效成分含量为0 4938mg 片 解 计算得 的95 置信区间为 0 4881 0 4995 显然该区间不包含0 5 故在 0 05显著水平下拒绝H0 0 5 根据第五章第二节 已知 2 X N 0 012 0 4938 的95 置信区间 二 临界值法 临界值法就是用临界值表示检验的拒绝域 例1 解 原假设H0 0 5 H1 0 5 在H0成立下 所以在显著水平 0 05下拒绝H0 即该批药片有效成分的平均含量 与 0 0 5有显著性差异 该厂产品不符合规定要求 三 P值法 P值法就是计算统计量的样本值所对应的小概率事件的概率值P 只要 P 0 05就拒绝原假设H0 P 0 05就接受原假设H0 P 在显著水平 0 05下拒绝H0 0 0 5有显著性差异 该厂产品不符合规定要求 即该批药片有效成分的平均含量 与 0 0 5 P值的计算 EXCEL中 在Excel中 有两个命令 NORMDIST NORMSDIST可以求出正态分布 或标准正态分布 下的 值 normdist normsdist 双侧 2 单个正态总体均值与已知值间的比较 第三节正态总体参数的假设检验 两独立正态总体间的均值比较 两样本不独立 数据具有配对的相依关系 1 考察对象 2 研究总体 3 两总体是否相互独立 一 单个正态总体的均值与已知值间的比较 二 两独立正态总体的均值比较 三 两配对正态总体的均值比较 一 单个正态总体的均值与已知值间的比较 在假设H0 0成立的前提下 设x1 x2 xn为来自于正态总体N 2 的样本值 且 2未知 试问总体均数 是否与已知定值 0有显著性差异 方差未知条件下的t检验 假设H0 4 45 H1 4 45 1 SPSS输入格式 5行1列 2 SPSS程序选项 3 结果 4 结论 P 0 06 0 05 接受原假设 认为此次抽样的含量和正常情况下没有显著性差异 两独立总体间的均值比较 方差未知 二 两个正态总体间的比较 例甲乙两厂生产同一药物 现分别从其产品中抽取若干样品测定其含量 结果如下 甲厂 X 0 510 490 520 550 480 47乙厂 Y 0 560 580 520 590 490 570 54 若已知两厂产品的药物含量均服从正态分布 试判断 两厂药物含量的总体均数是否相同 两正态总体均值间的比较 H0 1 2 H1 1 2 检验统计量 双样本抽样分布定理 1 SPSS输入格式 13行2列 Group是组别 甲厂生产的药物含量为第一组 乙厂生产的药物含量为第二组 2 SPSS程序选项 选择检验变量及分组变量 主要结果 1 P 0 577 0 05 方差齐性 2 P 0 027 0 05 均数有差异 结论 例5用两种方法测定药物中某元素的含量 各测定4次 得到的数据如下 方法一3 283 283 293 29方法二3 233 293 263 25经验得知测定数据服从正态分布 且已知两样本相互独立 方差非齐性 试检验这两种方法的测定值是否有显著差异 解根据假设 记两种方法的测定值为分别为X N 1 12 Y N 2 22 SPSS结果 所以拒绝原假设H0的统计学 依据尚不充分 结论 不能认为两种方法的测量值有显著性差异 配对设计 是将受试对象配成对子 给予每对中的个体以不同处理 优点是同对的试验对象间均衡性增大 其效率取决于配对条件的选择 应以主要的非实验因素作为配对条件 一般多考虑年龄 性别 环境条件等 不要以实验因素作为配对条件 分别将每对中的两个受试对象随机分配到不同处理组 两样本的均值比较 但数据具有配对关系 配对样本T检验 例 将16只大白鼠 配成8对 每对分别饲以正常饲料和缺乏维生素E饲料 过一定时期 测得两组大白鼠肝中维生素A的含量 服从正态分布 如下表 正常饲料组35502000300039503800375034503050 缺乏饲料组24502400180032003250270025001750 试比较两组维生素A含量有无差别 大白鼠对数12345678 三 配对样本检验 两配对样本检验是根据样本数据对来自的两配对正态总体的均值是否有显著差异进行的推断 一般用于同一研究对象 或两配对对象 分别给予两种不同处理的效果比较 以及同一研究对象 或两配对对象 实施某处理前后的效果比较 前者推断两种效果有无差别 后者推断某种处理是否有效 使用前提 1 两个样本应是配对的 在应用领域中 主要的配对资料包括 具有年龄 性别 体重 病况等非处理因素相同或相似者 首先两个样本的观察数目相同 其次两样本的观测值顺序不能随意改变 2 样本来自的总体应服从正态分布 例 10例矽肺患者经克矽平治疗前后的血红蛋白量 g dl 如下 治疗前 11 3151513 512 81011121312 3 治疗后 1413 81413 513 51214 711 413 812 问治疗对血红蛋白量有无作用 1 SPSS输入格式 10行2列 2 程序选择 选择配对变量 治疗前 治疗后 P 0 224 0 05 数据支持接受原假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论