质量检验的定义及分类.ppt_第1页
质量检验的定义及分类.ppt_第2页
质量检验的定义及分类.ppt_第3页
质量检验的定义及分类.ppt_第4页
质量检验的定义及分类.ppt_第5页
已阅读5页,还剩145页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计假设检验与参数估计 统计推断是根据样本分布规律和概率理论 由样本结果去推断总体特征 它主要包括假设检验 testofhypothesis 和参数估计 parametricestimation 两部分内容 下一张 主页 退出 上一张 假设检验又叫显著性检验 testofsignificance 显著性检验的方法很多 常用的有u检验 t检验 F检验和 2检验等 尽管这些检验方法的用途及使用条件不同 但其检验的基本原理是相同的 参数估计有点估计 pointestimation 和区间估计 intervalestimation 下一张 主页 退出 上一张 例1 某一酿造厂新引进一种酿醋曲种 以原曲种为对照进行试验 已知原曲种酿出的食醋醋酸含量平均为 0 9 75 其标准差为 5 30 现采用新曲种酿醋 得到30个醋样 测得其醋酸含量平均为 11 99 试问 能否由这30个醋样的平均数判断新曲种好于原曲种 1统计假设检验概述 下一张 主页 退出 上一张 1 1统计假设检验的意义和基本原理 1 1 1统计假设检验的意义 食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的 例2 A B两种肥料 在相同条件下各施用于5个小区的水稻上 水稻产量平均分别为 二者相差20kg 那么20kg差异究竟是由于两种肥料的不同而造成的还是由试验的随机误差造成的 例3 小麦良种的千粒重x N 33 5 1 62 现由外地引进一高产品种 在8个小区种植 得千粒重 g 35 6 37 6 33 4 35 1 32 7 36 8 35 9 34 6 平均数为 试问新引进的品种千粒重与当地品种有无显著差异 如果有显著差异 是否显著高于当地品种 以上这几种问题的判断均是由样本去推断总体的 属于统计假设检验问题 均是来判断数据差异 分布差异是由处理引起 还是由于随机误差引起的 样本虽然来自于总体 但样本平均数并非是总体平均数 由于抽样误差的影响 随机误差的存在 样本平均数与总体平均数之间往往有偏差 因此 仅由表面效应是不能判断它们之间是否有显著差异 其根本原因在于试验误差 或抽样误差 的不可避免性 通过试验测定得到的每个观测值 既由被测个体所属总体的特征决定 又受其它诸多无法控制的随机因素的影响 所以观测值由两部分组成 即 总体平均数反映了总体特征 表示试验误差 若样本含量为n 则可得到n个观测值 于是样本平均数 下一张 主页 退出 上一张 可以看出 样本平均数并非总体平均数 它还包含试验误差的成分 试验表面效应为 上式表明 试验的表面效应由两部分构成 一部分是试验的处理效应 即两总体平均数的差异 另一部分是试验误差 因此 仅凭表面效应来判断两总体平均数是否相同是不可靠的 如果处理效应不存在 即 则表面效应仅由误差造成 此时可以说两总体平均数无显著差异 如果处理效应存在 则表面效应不仅由误差造成 更主要由处理效应影响 所以 判断处理效应是否存在是假设检验的关健 同理 对于接受不同处理的两个样本来说 则有 这说明两个样本平均数之差 也包括了两部分 一部分是两个总体平均数的差 叫做试验的处理效应 treatmenteffect 另一部分是试验误差 下一张 主页 退出 上一张 也就是说样本平均数之差 包含有试验误差 它只是试验的表面效应 因此 仅凭 就对总体平均数 是否相同下结论是不可靠的 只有通过显著性检验才能从 中提取结论 对 进行显著性检验就是要分析 试验的表面效应 主要由处理效应 引起的 还是主要由试验误差所造成 下一张 主页 退出 上一张 处理效应 未知 但试验的表面效应是可以计算的 借助数理统计方法可以对试验误差作出估计 所以 可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在 下一张 主页 退出 上一张 下一张 主页 退出 上一张 小概率事件实际不可能性原理 1 1 2统计假设检验的基本思想 小概率事件在一次试验中被认为是不可能发生的 小概率事件不是不可能事件 但在一次试验中出现的可能性很小 不出现的可能性很大 以至于实际上可以看成是不可能发生的 在统计学上 把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理 亦称为小概率原理 小概率事件实际不可能性原理是统计学上进行假设检验 显著性检验 的基本依据 0 050 010 001称之为小概率事件 下一张 主页 退出 上一张 举一例子 箱子中有黑球和白球 总数100个 但不知黑球白球各多少个 现提出假设H0 箱子中有99个白球 暂时设H0正确 那么从箱子中任取一球 得黑球的概率为0 01 是一小概率事件 今取球一次 如果居然取到了黑球 那么 自然会使人对H0的正确性产生怀疑 从而否定H0 也就是说箱中不止1个黑球 下一张 主页 退出 上一张 1 1 3统计假设检验的基本原理 1 根据研究目的 对研究总体提出假设 原假设 无效假设 零假设 nullhypothesis 是被检验的假设 通过检验可能被接受 也可能被否定 与H0对应的假设 只有是在无效假设被否定后才可接受的假设 无充分理由是不能轻率接受的 备择假设 alternativehypothesis 如前例 原假设H0 即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等 这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的 试验的表面效应是随机误差引起的 对应的备择假设为 即表明采用新曲种酿造食醋能够改变醋酸含量 试验的处理效应存在 对于来自两个总体的两个样本 原假设H0 即两个总体的平均数相等 处理效应为零 试验表面效应仅由误差引起 处理效应不存在 对应的备择假设是 即假设两个总体的平均数不相等 亦即存在处理效应 其意义是指试验的表面效应 除包含试验误差外 还含有处理效应在内 2 在无效假设成立的前提下 构造合适的统计量 并由该统计量的抽样分布计算样本统计量的概率 下一张 主页 退出 上一张 当无效假设H0成立时 表明试验表面效应纯属试验误差引起 处理效应不存在 此时 可根据题意构造适当统计量 计算样本统计量值 对前例分析 无效假设H0 成立 试验的表面效应是随机误差引起的 那么 可以把试验中所获得的看成是从总体中抽取的一个样本平均数 由样本平均数的抽样分布理论可知 N 0 2 n 构造统计量 N 0 1 4 1 由样本值计算统计量u值 由正态分布双侧分位数 u 可知 本例计算出的统计量u 2 315 1 96 2 58 所以可推知其概率 0 01 0 05 本试验的表面效应 0 0224完全由试验误差造成的概率在0 01 0 05之间 在统计学上 把小概率事件在一次试验中看成是实际上不可能发生的事件 称为小概率事件实际不可能原理 根据这一原理 当试验的表面效应是试验误差的概率小于0 05时 可以认为在一次试验中试验表面效应是试验误差实际上是不可能的 因而否定原先所作的无效假设H0 接受备择假设HA 即认为试验的处理效应是存在的 当试验的表面效应是试验误差的概率大于0 05时 则说明无效假设成立的可能性大 不能被否定 因而也就不能接受备择假设 下一张 主页 退出 上一张 3 根据 小概率事件实际不可能性原理 否定或接受无效假设 叫做均数差异标准误 n1 n2为两样本的含量 对于来自两个总体的样本 研究在无效假设 成立的前提下 统计量 的抽样分布 经统计学研究 得到一个统计量t 下一张 主页 退出 上一张 其中 所得的统计量t服从自由度df n1 1 n2 1 的t分布 t df 根据两个样本的数据 计算得 11 9 2 1 8 下一张 主页 退出 上一张 进一步估计 t 2 426的两尾概率 即估计P t 2 426 是多少 查附表3 在df n1 1 n2 1 18时 两尾概率为0 05的临界值 两尾概率为0 01的临界t值 下一张 主页 退出 上一张 2 101 2 878 即 P t 2 101 P t 2 101 P t2 878 P t 2 878 P t 2 878 0 01 由两样本数据计算所得的t值为2 426 介于两个临界t值之间 即 t0 05 2 426 t0 01所以 t 2 426的概率P介于0 01和0 05之间 即 0 01 P 0 05 如图所示 t 2 426的两尾概率 说明无效假设成立的可能性 即试验的表面效应为试验误差引起的可能性在0 01 0 05之间 下一张 主页 退出 上一张 按所建立的 试验的表面效应是试验误差的概率在0 01 0 05之间 小于0 05 故有理由否定 从而接受 可以认为两个总体平均数和不相同 综上所述 显著性检验 从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设 这一过程实际上是应用所谓 概率性质的反证法 对试验样本所属总体所作的无效假设的统计推断 下一张 主页 退出 上一张 在统计假设检验中 否定或接受无效假设的依据是 小概率事件实际不可能性原理 用来确定否定或接受无效假设的概率标准叫显著水平 significancelevel 记作 在试验研究中常取 0 05或 0 01 下一张 主页 退出 上一张 1 1 4统计假设检验的显著水平 假设检验时选用的显著水平 除 0 05和0 01为常用外 也可选 0 10或 0 001等等 到底选哪个显著水平 应根据试验的要求或试验结论的重要性而定 如果试验中难以控制的因素较多 试验误差可能较大 则显著水平可选低些 即 值取大些 反之 如试验耗费较大 对精确度的要求较高 不容许反复 或者试验结论的应用事关重大 则所选显著水平应高些 即 值应该小些 显著水平 对假设检验的结论是有直接影响的 所以在试验开始前应给以确定 下一张 主页 退出 上一张 若 t 0 05 即表面效应属于试验误差的可能性大 不能否定 统计学上把这一检验结果表述为 两个总体平均数与差异不显著 在计算所得的t值的右上方标记 ns 或不做任何标记 下一张 主页 退出 上一张 统计假设检验结果说明 两个样本 若t0 05 t t0 01 则说明试验的表面效应属于试验误差的概率P在0 01 0 05之间 即0 01 P 0 05 表面效应属于试验误差的可能性较小 应否定 接受 统计学上把这一检验结果表述为 两个总体平均数与差异显著 在计算所得的t值的右上方标记 下一张 主页 退出 上一张 若 t t0 01 则说明试验的表面效应属于试验误差的概率P不超过0 01 即P 0 01 表面效应属于试验误差的可能性更小 应否定 接受 统计学上把这一检验结果表述为 两个总体平均数与差异极显著 在计算所得的t值的右上方标记 下一张 主页 退出 上一张 1 2统计假设检验的步骤 建立假设 对样本所属总体提出假设 包括无效假设H0和备择假设HA 确定显著水平 常用的显著水平 0 05和 0 01 从无效假设H0出发 根据样本提供信息构造适宜统计量 并计算统计量值或概率 由附表查出相应的统计量临界值 比较样本统计量值与临界值大小 根据小概率原理做出统计推断 或由概率大小做出判断 1 3统计假设检验的几何意义与两类错误 1 3 1统计假设检验的几何意义 统计假设检验从本质上来说 就是根据显著水平 将统计量 数 的分布划分为接受区和否定区两部分 前者为接受原假设H0的区间 后者为否定H0 而接受HA的区间 当试验结果落入接受区 就接受H0 反之 否定H0 而接受HA 否定区的概率为 接受区的概率为1 是否否定无效假设或 用实际计算出的统计量u或t的绝对值与显著水平 对应的临界值ua或ta比较 若 u ua或 t ta 则在 水平上否定 若 u ua或 t ta 则不能在 水平上否定 区间和或称为 水平上的否定域 而区间 则称为 水平上的接受域 下一张 主页 退出 上一张 图4 1双侧检验时H0的接受域和否定域 对前例分析 所以在a 0 05水平上的接受域为 0 0785 0 1165 否定域为 0 0785 0 1165 试验结果 0 1199 落入否定区间 所以否定 接受 结论 采用新曲种酿造食醋 其醋酸含量有显著改变 统计假设检验的是根据 小概率事件实际不可能性原理 来否定或接受无效假设的 所以不论是接受还是否定无效假设 都没有100 的把握 也就是说 在检验无效假设时可能犯两类错误 第一类错误 H0本身是成立 但通过检验却否定了它 犯了 弃真 错误 也叫 型错误 type error 错误 型错误 就是把非真实差异错判为真实差异 即为真 却接受了 下一张 主页 退出 上一张 1 3 2统计假设检验的两类错误 第二类错误 H0本身不成立 但通过检验却接受了它 犯了 纳伪 错误 也叫 型错误 type error 错误 型错误 就是把真实差异错判为非真实差异 即为真 却未能否定 统计检验是基于 小概率事件实际不可能性原理 来否定H0 但在一次试验中小概率事件并不是绝对不会发生的 如果我们抽得一个样本 它虽然来自与H0对应的抽样总体 但计算所得的统计量却落入了否定域中 因而否定了H0 于是犯了 型错误 犯 这类错误的概率不会超过a 下一张 主页 退出 上一张 型错误发生的原因可以用图4 2来说明 图中左边曲线是为真时 的分布密度曲线 右边曲线是为真时 的分布密度曲线 它们构成的抽样分布相叠加 有时我们从抽样总体抽取一个 恰恰在成立时的接受域内 如图中横线阴影部分 这样 实际是从总体抽的样本 经显著性检验却不能否定 因而犯了 型错误 犯 型错误的概率用表示 下一张 主页 退出 上一张 图4 2两类错误示意图 型错误概率值的大小较难确切估计 它只有与特定的结合起来才有意义 一般与显著水平 原总体的标准差 样本含量n 以及相互比较的两样本所属总体平均数之差 等因素有关 在其它因素确定时 值越小 值越大 反之 值越大 值越小 样本含量及 越大 均数标准误 越小 值越小 下一张 主页 退出 上一张 由于值的大小与 值的大小有关 所以在选用检验的显著水平时应考虑到犯 型错误所产生后果严重性的大小 还应考虑到试验的难易及试验结果的重要程度 若一个试验耗费大 可靠性要求高 不允许反复 那么 值应取小些 当一个试验结论的使用事关重大 容易产生严重后果 如药物的毒性试验 值亦应取小些 对于一些试验条件不易控制 试验误差较大的试验 可将 值放宽到0 1 甚至放宽到0 25 下一张 主页 退出 上一张 在提高显著水平 即减小 值时 为了减小犯 型错误的概率 可适当增大样本含量 因为增大样本含量可使 分布的方差 2 1 n1 1 n2 变小 使图4 2左右两曲线变得比较 高 瘦 叠加部分减少 即值变小 由于在具体问题中往往不是主观能够改变的客观存在 所以通过严密的试验设计 严格的试验操作和增大样本容量n来降低均数标准误 从而降低 下一张 主页 退出 上一张 注意 在上述显著性检验中 对应于无效假设的备择假设为 它包含了或两种可能 因而有两个否定域 分别为于分布曲线的两尾 这个假设检验的目的在于判断 与 0有无差异 而不考虑谁大谁小 下一张 主页 退出 上一张 1 4双侧检验与单侧检验 双侧检验 这样 在 水平上否定域有两个和 对称地分配在u分布曲线的两侧尾部 每侧的概率为 2 如图4 3所示 这种利用两尾概率进行的检验叫双侧检验 two sidedtest 也叫双尾检验 two tailedtest 为双侧检验的临界u值 下一张 主页 退出 上一张 但在有些情况下 双侧检验不一定符合实际情况 如酿醋厂的企业标准规定 曲种酿造醋的醋酸含量应保持在12 以上 0 如果进行抽样检验 样本平均数 该批醋为合格产品 但如果时 可能是一批不合格产品 对这样的问题 我们关心的是所在总体平均数 是否小于已知总体平均数数 0 即产品是否不合格 此时 无效假设应为 产品合格 备择假设则应为HA 产品不合格 这样 只有一个否定域 并且位于分布曲线的左尾 为左尾检验 如图4 3B所示 左侧的概率为 下一张 主页 退出 上一张 单测检验 若无效假设H0为 备择假设HA为 0 此时H0的否定域在u分布曲线的右尾 右尾检验 在 水平上否定域为 右侧的概率为 右尾检验如图4 3A所示 例如 国家规定酿造白酒中的甲醇含量不得超过0 1 在抽样检验中 若样本平均数小于0 1 产品合格 而当平均数0 1 产品为不合格 这样的问题 H0 HA 0 下一张 主页 退出 上一张 利用一尾概率进行的检验叫单侧检验 one sidedtest 也叫单尾检验 one tailedtest 此时u 为单侧检验的临界u值 单侧检验的u 双侧检验的u2 下一张 主页 退出 上一张 临界值u2 或t2 2样本平均数的假设检验 在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异 即检验该样本是否来自某一总体 即检验无效假设H0 0 备择假设HA 0或 0 0 的问题 已知的总体平均数一般为一些公认的理论数值 经验数值或期望数值 常用的检验方法有u检验和t检验 下一张 主页 退出 上一张 2 1单个样本平均数的假设检验 实质是样本所在总体平均数与已知总体平均数差异显著性检验 2 1 1单个样本平均数的u检验 u检验 u test 就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法 Excel中统计函数 Ztest 由抽样分布理论可知 有两种情况的资料可以用u检验方法进行分析 样本资料服从正态分布N 2 并且总体方差 2已知 总体方差虽然未知 但样本平均数来自于大样本 n 30 下边举例说明检验过程 例4 1 某罐头厂生产肉类罐头 其自动装罐机在正常工作时每罐净重服从正态分布N 500 64 单位 g 某日随机抽查10瓶罐头 得净重为 505 512 497 493 508 515 502 495 490 510 问装罐机当日工作是否正常 由题意知 样本服从正态分布 总体方差 2 64 符合u检验应用条件 由于当日装罐机的每罐平均净重可能高于或低于正常工作状态下的标准净重 故需作两尾检验 其方法如下 1 提出假设 无效假设H0 0 500g 即当日装罐机每罐平均净重与正常工作状态下的标准净重一样 备择假设HA 0 即罐装机工作不正常 2 确定显著水平 0 05 两尾概率 3 构造统计量 并计算样本统计量值 均数标准误 样本平均数 统计量u值 4 统计推断 由显著水平 0 05 查附表 得临界值u0 05 1 96 实际计算出的表明 试验表面效应仅由误差引起的概率P 0 05 故不能否定H0 所以 当日装罐机工作正常 下一张 主页 退出 上一张 2 1 2单个样本平均数的t检验 t检验 t test 是利用t分布来进行统计量的概率计算的假设检验方法 它主要应用于总体方差未知时的小样本资料 n 30 其中 为样本平均数 S为样本标准差 n为样本容量 例4 2用山楂加工果冻 传统工艺平均每100g加工500g果冻 采用新工艺后 测定了16次 得知每100g山楂可出果冻平均为 520g 标准差S 12g 问新工艺与老工艺在每100g加工果冻的量上有无显著差异 本例总体方差未知 又是小样本 采用双侧t检验 1 提出无效假设与备择假设 即新老工艺没有差异 新老工艺有差异 下一张 主页 退出 上一张 2 确定显著水平 0 01 3 计算t值 520g S 12g 所以 4 查临界t值 作出统计推断由 15 查t值表 附表3 得t0 01 15 2 947 因为 t t0 01 P 0 01 故应否定H0 接受HA 表明新老工艺的每100g加工出的果冻量差异极显著 在统计量t上标记 下一张 主页 退出 上一张 例4 3 某名优绿茶含水量标准为不超过5 5 现有一批该绿茶 从中随机抽出8个样品测定其含水量 平均含水量 5 6 标准差S 0 3 问该批绿茶的含水量是否超标 符合t检验条件 为单尾检验 1 提出无效假设与备择假设H0 5 5 HA 2 计算t值 下一张 主页 退出 上一张 3 查临界t值 作出统计推断单侧 双侧 1 895 t 1 0000 05 不能否定H0 5 5 可以认为该批绿茶的含水量符合规定要求 下一张 主页 退出 上一张 例 按饲料配方规定 每1000kg某种饲料中维生素C不得少于246g 现从工厂的产品中随机抽测12个样品 测得维生素C含量如下 255 260 262 248 244 245 250 238 246 248 258 270g 1000kg 若样品的维生素C含量服从正态分布 问此产品是否符合规定要求 下一张 主页 退出 上一张 按题意 此例应采用单侧检验 1 提出无效假设与备择假设H0 246 HA 246 2 计算t值经计算得 114 5 S 1 581 下一张 主页 退出 上一张 所以 2 281 3 查临界t值 作出统计推断因为单侧 双侧 1 796 t 2 281 单侧t0 05 11 P246 可以认为该批饲料维生素C含量符合规定要求 下一张 主页 退出 上一张 在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题 以了解两样本所属总体的平均数是否相同 对于两样本平均数差异显著性检验 因试验设计或调查取样不同 一般可分为两种情况 下一张 主页 退出 上一张 2 2两个样本平均数的差异显著性检验 2 2 1成组资料平均数的假设检验非配对设计两样本平均数的差异显著性检验成组设计 当一个试验只有两个处理的时 可将试验单元完全随机地分成两组 然后对两组试验单元各自独立地随机施加一个处理 在这种设计中两组的试验单元相互独立 所得的两个样本相互独立 其含量不一定相等 这种试验设计为处理数k 2的完全随机化设计 这样得到的试验资料为成组资料 成组设计数据资料的一般形式见表4 1 下一张 主页 退出 上一张 表4 1成组设计 非配对设计 资料的一般形式 下一张 主页 退出 上一张 成组资料的特点 两组数据相互独立 各组数据的个数可等 也可不等 1u检验 如果两个样本所在总体为正态分布 且总体方差和已知 或者总体方差未知 但两个样本都是大样本 n1 n2 30 可采用u检验来分析 由两均数差抽样分布理论可知 在上述条件下 两个样本平均数之差服从正态分布 即 参数关系 N 0 1 那么 在H0 1 2下 正态离差u值为 差数标准误为 根据4 2 4 3即可对两样本均数的差异做出检验 4 2 4 3 如果总体方差未知 但两个样本为大样本 可由样本方差S12 S22分别估计总体方差 12 22 平均数差数的标准误可由下列公式估计 其中 S12 S22分别是样本含量为n1 n2的两个样本方差 例4 4在食品厂的甲乙两条生产线上各测定了30个日产量如表所示 试检验两条生产线的平均日产量有无显著差异 表4 2甲乙两条生产线日产量记录 1 建立假设 即两条生产线的平均日产量无差异 2 确定显著水平 0 01 3 计算 故 4 统计推断 由 0 01查附表2 得u0 01 2 58实际 u 3 28 u0 01 2 58 故P 0 01 应否定H0 接受HA 说明两个生产线的日平均产量有极显著差异 甲生产线日平均产量高于乙生产线日平均产量 当两个样本所在总体方差未知 又是小样本 但假定时 有 下一张 主页 退出 上一张 2t检验 t 4 4 由4 4式可作两样本平均数差异的t检验 当样本含量相等时 自由度df 2 n 1 例4 5海关抽检出口罐头质量 发现有胀听现象 随机抽取了6个样品 同时随机抽取6个正常罐头样品测定其SO2含量 测定结果见表4 3 试分析两种罐头的SO2含量有无差异 表4 3正常罐头与异常罐头SO2含量测定结果 1 提出无效假设与备择假设 两种罐头SO2含量没有差异 2 确定显著水平 0 01 两尾概率 3 计算 4 统计推断由df 10 0 01查附表3得t0 01 10 3 169 实得 t 22 735 t0 01 10 3 169 P 0 01 故应否定无效假设H0 即两种罐头的SO2含量有高度显著差异 该批罐头质量不合格 例4 6 现有两种茶多糖提取工艺 分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量 结果见表4 4 问两种工艺的粗提物中茶多糖含量有无差异 表4 4两种工艺粗提物中茶多糖含量测定结果 1 建立假设 提出无效假设与备择假设 两种工艺的粗提物中茶多糖含量无差异 2 确定显著水平 0 05 两尾概率 3 计算 因两个样本的容量不等 所以 下一张 主页 退出 上一张 4 查临界t值 作出统计推断当df 9时 查临界值得 t0 05 9 2 262 t 1 3810 05 接受 表明两种工艺的粗提物中茶多糖含量无显著差异 在成组设计两样本平均数的差异显著性检验中 若总的试验单位数 不变 则两样本含量相等比两样本含量不等有较高检验效率 因为此时使最小 从而使t的绝对值最大 所以在进行成组设计时 两样本含量以相等为好 下一张 主页 退出 上一张 下一张 主页 退出 上一张 强调 不论样本大小 当总体方差未知时 但方差相等 都可用t检验方法进行假设检验 前提条件是样本所在总体应服从正态分布 3近似t检验 t 检验 两样本所在总体方差未知 而且两个方差不等 此时只能作近似t检验 检验原理 过程同t检验 只是计算上有区别 均数差数标准误 t 不再准确地服从自由度为的t分布 而只是近似地服从t分布 此时 应采用近似t检验法 此法在作统计推断时 所用临界值不是由附表直接查得的 而须进行矫正 4 6 实例见例4 7 P82 非配对设计要求试验单元尽可能一致 如果试验单元变异较大 如试验动物的年龄 体重相差较大 若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性 为了消除试验单元不一致对试验结果的影响 正确地估计处理效应 减少系统误差 降低试验误差 提高试验的准确性与精确性 可以利用局部控制的原则 采用配对设计 下一张 主页 退出 上一张 2 2 2成对资料平均数的假设检验 配对设计两样本平均数的差异显著性检验 配对设计是指先根据配对的要求将试验单元两两配对 然后将配成对子的两个试验单元随机地分配到两个处理组中 配对的要求是 配成对子的两个试验单元的初始条件尽量一致 不同对子间试验单元的初始条件允许有差异 每一个对子就是试验处理的一个重复 配对的方式有两种 自身配对与同源配对 下一张 主页 退出 上一张 自身配对 指在同一试验单元进行处理前与处理后的对比 用其前后两次的观测值进行自身对照比较 或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较 如观测某种病畜治疗前后临床检查结果的变化 观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等 同一食品在贮藏前后的变化 下一张 主页 退出 上一张 同源配对 指将非处理条件相近的两个试验单元组成对子 然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理 配对试验加强了配对处理间的试验控制 非处理条件高度一致 使处理间可比性增强 试验误差降低 因而 试验精度较高 成对资料与成组资料相比 成对资料中的两个处理间的数据不是相互独立的 而是存在某种联系 配对设计试验资料的一般形式见表4 5 下一张 主页 退出 上一张 表4 5配对设计试验资料的一般形式 下一张 主页 退出 上一张 两个处理的观测值一一配对 即 X11 X21 X12 X22 X13 X23 X1n X2n 那么 每对观测值之间的差数为di X1i X2i i 1 2 3 n 差数d1 d2 d3 dn组成容量为n的差数样本 差数样本的平均数为 i 1 2 3 n 差数均数标准误 4 7 下一张 主页 退出 上一张 4 8 根据 4 7 式和 4 8 式即可对成对资料平均数的差异性进行检验 例4 8 为研究电渗处理对草莓果实中的钙离子含量的影响 选用10个草莓品种进行电渗处理与对照处理对比试验 结果见表4 5 问电渗处理对草莓钙离子含量是否有影响 本例因每个品种实施了一对处理 试验资料为成对资料 表4 5电渗处理对草莓钙离子含量的影响 即电渗处理后草莓钙离子含量与对照钙离子含量无差异 也就是说电渗处理对草莓钙离子含量无影响 下一张 主页 退出 上一张 1 建立假设 2 确定显著水平 0 01 3 计算 将计算所得t值的绝对值与临界值比较 4 查临界t值 作出统计推断 根据df n 1 9 查临界t值 t0 01 9 3 250 因为 t 8 358 t0 01 9 P 0 01 否定H0 接受HA 表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著 即电渗处理极显著提高了草莓钙离子含量 例 用家兔10只试验某批注射液对体温的影响 测定每只家兔注射前后的体温 见表 设体温服从正态分布 问注射前后体温有无显著差异 自身配对 下一张 主页 退出 上一张 表10只家兔注射前后的体温 1 提出无效假设与备择假设 即假定注射前后体温无差异 即假定注射前后体温有差异 2 计算t值经过计算得故且 10 1 9 下一张 主页 退出 上一张 3 查临界t值 作出统计推断由df 9 查t值表得 t0 01 9 3 250 因为 t t0 01 9 P 0 01 否定 接受 表明家兔注射该批注射液前后体温差异极显著 这里表现为注射该批注射液可使体温极显著升高 例 现从8窝仔猪中每窝选出性别相同 体重接近的仔猪两头进行饲料对比试验 将每窝两头仔猪随机分配到两个饲料组中 时间30天 试验结果见表 问两种饲料喂饲仔猪增重有无显著差异 同源配对 下一张 主页 退出 上一张 一般说来 相对于成组设计 配对设计能够提高试验的精确性 配对内的误差是相同的且是随机的 配对间的误差不同 但它们是独立的 可分离出来 为系统误差 在进行两样本平均数差异显著性检验时 亦有双侧与单侧检验之分 关于单侧检验 只要注意问题的性质 备择假设HA的建立和临界值的查取就行了 具体计算与双侧检验相同 下一张 主页 退出 上一张 成对检验的优点 1 由于加强了试验控制 成对观测值的可比性提高 因而随机误差将减小 可以发现较小的真实差异 2 成对比较不受两个样本总体方差 12 22的干扰 不需考虑两者是否相等 3二项百分率的假设检验 在食品科研中 有许多试验结果以百分率表示 例如产品合格率 食品贮藏变质率 一级出品率等等 这些百分数资料是服从二项分布的 故称为二项百分率 它们与一般百分数不同 如食品中各种营养成分的含量 对二项百分率的检验 从理论上讲 应按二项分布进行 这样的检验方法虽然比较准确 但计算较麻烦 所以常用正态近似法来代替 下一张 主页 退出 上一张 当样本含量n较大 p不是很小 且np和nq均大于5时 二项分布接近于正态分布 所以 对于服从二项分布的百分率资料 当n足够大时 可以近似地用u检验法 进行差异显著性检验 适用于正态近似法的二项样本条件见表4 6 下一张 主页 退出 上一张 表4 6适用于正态近似法的二项样本条件 下一张 主页 退出 上一张 需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著 其目的在于检验一个样本百分率所在二项总体百分率p是否与已知二项总体百分率p0相同 下一张 主页 退出 上一张 3 1单个样本百分率的假设检验 一个样本百分率与已知总体百分率的差异显著性检验 由第3章可知 二项百分率的总体均值 方差 标准差分别为 在n 30 np nq 5时 标准化后有 在下 u统计量 百分率标准误 利用这样两个公式即可进行单个样本百分率检验 4 9 4 10 例4 9 某微生物制品的企业标准规定有害微生物不准超过1 p0 现从一批产品中抽取500件 n 发现有害微生物超标的产品有7件 x 问该批产品是否合格 本例关心的是产品有害微生物是否超标 属于一尾检验 1 提出假设 下一张 主页 退出 上一张 即该批产品合格 由一尾概率 0 05查附表 得一尾临界值u0 05 1 64 实际计算 p 0 05 表明该批产品达到了企业标准 为合格产品 2 计算 所以 3 作出统计推断 检验服从二项分布的两个样本百分率差异是否显著 其目的在于检验两个样本百分率 所在的两个二项总体百分率P1 P2是否相同 当两样本的np nq均大于5时 可以近似地采用u检验法进行检验 两样本百分率之差近似服从正态分布 下一张 主页 退出 上一张 3 2两个样本百分率的差异显著性检验 所以 在下 则 4 13 可借助正态分布作两样本百分率的差异检验 样本百分率的差数标准误为 在下 由于总体百分率p未知 只能由样本百分率来估计 这里用两个样本百分率的加权平均数来估计共同的总体百分率p 由样本获得的两样本百分率的差数标准误为 例4 10 葡萄贮藏试验 装入塑料袋不放保鲜片的葡萄385粒 n1 一个月后发现有25粒 x1 葡萄腐烂 装入塑料袋放保鲜片的葡萄598粒 n2 一个月后发现有20粒 x2 葡萄腐烂 问加保鲜片与不加保鲜片的两种葡萄的腐烂率是否有显著差异 1 提出假设 两种贮藏葡萄的腐烂率没有差异 即保鲜效果一致 2 计算 由 0 05和 0 01查附表得 临界值u0 05 1 96 u0 01 2 58 由于实际计算1 96 2 58 所以0 05 p 0 01 应否定H0 接受HA 表明两种贮藏葡萄的腐烂率有显著差异 加保鲜片贮藏葡萄有利于葡萄保鲜 下一张 主页 退出 上一张 3 作出统计推断 3 3二项样本百分率假设检验时的连续性矫正 样本容量n 25 且np 5时 假设检验需连续矫正 在np和 或 nq小于或等于30时 需作连续性矫正 附样本方差的假设检验 1 单个样本方差的检验 测验一个样本方差S2和某一指定方差C是否有显著差异 当样本容量n 30时 S2服从 2分布 用 2检验 当n 30时 因服从u分布 可用u检验 注意附表的 2值是右尾概率 的临界 2 值 记作 2 直接适用于测验H0 2 C 如果测验 2 C 则显著所需的 2值是 21 如测验H0 2 C 则显著所需的 2值是 2 2 例1 已知蔗糖自动打包机的核定方差为C 2 若该日抽取10包进行检测 其S2 2 5 问该打包机的变异程度是否与核定标准有显著差异 例2 某厂生产的保健饮料中的游离氨基酸含量 mg 100ml 在正常情况下服从正态分布N 200 252 某生产日抽测了6个样品 得数据为205 170 185 210 230 190 试问这一天生产的产品游离氨基酸含量的总体方差是否正常 H0 2 C 2 蔗糖打包机变异度与核定标准没有差异 HA 2 C 建立假设 测验计算 两尾检验 df 9 查临界值 21 2 20 975 2 70和 2 2 20 025 19 02 确定显著水平 0 05 查临界值 例1分析 统计推断 实得 2值在 2 70 19 02 内 故接受H0 即该打包机的变异度与核定没有显著差异 例2分析同上 样本平均值 样本方差S2 447 临界值 21 2 5 20 975 5 0 831和 2 2 5 20 025 5 12 833 2 两个样本方差的检验 检验两个来自正态总体的独立样本的方差S12和S22所属总体方差 12和 22是否有显著差异 由抽样分布知 F n1 1 n2 1 注意附表F值是右尾概率 的临界值 记作F 直接适用于检验H0 12 22 如果要检验H0 12 22 则显著所需的F值是F 2 而检验时则将大方差作分子 小方差作分母计算F值 这样 F F 2时 实得F在 水平上显著 用F检验 例某人研究了两种浸提条件下山楂中可溶性固形物的浸提率 试验结果见表试问这两种浸提条件下山楂可溶性固形物提取率有无显著差异 0 05 要考虑方差是否相等 表可溶性固形物提取率比较 建立假设H0 12 22HA 12 22 确定显著水平 0 05双尾检验 临界值F f1 f2 F0 05 5 5 5 05F 2 f1 f2 F0 025 5 5 7 15 计算F统计量 统计推断 实得F F0 05 F0 025 两总体方差相等 1 提出假设 两种浸提条件的提取率没有差异 2 确定显著水平 0 05 两尾概率 3 计算 在方差相等的条件下作成组资料平均数差异显著性检验 4 统计推断由df 10 0 05查附表3得t0 05 10 2 228 实得 t 7 36 t0 05 10 2 228 P 0 05 故应否定无效假设H0 即两种浸提条件的提取率有显著差异 进行显著性检验应注意以下几个问题 4 1要有严密的试验设计和正确的试验技术试验中各个处理的非处理条件应尽可能一致 以保证各样本是从方差同质的总体中抽取的 这样可使假设检验中获得较小而无偏的标准误 提高分析精度 减少犯两类错误的可能性 否则 任何显著性检验的方法都不能保证结果的正确 下一张 主页 退出 上一张 4统计假设检验中应注意的问题 由于研究变量的类型 问题的性质 条件 试验设计方法 样本大小等的不同 所用的显著性检验方法也不同 因而在选用检验方法时 应认真考虑其适用条件 不能滥用 下一张 主页 退出 上一张 4 2选用的显著性检验方法应符合其应用条件 显著性检验结论中的 差异显著 或 差异极显著 不应该误解为相差很大或非常大 也不能认为在专业上一定就有重要或很重要的价值 显著 或 极显著 是指表面上如此差别的不同样本来自同一总体的可能性小于0 05或0 01 已达到了可以认为它们有实质性差异的显著水平 有些试验结果虽然差别大 但由于试验误差也大 也许还不能得出 差异显著 的结论 而有些试验的结果间的差异虽小 但由于试验误差也小 反而可能推断为 差异显著 下一张 主页 退出 上一张 4 3要正确理解差异显著或极显著的统计意义 显著水平的高低只表示下结论的可靠程度的高低 即在0 01水平下否定无效假设的可靠程度为99 而在0 05水平下否定无效假设的可靠程度为95 差异不显著 是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0 05 不能理解为试验结果间没有差异 下 差异不显著 的结论时 客观上存在两种可能 一是本质上有差异 但被试验误差所掩盖 表现不出差异的显著性来 如果减小试验误差或增大样本含量 则可能表现出差异显著性 二是可能两处理间确无本质上差异 下一张 主页 退出 上一张 就两个样本平均数差异显著性检验来说 无效假设与备择假设的建立 如前所述 下一张 主页 退出 上一张 4 4合理建立统计假设 正确计算检验统计量 影响显著性检验结果的因素很多 如被研究事物本身存在的差异 试验误差的大小 样本容量以及选用显著水平等 同样一种试验 试验本身差异程度的不同 样本含量大小的不同 显著水平高低的不同 统计推断的结论可能不同 否定H0时可能犯 型错误 接受H0时可能犯 型错误 尤其在P接近 时 下结论更应慎重 有时应用重复试验来证明 总之 具有实用意义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论