




已阅读5页,还剩81页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章假设检验 假设检验是对参数的值先提出一个假设 然后利用样本信息去检验这个假设是否成立 基本思想 小概率原理 如果对总体的某种假设是真实的 那么不利于或不能支持这一假设的事件A 小概率事件 在一次试验中几乎不可能发生的 要是在一次试验中A竟然发生了 就有理由怀疑该假设的真实性 拒绝这一假设 总体 某种假设 抽样 样本 观察结果 检验 接受 拒绝 小概率事件未发生 小概率事件发生 8 1假设检验的基本问题 8 1 1假设问题的提出 让我们看一个例子 例8 1 由统计资料得知 1989年某地新生儿平均体重为3190克 现从1990年新生儿中随机抽取100个 测得其平均体重为3210克 问1990年的新生儿与1989年相比 体重有无显著差异 问题 差异20克是随机抽样造成的还是本来就有显著差异 用 0表示1989年新生儿的平均体重 表示1990年新生儿的平均体重 我们假设 0或 0 0 然后再来验证我们的假设是否成立 假设检验的步骤提出原假设和备择假设确定适当的检验统计量规定显著性水平 计算检验统计量的值并作出统计决策 提出原假设和备择假设 什么是原假设 NullHypothesis 1 待检验的假设 又称 0假设 2 如果错误地作出决策会导致一系列后果3 总是有等号 或 4 表示为H0H0 某一数值指定为 号 或 例如 H0 3190 克 为什么叫0假设 什么是备择假设 AlternativeHypothesis 1 与原假设对立的假设2 总是有不等号 或 3 表示为H1H1 某一数值 或 某一数值例如 H1 3910 克 或 3910 克 提出原假设和备择假设 什么检验统计量 1 用于假设检验问题的统计量2 选择统计量的方法与参数估计相同 需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为 确定适当的检验统计量 规定显著性水平 什么显著性水平 1 是一个概率值2 原假设为真时 拒绝原假设的概率被称为抽样分布的拒绝域3 表示为 alpha 常用的 值有0 01 0 05 0 104 由研究者事先确定 作出统计决策 计算检验的统计量根据给定的显著性水平 查表得出相应的临界值Z 或Z 2将检验统计量的值与 水平的临界值进行比较得出接受或拒绝原假设的结论 假设检验中的小概率原理 假设检验中的小概率原理 什么小概率 1 在一次试验中 一个几乎不可能发生的事件发生的概率2 在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设3 小概率由研究者事先确定 假设检验中的两类错误 决策风险 假设检验中的两类错误 1 第一类错误 弃真错误 原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为 被称为显著性水平2 第二类错误 取伪错误 原假设为假时接受原假设第二类错误的概率为 Beta H0 无罪 假设检验中的两类错误 决策结果 假设检验就好像一场审判过程 统计检验过程 大 就小 小 就大 基本原则 力求在控制 前提下减少 显著性水平 取值 0 1 0 05 0 01 等 如果犯I类错误损失更大 为减少损失 值取小 如果犯II类错误损失更大 值取大 双侧检验和单侧检验之比较 8 1 6单侧检验在双侧检验中 只要 0或者 0二者之中有一个成立 就可以拒绝原假设 但在一些特殊情况下 我们关心的问题带有方向性 如灯泡使用的寿命越大越好 次品率越小越好 在这种情况下只需要单侧检验就能满足要求 1 左单侧检验 例8 2 某批发商欲从厂家购进一批灯泡 根据合同规定灯泡的使用寿命平均不能低于1000小时 已知灯泡燃烧寿命服从正态分布 标准差为200小时 在总体中随机抽取了100个灯泡 得知样本均值为960小时 批发商是否应该购买这批灯泡 关心的问题是 1000小时所以H0 1000H1 1000这是一个左单侧检验 2 右单侧检验 例8 2 某种大量生产的袋装食品 按规定重量不得少于250克 今从一批该种食品中随机抽取50袋 发现有6袋重量低于250克 若规定不符合标准的比例达到5 食品就不得出厂 问该批食品能否出厂 我们希望不符合标准的比例越小越好 关心的问题是 5 所以H0 5 H1 5 这是一个右单侧检验 双侧检验与单侧检验 假设的形式 双侧检验 原假设与备择假设的确定 双侧检验属于决策中的假设检验 也就是说 不论是拒绝H0还是接受H0 我们都必需采取相应的行动措施例如 某种零件的尺寸 要求其平均长度为10厘米 大于或小于10厘米均属于不合格建立的原假设与备择假设应为H0 10H1 10 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 双侧检验 显著性水平与拒绝域 单侧检验 原假设与备择假设的确定 检验研究中的假设将所研究的假设作为备择假设H1将认为研究结果是无效的说法或理论作为原假设H0 或者说 把希望 想要 证明的假设作为备择假设先确立备择假设H1 单侧检验 原假设与备择假设的确定 例如 采用新技术生产后 将会使产品的使用寿命明显延长到1500小时以上属于研究中的假设建立的原假设与备择假设应为H0 1500H1 1500例如 改进生产工艺后 会使产品的废品率降低到2 以下属于研究中的假设建立的原假设与备择假设应为H0 2 H1 2 单侧检验 原假设与备择假设的确定 检验某项声明的有效性将所作出的说明 声明 作为原假设对该说明的质疑作为备择假设先确立原假设H0除非我们有证据表明 声明 无效 否则就应认为该 声明 是有效的 单侧检验 原假设与备择假设的确定 例如 某灯泡制造商声称 该企业所生产的灯泡的平均使用寿命在1000小时以上除非样本能提供证据表明使用寿命在1000小时以下 否则就应认为厂商的声称是正确的建立的原假设与备择假设应为H0 1000H1 1000 单侧检验 显著性水平与拒绝域 左侧检验 显著性水平与拒绝域 左侧检验 显著性水平与拒绝域 右侧检验 显著性水平与拒绝域 右侧检验 显著性水平与拒绝域 8 1 5利用P值进行决策P决策能精确反映决策的风险度 P值就是原假设为真时所得到的样本观察结果或更极端结果出现的概率 如果P值很小 说明这种情况发生的概率很小 而如果出现了 根据小概率原理 我们就有理由拒绝假设 P值越小 我们拒绝原假设的理由就越充分 在上面的例子中就是求出 假设总体均值为3190克 80时 样本均值等于和大于3190克的概率P是多少 可求得P 0 01242 如果事先确定了显著性水平为 0 05 则在双侧检验中 P 2 0 025时 不能拒绝原假设 反之 P 0 025时 则拒绝原假设 8 2一个总体参数的检验 8 2 1检验统计量的确定 Z统计量t统计量 常用于均值和比例的检验 统计量 方差的检验 1 样本量由抽样理论知 在大样本条件下 如果总体为正态分布 样本统计量服从正态分布 如果总体为非正态分布 样本统计量渐近服从正态分布 所以在大样本情况下 我们都可以把样本统计量视为正态分布 可用Z统计量 当 未知时 用样本标准差s代替 2 总体标准差 是否已知在小样本情况下 如果总体方差已知 样本统计量将服从正态分布 这时可以采用Z统计量 如果总体标准差未知 这时只能使用样本标准差 样本统计量服从t分布 应采用t统计量 自由度为n 1 8 2 随着n的增大 t分布向Z分布逼近 当样本时n 30时 t分布已非常接近Z分布 所以 当n30的条件下 可以选择Z分布 样本量 Z统计量 总体标准差 Z统计量 t统计量 已知 未知 小 大 8 2 2总体均值的检验1 已知 例8 4 某机床厂加工一种零件 根据经验知道 该厂加工的零件的椭圆度渐近服从正态分布 其总体均值为0 081mm 总体标准差为0 025mm 今另换一种新机床进行加工 取200个零件进行检验 得到椭圆度均值为0 076mm 问新机床加工零件的椭圆度总体均值与以前有无明显差别 解 原假设H0 0 081mm 新机床加工零件的椭圆度总体均值与以前无明显差异 备择假设H1 0 081mm由题意知 0 0 081mm 0 025mm 0 076mm n 200 因为 已知 且n较大 所以选Z统计量 我们取显著性水平为 0 05 z 2 1 96 Z z 2 根据决策准则 拒绝H0 即新老机床加工零件椭圆度的均值有显著差异 为显著性水平 它的含义是当原假设正确时却被拒绝的概率风险 也就是犯弃真错误的概率 这是根据检验的要求确定的 通常取小概率事件 0 05或者 0 01 它说明正确的概率为1 为95 或者99 用P值检验实际上P值就是1 P Z 2 83 1 2 2 83 1 2 2 2 83 2 1 2 83 P 2 1 NORMSDIST Z NORMSDIST Z NORMSDIST 2 83 0 997672537P 2 1 NORMSDIST Z 0 004654P远远小于 0 05 故拒绝H0 均值的单侧Z检验 2已知 假定条件总体服从正态分布若不服从正态分布 可以用正态分布来近似 n 30 2 备择假设有符号3 使用z 统计量 均值的单侧Z检验 提出假设 左侧 H0 0H1 0 Z 0 拒绝H0 右侧 H0 0H1 0 Z 0 拒绝H0 均值的单侧Z检验 实例 例 某批发商欲从生产厂家购进一批灯泡 根据合同规定 灯泡的使用寿命平均不能低于1000小时 已知灯泡使用寿命服从正态分布 标准差为200小时 在总体中随机抽取100只灯泡 测得样本均值为960小时 批发商是否应该购买这批灯泡 0 05 均值的单侧Z检验 计算结果 H0 1000H1 1000 0 05n 100临界值 s 检验统计量 在 0 05的水平上拒绝H0 有证据表明这批灯泡的使用寿命低于1000小时 决策 结论 用P值检验因为是单侧检验 所以P 1 Z 1 2 1 0 97725 0 02275显然P 0 02275 0 05 故拒绝H0 如果取显著性水平 0 02 就不能拒绝原假设 这说明 不能拒绝H0并不一定保证H0为真 只是在规定的显著性水平上不能拒绝原假设 这个例子说明在95 置信水平上能拒绝原假设 却不能在98 水平上拒绝原假设 均值的单侧Z检验 实例 例 根据过去大量资料 某厂生产的灯泡的使用寿命服从正态分布N 1020 1002 现从最近生产的一批产品中随机抽取16只 测得样本平均寿命为1080小时 试在0 05的显著性水平下判断这批产品的使用寿命是否有显著提高 0 05 均值的单侧Z检验 计算结果 H0 1020H1 1020 0 05n 16临界值 s 检验统计量 在 0 05的水平上拒绝H0 有证据表明这批灯泡的使用寿命有显著提高 决策 结论 例8 6 某电子元件批量生产的质量标准为平均使用寿命1200小时 某厂宣称它们采用一种新工艺生产的元件质量大大超过规定标准 为了进行验证 随机抽取了100件作为样本 测得平均使用寿命1245小时 标准差300小时 能否说该厂的零件质量显著地高于规定标准 解 原假设H0 1200 采用右单侧检验 备择假设H1 1200依题意 0 1200 1245 s 300 n 100 并取 0 05 这里 未知 且n较大 所以可休用Z统计量 右单侧检验 z 1 645 由 Z z 所以不能拒绝H0 即不能说该厂产品质量显著地高于规定标准 用P值检验P 1 1 5 1 0 9332 0 0668由于P 故不能拒绝H0 3 未知 小样本 例8 7 某机器制造出的肥皂厚度为5cm 今欲了解机器性能是否良好 随机抽取10块肥皂为样本 测得平均厚度为5 3cm 标准差为0 3cm 试以0 05的显著性水平检验机器性能良好的假设 解 原假设H0 5H1 5 依题意 0 5 5 3 s 0 3 n 10 0 05 这里 未知 小样本 所以用t统计量 t 2 10 1 2 2622 由t t 2 故拒绝H0 说明该机器性能并不好 用P值检验P TDIST 3 16 9 2 0 01155 0 025p 2 故拒绝H0 但如果是Z统计量 则P值为0 001578与t统计量差别较大 8 2 3总体比例的检验 设总体比例为 0 p为样本比例 由二项分布的原理和渐近分布的理论可知 当n充分大时 的分布可用正态分布逼近 此时抽样分布服从均值为 方差为的正态分布 8 3 n充分大的条件 一般地np 5同时n 1 p 5就可认为n充分大 例8 8 一项统计结果声称某市老年人口 年龄在65岁以上 所占的比例为14 7 该市老年人口研究会为了检验该项统计是否可靠 随机抽取了400名居民 发现其中有57人年龄在65岁以上 调查结果是否支持该市老年人口比例为14 7 的看法 0 05 解 H0 14 7 H1 14 7 依题意 p 57 400 14 25 由Z 2 1 96 知 Z Z 2 故不能拒绝H0 即调查结果支持了该市老年人口所占比例为14 7 的看法 8 2 4总体方差的检验设总体分布为N 2 根据 6 18 则样本方差S2的分布为 8 4 卡方 2 检验实例 例 根据长期正常生产的资料可知 某厂所产维尼纶的纤度服从正态分布 其方差为0 0025 现从某日产品中随机抽取20根 测得样本方差为0 0042 试判断该日纤度的波动与平日有无显著差异 0 05 卡方 2 检验计算结果 H0 2 0 0025H1 2 0 0025 0 05df 20 1 19临界值 s 统计量 在 0 05的水平上接受H0 有证据表明该日纤度的波动比平时没有显著差异 决策 结论 例8 9 某厂商生产出一种新的饮料瓶机器 按设计要求 该机器装一瓶1000ml的饮料误差上下不超过1ml 如果达到设计要求 表明机器的稳定性能非常好 现从该机器装完的产品中随机抽取25瓶 分别进行测定 用样本观测值分别减1000ml 得到如表8 2所示的结果 试以 0 05的显著性水平检验该机器的性能是否达到设计要求 解 这里采用双侧检验 如果样本统计量 故不能拒绝H0 认为该机器的性能达到设计要求 8 3两个总体参数的检验 8 3 1检验统计量的确定 两个总体均值之差的检验 两个总体比例之差的检验 两个总体方差比的检验 两个正态总体的检验 均值之差的检验 比例之差的检验 方差比的检验 2已知或 2未知大样本 2未知小样本 Z统计量 t统计量 Z统计量 F统计量 图8 13检验统计量的确定 8 3 2两个总体均值之差的检验 式中 1为总体1的均值 2为总体2的均值 8 5 8 10 有两种方法可用于制造某种以抗拉强度为重要特征的产品 根据以往的资料得知 第一种方法生产出产品抗拉强度的标准差为8千克 第二种方法的标准差为10千克 从两种方法生产的产品中各抽一个随机样本 样本量分别为n1 32 n2 40 测得 50千克 44千克 问这两种方法生产出来的产品平均抗拉强度是否有显著差别 0 05 解 用双侧检验 H0 1 2 0H1 1 2 0依题意 由Z 2 1 96 知 Z Z 2 所以拒绝H0 即两种方法生产出来的产品其抗拉强度有显著差异 用S1和S2来加权平均出 的值 8 6 8 7 8 8 t的自由度为n1 n2 2 改变了自由度已不是 n1 n2 2 而是v 8 10 8 9 8 11 例8 11 尽管存在争议 但大多数科学家认为 食用含有高纤维的谷类食物有助于降低癌症发生的可能性 然而有一个科学家提出 如果人们在早餐中食用高纤维的谷类食物 那么平均而言 与早餐没有食用谷物的人群相比 食用谷物者在午餐中摄取的热量 大卡 将会减少 TorontoStar 1991 如果这个观点成立 谷物食品的生产商又将获得一个很好的机会 他们会宣传说 多吃谷物吧 早上也吃 这样将有助于减肥 为了验证这个假设 随机抽取了35人 询问他们早餐和午餐的通常食谱 根据他们的食谱 将其分为两类 一类为经常的谷类食用者 总体1 一类为非经常阅类食用者 总体2 然后测度每人午餐的大卡摄取量 经过一段时间的实验 得到的结果如表8 3所示 试以 0 05的显著性水平检验 解 本例要检验的命题是 早餐食用较多的谷类食物有助于减少午餐中热量的摄取 由于此命题是一个未被证实的命题 所以在单侧检验中 原假设对此类命题应持否定态度 故有 设总体1和总体2的热量摄取量分别为 1 2H0 1 2 0H1 1 2 0 方差未知 且不相等 小样本 由 t t 故拒绝H0 例题成立 8 3 3两个总体比例之差的检验设两个总体服从二项分布 这两个总体中具有某种特征单位数的比例分别为 1和 2 但 1和 2未知 可以用样本比例p1和p2代替 我样需要考虑两种情况 检验两个总体比例相等和不相等 应分别处理 1 检验两个总体比例相等的假设H0 1 2 0 也就是 1 2 在构造统计量Z时 如何估计 我们试图用p代替 用它们的样本量作为权数把p1 p2组合起p来 样本平均比例 8 12 8 13 其中 例8 12 人们普遍认为麦当劳的主要消费群体是青少年 但对市场的进一步细分看法不同 一种观点认为小学生更喜欢麦当劳 另一种观点认为中学生对麦当劳的喜爱程度不亚于小学生 某市场调查咨询公司对此在某地区进行了一项调查 随机抽取了100名小学生和100名中学生 调查的问题是如果有麦当劳和其他中式快餐 如兰州拉面 你会首选哪种作为经常性午餐 调查结果如下 小学生 样本1 100人中有76人把麦当劳作为首选的经常性午餐 中学生 样本2 100人中有69人作出同样的选择 调查结果支持哪种观点 解 H0 1 2 0H1 1 2 0 若取 0 05作为显著性水平 则 Z 1 11 Z 2 1 96故不能拒绝原假设 也就是说 在该地区小学生和中学生对麦当劳的偏
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年春季初级经济师职业资格考试 经济基础知识押题实战模拟试卷
- 2025年高中物理力学专题冲刺试卷
- 2025年心理咨询师五级考试全真试卷 心理咨询基础技能专项训练
- 玩具生产培训知识总结课件
- 2026届安徽省泗县刘圩高级中学高二化学第一学期期中统考模拟试题含解析
- 王文婷两小儿辩日课件
- 王崧舟两小儿辩日课件
- 廉洁文化教育兴廉洁之风树浩然正气65课件
- 2026届广西钦州市第四中学化学高三上期中达标检测模拟试题含解析
- 事务管理单位片区物业采购项目方案投标文件(技术标)
- 2025年交通工程师考试试卷及答案
- 2023年白酒酿造、生产工艺、品鉴评师等知识竞赛试题库(附含答案)
- 2024-2025学年上课趣味互动《太乙惩罚》课件
- 建筑木工包工协议书
- 华为人力资源流程体系解析
- 新药研发与临床应用的试题及答案
- 《抗高血压药物》课件
- T∕DZJN80-2022数据中心用锂离子电池设备产品技术标准
- 科技创新项目的成果专家鉴定意见范文
- 私宴合同协议模板
- 粉尘定期清扫制度
评论
0/150
提交评论