医学]山西财大统计学第6章假设检.ppt_第1页
医学]山西财大统计学第6章假设检.ppt_第2页
医学]山西财大统计学第6章假设检.ppt_第3页
医学]山西财大统计学第6章假设检.ppt_第4页
医学]山西财大统计学第6章假设检.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 假设检验 (Hypothesis testing) 本章主要内容: 假设检验的基本原理 总体参数的假设检验 假设检验的两类错误与功效 一、基本概念 对总体未知的分布函数形式或分布中的 未知参数做出某种假设,然后抽取样本,根 据样本提供的信息去验证这一假设是否成立 的过程,称为假设检验。 第一节 假设检验的基本原理 二、假设检验的基本原理 小概率原理小概率原理 如果对总体的某种假设是真实的,那么不如果对总体的某种假设是真实的,那么不 利于或不能支持这一假设的事件利于或不能支持这一假设的事件A A(小概率事(小概率事 件)在一次试验中是几乎不可能发生的;要是件)在一次试验中是几乎不可能发生的;要是 在一次试验中在一次试验中A A竟然发生了,就有理由怀疑该竟然发生了,就有理由怀疑该 假设的真实性,拒绝这一假设。假设的真实性,拒绝这一假设。 抽样 检 验 (接受)(拒绝) 小概率事件小概率事件 未未 发发 生生 小概率事件小概率事件 发发 生生 总总 体体 某种假设某种假设 样本样本 观察结果观察结果 显著水平 临界值 三、假设检验的基本思想 例例 某企业生产一种零件,过去的大量资料表某企业生产一种零件,过去的大量资料表 明,零件的平均长度为明,零件的平均长度为4 4厘米,标准差为厘米,标准差为0.10.1 厘米。改革工艺后,抽查了厘米。改革工艺后,抽查了100100个零件,测得个零件,测得 样本平均长度为样本平均长度为3.953.95厘米。现问:工艺改革厘米。现问:工艺改革 前后零件的长度是否发生了显著的变化?前后零件的长度是否发生了显著的变化? 改革工艺后总体平均长度确实发生了变化 改革工艺前后总体平均长度没变, 误差是由抽样随机性所致 分析:分析: 原来原来 = = 0 0 =4=4,抽查,抽查100100个零件得样本平均数个零件得样本平均数 这是工艺改革前后零件的平均长度(这是工艺改革前后零件的平均长度( 总体平均数总体平均数) ) 是否等于是否等于4 4的假设检验问题。的假设检验问题。 实际误差 如果不大,没有超出允许 误差范围,可认为总体平均数没有发生变化; 哪种原因? 如果 超出了允许误差范围,则认为 总体平均数发生了显著变化 本例中,本例中, 。 所以否定原假设 =4 ,即根据样样本信息,应应推断工 艺改革前后零件的平均长度发生了显著变化。 假设假设 =4=4,给给给给定定 =0.01=0.01,查查查查表得表得临临临临界界值值值值= 2.58 .= 2.58 . 计算可得计算可得 结论:假设检验是带有概率性质的反证法。 n n 反证法:先给出一个假设,根据样本信息推断假设反证法:先给出一个假设,根据样本信息推断假设 是否合理,合理就接受,不合理就拒绝。是否合理,合理就接受,不合理就拒绝。 n n 合理与否的依据:合理与否的依据:“ “小概率事件在一次抽样中不可小概率事件在一次抽样中不可 能发生能发生” ”。小概率事件没有发生,认为合理;发生。小概率事件没有发生,认为合理;发生 了,认为不合理。了,认为不合理。 n n “ “合理与否合理与否” ”不是绝对的,它是概率意义下的合理与不是绝对的,它是概率意义下的合理与 否,依给定的显著性水平否,依给定的显著性水平 而变化。而变化。 四、假设四、假设 检验步骤检验步骤 建立总体假设 H0,H1 抽样得到样 本观察值 选择统计量 确定H0为真 时的抽样分布 根据具体决策 要求确定 计算检验统 计量的数值 确定分布上 的临界点 比较并作出 检验判断 ( (一一) ) 建立假设建立假设 n n 对于每一个要检验的问题,要同时提出两个对于每一个要检验的问题,要同时提出两个 相互对立的假设:原假设和备择假设相互对立的假设:原假设和备择假设 n n 原假设是被检验的主体,一般是指检验者有原假设是被检验的主体,一般是指检验者有 可能推翻,但没有充分的根据就不能轻易推翻可能推翻,但没有充分的根据就不能轻易推翻 的假设,用的假设,用 H H0 0 表示; 表示; n n 备择假设是原假设的对立面,在原假设被推备择假设是原假设的对立面,在原假设被推 翻时所接受的假设,用翻时所接受的假设,用 H H1 1 表示。 表示。 1双侧检验 n n 样本统计量的值明显大于样本统计量的值明显大于0 0 , ,或明显小于或明显小于 0 0 ,二者之一成立,就可以拒绝原假设。,二者之一成立,就可以拒绝原假设。 (1 1)左侧检验)左侧检验 2单侧检验 n n 样本统计量明显小于假设的总体参数时,样本统计量明显小于假设的总体参数时, 拒绝原假设。显著性水平拒绝原假设。显著性水平分布在左侧。分布在左侧。 (2 2)右侧检验)右侧检验 n n 样本统计量明显大于假设的总体参数时,样本统计量明显大于假设的总体参数时, 拒绝原假设。显著性水平拒绝原假设。显著性水平分布在右侧分布在右侧 。 (二)确定检验统计量,同时计算出它的值 n n 在此我们只讨论简单随机组织方式下重复抽在此我们只讨论简单随机组织方式下重复抽 样的假设检验问题。样的假设检验问题。 n n 根据样本统计量的抽样分布确定检验统计量根据样本统计量的抽样分布确定检验统计量 正态分布正态分布 z z 统计量统计量 t t 分布分布 t t 统计量统计量 分布分布 统计量统计量 (三)规定显著性水平 ,查表得到临界值 n n 显著性水平是假设检验中判断样本统计量与显著性水平是假设检验中判断样本统计量与 总体参数是否有显著差异的标准,用总体参数是否有显著差异的标准,用表示表示 。常用的有。常用的有=0.100.10,=0.050.05,=0.010.01等。等。 n n =0.050.05的的含义:假设总体参数是正确的,则含义:假设总体参数是正确的,则 样本统计量与总体参数差异过大者,每样本统计量与总体参数差异过大者,每100100个个 样本中不超过样本中不超过5 5个,即样本统计量与总体参数个,即样本统计量与总体参数 差异过大这一事件的概率小于差异过大这一事件的概率小于5 5。 (四)做出统计决策 n n 将检验统计量的值与在显著性水平将检验统计量的值与在显著性水平下分布下分布 的临界值进行比较,作出接受或拒绝原假设的临界值进行比较,作出接受或拒绝原假设 的统计决策。的统计决策。 1 1双侧检验双侧检验 2 2左侧检验左侧检验 3. 3. 右侧检验右侧检验 第二节 总体参数的检验 1.1.单一总体均值的检验单一总体均值的检验 假设 H0: =0 H1: 0( (或或 0 0 或或 7.6 由 计算得检验统计量Z的值为 : 对显著性水平 =0.01,查标准正态分布表得Z =Z0.01=2.33,由于 Z=2.982.33=Z ,所以拒绝原假 设,接受备择假设,认为该市人均居住面积有所增 大。 【例6-2】 某贸易公司用自动装袋机将一批 名茶装袋,在正常情况下,平均每袋的重量 为500克,从某天所包装的茶叶中随机抽取了 8袋,测得每袋的重量(克)为:495,501, 502,495,500,497,502,499,问在0.05 的显著性水平下,从所装茶叶的平均重量来 看装袋机运行是否正常? 解:根据题意可建立原假设和备择假设如下: H0: 500, H1: 500 由于总体方差2未知,所以应该用 t 检验,计算得: 对=0.05,查查表可得t/2(n-1)=t 0.025(7)2.36, 由于|t|=1.082或12或12.02 = t0.025(38), 所以 拒绝原假设,即认为市区、郊区两居民区的家庭平均 每月生活消费支出有差异。 1.1.单一总体比例的检验单一总体比例的检验 假设 H0: P=P0 H1: P P0( (或或P P P P 0 0 或或P PP2或P1 P2 n1=80、 n2=70为大样本,计算可得 p1 =32/80=40%, p2=21/70=30%,总体比例的联合估计量为 检验统计量 对于给定的显著性水平=0.01,查标准正态分布 表可得Z 0.01=2.33,由于 Z=1.28 25 2 检验统计量的值为 此例为右侧检验,对于显著性水平 ,查查 分布表 得临临界值值 由于 所以接受假设,即认为农科院专家的承诺标准已经 达到。 第三节 假设检验的两类错误 与检验功效 检验检验检验检验 决策决策HH 0 0 真真HH 0 0 不真不真 拒拒绝绝绝绝HH 0 0 第第类错误类错误类错误类错误正确正确 接受接受HH 0 0 正确正确第第类错误类错误类错误类错误 一、假设检验的两类错误一、假设检验的两类错误 假设检验的第一类错误又称假设检验的第一类错误又称弃真错误弃真错误,它是指原,它是指原 假设假设HH 0 0 正确但却被拒绝了的错误。正确但却被拒绝了的错误。 犯第一类错误的概率为犯第一类错误的概率为 P P 拒绝拒绝HH 0 0 H H 0 0 为真为真 = 假设检验的第二类错误又称假设检验的第二类错误又称纳伪错误纳伪错误,它是指原,它是指原 假设不正确但却接受原假设的错误。假设不正确但却接受原假设的错误。 犯第二类错误的概率犯第二类错误的概率 PP接受接受HH 0 0 H H 0 0 不真不真 = H0: 0 H1: 0 与 的大小关系: 降低其中一个,必使另一个 变大。 临界值 H0: 0 H1: = 1 0 P P 接受接受HH 0 0 HH 0 0 不真不真 二、假设检验的功效二、假设检验的功效 假设检验的功效是指备择假设假设检验的功效是指备择假设HH 1 1 为真时,为真时, 接受备择假设接受备择假设HH 1 1 的概率。的概率。 PP接受接受 HH 1 1 H H 1 1 为真为真 =1 =1PP拒绝拒绝HH 1 1 H H 1 1 为真为真 = 1 = 1 P P接受接受HH 0 0 H H 0 0 不真不真 = 假设检验的功效可以判别该假设检验的优劣。假设检验的功效可以判别该假设检验的优劣。 功效函数,功效曲线 注:(1)无论是单侧检验还是双侧检验, 备择假设值与原假设值的偏离程度越大,犯 第二类错误的概率越小,从而检验的功效1- 越大;反之,备择假设值与原假设值的偏 离程度越小,犯第二类错误的概率越大, 从而检验的功效1-越小。 (2)对于 Z 检验统计量和 t 检验统计量而 言,双侧检验的功效曲线是对称的,即备 择假设值从正负两个方向与原假设值的偏 离程度相同时,检验的功效也相同。 三、区间估计与假设检验的关系三、区间估计与假设检验的关系 区别:区别: 1. 1.推断的目的不同推断的目的不同 2. 2.关注的概率不同关注的概率不同 3. 3.结果的形式不同结果的形式不同 4. 4.推断的思想不同推断的思想不同 联系:联系: 1. 1.依据的都是样本信息及同样的抽样分布定理依据的都是样本信息及同样的抽样分布定理 2. 2.都是概率意义下的统计推断,都有不确定性都是概率意义下的统计推断,都有不确定性 3. 3.两者可相互转换两者可相互转换 四、假设检验的四、假设检验的P P值值 1. 1.影响假设检验推断结果的因素影响假设检验推断结果的因素 检验统计量的值检验统计量的值C C 显著性水平显著性水平 临临界值界值 例如,在例例如,在例6-16-1中,中, 检验统计量的值检验统计量的值Z=2.98Z=2.98, =0.01 =0.01 时,结论如何?时,结论如何? =0.00135 =0.00135 时,结论又如何?时,结论又如何? 0.001441 0.001441 时,拒绝原假设;时,拒绝原假设; 0.0014410.001441时,接受原假设。时,接受原假设。 C 定义:通常把定义:通常把 “ “拒绝原假设的最小显著水平拒绝原假设的最小显著水平” ” 称为假设检验的称为假设检验的P P值。值。 一般地,用一般地,用表示检验统计量,当表示检验统计量,当H H 0 0 为为 真时,可由样本数据计算出该统计量的值真时,可由样本数据计算出该统计量的值C C ,根据检验统计量的具体分布,可求出,根据检验统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论