概率论第8章假设检验_第1页
概率论第8章假设检验_第2页
概率论第8章假设检验_第3页
概率论第8章假设检验_第4页
概率论第8章假设检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计数理统计 假设检验的基本思想和方法假设检验的基本思想和方法假设检验的一般步骤假设检验的一般步骤假设检验的两类错误假设检验的两类错误课堂练习课堂练习小结小结 布置作业布置作业第一节第一节 假设检验假设检验 数理统计数理统计 第八章第八章 假假 设设 检检 验验 数理统计数理统计 这类问题称作假设检验问题这类问题称作假设检验问题 . 在本节中,我们将讨论不同于参数估计的另一在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题类重要的统计推断问题. 这就是这就是根据样本的信息检验根据样本的信息检验关于总体的某个假设是否正确关于总体的某个假设是否正确.一、假设检验的基本思想和方法一、假

2、设检验的基本思想和方法数理统计数理统计 生产流水线上罐装可生产流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运. 怎么知道这批罐装怎么知道这批罐装可乐的容量是否合格呢?可乐的容量是否合格呢?例例1:罐装可乐的标准容量是罐装可乐的标准容量是355毫升毫升数理统计数理统计 例例2(医疗领域医疗领域)为了检验某种新疗法是否比传统为了检验某种新疗法是否比传统疗法更有效,对疗法更有效,对40名患者进行实验。把病人分名患者进行实验。把病人分成两组,每组成两组,每组20人,第一组采用新疗法,第二人,第一组采用新疗法,第二组采用传统疗法。从治疗结果表中,我们能否组采用传统疗法。从治疗结果表中

3、,我们能否认为新疗法比传统疗法更有效?即第一组的康认为新疗法比传统疗法更有效?即第一组的康复人数比第二组多的原因是因为新疗法效果更复人数比第二组多的原因是因为新疗法效果更好,还是由随机因素引起的?好,还是由随机因素引起的?疗法康复未康复新疗法128传统疗法911数理统计数理统计 例例3 从某校从某校2004年年250名应届毕业生的高考成绩名应届毕业生的高考成绩中随机抽取了中随机抽取了50个,问能否根据这个,问能否根据这50个成绩判个成绩判断该校在断该校在2004年高考成绩服从正态分布?年高考成绩服从正态分布? 以上实际例子的解决都需要我们根据以上实际例子的解决都需要我们根据问题本身提出假设,然

4、后根据样本的信息问题本身提出假设,然后根据样本的信息对假设进行检验,最后作出对假设进行检验,最后作出“是是”与与“否否”的判断。的判断。数理统计数理统计 假设检验假设检验参数假设检验参数假设检验非参数假设检验非参数假设检验这类问题称作假设检验问题这类问题称作假设检验问题 .总体分布已总体分布已知,检验关知,检验关于未知参数于未知参数的某个假设的某个假设总体分布未知时的假设检验问题总体分布未知时的假设检验问题 在本节中,我们将讨论不同于参数估计的另一在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题类重要的统计推断问题. 这就是这就是根据样本的信息检验根据样本的信息检验关于总体的某个假

5、设是否正确关于总体的某个假设是否正确.一、假设检验的基本思想和方法一、假设检验的基本思想和方法数理统计数理统计 让我们先看一个例子让我们先看一个例子.这一章我们讨论对参数的假设检验这一章我们讨论对参数的假设检验 .数理统计数理统计 生产流水线上罐装可乐不生产流水线上罐装可乐不断地封装,然后装箱外运断地封装,然后装箱外运. 怎怎么知道这批罐装可乐的容量是么知道这批罐装可乐的容量是否合格呢?否合格呢?把每一罐都打开倒入量杯把每一罐都打开倒入量杯, 看看看容量是否合于标准看容量是否合于标准. 这样做显然不这样做显然不行!行!罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升

6、之间毫升之间.数理统计数理统计 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐 . 如每隔如每隔1小时,抽小时,抽查查5罐,得罐,得5个容量的值个容量的值x1,x5,根据这些值,根据这些值来判断生产是否正常来判断生产是否正常. 如发现不正常,就应停产,找出原因,排除如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量时间再抽样,以此监督生产,保证质量.通常的办法是进行抽样检查通常的办法是进行抽样检查.数理统计数理统计 很明显,不能由很明显,不能由5罐容量的数据,在把握不大罐容量的数据,在把

7、握不大的情况下就判断生产的情况下就判断生产 不正常,因为停产的损失是不正常,因为停产的损失是很大的很大的. 当然也不能总认为正常,有了问题不能及时当然也不能总认为正常,有了问题不能及时发现,这也要造成损失发现,这也要造成损失. 如何处理这两者的关系,假设检验面对的就如何处理这两者的关系,假设检验面对的就是这种矛盾是这种矛盾.数理统计数理统计 在正常生产条件下,由于种种随机因素的影响,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在每罐可乐的容量应在355毫升上下波动毫升上下波动. 这些因素这些因素中没有哪一个占有特殊重要的地位中没有哪一个占有特殊重要的地位. 因此,根据中因此,根据

8、中心极限定理,假定每罐容量服从正态分布是合理的心极限定理,假定每罐容量服从正态分布是合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫升之间毫升之间.数理统计数理统计 它的对立假设是:它的对立假设是:称称h0为原假设为原假设(或零假设,解消假设);(或零假设,解消假设);称称h1为备选假设为备选假设(或对立假设)(或对立假设).在实际工作中,在实际工作中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设. 0 h0:( = 355)0 h1:0 这样,我们可以认为这样,我们可以认为x1,x5是取自

9、正态是取自正态总体总体 的样本,的样本,),(2 n是一个常数是一个常数. 2 当生产比较稳定时,当生产比较稳定时,现在要检验的假设是:现在要检验的假设是:数理统计数理统计 那么,如何判断原假设那么,如何判断原假设h0 是否成立呢?是否成立呢?较大、较小是一个相对的概念,合理的界限在何较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?处?应由什么原则来确定?由于由于 是正态分布的期望值,它的估计量是样本是正态分布的期望值,它的估计量是样本均值均值 ,因此,因此 可以根据可以根据 与与 的差距的差距x 0 来判断来判断h0 是否成立是否成立.x- |0 较小时,可以认为较小时,可

10、以认为h0是成立的;是成立的;当当x- |0 生产已不正常生产已不正常.当当较大时,应认为较大时,应认为h0不成立,即不成立,即- |x|0 数理统计数理统计 问题归结为对差异作定量的分析,以确定其性质问题归结为对差异作定量的分析,以确定其性质.差异可能是由抽样的随机性引起的,称为差异可能是由抽样的随机性引起的,称为“抽样误差抽样误差”或或 随机误差随机误差这种误差反映偶然、非本质的因素所引起的随机这种误差反映偶然、非本质的因素所引起的随机波动波动.数理统计数理统计 然而,这种随机性的波动是有一定限度的,然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样如果差异超

11、过了这个限度,则我们就不能用抽样的随机性来解释了的随机性来解释了.必须认为这个差异反映了事物的本质差别,即必须认为这个差异反映了事物的本质差别,即反映了生产已不正常反映了生产已不正常.这种差异称作这种差异称作“系统误差系统误差”数理统计数理统计 问题是,根据所观察到的差异,如何判断问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实它究竟是由于偶然性在起作用,还是生产确实不正常?不正常?即差异是即差异是“抽样误差抽样误差”还是还是“系统误差系统误差”所引所引起的?起的?这里需要给出一个量的界限这里需要给出一个量的界限 .数理统计数理统计 问题是:如何给出这个量的界限?问

12、题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验小概率事件在一次试验中基本上不会发生中基本上不会发生 .数理统计数理统计 现在回到我们前面罐装可乐的例中:现在回到我们前面罐装可乐的例中:在提出原假设在提出原假设h0后,如何作出接受和拒绝后,如何作出接受和拒绝h0的结的结论呢?论呢? 在假设检验中,我们称这个小概率为在假设检验中,我们称这个小概率为显著性水显著性水平平,用,用 表示表示. 常取常取 的选择要根据实际情况而定。的选择要根据实际情况而定。 .05. 0,01. 0, 1 . 0 数理统计数理统计 下面,我

13、们再结合例子,进一步说明假设检验下面,我们再结合例子,进一步说明假设检验的一般步骤的一般步骤 .二、假设检验的一般步骤二、假设检验的一般步骤提出提出h0在在h0成立成立时时构造构造统计量和统计量和小概率事件小概率事件a 进行1次试验或抽样试验或抽样若若a发生发生推翻推翻h0 若a没发生没发生接受接受h0基本步骤:基本步骤:数理统计数理统计 罐装可乐的容量按标准应在罐装可乐的容量按标准应在350毫升和毫升和360毫毫升之间升之间. 一批可乐出厂前应进行抽样检查,现抽一批可乐出厂前应进行抽样检查,现抽查了查了n 罐,测得容量为罐,测得容量为 x1,x2,xn,问这一批可问这一批可乐的容量是否合格?

14、乐的容量是否合格?数理统计数理统计 (1) 提出假设提出假设(2) 选检验统计量选检验统计量nxu0 n(0,1)|uuph0: = 355 h1: 355由于由于 已知,已知, 它能衡量差异它能衡量差异大小且分布已知大小且分布已知 .|0 x(3)对给定的显著性水平对给定的显著性水平 ,可以在可以在n(0,1)表中查表中查到分位点的值到分位点的值 ,使,使u 数理统计数理统计 (4)故我们可以取拒绝域为故我们可以取拒绝域为:也就是说也就是说,“uu|”是一个小概率事件是一个小概率事件.w:uu|(5)如果由样本值算得该统计量的实测值落入区如果由样本值算得该统计量的实测值落入区域域w,则拒绝,

15、则拒绝h0 ;否则,不能拒绝;否则,不能拒绝h0 .|uup数理统计数理统计 如果如果h0 是对的,那么衡量差异大小的某个统计是对的,那么衡量差异大小的某个统计量落入区域量落入区域 w(拒绝域拒绝域) 是个小概率事件是个小概率事件. 如果该统如果该统计量的实测值落入计量的实测值落入w,也就是说,也就是说, h0 成立下的小概成立下的小概率事件发生了,那么就认为率事件发生了,那么就认为h0不可信而否定它不可信而否定它. 否否则我们就不能否定则我们就不能否定h0 (只好接受它)(只好接受它).这里所依据的逻辑是:这里所依据的逻辑是:数理统计数理统计 不否定不否定h0并不是肯定并不是肯定h0一定对,

16、而只是一定对,而只是说差异还不够显著,还没有达到足以否定说差异还不够显著,还没有达到足以否定h0的程度的程度 .所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”数理统计数理统计 如果显著性水平如果显著性水平 取得很小,则拒绝域取得很小,则拒绝域 也会比较小也会比较小. 其产生的后果是:其产生的后果是: h0难于被拒绝难于被拒绝.如果在如果在 很小的情况下很小的情况下h0仍被拒绝了,则说明实际情仍被拒绝了,则说明实际情况很可能与之有显著差异况很可能与之有显著差异.01. 0基于这个理由,人们常把基于这个理由,人们常把 时拒绝时拒绝h0称为称为是是显著显著的,而把在的,而把在 时拒绝时拒绝

17、h0称为是称为是高度高度显著显著的的.05. 0数理统计数理统计 下面,我们再结合另一个例子,进一步说明假下面,我们再结合另一个例子,进一步说明假设检验的一般步骤设检验的一般步骤 .二、假设检验的一般步骤二、假设检验的一般步骤提出提出h0在在h0成立成立时时构造构造统计量和统计量和小概率事件小概率事件a 进行1次试验或抽样试验或抽样若若a发生发生推翻推翻h0 若a没发生没发生接受接受h0基本步骤:基本步骤:数理统计数理统计 设总体设总体),(2 n关于总体参数关于总体参数2,讨论讨论4种假设检验:种假设检验:1. 方差已知,检验假设方差已知,检验假设 00:h2.方差未知,检验假设方差未知,检

18、验假设00:h3.期望已知,检验假设期望已知,检验假设2020:h4.期望未知,检验假设期望未知,检验假设2020:h三、一个正态总体的假设检验三、一个正态总体的假设检验 数理统计数理统计 例例2 某工厂生产的一种螺钉,标准要求长度是某工厂生产的一种螺钉,标准要求长度是32.5毫米毫米. 实际生产的产品,其长度实际生产的产品,其长度x 假定服从正态分布假定服从正态分布 若若 =1.21,现从该厂生产的一批产品中,现从该厂生产的一批产品中抽取抽取6件件, 得尺寸数据如下得尺寸数据如下:),(2 n2 32.56, 29.66, 31.64, 30.00, 31.87, 31.03问这批产品是否合

19、格问这批产品是否合格?(0.05)若若 未知,问这批产品是否合格?未知,问这批产品是否合格?2 (0.01)数理统计数理统计 提出原假设和备择假设提出原假设和备择假设 5 .32:5 .32:10 hh第一步:第一步:第二步:第二步:取一检验统计量,在取一检验统计量,在h0成立下成立下求出它的分布求出它的分布32.5(0,1)1.16xun 已知已知 x21.21 2( ,),n 数理统计数理统计 第三步:第三步: 对给定的显著性水平对给定的显著性水平 = =0.05,查表确定,查表确定 |puu 可得否定域可得否定域 w: |u |1.961.96u 其中其中第四步第四步:将样本值代入算出统

20、计量将样本值代入算出统计量 u 的实测值的实测值, , 最后可以下结论否定最后可以下结论否定h0,即认为这批产品是不,即认为这批产品是不合格的。合格的。31.1332.50|3.051.961.1/6u 数理统计数理统计 提出原假设和备择假设提出原假设和备择假设 5 .32:5 .32:10 hh第一步:第一步:已知已知 x),(2 n2 未知未知.第二步:第二步:能衡量差异大小且分布已知能衡量差异大小且分布已知取一检验统计量,在取一检验统计量,在h0成立下成立下求出它的分布求出它的分布)5(65 .32tsxt(0,1)/xunsn大大样样本本利利用用= = (1)/xtt nsn小小样样本

21、本利利用用 = =数理统计数理统计 第三步:第三步:即即“ ”是一个是一个小概率事件小概率事件 . )5(|2 tt 对给定的显著性水平对给定的显著性水平 = =0.01,查表确定临,查表确定临界值界值 0322. 4)5()5(005. 02 tt , ,使使)5(|2ttp得否定域得否定域 w: |t |4.0322数理统计数理统计 故不能拒绝故不能拒绝h0 ,即认为是合格品。,即认为是合格品。第四步第四步:将样本值代入算出统计量将样本值代入算出统计量 t 的实测值的实测值, ,| t |=2.9971.645故拒绝故拒绝h0 ,即认为这批推进器的燃料率较以往,即认为这批推进器的燃料率较以往生产的有显著的提高。生产的有显著的提高。 落入否定域落入否定域解解: :提出假设提出假设: : 0100:40:hh645. 105. 00unxu取统计量取统计量否定域为否定域为 w :05. 0uu =1.645数理统计数理统计 某织物强力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论