假设检验总结课件_第1页
假设检验总结课件_第2页
假设检验总结课件_第3页
假设检验总结课件_第4页
假设检验总结课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章假设检验第一节假设检验的基本概念第二节参数的假设检验第三节非参数假设检验第6章假设检验第一节假设检验的基本概念假设检验在统计方法中的地位参数估计假设检验统计方法描述统计推断统计假设检验在统计方法中的地位参数估计假设检验统计方法描述统计推第一节假设检验的基本概念1、原假设和备择假设2、检验统计量3、接受域和拒绝域4、显著性水平5、双侧检验与单侧检验6、假设检验中的两类错误第一节假设检验的基本概念1、原假设和备择假设什么是假设?

(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!什么是假设?

(hypothesis)对总体参数的具体数什么是假设检验?

(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理什么是假设检验?

(hypothesistest)先对总假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的假设均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20假设检验的基本思想...因此我们拒绝假设=50..总体假设检验的过程抽取随机样本均值

x

=20我认为人口的平均年龄是50岁提出假设

拒绝假设别无选择!作出决策总体假设检验的过程抽取随机样本均值

x=原假设与备择假设原假设与备择假设原假设

(nullhypothesis)在假设检验时首先要提出一个假设,就称原假设。又称零假设或虚拟假设,通常用H0表示例如:在质量管理中假设在正常的情况下,零件的平均长度应是2厘米,就建立

原假设

(nullhypothesis)在假设检验时首先要在提出原假设的同时,还要制定另一个假设称做备择假设。原假设是待检验的假设,备择假设则是原假设被拒绝后替换的假设。因为对于任何一个假设检验问题所有可能的结果都应包含在两个假设之内,非此即彼。如上述例子中零件长度要么等于2厘米,要么不等于2厘米,备择假设通常用

表示,因此可以建立

备择假设(alternativehypothesis)在提出原假设的同时,还要制定另一个假设称做备择假设。备择假设【例】一种电子元件的生产标准是直径为0.1cm,为对生产过程进行控制,质量检测人员定期对一台加工设备检查,确定这台设备生产的电子元件是否符合标准要求。如果元件的平均直径大于或小于0.1cm,则表明生产过程不正常,必须进行调整。试建立用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

0.1cmH1:

0.1cm【例】一种电子元件的生产标准是直径为0.1cm,为对生产过【例】某厂家声称,所生产的某品牌灯管寿命不低于4000小时,经销商在对该灯管经销前,有关研究人员想通过抽检其中的一批灯管来验证该生产厂家的声称是否属实。试建立用于检验的原假设和备择假设。提出假设(例题分析)解:研究者想搜集证据予以证明的假设应该是“灯管寿命低于4000小时”。于是原假设和备择假设应设定为

H0:

4000H1:

<4000【例】某厂家声称,所生产的某品牌灯管寿命不低于4000小时,【例】一家研究机构估计,某县60岁以下人群中初中及其以下文化程度的人口所占比重超过10%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试建立用于检验的原假设与备择假设。提出假设(例题分析)解:研究者想搜集证据予以支持的假设是“该县60岁以下人群中初中及其以下文化程度的人口所占比重超过10%”。于是原假设和备择假设应设定为:

H0:

10%H1:

10%【例】一家研究机构估计,某县60岁以下人群中初中及其以下文化原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)原假设和备择假设是一个完备事件组,而且相互对立提出假设对原假设检验时必然要样本的数据来判断。对样本数据进行加工并用来判断是否接受原假设的统计量称为检验统计量。例如上面列举的原假设

那么样本均值就可以作为检验统计量,有时为了方便还将样本均值标准化为,称为Z统计量。2、检验统计量(teststatistic)对原假设检验时必然要样本的数据来判断。对样本数据进行加工并用3、接受域和拒绝域假设检验根据检验统计量的具体结果来判别是否接受H0因此在假设为真的情况下将抽样所有可能结果组成的样本空间划分为两部分:一部分是原假设为真时允许范围内的变动,应该接受原假设,因此称作接受域;另一部分是超出了一定的界限,当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域称作拒绝域。接受域和拒绝域之间的分割点通常称作临界值3、接受域和拒绝域假设检验根据检验统计量的具体结果来判别是否4、显著性水平例如:有一批产品1000件,生产商声称只有一件为次品,那么随机抽取一个进行检查时,通常不会抽到次品,因为抽中次品的概率为千分之一,但如果在一次抽取中抽到了次品,显然就有理由怀疑生产者的声称,认为1000件中只有一件次品的说法是假的。在假设检验时也是如此。我们确定了原假设为真时的可能范围为接受域,而落入拒绝域是个小概率事件。一旦落入拒绝域,就要拒绝原假设而接受备择假设。小概率常用

表示,也称显著性水平。4、显著性水平例如:有一批产品1000件,生产商声称只有一件5、双侧检验与单侧检验5、双侧检验与单侧检验假设检验根据实际的需要可以分为双侧检验和单侧检验。单侧检验分为左侧检验和右侧检验。双侧检验指客体的指标过大和过小都不符合要求,因此都需要加以检验,这时检验的拒绝域就位于图形的两侧。双侧检验与单侧检验假设检验根据实际的需要可以分为双侧检验和单侧检验。双侧检验与两类错误与显著性水平两类错误与显著性水平假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)

的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小和的关系你不能同时减少两类错误!和的关系影响的因素1. 总体参数的真值随着假设的总体参数的减少而增大2. 显著性水平当减少时增大3. 总体标准差当增大时增大4. 样本容量n当n减少时增大影响的因素1. 总体参数的真值显著性水平

(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 常用的

值有0.01,0.05,0.104. 由研究者事先确定显著性水平

(significantlevel)1. 检验统计量与拒绝域检验统计量与拒绝域决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:|统计量|

>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0决策规则给定显著性水平,查表得出相应的临界值z或z/2假设检验步骤的总结(一)提出原假设和备择假设(二)确定适当的检验统计量(三)规定显著性水平(四)计算检验统计量的值(五)作出统计决策假设检验步骤的总结(一)提出原假设和备择假设第二节参数的假设检验一、单个总体的均值检验二、单一样本的比例检验三、两个总体均值之差的检验四、两个总体比例之差的检验第二节参数的假设检验一、单个总体的均值检验一、单个总体,的检验

1、正态总体且2已知[例]某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强度为8kg,标准差为0.5kg。现从中随机抽出50条,测试结果为平均强度为7.85kg,问能否接受厂商的声称?(=0.05)解:H0:=8H1:8

-Z/20Z/2一、单个总体,的检验

1、正态总体且2已知-Z/2[例]某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强度不超过8kg,标准差为0.5kg。现从中随机抽出50条,测试结果为平均强度为8.1kg,可否认为其平均强度比8kg高?(=0.05)解:H0:8H1:>8

x0[例]某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强2、正态总体,2未知

[例]某种金属线的抗拉强度X~N(10620,2

),据说目前有所下降。为此从新生产的产品中任取10根,测得样本均值10600kg,样本标准差为81kg。可否认为其平均抗拉强度比过去下降了?(=0.05)解:H0:10620H1:<10620-1.8302、正态总体,2未知

[例]某种金属线的抗拉强度X~N(13、非正态分布或总体分布形式未知

STAT[例]一食品加工者关心500g的水果罐头是否装得太满。现随机抽取一个容量为50的样本,发现平均重量为510g,标准差为8g。试根据0.05的显著性水平检验罐头是否装得太满?解:H0:500H1:>500

1.6453、非正态分布或总体分布形式未知

STAT[例]一食品加工者二、单个总体,比例的检验STAT(一)确定假设1、H0:P=P0H1:PP0

2、H0:PP0H1:PP03、H0:PP0H1:PP0(二)检验统计量当n很大(≥30),且nP和n(1–P)两者均大于等于5时,二、单个总体,比例的检验STAT(一)确定假设STAT[例]据以往调查,购买某企业产品的顾客中30岁以上的男子占50%。该企业关心这个比例是否有变,于是随机抽取400名顾客进行调查,结果有210人为30岁以上的男子。该厂希望在0.05的显著性水平下检验这个比例是否有变。解:H0:P=50%H1:P50%

-1.961.96STAT[例]据以往调查,购买某企业产品的顾客中30岁以上的三、两个总体平均数之差的假设检验

STAT(一)确定假设1、H0:1–2=0H1:1–202、H0:1–20H1:1–203、H0:1–20H1:1–2

0(二)确定检验统计量正态总体、2未知但相等三、两个总体平均数之差的假设检验

STAT(一)确定假设正态STAT[例]两种方法生产的产品抗拉强度都近似服从正态分布。方法1的标准差1=6kg,方法2的标准差2=8kg。现从方法1和方法2生产的产品中分别抽取容量为12、16的样本,其样本均值分别40kg和34kg。管理部门想知道这两种方法生产出来的产品的平均抗拉强度是否相同(=0.05)建立假设:H0:1–2=0H1:1–20STAT[例]两种方法生产的产品抗拉强度都近似服从正态分布。四、两个总体比率之差的假设检验STAT(一)确定假设1、H0:P1=P2H1:P1P2

2、H0:P1P2H1:P1P23、H0:P1P2H1:P1P2(二)检验统计量当n很大(>30),且np和n(1–p)两者均大于5时,四、两个总体比率之差的假设检验STAT(一)确定假设STAT[例]一保险机构称,对于新出台的某一险种,沿海地区的人们的喜爱程度要高于内地的人们。为此进行的一次抽样调查显示:沿海和内地人们的喜爱程度分别为0.65、0.55,样本容量为300、400人。可否认为沿海比内地更喜爱这一险种(=0.01)。建立假设:H0:P1

P20

H1:P1P20STAT[例]一保险机构称,对于新出台的某一险种,沿海地区的第三节非参数检验一、什么是非参数假设检验1.非参数检验:它泛指参数假设检验以外的各种检验。2.非参数检验的特点·非参数检验不依赖于总体分布。·非参数假设检验适用于较低的计量水平,如等级、顺序的计量等。·常常用于参数以外的检验,如随机变量是否服从某种规律、某种分布的拟合优度检验,数据是否随机的游程检验等。3.由于非参数检验只应用于顺序等计量,没有充分利用信息,其效率不如参数检验,有些数据可以同时使用参数检验和非参数检验。第三节非参数检验一、什么是非参数假设检验二、χ2检验(一)分类数据的拟合优度检验1.如何探讨数据规律显示数据规律性的方法:频数分布表,能否了解数据来自某一分布或与某一理论分布相一致的程度如何?——χ2检验直方图和统计量的检测可能给出了一些探索性的假设。然而,这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验(χ2)。拟合优度的卡方检验的假设为:H0:抽样数据来自于一个特殊的分布(如正态分布)H1:抽样数据不是来自于这个特殊的分布二、χ2检验(一)分类数据的拟合优度检验2.利用χ2进行拟合优度检验的步骤第一步,先将观测到的数据分类,假设分成m类,每类中的频数为,或记为i(i=1,2,…,m)。第二步:根据观测结果似乎服从某一理论分布的规律,需要进一步检验。按照理论分布,各类的频数应为ei=nPi(i=1,2,…,m),其中Pi为根据理论分布,观测发生在第i类的概率。第三步:计算统计量如果理论分布的参数是预先给定的(已知的),则χ2统计量服从自由度为m-1的χ2分布。若理论分布的参数是未知的,需要用样本观测值来估计时,χ2统计量服从自由度为m-r-1的χ2分布,其中r为需要估计的参数的个数。第四步:根据显著性水平a查χ2分布表求相应的临界值χ2

a。χ2>χ2

a时,拒绝原假设,说明样本观测并非来自该理论分布。2.利用χ2进行拟合优度检验的步骤第一步,先将观测到的数据分例题分析p184-185例6.10和6.11例题分析p184-185例6.10和6.11(二)χ2分布的独立性检验在独立性检验中的χ2统计量为其中(二)χ2分布的独立性检验在独立性检验中的χ2统计量为例题分析p187例6.12例题分析p187例6.12或者用公式或者用公式例题分析p189例6.13例题分析p189例6.13三、秩和检验(等级和检验)当总体不符合正态分布时,转换成等级,然后检验,这一类的检验统称为秩和检验。(一)曼-惠特尼U检验它假设两个样本分别来自两个总体,目的是检验这两个总体的均值是否有显著的差别。三、秩和检验(等级和检验)当总体不符合正态分布时,转换成等级2.具体步骤第一步:把两组数据混和在一起,按照大小顺序编排等级。最小的为1,其次为2等等,两个数据和三个数据相等如何处理?若有两个数据相等,且它们在按大小顺序编排好的数列里是第m和第m+1个数据,则它们的等级(也称作秩)都是m+(m+1)/2=2m+1/2。同理,若有3个数据相等,且它们在按大小顺序编排好的数据列里第m,第m+1和第m+2位数据,则它们的等级都是3m+3/3=m+1。第二步:分别求两个样本的等级和。设第一个样本的等级和为W1,第二个样本的等级和为W2,则有W1+W2=n(n+1)/2。第三步:计算曼-惠特尼U检验统计量2.具体步骤第一步:把两组数据混和在一起,按照大小顺序编排等第四步:作出判断对于n1n2都比较小的情形,可以查附表6得到临界值Ua,在U<Ua时拒绝H0:。在原假设为真的情况下,可以证明随机变量U的均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论