第三讲:假设检验_第1页
第三讲:假设检验_第2页
第三讲:假设检验_第3页
第三讲:假设检验_第4页
第三讲:假设检验_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲:假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验假设检验的基本问题假设问题的提出假设的表达式两类错误假设检验中的值假设检验的另一种方法单侧检验假设检验的概念与思想什么是假设?

(hypothesis)

对总体参数的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!什么是假设检验?

(hypothesistesting)事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立有参数假设检验和非参数假设检验采用逻辑上的反证法,依据统计上的小概率原理假设检验的基本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20总体

假设检验的过程抽取随机样本均值

X=20

我认为人口的平均年龄是50岁提出假设

拒绝假设!

别无选择.作出决策假设检验的步骤提出假设确定适当的检验统计量规定显著性水平

计算检验统计量的值作出统计决策提出原假设和备择假设

什么是原假设?(nullhypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3. 总是有等号

,

4. 表示为H0H0:

某一数值指定为=号,即

例如,H0:

3190(克)

什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:

,

表示为H1H1:

<某一数值,或

某一数值例如,H1:

<3910(克),或

3910(克)提出原假设和备择假设

什么检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量规定显著性水平

(significantlevel)

什么显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为

(alpha)常用的值有0.01,0.05,0.104. 由研究者事先确定作出统计决策计算检验的统计量根据给定的显著性水平

,查表得出相应的临界值z

或z/2,t

或t/2将检验统计量的值与

水平的临界值进行比较得出拒绝或不拒绝原假设的结论假设检验中的小概率原理假设检验中的小概率原理

什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定假设检验中的两类错误(决策风险)假设检验中的两类错误1. 第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为

被称为显著性水平2. 第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为

(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H0正确决策(1–a)第二类错误(b)拒绝H0第一类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程

错误和

错误的关系

你不能同时减少两类错误!

和的关系就像翘翘板,小就大,大就小假设检验中的

P值什么是P值?

(P-value)是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0

能被拒绝的最小值双侧检验的P值

/

2

/

2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-

置信水平计算出的样本统计量P值右侧检验的P值H0值临界值a拒绝域抽样分布1-

置信水平计算出的样本统计量P值利用P值进行检验

(决策准则)单侧检验若p-值>

,不拒绝H0若p-值<

,拒绝H0双侧检验若p-值>

/2,不拒绝H0若p-值</2,拒绝H0双侧检验与单侧检验

(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0双侧检验

(原假设与备择假设的确定)例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为

H0:

=10H1:

10双侧检验

(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域1-

置信水平双侧检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-

置信水平双侧检验

(显著性水平与拒绝域)H0值临界值临界值

a/2a/2

样本统计量拒绝域拒绝域抽样分布1-

置信水平双侧检验

(显著性水平与拒绝域)H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域抽样分布1-

置信水平单侧检验

(原假设与备择假设的确定)将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1单侧检验

(原假设与备择假设的确定)一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为

H0:

1500H1:

1500单侧检验

(原假设与备择假设的确定)某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“<”(寿命不足1000小时)建立的原假设与备择假设应为

H0:

1000H1:

<1000单侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-

置信水平左侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-

置信水平观察到的样本统计量左侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-

置信水平右侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-

置信水平观察到的样本统计量右侧检验

(显著性水平与拒绝域)H0值临界值a样本统计量抽样分布1-

置信水平拒绝域一个正态总体参数的检验检验统计量的确定总体均值的检验总体比例的检验总体方差的检验一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差总体均值检验总体均值的检验

(检验统计量)总体是否已知?用样本标准差S代替t检验小样本容量n否是z检验

z检验大总体均值的检验

(

2

已知或

2未知大样本)1. 假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n

30)使用Z-统计量

2

已知:

2

未知:

2

已知均值的检验

(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为

0=0.081mm,总体标准差为

=0.025

。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(

=0.05)双侧检验

2

已知均值的检验

(例题分析)H0:

=0.081H1:

0.081

=

0.05n

=

200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:

=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异总体均值的检验

(

2未知小样本)1. 假定条件总体为正态分布

2未知,且小样本2. 使用t

统计量

2

未知小样本均值的检验

(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验

2

未知小样本均值的检验

(例题分析)H0:

=5H1:

5

=0.05df=10-1=9临界值(s):检验统计量:在

=0.05的水平上拒绝H0说明该机器的性能不好

决策:结论:t02.262-2.262.025拒绝H0拒绝H0.025

2

未知小样本均值的检验

(例题分析)

【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(

=0.05)单侧检验!均值的单尾t检验

(计算结果)H0:

40000H1:

<40000

=0.05df=20-1=19临界值(s):检验统计量:

=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符决策:

结论:

-1.7291t0拒绝域.05总体比例的检验

(Z

检验)适用的数据类型离散数据

连续数据数值型数据数据分类数据一个总体比例检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量

0为假设的总体比例一个总体比例的检验

(例题分析)【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(

=0.05)双侧检验一个总体比例的检验

(例题分析)H0:

=14.7%H1:

14.7%

=0.05n

=400临界值(s):检验统计量:在

=0.05的水平上不拒绝H0该市老年人口比重为14.7%决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差两个正态总体参数的检验检验统计量的确定两个总体均值之差的检验两个总体比例之差的检验检验中的匹配样本两个正态总体参数的检验两个总体的检验Z

检验(大样本)t

检验(小样本)t

检验(小样本)Z检验F

检验独立样本配对样本均值比例方差独立样本总体均值之差的检验两个独立样本之差的抽样分布m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布两个总体均值之差的检验

(

12、

22

已知)1. 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n1

30和n2

30)检验统计量为两个总体均值之差的检验

(假设的形式)假设研究的问题没有差异有差异均值1

均值2均值1<均值2均值1

均值2均值1>均值2H0

1–

2=0

1–

2

0

1–

2

0H1

1–

2

0

1–

2<0

1–

2>0两个总体均值之差的检验

(例题分析)

双侧检验!【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得

x2=50公斤,

x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(

=0.05)两个总体均值之差的检验

(例题分析)H0:

1-

2=0H1:

1-

2

0

=

0.05n1

=32,n2

=40临界值(s):检验统计量:决策:结论:

=0.05的水平上拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025两个总体均值之差的检验

(

12、

22

未知且不相等,小样本)检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等

12

22检验统计量其中:两个总体均值之差的检验

(

12、

22

未知但相等,小样本)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等

12=22检验统计量两个匹配(或配对)样本的均值检验两个总体均值之差的检验

(匹配样本的t

检验)1. 检验两个总体的均值配对或匹配重复测量(前/后)3. 假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1

30,n2

30)匹配样本的t

检验

(假设的形式)假设研究的问题没有差异有差异总体1

总体2总体1<总体2总体1

总体2总体1>总体2H0mD=0mD

0mD

0H1mD

0mD<0mD>0注:Di=X1i-X2i

,对第i对观察值匹配样本的t

检验

(数据形式)

观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n匹配样本的t

检验

(检验统计量)样本差值均值样本差值标准差自由度df=nD-1统计量D0:假设的差值匹配样本的t

检验

(例题分析)【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:在

=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102单侧检验样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t

检验

(例题分析)配对样本的t

检验

(例题分析)差值均值差值标准差配对样本的t

检验

(例题分析)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论