平均数差异的显著性检验_第1页
平均数差异的显著性检验_第2页
平均数差异的显著性检验_第3页
平均数差异的显著性检验_第4页
平均数差异的显著性检验_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

平均数差异的显著性检验有一家本地的饭馆为了提高午餐时间的生意而宣布举行一次活动。为了促销,有20%的机打餐单将会根据随机的原则印有一个红星,这标志着这一顿午餐是免费的。你从活动开始后已经在这个饭馆就餐了4次了,但仍然没有遇上免费午餐。你是否应该怀疑这次促销活动的真实性呢?如果你8次后仍然没有,或16次后仍然没有又该如何呢?你是应该抱怨还是将这归于坏运气呢?一、假设

假设是对总体参数的具体数值所作的陈述。总体参数包括总体均值、比率、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!假设的类型(1)虚无假设(零假设)(2)研究假设(备择假设)虚无假设定义:研究者根据样本信息期待拒绝的假设。

符号:H0

内容:假设两个均数之间的差异是抽样误差。在假设检验中将被视作已知条件应用,因此一般是一个相对比较明确的陈述命题。等号“=”一般都是放在原假设上。

表示方式也称作零假设、原假设或解消假设。虚无假设常常是根据已有的资料,或根据周密考虑后确定的,是已有的、具有稳定性的经验看法,是保守、受到保护的,没有充分根据,是不会被轻易否定的。例如,根据以往资料,某地女青年的平均初婚年龄是25岁。但今年根据100名女青年的随机抽样调查,得到的平均初婚年龄是26岁,问能否认为该地女青年的初婚年龄比以往已有所推迟?研究假设定义:研究者想收集证据予以支持的假设。符号:H1、Ha

内容:假设两均数之间存在真实的差异。备择假设作为虚无假设的对立假设而存在,因此它也是一个陈述命题。备择假设是对虚无假设的否定。表示方法:也称作备择假设、对立假设。虚无假设和备择假设的关系原假设和备择假设是一个完备事件组,而且相互对立,作假设时一定要将两个假设同时列出。由于虚无假设要作为检验的已知条件,而备择假设仅是备以待择,是虚无假设被拒绝后供人们采择的假设,故虚无假设一定在前,备择假设一定在后。但一般先确定备择假设,再确定原假设。从逻辑上看两者是非此即彼的,假设中一定有一个而且也仅有一个是正确的;两个假设不可能同时成立,但也不可能同时不成立;两个假设中若有一个被证实是错误的话,那么另一个假设就自然是正确的。因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。逻辑上运用反证法,统计上依据小概率原理二、小概率事件常常把概率取值小于0.05的随机事件称为小概率事件。但小概率事件毕竟不是不可能事件,小概率事件还是会发生的。小概率事件原理就是认为小概率事件在一次抽样中不可能发生的原理。在实际工作中,人们常常按照小概率事件原理对随机现象作决策判断,这是一种科学的思维方式。在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平,记为α,α值必须在每一次统计检验之前就取定。在教育统计学中,α值常取0.05和0.01两个水平,偶尔也有取0.001的。在假设检验中,α的取值越小,称此假设检验的显著性水平越高。小概率由研究者事先确定,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。三、显著性水平1.原假设为真时,拒绝原假设的概率。2.它是事先指定的犯第Ⅰ类错误概率的最大允许值3. 常用的

值有0.01,0.05,0.104. 由研究者事先确定5.拒绝原假设,则表明检验的结果是显著的不拒绝原假设,表明检验的结果是不显著的/

2/

2Z拒绝拒绝H0值样本统计量样本统计量四、检验方法(一)双尾(侧)检验(二)单尾(侧)检验(一)双尾(侧)检验1定义:拒绝性概率置于理论分布两尾。2使用:结果或方向不确定时。3意义:只推断有无差异,不断言方向Z(CR)P值显著性符号<1.96>0.05不显著≥1.96≤0.05显著*≥2.58≤0.01极显著**/

2/

2Z拒绝拒绝H0值样本统计量样本统计量双侧检验(二)单尾(侧)检验定义:拒绝性概率置于理论分布一尾。使用:结果或方向确定时。意义:即推断有无差异,又断言方向。类型(1)右尾检验(2)左尾检验右尾检验定义:拒绝性概率置于理论分布的右尾。使用:能确定一个总体大于另一总体时。假设形式:H0:μ≤μ0H1:μ>μ0右侧检验H0值a拒绝域抽样分布1-置信水平计算出的样本统计量左尾检验定义:拒绝性概率置于理论分布的左尾。使用:能确定一个总体小于另一总体时。假设形式:H0:μ≥μ0H1:μ<μ0

左侧检验H0值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量Z(CR)P值显著性符号<1.645>0.05不显著≥1.645≤0.05显著*≥2.330≤0.01极显著**t(CR)P值显著性符号<t(n’)0.05>0.05不显著≥t(n’)0.05≤0.05显著*≥t(n’)0.01≤0.01极显著**CR值、P值差异显著性关系表Z检验t检验双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0决策时的几种逻辑情况:①H0为真,拒绝了H0

②H0为真,接受了H0③H0不真,接受了H0④H0不真,拒绝了H0

五、假设检验中的两类错误五、假设检验中的两类错误

第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)拒绝域H1为真时的分布不拒绝H0,认为样本来自u=u0的总体拒绝H0,认为样本部来自u=u0的总体实际情况样本来自u=u0的总体判断正确判断错误:Ⅰ型错误样本来自u=u1的总体判断错误:Ⅱ型错误判断正确H0为真时的分布错误和

错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小两类错误的控制α错误:控制显著性水平。

①实验条件控制较好:α=0.05②实验条件难于控制:α=0.01或更高β错误的影响因素与控制①实际值与假设值相差越大,β越小。②α越小,β越大。同时控制,增加n。③α、n固定时,适当的检验类型可减小β。1.提出(或建立)假设H0:H1:2.规定显著性水平(1)α=0.05(2)α=0.013.计算检验统计量4.比较与决策六、假设检验的一般过程根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量标准化的检验统计量决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0

双侧检验:│统计量│>临界值,拒绝H0

左侧检验:统计量<-临界值,拒绝H0

右侧检验:统计量>临界值,拒绝H0也可以直接利用统计量对应的P值作出决策:

p值<,拒绝H0双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值第四节总体平均数的显著性检验检验统计量确定的因素

1.样本容量的大小

2.总体分布形状

3.总体方差是否已知总体均值检验统计量主要有

1.z检验统计量

2.t检验统计量σ2已知σ2未知Z检验t检验

一、总体正态σ2已知σ2未知t检验或渐近正态法或二总体非正态,n≥30三检验过程

1.条件分析(1)双尾或单尾检验?(2)σ2已知否?(3)总体正态否?(4)Z检验、t检验或Z’检验?2.建立假设:H0,H13.求检验值4.比较决策例:某心理学家认为,一般汽车司机视反应时平均175ms。有人随机抽取26名司机为样本测定,结果平均180ms,标准差20ms。能否根据测试结果否定心理学家的结论?(假定视反应符合正态分布)条件分析:双尾检验σ2未知总体正态t检验步骤:①

建立假设②求检验值均数标准误:t值:③比较决策例:全区物理统一考试,成绩分布服从正态分布,平均分为50,标准差为10。某校一个班41人,平均分52.5,问该班物理成绩与全区平均成绩的差异是否显著?双尾检验σ2已知总体正态Z检验例:某省进行数学竞赛,结果分数分布非正态,总平均43.5。某县参赛学生168人,平均45.1,标准差18.7。试问该县平均分与全省平均分有无显著差异?双尾检验σ2未知总体非正态Z’检验或t检验例:有人调查早期教育对儿童智力发展的影响,从受过良好早期教育的儿童中随机抽样70人进行韦氏儿童智力测验,结果M=108。能否认为受过良好早期教育的儿童智力高于一般水平?单尾检验σ2已知总体正态Z检验是否已知小样本容量n大是否已知否t检验否z检验是z检验

是z检验第七章两个总体均值之差的检验复习医学上测定,正常人的血色素应该是每100毫升13克,某学校进行抽查,37名学生血色素平均值为12.1克/100毫升,标准差为1.5克/100毫升。试问该校学生的血色素是否显著低于正常值?假设一位老年问题专家想要对两种提高需要家庭护理的老人的记忆力方法的效果进行比较。他抽出了10位居民并随机地把他们分为两组。一组被指派为采用A种方法,另一组则采用方法B。根据这项记忆力提高训练,所有的10名被试者都被进行了同样的记忆测验,采用方法A的5名被试者的样本均值为82分,而采用方法B的样本均值为77分。是方法A能更好地提高记忆力吗?两种方法对应的成绩分别为:方法A:82、83、82、80、83;方法B:78、77、76、78、76)1.检验内容:2.样本性质(1)独立样本:从两无关总体抽取的两个样本。(2)相关样本:从相关总体抽取的两个样本。eg同组比较:同组前后比较。(3)配对样本:同质被试两两配对形成样本的先后比较。一、两个总体均值之差的检验的基本原理从第一个总体中抽取一个样本算出平均数,再从第二个总体中抽取一个样本算出平均数。记当两个总体都是正态分布,则样本平均数差异的分布仍为正态分布。3.平均数之差的平均数与标准误检验统计量4.检验过程假设双侧检验左侧检验右侧检验假设形式H0:m1-m2=0H1:m1-m20

H0:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0统计量12,

22已知Z12,

22未知t拒绝域P值决策拒绝H0一、两个总体均值之差的检验(独立大样本)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12

22

已知:12

,22

未知:两个总体均值之差的检验

(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m1-m2=0H1:m1-m20

H0:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0统计量12,

22已知12,

22未知拒绝域P值决策拒绝H0两个总体均值之差的检验

(例题分析)【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?两个样本的有关数据

男性职员女性职员n1=44n1=32x1=75x2=70S12=64S22=42.25两个总体均值之差的检验

(例题分析)H0:1-2=0H1:1-2

0=0.05n1=44,n2=32临界值(c):检验统计量:决策:结论:

拒绝H0该公司男女职员的平均小时工资之间存在显著差异

z01.96-1.960.025拒绝H0拒绝H00.0251、12,

22已知假定条件两个独立的小样本两个总体都是正态分布12,

22已知检验统计量二、两个总体均值之差的检验(独立小样本)2、12,22未知但12=22假定条件两个独立的小样本两个总体都是正态分布12、

22未知但相等,即12=22检验统计量其中:自由度:3、12,

22未知且不相等1222假定条件两个总体都是正态分布12,

22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量自由度:4、12,

22未知且不相等1222假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量自由度:两个总体均值之差的检验(例题分析)【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?两台机床加工零件的样本数据

(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2两个总体均值之差的检验(例题分析)H0

:1-2

=0H1

:1-2

0=0.05n1=8,n2

=7临界值(c):检验统计量:决策:结论:

不拒绝H0没有理由认为甲、乙两台机床加工的零件直径有显著差异

t02.160-2.1600.025拒绝H0拒绝H00.025两个总体均值之差的估计

(例题分析)【例】为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平0.05,能否认为方法1组装产品的平均数量明显地高于方法2?两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521练习从某地区的六岁儿童中随机抽取男生30人,测量身高,平均为114cm;抽取女生27人,平均身高为112.5cm。根据以往积累资料,该地区六岁男童身高的标准差为5cm,女童身高标准差为6.5cm。能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童身高有显著差异。某年长沙市青少年儿童体质调查结果,其中208名12岁男性少年平均身高145.3,标准差6.69;201名女性少年平均身高135.2,标准差6.62。性别对12岁少年身高是否有显著影响?(假设方差一致)

从甲乙两校高中一年级随机抽取学生各50名进行数学测验。甲校平均成绩75分,标准差6分;乙校平均成绩70,标准差6.5分。试向两校学生数学平均成绩有无显著差?(假设方差一致)从某班随机抽取男女生各10人参加创造性思维测验,结果如下。试问男女生创造性思维测验成绩之差是否显著?(已知总体方差一致)男:35352832262429253531女:28342520201631272415作业性别nMS男384118.644.53女377117.864.86作业对7岁儿童作身高调查,得到如下结果。能否说明性别对于7岁儿童的身高有显著影响?练习对于均值差异的显著性假设,保持零假设意味着:a.样本均值间没有差异;b.总体均值间没有差异;c.均值间的差异是显著的;d.均值间的差异太大了从而不可能是抽样误差。练习对于均值差异的显著性假设,z分数越大:a.均值的差异距零点的距离越大;b.更有可能拒绝零假设;c.结果更可能是显著的;d.以上都是。练习零假设能够以多大的概率水平被拒绝被称为:a.显著性水平;b.分布;c.自由度;d.以上都是。练习我们的临界值落在分布的尾部越远的位置,我们犯什么错误的风险也越大?a.第一类错误;b.第二类错误;c.第一和第二类错误;d.第三类错误。练习将会使得我们拒绝零假设的在分布曲线下的尾部的区域的大小被称为:a.α值;b.P;c.差异的标准误;d.自由度。练习均值间差异的标准误被定义为:a.我们抽取的两个样本的标准差;b.我们从中抽取样本的两个总体的标准差;c.我们估计的均值差异的理论上的抽样分布的标准差。练习t分数越大,我们越有可能:a.保持零假设;b.拒绝零假设;c.得出我们的结果在统计学上是不显著的结论。练习标准化的SAT考试的总体均值μ为500,总体标准差σ为100.假设一位研究者对50名男性和50名女性的随机样本进行了SAT测试,产生的样本均值分别为511和541.基于这样的样本规模,这位研究者计算出均值间差异的抽样分布的标准差为20.问一个女性样本其均值至少比男性样本的均值高30分的概率。为了检验女性比男性更经常对别人微笑的假设,男性和女性与别人交往时被录像并分性别记录下了微笑的次数。通过下列在5分钟的交往中的微笑次数的数据,检验微笑次数没有性别差异的零假设。

男女81511191313411218练习练习两组学生参加了统计学测验。只有一组学生参加了测验的正是准备性课程;另一组只读了指定的课本但没有上过课。第一组(上过课的)得到的测验分数为2、2、3、4;第二组(没上过课的)得到的测验分数为1、1、、2、3.试检验学生是否上过课对成绩有无影响。σ12、σ22已知时,相关样本的标准误相关样本平均数差异的显著性检验检验统计量练习某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(σ=16),结果平均智商为106,一年后再对同组被试施测,结果平均智商为110,一直两次测验结果的相关系数r=0.47,问能否说随着年龄的增长与一年的教育,儿童智商有了显著提高。相关样本平均数差异的显著性检验σ12、σ22未知时相关样本数据形式观察序号样本1样本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n从某中学二年级随机抽取学生50名作为样本,在学期初进行了一次阅读测验,平均数为55,标准差为5;期未又进行一次类似测验,平均数为60,标准差为7;两次测验的相关为0.6。试问经过一学期,该年级学生的阅读水平是否有显著性提高?练习从某中学随机抽取初三10名学生,学期初进行了推理能力测验,期末又进行类似测验,结果如下。问其推理能力有无显著差异?

编号学期初学期末111142151531514414145101161314711158121191314101214练习某班45名学生先后用A、B两种学习方法进行学习,学习后分别进行类似的测验,结果如下表。试问两种方法有无显著不同?学法nMSrA45808B4578120.65练习从小学三年级随机抽取10名儿童,分别在学期初与学期末进行类似的数运算测验,结果如下表。试问学生的数运算成绩是否有显著的提高?学期初12131211101314151511学期末14141115111414141514练习某心理学家认为RNA可以促进记忆力,因此有助于老鼠的迷津学习。他以随机抽样的方法抽取24只老鼠,随机分为实验组和控制组,每组12支。实验组注射RNA,控制组注射生理盐水,然后在同样的条件下进行迷津学习实验,结果如下表。是否可以说接受RNA注射的老鼠比未注射的学习成绩好?实验组29273225333036283328

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论