版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章第八章 假设检验假设检验o第一节第一节 假设检验的原理假设检验的原理o第二节第二节 平均数的显著性检验平均数的显著性检验o第三节第三节 平均数差异的显著性检验平均数差异的显著性检验o第四节第四节 方差的差异检验方差的差异检验o第五节第五节 相关系数的显著性检验相关系数的显著性检验o第六节第六节 比率的显著性检验比率的显著性检验o假设检验假设检验(hypothesis testing):通过:通过样本统计量得出的差异做出一般性结论,判样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异的推论过程。断总体参数之间是否存在差异的推论过程。o假设检验的基本任务:事先对总体参数或总假设
2、检验的基本任务:事先对总体参数或总体分布形态做出一个假设,然后利用样本信体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接息来判断原假设是否合理,从而决定是否接受原假设。受原假设。o假设检验包括参数检验和非参数检验。假设检验包括参数检验和非参数检验。o参数假设检验参数假设检验(parameteric test)(parameteric test):进行假设检验进行假设检验时总体的分布形式已知,需要对总体的未知参数进时总体的分布形式已知,需要对总体的未知参数进行假设检验。行假设检验。o非参数假设检验非参数假设检验(non-parameteric test)(non-pa
3、rameteric test) :进行进行假设检验时对总体的分布形式所知甚少,需要对未假设检验时对总体的分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验。知分布函数的形式及其他特征进行假设检验。第一节 假设检验的原理o一、假设与假设检验一、假设与假设检验o统计学中的假设一般专指用统计学术语对总体统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。参数所做的假定性说明。o在进行任何一项研究时,都需要根据已有的理在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果作出一种预想的希望论和经验事先对研究结果作出一种预想的希望证实的假设。这种假设叫科学假设,用统计术证
4、实的假设。这种假设叫科学假设,用统计术语表示时叫研究假设,记作语表示时叫研究假设,记作H1。o在统计学中不能直接对在统计学中不能直接对H1的真实性直接检验,需的真实性直接检验,需要建立与之对立的假设,称作虚无假设要建立与之对立的假设,称作虚无假设(null hypothesis),或叫无差假设、零假设、原假设,或叫无差假设、零假设、原假设,记为记为H0。o在假设检验中在假设检验中H0总是作为直接被检验的假设,而总是作为直接被检验的假设,而H1与与H0对立,二者择一,因而对立,二者择一,因而H1也叫做对立假设也叫做对立假设或备择假设或备择假设(alternative hypothesis)。o假
5、设检验的问题,就是要判断虚无假设假设检验的问题,就是要判断虚无假设H0是否正确,是否正确,决定接受还是拒绝虚无假设。若拒绝虚无假设,则接受决定接受还是拒绝虚无假设。若拒绝虚无假设,则接受备择假设。备择假设。o虚无假设是统计推论的出发点。虚无假设是统计推论的出发点。o虚无假设常常是根据历史资料,或根据周密考虑后确定虚无假设常常是根据历史资料,或根据周密考虑后确定的,若没有充分的依据,虚无假设是不能被轻易否定的。的,若没有充分的依据,虚无假设是不能被轻易否定的。o可以说,每一实验的存在,仅仅是为了给事实一个反驳可以说,每一实验的存在,仅仅是为了给事实一个反驳虚无假设的机会。(费舍)虚无假设的机会。
6、(费舍)o二、假设检验中的小概率原理二、假设检验中的小概率原理o假设检验的基本思想是概率性质的反证法。假设检验的基本思想是概率性质的反证法。o为了检验虚无假设为了检验虚无假设 ,首先假定虚无假设为真。在虚无,首先假定虚无假设为真。在虚无假设为真的前提下,如果导致违反逻辑或违背人们常识假设为真的前提下,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明和经验的不合理现象出现,则表明“虚无假设为真虚无假设为真”的的假定是不正确的,也就不能接受虚无假设。若没有导致假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为不合理现象出现,那就认为“虚无假设为真虚无假设为真”的假
7、定是的假定是正确的,也就是说要接受虚无假设。正确的,也就是说要接受虚无假设。o假设检验中的假设检验中的“不合理现象不合理现象”是指小概率事是指小概率事件在一次试验中发生了。件在一次试验中发生了。o小概率事件原理:小概率事件在一次试验中小概率事件原理:小概率事件在一次试验中几乎是不可能发生的。假设检验的依据是小几乎是不可能发生的。假设检验的依据是小概率事件原理。通常情况下,将概率不超过概率事件原理。通常情况下,将概率不超过0.05、0.01或或0.001的事件当做小概率事的事件当做小概率事件。件。o三、假设检验中的两类错误三、假设检验中的两类错误o(一)(一)型错误与型错误与型错误型错误o总体的
8、真实情况往往是未知的,根据样本推总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:断总体,有可能犯两类错误:o虚无假设虚无假设H0本来是正确的,但拒绝了本来是正确的,但拒绝了H0,这类错误称为弃真错误、这类错误称为弃真错误、型错误、型错误、 错误。错误。o虚无假设虚无假设H0本来不正确但却接受了本来不正确但却接受了H0,这,这类错误称为取伪错误、类错误称为取伪错误、型错误、型错误、错误。错误。o在实际问题中,一般总是控制犯在实际问题中,一般总是控制犯错误的概错误的概率,使率,使H0成立时犯成立时犯型错误的概率不超过型错误的概率不超过 。在这种原则下的统计假设检验问题称为显著在这种
9、原则下的统计假设检验问题称为显著性检验性检验(significance test),将犯,将犯型型错误的概率错误的概率 称为假设检验的显著性水平。称为假设检验的显著性水平。o(二)两类错误的关系(二)两类错误的关系o1.1. + +不一定等于不一定等于1 1o2.2.在其他条件不变的情况下,在其他条件不变的情况下, 与与不可能不可能同时减小或增大同时减小或增大o增大样本容量可同时减小增大样本容量可同时减小 与与错误,或在错误,或在 错误保持不变的情况下,减小错误保持不变的情况下,减小错误。错误。o3.3.统计检验力统计检验力o统计检验力统计检验力(power of test):1反映着正反映着
10、正确辨认真实差异的能力。确辨认真实差异的能力。o假如真实差异很小时,某个检验仍能以较大假如真实差异很小时,某个检验仍能以较大的把握接受它,就说这个检验的统计检验力的把握接受它,就说这个检验的统计检验力比较大。比较大。o四、单侧检验与双侧检验四、单侧检验与双侧检验o双侧检验双侧检验(two-sided test, two-tailed test):只强调差异而不强调方:只强调差异而不强调方向性的检验。向性的检验。oH0:1=0 H1:10o单侧检验单侧检验(one-sided test, one-tailed test):强调某一方向的检验。:强调某一方向的检验。o右侧检验:右侧检验:H0:10
11、 H1:10o左侧检验:左侧检验:H0:10 H1:10o通常适用于检验某一参数是否通常适用于检验某一参数是否“大于大于”或或“优优于于”、“快于快于”及及“小于小于”、“劣于劣于”、“慢慢于于”另一参数等一类问题。另一参数等一类问题。o应该用单侧检验的问题,若使用双侧检验,应该用单侧检验的问题,若使用双侧检验,其结果一方面可能使结论由其结果一方面可能使结论由“显著显著”变为变为“不显著不显著”;另一方面也增大了;另一方面也增大了错误。反错误。反之,应当用双侧检验的问题若用单侧检验,之,应当用双侧检验的问题若用单侧检验,虽然减小了虽然减小了错误,但是使无方向性的问题错误,但是使无方向性的问题人
12、为地成为单方向问题,这也有悖于研究目人为地成为单方向问题,这也有悖于研究目的。的。o五、假设检验的步骤五、假设检验的步骤o第一,根据问题要求,提出虚无假设和备择第一,根据问题要求,提出虚无假设和备择假设。假设。o双侧检验:双侧检验:H0:1=0 H1:10o左侧检验:左侧检验:H0:10 H1:10o右侧检验:右侧检验:H0:10 H1:10o第二,选择适当的检验统计量。第二,选择适当的检验统计量。o第三,规定显著性水平第三,规定显著性水平 。o第四,计算检验统计量的值。第四,计算检验统计量的值。o第五,做出决策。第五,做出决策。o假设检验一般处理两类差异问题:样本统计假设检验一般处理两类差异
13、问题:样本统计量与相应总体参数的差异;两个样本统计量量与相应总体参数的差异;两个样本统计量之间的差异。之间的差异。第二节 平均数的显著性检验o平均数的显著性检验:对样本平均数与总体平均数平均数的显著性检验:对样本平均数与总体平均数之间差异进行的显著性检验。之间差异进行的显著性检验。o一、总体正态分布、总体方差已知一、总体正态分布、总体方差已知o【例例8-2】o全区统一考试物理平均分全区统一考试物理平均分0=50,标准差,标准差0=10分。某校的一个班(分。某校的一个班(n=41)平均成绩)平均成绩 ,问该班成绩与全区平均成绩差异是否显著?问该班成绩与全区平均成绩差异是否显著?52.5X o解:
14、解: o提出假设提出假设oH0:1=0oH1:10o样本平均数分布的标准误样本平均数分布的标准误( 或或 )0101.56241XXSEnXXSEo临界比率临界比率CR (critical ration)oCR的意义与标准分数的意义与标准分数Z相似。在总体分布为相似。在总体分布为正态、总体方差已知时,临界比率正态、总体方差已知时,临界比率CR一般一般用用Z表示:表示: 052.5501.61.562XXCRSE0XXZSEo【例例8-3】o有人从受过良好早期教育的儿童中随机抽取有人从受过良好早期教育的儿童中随机抽取70人进行韦氏儿童智力测验(人进行韦氏儿童智力测验(0=100,0=15),结果
15、),结果 。能否认为受过。能否认为受过良好早期教育的儿童智力高于一般水平。良好早期教育的儿童智力高于一般水平。103.3X o解:解:o提出假设提出假设oH0:10 H1:10o样本平均数分布的标准误样本平均数分布的标准误0151.79370XSEno临界比率临界比率0103.3 1001.841.793XXZSEo二、总体正态分布、总体方差未知二、总体正态分布、总体方差未知o平均数分布的标准误平均数分布的标准误o临界比率临界比率1=1nXssSEnn01Xtsndf=n1o【例例8-4】 o某心理学家认为一般汽车司机的视反应时平某心理学家认为一般汽车司机的视反应时平均均175毫秒,有人随机抽
16、取毫秒,有人随机抽取36名汽车司机名汽车司机作为研究样本进行了测定,结果平均值为作为研究样本进行了测定,结果平均值为180毫秒,标准差毫秒,标准差25毫秒。能否根据测试毫秒。能否根据测试结果否定该心理学家的结论。(假定人的视结果否定该心理学家的结论。(假定人的视反应时符合正态分布)反应时符合正态分布)o解:解: 已知已知0=175,1指样本指样本 的总平的总平均,均, ,s=25,n=26o提出假设提出假设oH0:1=0oH1:10X180X o样本平均数分布的标准误样本平均数分布的标准误o临界比率临界比率o查查t分布表,分布表,t0.05/2(35)=2.03ot=1.182.03=t0.0
17、5/2(35),p0.05254.226136 1XsSEn0180 1751.184.23XXtSEo在实际使用中,当在实际使用中,当n30时,时,t分布常常被近似分布常常被近似地按正态分布对待,这时检验就近似地应用地按正态分布对待,这时检验就近似地应用Z检验:检验:o但但n30时则必须用时则必须用t检验。因此,检验。因此,Z检验又叫检验又叫大样本检验,大样本检验,t检验又叫小样本检验。检验又叫小样本检验。0XZsno在理论上(或实际应用要求严格时)只要总在理论上(或实际应用要求严格时)只要总体为正态分布、总体方差已知,不论体为正态分布、总体方差已知,不论n30还是还是n30都应用都应用Z检
18、验;而总体为正态分检验;而总体为正态分布、总体方差未知时,即使布、总体方差未知时,即使n30也没有必也没有必要近似地做要近似地做Z检验,应该用检验,应该用t检验。检验。o三、总体非正态分布三、总体非正态分布o如果有理由认为某一变量的总体分布不是正如果有理由认为某一变量的总体分布不是正态,原则上是不能进行态,原则上是不能进行Z检验或检验或t检验的,应检验的,应该进行非参数检验。有时也可以对原始数据该进行非参数检验。有时也可以对原始数据进行对数转换或其他转换,使非正态数据转进行对数转换或其他转换,使非正态数据转换为正态形式,然后再做换为正态形式,然后再做Z检验或检验或t检验。检验。o如果样本容量较
19、大,也可以近似地应用如果样本容量较大,也可以近似地应用Z检检验。验。o中心极限定理:中心极限定理:从平均数从平均数0、标准差、标准差0 0的的总体(无论正态与否)中随机抽样,样本平总体(无论正态与否)中随机抽样,样本平均数均数 的分布将随着样本容量的增大而趋的分布将随着样本容量的增大而趋于正态分布,且于正态分布,且 , 。0=X0=XSEnXo一般认为当一般认为当n30(或(或n50)时,尽管总体分布)时,尽管总体分布非正态,对于平均数的显著性检验仍可近似用非正态,对于平均数的显著性检验仍可近似用Z检检验。验。o总体标准差已知总体标准差已知o总体标准差未知总体标准差未知0XZn0XZsno【例
20、例8-5】o某省进行数学竞赛,结果分数的分布不是正某省进行数学竞赛,结果分数的分布不是正态,总平均分态,总平均分43.5。其中某县参加竞赛的。其中某县参加竞赛的学生学生168人,人, ,s=18.7,该县平,该县平均分与全省平均分有否显著差异?均分与全省平均分有否显著差异?45.1X o解:解:n=168并大于并大于50,符合使用近似,符合使用近似Z检检验的条件验的条件o p0.05045.143.51.111.9618.7168XZsn第三节 平均数差异的显著性检验o平均数差异的显著性检验:平均数差异的显著性检验:对两个样本平均对两个样本平均数之间差异的检验。这种检验的目的在于由数之间差异的
21、检验。这种检验的目的在于由样本平均数之间的差异样本平均数之间的差异 来检验各自来检验各自代表的两个总体之间的差异代表的两个总体之间的差异(12)。12()XXo进行平均数差异显著性检验需要注意的前提条进行平均数差异显著性检验需要注意的前提条件件o总体分布形态总体分布形态o总体方差是否已知总体方差是否已知o两个总体方差是否一致(方差齐性与否)两个总体方差是否一致(方差齐性与否)o两个样本是否相关两个样本是否相关o两个样本容量是否相同两个样本容量是否相同o一、两个总体都是正态分布、两个总体方差都已知一、两个总体都是正态分布、两个总体方差都已知o从第一个总体(从第一个总体(1, )中抽取一个样本算出
22、)中抽取一个样本算出 ,再从第二个总体(再从第二个总体(2, )中抽取一个样本算)中抽取一个样本算出出 ,两个样本平均数之间的差异记为,两个样本平均数之间的差异记为 。若两个总体都是正态分布,则若两个总体都是正态分布,则 的分布仍为正态。的分布仍为正态。设设 的总体平均为的总体平均为 ,很容易证明,很容易证明 。这时对两个样本平均数差异(这时对两个样本平均数差异( )的显著性检)的显著性检验实际上就是对验实际上就是对 与与 差异的检验,即差异的检验,即 的显著的显著性检验。性检验。211X222X12=XDXXXDXDXD12=XD 12XXXDXDXDo(一)独立样本的平均数差异检验(一)独
23、立样本的平均数差异检验o独立样本:两个样本内的个体之间不存独立样本:两个样本内的个体之间不存在一一对应关系。在一一对应关系。o两个样本的容量可以相等,也可以不相等。两个样本的容量可以相等,也可以不相等。o当两个变量当两个变量X、Y相互独立时:相互独立时:o 的方差:的方差:222XYX Y221212DXSEnn12()XX122222=XXDDXXSESESE1212XXXDXDDXXDZSESEo【例例8-6】o从某地区的六岁儿童中随机抽取男生从某地区的六岁儿童中随机抽取男生30人,身高人,身高平均为平均为 ,抽取女生,抽取女生27人平均身人平均身高高 。根据以往资料,该地区六岁男童身。根
24、据以往资料,该地区六岁男童身高的标准差高的标准差1=5cm ;女童身高的标准差;女童身高的标准差2=6.5cm。能否根据这一次抽样测量的结果下。能否根据这一次抽样测量的结果下结论:该地区六岁男女儿童身高有显著差异。结论:该地区六岁男女儿童身高有显著差异。1114Xcm2112.5Xcmo解:已知解:已知n1=30, ,1=5o n2=27, ,2=6.5o提出假设提出假设oH0:1=2oH1:12o平均数之差的标准误平均数之差的标准误1114X 2112.5X 2222121256.51.553027XDSEnno由于设定由于设定H0: 1=2,因此,因此o0.961.96,p0.050DX0
25、114 112.50.961.55XXXDXXDDDDZSESEo(二)相关样本的平均数差异检验(二)相关样本的平均数差异检验o相关样本:两个样本的数据之间存在一一对相关样本:两个样本的数据之间存在一一对应的关系。应的关系。o相关样本一般在两种情形下产生:一是采用相关样本一般在两种情形下产生:一是采用配对组的实验设计,二是采用同一样本前后配对组的实验设计,二是采用同一样本前后测设计。测设计。o当两个变量当两个变量X、Y之间的相关系数为之间的相关系数为r时:时:o 的方差:的方差:o平均数之差的标准误:平均数之差的标准误:222(X Y)XY=2XYr 12()XX12122222XDXXXXS
26、ESESErSESE2212122XDSErnnnnXXDDZSEo【例例8-7】o某幼儿园在儿童入园时对某幼儿园在儿童入园时对49名儿童进行了名儿童进行了比奈智力测验(比奈智力测验(=16),结果平均智),结果平均智商商 ,一年后再对同组被试施测,结,一年后再对同组被试施测,结果果 。已知两次测验结果的相关系数。已知两次测验结果的相关系数r=0.74,问能否说随着年龄增长与一年的,问能否说随着年龄增长与一年的教育,儿童智商有了显著提高。教育,儿童智商有了显著提高。1106X 2110Xo解:根据题意,用单侧检验。解:根据题意,用单侧检验。o已知已知n=49,=16, , o提出假设提出假设o
27、H0:12oH1:12o平均数之差平均数之差 的标准误的标准误1106X 2110X221212222216162 0.74 16 =1.7149XDSErnnnn o0.01水平水平Z值单侧临界值为值单侧临界值为2.32,2.342.32,即,即p0.01。110 1062.341.71XXDDZSEo二、两总体都是正态分布、两总体方差都未二、两总体都是正态分布、两总体方差都未知知o(一)独立样本的平均数差异检验(一)独立样本的平均数差异检验o1.两个总体方差一致或相等,即方差齐性两个总体方差一致或相等,即方差齐性(homogeneity of variance): o两个样本平均数差数分布
28、的标准误两个样本平均数差数分布的标准误222120=222120121211XDSEnnnno 与与 的加权平均数,即联合方差,的加权平均数,即联合方差,是是 最好的估计值最好的估计值121ns221ns 122211212121111nnPnsnssnn2022221()11()1nXXnsnXXnsn 2221 12 2122Pn sn ssnno平均数差异显著性平均数差异显著性t检验检验12XDXXtSEdf=n1+n22o例例8-88-8o在一项关于反馈对知觉判断的影响的研究中,将被在一项关于反馈对知觉判断的影响的研究中,将被试随机分成两组,其中一组试随机分成两组,其中一组60人作为实
29、验组(每人作为实验组(每一次判断后将结果告诉被试),实验的平均结果一次判断后将结果告诉被试),实验的平均结果 为为 =80,标准差,标准差s1=18;另一组;另一组52人作为控人作为控制组(实验过程中每一次判断后不让被试知道结制组(实验过程中每一次判断后不让被试知道结果),实验的平均结果果),实验的平均结果 =73,s2=15。试问。试问实验组与控制组的平均结果是否有显著差异?实验组与控制组的平均结果是否有显著差异?1X2Xo解:已知解:已知 =80,s1=18,n1=6, =73,s2=15,n2=5o(1)提出假设)提出假设oH0:12oH1:12o(2)由于两样本是独立样本,且两总体方差
30、均未)由于两样本是独立样本,且两总体方差均未知,故需进行方差齐性检验知,故需进行方差齐性检验1X2Xo提出假设提出假设oH0:oH1:o两样本是独立样本,应用两样本是独立样本,应用F检验检验2212=2212 2222s18F=1.44s15大小o确定临界值确定临界值o分子自由度分子自由度df=60-1=59o分母自由度分母自由度df=52-1=51oF(59,51)0.05/2=1.73o统计决断统计决断o两独立样本的方差是齐性的。两独立样本的方差是齐性的。o(3)由于两独立样本方差齐性,故采用)由于两独立样本方差齐性,故采用t检检验验o联合方差联合方差2221 12 21222n s +n
31、 s=n +n260 18 +52 15 =60+522 =283pso平均数之差的标准误为:平均数之差的标准误为:X21211=(+)11 = 283 (+)6052 =3.19DpSEsnno(4)确定临界值)确定临界值ot(110)0.05/2=1.98o(5)统计决断)统计决断o实验组与控制组的平均结果在实验组与控制组的平均结果在0.05水平上水平上差异显著。差异显著。X12DXX8073=2.19SE3.19to当当n1=n2时,平均数差异的标准误和时,平均数差异的标准误和t值公值公式将变为:式将变为:22121XDssSEn1222121XXtssndf=2n2o2.2.两个总体方
32、差不齐性两个总体方差不齐性(heterogeneity of (heterogeneity of variance)variance)o 且未知时,平均数差异的检验问题是统计且未知时,平均数差异的检验问题是统计学中的一个著名问题,称为贝赫兰斯学中的一个著名问题,称为贝赫兰斯-费希尔费希尔(Behrens-Fisher)问题。问题。o用两个样本方差作为对应两个总体方差的无偏估计用两个样本方差作为对应两个总体方差的无偏估计12221112XnnDssSEnn2212 o柯克兰柯克兰-柯克斯柯克斯t检验检验(Cochran-Cox t-test)ot分布只是近似的分布只是近似的t分布,分布,t 临界
33、值的计算临界值的计算公式:公式:12121222221112122211nnXXXXtssssnnnn 1212221222XXXXSEtSEttSESEo例例8-98-9o为了比较独生子女与非独生子女在社会性方面的差为了比较独生子女与非独生子女在社会性方面的差异,随机抽取独生子女异,随机抽取独生子女25人,非独生子女人,非独生子女31人,人,进行社会认知测验,结果独生子女进行社会认知测验,结果独生子女 =25.3,s1=6,非独生子女,非独生子女 =29.6,s2=10.2。试。试问独生与非独生子女社会认知能力是否存在显著差问独生与非独生子女社会认知能力是否存在显著差异?异?1X2Xo解:已
34、知解:已知 =25.3,s1=6,n1=25; =29.6,s2=10.2,n2=31。o(1)提出假设)提出假设oH0:12oH1:12o(2)由于两样本是独立样本,且两总体方差均未)由于两样本是独立样本,且两总体方差均未知,故需进行方差齐性检验知,故需进行方差齐性检验1X2Xo提出假设提出假设oH0:oH1:o独立样本,故采用独立样本,故采用F检验检验2212=2212 2222s10.2F=2.89s6大小o确定临界值确定临界值o分子自由度分子自由度df=31-1=30o分母自由度分母自由度df=25-1=24oF(30,24)0.05/2=2.21o统计决断统计决断o两独立样本的方差是
35、不齐性的。两独立样本的方差是不齐性的。o(3)独立样本,两总体方差未知且不齐性,故采)独立样本,两总体方差未知且不齐性,故采用用t检验检验1222121222=+n1n125.329.6 =610.2+2430 = 1.929XXtsso(4)确定临界值)确定临界值1212221( )2( )22+t =+XXXXSEtSEtSESE1212221(0.05/2)2(0.05/2)0.05/222+t=+XXXXSEtSEtSESE1222116=1.5124XsSEn 22222210.2=3.468130XsSEn t1(0.05/2)=2.064 (df1=24)t2(0.05/2)=2
36、.042 (df2=30)1212221(0.05/2)2(0.05/2)0.05/222+t=+1.5 2.064+3.468 2.042 =1.5+3.468 =2.049XXXXSEtSEtSESE(5)统计决断)统计决断在这项社会认知能力上独生子女与非独生子女无在这项社会认知能力上独生子女与非独生子女无显著性差异。显著性差异。o统计软件中常用的统计软件中常用的Satterthwaite法法 t检验的自由度校正公式:检验的自由度校正公式:22212122222121212(+)=()()+11ssnndfssnnnno当当n1=n2时,时, ,临界值的计算公式:,临界值的计算公式:122
37、2121XXtssn12122222()()XXXXtSESEtSESE此时此时t1( )=t2( )=t ,df=n1o当总体正态分布、总体方差未知且不等时,当总体正态分布、总体方差未知且不等时,只要只要n1=n2仍然可以近似地应用仍然可以近似地应用 条件下的条件下的t检验(只需将自由度从检验(只需将自由度从2n2变为变为n1)。)。o当两总体方差不一致时,安排当两总体方差不一致时,安排n n1 1=n=n2 2可以可以起一定的校正作用,所以在研究中应充分起一定的校正作用,所以在研究中应充分重视取样时重视取样时n n1 1=n=n2 2的优越性。的优越性。2212=o(二)相关样本的平均数差
38、异检验(二)相关样本的平均数差异检验o相关样本:两个样本的数据之间存在一一对相关样本:两个样本的数据之间存在一一对应的关系。应的关系。o相关样本一般在两种情形下产生:一是采用相关样本一般在两种情形下产生:一是采用配对组配对组的实验设计,二是采用的实验设计,二是采用同一样本前后同一样本前后测测设计。设计。o1.相关系数未知相关系数未知o每一对对应数据之差:每一对对应数据之差:d di i=X=X1i1iX X2i2i。on n个个d d值的平均数:值的平均数:o (平均数之差(平均数之差或差值的平均数)或差值的平均数)on n个个d d值的方差:值的方差:1212iiiXXddXXnn2222d
39、ddddnsnno当当n时时,d值的分布是正态,此时值的分布是正态,此时 的样本分的样本分布也为正态,其平均数:布也为正态,其平均数:o标准误:标准误:o因因 即即 ,因此,因此22211ddddsnSEnn n12dd21XdDsSEndXDo平均数差异显著性平均数差异显著性t检验检验121222211dXXXXtsddnnn ndf=n1o例例8-10o对对9个被试进行两种夹角个被试进行两种夹角(15, 30)的的缪勒缪勒-莱依尔错觉实验结果如下,问两种夹莱依尔错觉实验结果如下,问两种夹角的情况下错觉量是否有显著差异?角的情况下错觉量是否有显著差异?缪勒缪勒-莱依尔错觉莱依尔错觉被试被试
40、12345678915 5 14.718.917.215.415.313.920.016.215.330 0 10.615.116.211.212.014.718.113.810.9di4.13.81.04.23.30.81.92.44.4o解:解:o(1)提出假设)提出假设oH0:12oH1:12o(2)由于两样本是相关样本,且两总体方)由于两样本是相关样本,且两总体方差均未知,故采用差均未知,故采用t检验检验12216.313.62= 4.592.7381dXXtsn(3)确定临界值)确定临界值t(8)0.05/2=2.306, t(8)0.01/2=3.355(4)统计决断)统计决断两种
41、夹角情况下,缪勒两种夹角情况下,缪勒-莱依尔错觉量的莱依尔错觉量的差异非常显著。差异非常显著。222121 2=+dsssrs sX22121 2+=n1Dssrs sSE1222121 2XX=+n1tssrs so2.2.相关系数已知相关系数已知df=n1o【例例8-11】o用公式用公式8-18对对【8-10】进行检验。进行检验。o解:经计算,得解:经计算,得 ,s1=1.90,s2=2.47, r=0.74116.3X 213.62X 221.902.472 0.74 1.90 2.479 10.588XDSE o平均数差异平均数差异t检验检验1216.3 13.624.563.3550
42、.588XDXXtSEo相关样本的平均数差异显著性相关样本的平均数差异显著性t t检验一般不检验一般不需要事先进行方差齐性检验。需要事先进行方差齐性检验。o三、两个总体非正态分布三、两个总体非正态分布o两个总体非正态分布,当两个样本容量都大两个总体非正态分布,当两个样本容量都大于于30(或都大于(或都大于50时),平均数的差异显时),平均数的差异显著性检验可以用著性检验可以用Z检验。检验。o(一)独立样本的平均数差异检验(一)独立样本的平均数差异检验12221212XXZnn12221212XXZssnno(二)相关样本的平均数差异检验(二)相关样本的平均数差异检验122212122XXZrn
43、 1222121 22XXZssrs sno四、平均数差异显著性检验的统计检验力和效四、平均数差异显著性检验的统计检验力和效应量的估计应量的估计o(一)统计检验力的含义与估计原理(一)统计检验力的含义与估计原理o根据假设检验的结果,无论是拒绝或者接收虚根据假设检验的结果,无论是拒绝或者接收虚无假设,都有可能犯错误,即或者犯无假设,都有可能犯错误,即或者犯 错误或错误或者犯者犯错误。错误。o在其他条件不变的情况下,在其他条件不变的情况下, 与与不可能同时增不可能同时增大或减小。大或减小。o表表1 假设检验的各种可能结果假设检验的各种可能结果图图1 与与关系示意图关系示意图 o当当H1为真,即为真
44、,即1与与0 确实有差异时,确实有差异时,1与与0的的距离即表示距离即表示1与与0的真实差异,统计上是以的真实差异,统计上是以1的概率接受的概率接受H1。o1反映着正确辨认真实差异的能力,统计学中反映着正确辨认真实差异的能力,统计学中称之为统计检验力或统计效力称之为统计检验力或统计效力(power of test)。o统计检验力统计检验力1也指:在虚无假设也指:在虚无假设H0为假(备择为假(备择假设假设H1为真)时,正确拒绝为真)时,正确拒绝H0的概率。的概率。o当检验的虚无假设是当检验的虚无假设是H0:1=0时,虚无假时,虚无假设分布设分布(null hypothesis distribut
45、ion, NHD)是以零为中心的正态分布。是以零为中心的正态分布。o相应地,相应地,Z统计量分布(或统计量分布(或t统计量分布),统计量分布),在置信度范围内也是以零为中心的分布在置信度范围内也是以零为中心的分布(a central Z or t distribution)。o如果想要知道犯如果想要知道犯型错误的概率是多少,就要知道型错误的概率是多少,就要知道备择假设的分布情况备择假设的分布情况(alternative hypothesis distribution)。o遗憾的是,由于与虚无假设相对立的备择假设遗憾的是,由于与虚无假设相对立的备择假设H1:10是虚无假设是虚无假设H0:1=0的
46、补集,两个平的补集,两个平均值之间不相等的值几乎是无限多的。因此,它们均值之间不相等的值几乎是无限多的。因此,它们之间的差值到底是多少是不确定的。之间的差值到底是多少是不确定的。o在理论上,备择假设在理论上,备择假设H1:10的分布不是的分布不是一个以零为中心的分布一个以零为中心的分布(a noncentral Z or t distribution),它的中心值有着无,它的中心值有着无数多的选择。数多的选择。因此,一般情况下,难以对因此,一般情况下,难以对或或1值做出准确的估计。值做出准确的估计。o虽然在一般情况下,由于不知道备择假设分布是怎虽然在一般情况下,由于不知道备择假设分布是怎样的而
47、无法精确计算样的而无法精确计算型错误的值,但在以平均数型错误的值,但在以平均数差异差异显著性检验为目的的抽样实验中总会得到差异差异显著性检验为目的的抽样实验中总会得到一个一个Z(或或t)统计量。统计量。如果备择假设服从正态分布,如果备择假设服从正态分布,就可以利用这个在一次性抽样中所得到的就可以利用这个在一次性抽样中所得到的Z值来作值来作为估计备择假设分布的中心点,以此作为该次实验为估计备择假设分布的中心点,以此作为该次实验中备择假设分布的期望值中备择假设分布的期望值(the expedcted Z value,或称为备择假设分布的平均数或称为备择假设分布的平均数)。o通常,人们通常,人们用用
48、表示备择假设分布的期望表示备择假设分布的期望Z Z值,值,并假定在备择假设的分布中,大于这个并假定在备择假设的分布中,大于这个Z Z统计量的备择假设的数量与小于这个统计量的备择假设的数量与小于这个Z Z统计统计量的备择假设的数量各占量的备择假设的数量各占50%50%,由此来对可由此来对可能犯能犯型型错误的概率进行近似的估计。错误的概率进行近似的估计。o用一次抽样中所获得的检验假设的用一次抽样中所获得的检验假设的Z统计量统计量来作为来作为值。值。o以两独立样本平均数差异显著性检验为例以两独立样本平均数差异显著性检验为例oZ Z值与值与值的关系值的关系1212221212()()XXZnn o值的
49、公式值的公式12221212()nn o图图2 =3.0时的时的值分布及统计检验力示意图值分布及统计检验力示意图o(二)两独立样本平均数差异显著性检验统计检验力的(二)两独立样本平均数差异显著性检验统计检验力的估计方法估计方法o(1)根据已知条件建立虚无假设)根据已知条件建立虚无假设H0和备择假设和备择假设H1;o(2)用相应的公式计算)用相应的公式计算Z统计量;统计量;o(3)确定做出统计决策的)确定做出统计决策的 水平及相应的临界值;水平及相应的临界值;o(4)计算实际得到的)计算实际得到的Z值与值与 水平临界值的差;水平临界值的差;o(5)根据)根据Z值与值与 水平临界值的差值查正态分布
50、表,水平临界值的差值查正态分布表,确定可能犯确定可能犯型错误或统计检验力型错误或统计检验力1的概率。的概率。o例例01o已知已知n n1 1=100=100, ,1 1=15=15; n n2 2=100=100, ,2 2=15=15。试求。试求 =0.05=0.05水平平均数假设检验(双侧)的统计检验力。水平平均数假设检验(双侧)的统计检验力。1115X 2111X o解:解:o(1)建立假设)建立假设oH0: 1=2 oH1: 12 o(2)计算检验统计量)计算检验统计量Z值值121222121222()()115 11141.892.121515100100XXZnn o(3)确定做出
51、统计决策的)确定做出统计决策的 水平并做出决水平并做出决策策oZ0.05/2=1.96o(4)计算实际得到的)计算实际得到的Z值与值与 水平临界值的水平临界值的差值差值o1.891.96=0.07o(5)根据)根据Z值与值与 水平临界值的差值查正态水平临界值的差值查正态分布表,确定可能犯分布表,确定可能犯型错误或统计检验力型错误或统计检验力1的概率。的概率。oZ=0.07, p=0.0279o=0.500.0279=0.5279o1=1 0.53=0.47o图3 本例中的备择假设分布图(=0.05)o(三)两独立样本平均数差异显著性检验效应量的估计(三)两独立样本平均数差异显著性检验效应量的估
52、计方法方法o效应量效应量(effect size):效应大小、效应值或效果大小,:效应大小、效应值或效果大小,是反映统计检验效果大小或处理效应大小的重要指标,是反映统计检验效果大小或处理效应大小的重要指标,它表示不同处理下的总体平均数之间差异的大小,可以它表示不同处理下的总体平均数之间差异的大小,可以在不同研究之间进行比较。在不同研究之间进行比较。o效应量反映了两个总体受某种因素的影响的差异程度。效应量反映了两个总体受某种因素的影响的差异程度。o平均数差异显著性检验的效应量一般用符号平均数差异显著性检验的效应量一般用符号d表示。表示。o在两独立样本的方差和样本容量都相等的条在两独立样本的方差和
53、样本容量都相等的条件下:件下:o这表明,在其他条件不变的情况下,这表明,在其他条件不变的情况下,d值越大,值越大,值也会越大。而值也会越大。而值越大,则统计检验力值越大,则统计检验力1也也越大。越大。因此,因此,d值与统计检验力值与统计检验力1之间存在正相之间存在正相关的关系。关的关系。o二者的区别:二者的区别:统计检验力统计检验力1受样本容量受样本容量的影响较大,而的影响较大,而d值则不受样本容量影响。值则不受样本容量影响。od值反映两个总体分布的重叠量。值反映两个总体分布的重叠量。o效应量效应量d值越大,重叠程度就越小,平均数值越大,重叠程度就越小,平均数差异显著性检验的效果就会越明显;差
54、异显著性检验的效果就会越明显;d值越值越小则相反。小则相反。图图4 作为效应量函数的两总体重叠图作为效应量函数的两总体重叠图o不管你取哪种样本,不管你取哪种样本,d值总是作为一种标准值总是作为一种标准的平均数差异的估计,的平均数差异的估计,它与当前样本无关。它与当前样本无关。o显然,传统的检验统计量显然,传统的检验统计量Z、t、2或或F值及值及相应的概率值相应的概率值p只是说明平均数的差异如何,只是说明平均数的差异如何,但这种差异脱离样本推广到不同的抽样群体但这种差异脱离样本推广到不同的抽样群体时,差异究竟有多大则需要用反映效应量大时,差异究竟有多大则需要用反映效应量大小的小的d值来描述。值来
55、描述。od值更能说明我们在实际生活中所关心的差值更能说明我们在实际生活中所关心的差异,而不是数据上的差异。异,而不是数据上的差异。d值能帮助我们值能帮助我们了解观测到的差异是不是事实上的差异。了解观测到的差异是不是事实上的差异。oJ.Cohen (1992)认为,认为,d=0.2视为低效视为低效应量,应量,d=0.5视为中等程度的效应量,视为中等程度的效应量,d=0.8视为高效应量。视为高效应量。o例例02o已知已知n1=100, ,1 1=15=15; n2=100, ,2 2=15=15。试计算。试计算 =0.05=0.05水平平均数假设检验(双侧)的效应量。水平平均数假设检验(双侧)的效
56、应量。1115X 2111X o解:解:12()115 1110.2715d o(四)平均数差异显著性统计检验力的影响因素(四)平均数差异显著性统计检验力的影响因素o影响第二类影响第二类()错误的因素主要有三个错误的因素主要有三个:o(1) 水平;(水平;(2)1与与0或或1与与2之间的距离,之间的距离,也就是效应量;(也就是效应量;(3)样本容量。)样本容量。oJ.Cohen把统计检验力定义为:把统计检验力定义为:“显著性检验的显著性检验的统计检验力是在给定总体效应量统计检验力是在给定总体效应量d、显著性水平、显著性水平 和样本容量和样本容量n的条件下拒绝的条件下拒绝H0的概率。的概率。”o
57、1. 1. 水平水平o图5 作为固定值的的函数的统计检验力示意图o表2 作为与水平函数的统计检验力表统计检验力1的值随着值的减小而降低,随着值的增大而增大。o2. 样本容量样本容量o样本容量也是影响样本容量也是影响值的因素之一,样本容值的因素之一,样本容量越大,量越大,值也越大。值也越大。2nd o由由o可以推导出在确定显著性水平可以推导出在确定显著性水平 和不同和不同d值值条件下,要达到某种程度的统计检验力所需条件下,要达到某种程度的统计检验力所需要的样本容量。要的样本容量。2nd 22()ndo(五)其他条件下平均数差异显著性检验统计检验(五)其他条件下平均数差异显著性检验统计检验力与效应
58、量的估计方法力与效应量的估计方法o1. 不同条件下进行的不同条件下进行的Z检验或检验或t检验的统计检验力检验的统计检验力o(1)需要进行的假设检验是单总体抽样还是两个)需要进行的假设检验是单总体抽样还是两个总体的抽样?总体的抽样?o(2)在两个总体抽样的假设检验中,两个样本的)在两个总体抽样的假设检验中,两个样本的方差是否相等?两个抽样样本的容量是否相等?方差是否相等?两个抽样样本的容量是否相等?o2. 2. 不同条件下进行的不同条件下进行的Z Z检验或检验或t t检验的效应检验的效应量量o两总体参数两总体参数相等、两个样本容量相等的情相等、两个样本容量相等的情况下况下12()d 2dn2dn
59、 o如果知道两个总体参数如果知道两个总体参数1 1和和2 2 (无论(无论1 1与与2 2是否相等),在两个样本容量不相等是否相等),在两个样本容量不相等的情况下,需要计算两个样本容量的调和平的情况下,需要计算两个样本容量的调和平均数:均数:12122Hn nnnn2Hdn o单样本平均数显著性检验单样本平均数显著性检验10()d dno(六)相关样本平均数差异显著性检验统计(六)相关样本平均数差异显著性检验统计检验力和效应量的估计检验力和效应量的估计o相关样本平均数差异显著性相关样本平均数差异显著性Z检验(或检验(或t检验)检验)备择假设期望值的计算公式:备择假设期望值的计算公式:112nd
60、matchedoCohen d 的计算公式:的计算公式:o 112ndmatched第四节 方差的差异检验o一、样本方差与总体方差的差异检验oXN(,2),样本容量,样本容量n,样本方差与总体,样本方差与总体方差的比值为方差的比值为 分布。分布。2220ns=2o例例8-128-12o在一次全区统考中,全体学生的总方差为在一次全区统考中,全体学生的总方差为182,而某校,而某校40名学生成绩的方差为名学生成绩的方差为122,问该校学生成绩的方差与全区方差是否有显问该校学生成绩的方差与全区方差是否有显著差异?著差异?o解:解:o根据题意,应该用双侧检验。根据题意,应该用双侧检验。o已知已知2 =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某著名企业金典系列路演活动策划案
- 《GBT 22325-2008小麦粉中过氧化苯甲酰的测定 高效液相色谱法》专题研究报告
- 《GBT 14454.11-2008香料 含酚量的测定》专题研究报告
- 道路养护安全培训计划课件
- 道路交通安全培训效果课件
- 2026年江苏高考生物试题及答案
- 2022头皮美塑疗法技术操作规范专家共识
- 内蒙古农作物生产技术(北方本)综合测试题(四)及答案
- 车队安全培训内容
- 2025工程技术年终总结(2篇)
- 2026年辽宁金融职业学院单招职业技能测试题库附答案解析
- 2026北京海淀初三上学期期末语文试卷和答案
- 2024-2025学年北京市东城区五年级(上)期末语文试题(含答案)
- 2026年宁夏贺兰工业园区管委会工作人员社会化公开招聘备考题库带答案详解
- NB-T32036-2017光伏发电工程达标投产验收规程
- 两轮车控制器行业报告
- JSA临时用电作业安全分析表
- 2015-2022年北京卫生职业学院高职单招语文/数学/英语笔试参考题库含答案解析
- 赛肤润常见临床应用2010年
- 提高铝模板施工质量合格率
- 传感器与检测技术习题集
评论
0/150
提交评论