统计分析与方法-第五章 假设检验_第1页
统计分析与方法-第五章 假设检验_第2页
统计分析与方法-第五章 假设检验_第3页
统计分析与方法-第五章 假设检验_第4页
统计分析与方法-第五章 假设检验_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 简单统计推断简单统计推断假假设设检检验验假设检验的基本问题假设检验的基本问题为什么要假设检验为什么要假设检验? ?例如,在例如,在20022002年对年对1000010000名妇女的身高进名妇女的身高进行了全面调查,得出行了全面调查,得出平均身高为平均身高为160cm160cm,标准差为标准差为5cm5cm。在在20042004年对该妇女(还是原总体)进行年对该妇女(还是原总体)进行了随机抽样调查,调查了了随机抽样调查,调查了100100名妇女,测名妇女,测得得样本身高样本身高162cm162cm,标准差为,标准差为5cm5cm。请问:请问:调查结果是否说明这批妇女的身调查结果是

2、否说明这批妇女的身高升高了?高升高了?为什么要假设检验为什么要假设检验? ?为了回答这个问题,我们必须知道:样本平均身高与总体平均身高之差cmXx2160162是由什么原因造成(或带来)的是由什么原因造成(或带来)的,即,即 是抽样误差造成的身高没变化是抽样误差造成的身高没变化 2cm产生的原因产生的原因 不仅是误差,不仅是误差, 确实是身高发生了变化确实是身高发生了变化为什么要假设检验为什么要假设检验? ?又如:同一位老师教授统计系本科两个又如:同一位老师教授统计系本科两个班同一门课程,如果两个班考试内容和班同一门课程,如果两个班考试内容和形式完全一样,但是平均成绩却不同:形式完全一样,但是

3、平均成绩却不同:一班一班42人,平均成绩人,平均成绩78分,标准差分,标准差15分分二班二班40人,平均成绩人,平均成绩75分,标准差分,标准差10分分请问:请问:这两个班的平均成绩是否有显著这两个班的平均成绩是否有显著的差异?的差异?为什么要假设检验为什么要假设检验? ?还有:某减肥产品夸口说它的减肥效果还有:某减肥产品夸口说它的减肥效果是如何如何的好,如果我们有一些志愿是如何如何的好,如果我们有一些志愿者对该产品试服减肥,减肥前和减肥后者对该产品试服减肥,减肥前和减肥后的体重发生了一些差异。(具体数据见的体重发生了一些差异。(具体数据见spss数据:数据:diet.sav)请问:体重发生的

4、差异是否显著的?即请问:体重发生的差异是否显著的?即减肥是否真有效果,是否能相信该减肥减肥是否真有效果,是否能相信该减肥产品的减肥效果?产品的减肥效果?为什么要假设检验为什么要假设检验? ?这样的例子很多,其实只要我们进行比这样的例子很多,其实只要我们进行比较、判断时:总体与样本比,不同总体较、判断时:总体与样本比,不同总体之间比之间比,样本与样本比等,都要用到假设样本与样本比等,都要用到假设检验。检验。那么如何检验呢?那么如何检验呢?如何假设检验如何假设检验? ?还是回到妇女身高的例子,已知样本均值与总体均值相差2cm,这2cm是如何造成的? 是抽样误差造成的身高没变化 2cm产生的原因 不

5、仅是误差, 确实是身高发生了变化如何假设检验如何假设检验? ?首先可假设这2cm的误差是由抽样误差造成的。上一章中我们介绍了样本均值的分布:即:),()(nXNx服从样本均值)1005,160(x:)n,X()(NNx即服从正态分布样本均值%27.68)(:%.768.2)()(nXxPnXx即的概率为范围内在一个与总体均值样本均值1 68.27% 2 95.45% %45.952)(2:.%45.952)()(nXxnPnXx即的概率为范围内在一个与总体均值样本均值3 99.37% %73.993)(3:.%73.993)()(nXxnPnXx即的概率为范围内在一个与总体均值样本均值如何假设

6、检验如何假设检验? ?那么:如果 真是由抽样误差造成的,那么它就不应该大于2或3个标准差,即?,2)(呢个标准差等于ncmXxcmXx2)(32)(或nXx如何假设检验如何假设检验? ?反之,如果:那么我们说不应该发生的小概率发生了,即2cm的误差不仅是由抽样误差带来的,而且确实是样本均值与总体均值发生了显著的差异。即这批妇女的身高增高了!32)(或nXx%45.952)(2:.%595.42)(,nXxnPnXx即范围内的概率为在即抽样误差%73.993)(3:.%99.733)(,nXxnPnXx即范围内的概率为在即抽样误差如何假设检验如何假设检验? ?因此我们就需要计算:样本均值与总体均

7、值的差究竟等于几个标准差,即:45 . 021005160162)(nXxt所以说明样本均值与总体均值的差不仅是抽样误差,而是确实两者之间存在着显著的差异,即该批妇女的身高增高了!如何假设检验如何假设检验? ?小概率事件:在一次事件中几乎不可能发生的事件。一般称之为“显著性水平,用 表示。显著性水平一般取值为:1%,01. 05%,05. 0即即如何假设检验如何假设检验? ?在用计算机软件进行假设检验时,计算在用计算机软件进行假设检验时,计算机输出的检验结果是:机输出的检验结果是:t-值和值和p-值(值(p-value) T值就是我们刚才计算过的值就是我们刚才计算过的t值,对于不值,对于不同的

8、分布,计算同的分布,计算t值的方法和公式不一样。值的方法和公式不一样。p-值(值(p-value)就是对应于就是对应于t值及之外的双值及之外的双尾概率,即小概率尾概率,即小概率。这就是双尾概率,这就是双尾概率,p值为值为0.045,即即p=4.5%假设检验的过程-以妇女身高为例首先要提出一个原假设首先要提出一个原假设,如妇女身高的,如妇女身高的均值等于均值等于160cm( )。这种原假)。这种原假设也称为设也称为零假设(零假设(null hypothesis),记),记为为H0。与此同时必须提出对立假设,如妇女身与此同时必须提出对立假设,如妇女身高均值不等于高均值不等于160cm( )。对立)

9、。对立假 设 又 称 为假 设 又 称 为 备 选 假 设 或 备 择 假 设备 选 假 设 或 备 择 假 设(alternative hypothesis)记为)记为H1。cm160cm160假设检验的过程-以妇女身高为例形式上,上面的关于总体均值的形式上,上面的关于总体均值的H0相对相对于于H1的检验记为的检验记为:我们将我们将 的假设称为双尾的假设称为双尾检验检验 ,即前面说述的假设检验。,即前面说述的假设检验。cmHcmH160:160:10cmH160:1假设检验的过程-以妇女身高为例如果备选假设为:或:cmH160:1cmH160:1则称为单尾检验。需要选择何种备选假设,则需根据

10、需要决定。假设检验的过程-以妇女身高为例需要注意的是:计算机输出结果中的需要注意的是:计算机输出结果中的p值值是双尾检验的概率。是双尾检验的概率。如果备选假设选择的是单尾检验,则要如果备选假设选择的是单尾检验,则要将计算机给的将计算机给的p值除以值除以2,即取,即取p值的一半值的一半。计算机给的计算机给的p值为值为0.045,即即p=4.5%,如果是单尾检验,则如果是单尾检验,则p=0.045/2=0.0225假设检验的过程假设检验的过程第二,确定检验统计量第二,确定检验统计量 。有了两个假设,就要根据数据来对它们有了两个假设,就要根据数据来对它们进行判断进行判断。根据零假设根据零假设(不是备

11、选假设!)来判断:(不是备选假设!)来判断:如果是检验均值的,那么一般是在正态如果是检验均值的,那么一般是在正态总体分布的背景下检验的。总体分布的背景下检验的。如果是检验比例的,那么就要用到非参如果是检验比例的,那么就要用到非参数检验。数检验。 假设检验的过程假设检验的过程第三,确定显著性水平第三,确定显著性水平根据样本所得的数据来拒绝零假设的概根据样本所得的数据来拒绝零假设的概率应小于率应小于0.050.05,当然也可能是,当然也可能是0.010.01,0.0050.005,0.0010.001等等。等等。 显著性水平就是小概率水平,但小概率显著性水平就是小概率水平,但小概率并不能说明不会发

12、生,仅仅是发生的概并不能说明不会发生,仅仅是发生的概率很小罢了。拒绝正确零假设的错误常率很小罢了。拒绝正确零假设的错误常被称为第一类错误(被称为第一类错误(type I errortype I error)。)。 假设检验的过程假设检验的过程有第一类错误,就有第二类错误;有第一类错误,就有第二类错误;那是备选假设正确时反而说零假设正确那是备选假设正确时反而说零假设正确的错误,称为第二类错误(的错误,称为第二类错误(type II type II errorerror)。)。在一般的假设检验问题中,由于备选假在一般的假设检验问题中,由于备选假设往往不是一个点,所以无法算出犯第设往往不是一个点,所

13、以无法算出犯第二类错误的概率。二类错误的概率。 假设检验的过程假设检验的过程第四,根据数据计算检验统计量的实现第四,根据数据计算检验统计量的实现值(值(t-t-值)和根据这个实现值计算值)和根据这个实现值计算p-p-值值;这一步一般都可由计算机软件来完成。这一步一般都可由计算机软件来完成。第五,进行判断:如果第五,进行判断:如果p-p-值小于或等于值小于或等于a a,就拒绝零假设就拒绝零假设,这时犯错误的概率最多,这时犯错误的概率最多为为 ;如果;如果p-p-值大于值大于 ,就不拒绝零假,就不拒绝零假设,因为证据不足。设,因为证据不足。 假设检验的过程假设检验的过程在这个意义上,p-值又称为观

14、测的显著观测的显著性水平(性水平(observed significant level)。在统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”就是这个道理。正态总体均值的检验正态总体均值的检验正态总体均值检验的类型正态总体均值检验的类型 根据一个样本对其总体均值大小进行检根据一个样本对其总体均值大小进行检验验 ,如妇女身高的检验如妇女身高的检验 One-Sample T Test 根据来自两个总体的独立样本对其总体根据来自两个总体的独立样本对其总体均值的检验均值的检验,如两个班平均成绩的检验。如两个班平均成绩的检验。 Indepent Two-Sa

15、mple T Test成对样本的检验成对样本的检验,如减肥效果的检验。,如减肥效果的检验。 Pari-Sample T Test 如果是两个以上总体的均值检验,则将用到方差分析,到方差分析一章时,再进行介绍。根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验例5.1:如果你买了一包标有500g重的一包红糖,你觉得份量不足。于是你找到监督部门;当然他们会觉得一包份量不够可能是随机的。于是监督部门就去商店称了50包红糖(数据在sugar.sav);其中均值(平均重量)是498.35g;这的确比500g少,但这是否能够说明厂家生产的这批红糖平均起来不够份量呢? 于是需要统计检验

16、。首先,可以画出这些重量的直方图(图5.)WEIGHT506.0505.0504.0503.0502.0501.0500.0499.0498.0497.0496.0495.0494.0493.0492.0491.0490.086420Std. Dev = 4.33 Mean = 498.3N = 50.00图图6. 506. 50包红糖重量的直方图包红糖重量的直方图根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验这个直方图看上去象是正态分布的样本。于是不妨假定这一批袋装红糖有正态分布。由于厂家声称每袋500g(标明重量),因此零假设为总体均值等于500g(被怀疑对象总是

17、放在零假设);而且由于样本均值少于500g(这是怀疑的根据),把备选假设定为总体均值少于500g(这种备选假设为单向不等式的检验为单尾检验,)。根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验即:或:500:500:10HH500:500:10HH根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验检验统计量就是作为对均值的标准化的符号中的 通常表示为零假设中的均值(即总体的均值,这里是500)Spss选项:AnalyzeCompare mean One-Sample T Test 0/xtsn0Spss输出结果输出结果根据一个样本对其总体均值大小进

18、行检验根据一个样本对其总体均值大小进行检验计算结果是t=-2.696(也称为t值), 同时得到p-值为0.005(由于计算机输出的为双尾检验的p-值,比单尾的大一倍,应该除以2)。看来可以选择显著性水平为0.005,并宣称拒绝零假设,而拒绝错误的概率为0.005。对于这里红糖的具体问题则可以认为,红糖标记重量为500g是不能接受的,实际上平均起来要少于500g。下面图6.2给出一个t分布图,让我们看看到底这t统计量取值在什么位置。看得出来,在直观上这也的确是个小概率事件。 -5-4-3-2-101234500.050.10.150.20.250.30.350.4t valueDensity o

19、f t(59)Tail Probability for t(59)t=-2.696p-value=0.005根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验例例5.2(Spss数据数据exh.sav)汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该样本均值为21.13。究竟能否由此认为该指标均值超过20?根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验这次的假设检验问题就是:Spss选项:A

20、nalyzeCompare mean One-Sample T Test 20:20:10HHSpssSpss输出结果输出结果根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验可以发现p-值为0.1243(计算机输出的双尾检验的p-值除以2),因此,没有证据否定零假设。这时的检验统计量t=1.2336。也可以画出类似于图6.的图(图6.)这时的t分布的自由度为9。 -5-4-3-2-101234500.050.10.150.20.250.30.350.4t valueDensity of t(9)Tail Probability for t(9)t=1.234p-valu

21、e=0.1243t=1.2336根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验从图6.3可以看出,右边的尾概率不能说是小概率。如果要是拒绝零假设的话,犯错误的概率就多于12(0.1243)了,因此没有足够证据来拒绝零假设。要注意,SPSS的这类t检验的标准输出都是以双尾检验的p-值来输出的。因此在解决单尾检验问题时,要把计算机输出的“p-值”减半才能够得到真正的单尾检验p-值。根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验和区间估计类似,也可以做关于两个独立总体均值 和 的差异的假设检验。和一个总体均值的检验类似,检验统计量也

22、有t分布。也可以做单尾和双尾检验。我们用两个班学习成绩的例子说明。 12根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验例2.3 SPSS数据:学生成绩.sav设两个班同上“经济统计”课程,期末考试成绩为:一班一班28人,平均成绩人,平均成绩74.82分,标准差分,标准差10.06分分三班三班38人,平均成绩人,平均成绩76.74分,标准差分,标准差9.11分分根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验假设:假设:Spss选项:选项: AnalyzeCompare mean Indepent Two-Samp

23、le T Test211210:HHG Gr ro ou up p S St ta at ti is st ti ic cs s2874.8210.0561.9003876.749.1081.478班级1.003.00经济统计NMeanStd. DeviationStd. ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.317.575-.80864.422 -1.9152.371 -6.6522.821-.796 54.877.430 -1.9152.407 -6.7402.909Equ

24、al variancesassumedEqual variancesnot assumed经济统计FSig.Levenes Test forEquality of VariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceInterval of theDifferencet-test for Equality of MeansSPSSSPSS输出结果输出结果根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验例例6.46.4 (Spss数据:drug.s

25、av)为检测某种药物对攻击性情绪的影响,对100名服药者和150名非服药者进行心理测试,得到相应的某指标。要进行这两类人的该指标的均值比较。根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验相应的假设检验问题为:也可以写成这样:这里 为第一组的总体均值,而 为第二组的总体均值。211210:HH0:0:211210HH12根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验SpssSpss选项选项:AnalyzeCompare Means Independent-Samples T Test通过计算,通过计算,t统计量等

26、于统计量等于0.942,p-值为值为0.1735(输出中的双尾检验(输出中的双尾检验p-值的一半)。值的一半)。因此无法拒绝零假设,即不能得出第一组因此无法拒绝零假设,即不能得出第一组的平均指标大于第二组的结论的平均指标大于第二组的结论。 SpssSpss输出结果输出结果根据来自两个总体的独立样本对其总根据来自两个总体的独立样本对其总体均值的检验体均值的检验注意:这个输出的前面三列(Levenes Test for Equality of Variances)为检验这两个样本所代表的总体之方差是否相等(零假设为相等)。如果显著,即在Sig列中的该Levene检验p-值很小(这里是0.008),

27、说明两总体的方差相等被拒绝。就应该看两总体方差不等的结果,即最后一行的t检验输出(p-值0.347/2);否则看上面一行的结果。之所以这样做,是因为总体方差相同时使用的检验统计量与方差不同时使用的不一样。 成对样本的检验成对样本的检验经常有所谓成对样本(成对样本(paired samplespaired samples)问题。比如要比较50个人在减肥前和减肥后的重量。这样就有了两个样本,每个都有50个数目。这里不能用前面的独立样本均值差的检验;这是因为两个样本并不独立。每一个人减肥后的重量都和自己减肥前的重量有关。但不同人之间却是独立的。 成对样本的检验成对样本的检验令减肥前的重量均值为 而减

28、肥后的均值为 ;这样所要进行的检验为则可以把两个样本中配对的观测值逐个相减,形成成一个由独立观测值组成的样本;然后用单样本检验方法,看其均值是否为零。在相减之后公式和单样本均值检验无异。 12211210:HH 成对样本的检验成对样本的检验例例6.5:减肥数据(diet.sav)。这里有两列50对数据。其中一列数据(变量是before)是减肥前的重量,另一列(变量是after)是减肥后的重量(单位:公斤)。Spss选项:AnalyzeCompare Means Paired-Samples T TestSpssSpss输出结果输出结果 成对样本的检验成对样本的检验计算之后得到双尾p-值为0.0

29、02,这里的单尾p-值于是为0.001。因此减肥后和减肥前相比,平均重量显著要轻。对于比例的检验对于比例的检验对于离散变量总体比例的检验对于离散变量总体比例的检验 例例6.66.6(twop.savtwop.sav)对于评价电视节目,收视率是个重要的指标。一个电话调查表明,在某一节目播出的时候,被访的正在观看电视的人中有23的正在观看这个节目。现在想知道,这是否和该节目的制作人所期望的25有显著不足。这显然是一个参数为p的二项分布问题。对于离散变量总体比例的检验对于离散变量总体比例的检验形式上的假设检验问题是如果n为访问的正在看电视的人数,x为观看该节目的人数,那么样本中的观看比例为p。检验统

30、计量则是在零假设下当大样本时近似标准正态的统计量。 25. 025. 0:000ppH0000.230.25(1)0.25 (1 0.25)Ppzppnn对于离散变量总体比例的检验对于离散变量总体比例的检验这个数值用手算也不费力气。请注意,前面第四章提起过,即使被访者的百分比一样,但样本少的,信息就少。对于假设检验也是一样。样本量对于假设检验的结果就十分重要。现在还未给出样本量n呢。下面看不同的样本量会得到什么结果(假定 不变)。/0.23Px n对于离散变量总体比例的检验对于离散变量总体比例的检验假定假定样本量为样本量为n=1500(和数据给的一(和数据给的一样),那么,上面的检验得到的样)

31、,那么,上面的检验得到的p-值为值为0.0368。因此,可以认为(如果选显著性。因此,可以认为(如果选显著性水平为水平为0.05的话)的话)拒绝零假设拒绝零假设。假定假定样本量为样本量为n=100,那么,上面的检验,那么,上面的检验得到的得到的p-值为值为0.3221。因此,。因此,没有足够的没有足够的理由拒绝收视率有理由拒绝收视率有25的零假设的零假设(如果(如果选显著性水平为选显著性水平为0.05的话)的话)。 对于离散变量总体比例的检验对于离散变量总体比例的检验从这个例子不仅看出样本量的作用,也看出如果在假定n=100时“接受”零假设会如何地荒唐。注意,利用软件时,上面的p-值计算往往在

32、公式中加上用连续变量近似离散变量分布时常用的连续性纠正,因此结果和用上面公式直接手算的稍有不同。SpssSpss选项选项首先要加权(用数据中的变量weight);然后选AnalyzeNonparametric TestsBinomial,再把变量watch选入Test Variable List,然后在下面Test Proportion输入p0=0.25。Spss输出结果(n=1500)对于离散变量总体比例的检验对于离散变量总体比例的检验同样我们也可做样本容量n=100的比例检验。不同的是需要再增加一个加权变量:weight123,77然后与前面的选项完全一样。Spss输出结果(n=100)对

33、于离散变量总体比例的检验对于离散变量总体比例的检验前面对总体比例的检验所用的公式利用了二项分布的大样本正态近似;怎样才是大样本呢?这和第五章求比例的置信区间时大样本的近似标准类似,即当区间000(1)3pppn完全包含在(0,1)区间内部时,可以认为样本足够大,能够用正态近似。 如何建立假设检验如何建立假设检验如何建立假设如何建立假设在单测检验的问题中,如何建立假设是一个需要考虑的问题。因为同一个数据,由于假设的建立不同,可能得出完全相反的结论。可从下面的例子中加以说明。如何建立假设如何建立假设例5某种灯泡的质量标准是平均燃烧寿命不得低于1000小时。已知灯泡批量产品的燃烧寿命服从正态分布,且

34、标准差为100小时。商店欲从工厂进货,随即抽取81只灯泡检查,测得 小时。 问商店是否决定购进这批灯泡?990 x如何建立假设如何建立假设这里可以有两种假设:第一种,认为该厂生产的灯泡不会低于规定的质量标准,故检验 小时是否成立。即:这是左侧检验,1000:1000:10HH1000如何建立假设如何建立假设检验结果:P=1-0.816=0.184如果置信水平为0.05,则没有足够的证据拒绝原假设,即我们没有足够的证据认为该厂生产的灯泡低于规定的质量标准,因此只能认为该厂生产的灯泡不会低于规定的质量标准05.0184.0P如何建立假设如何建立假设第二种:认为该厂生产的灯泡很可能低于规定的质量标准,故检验 是否成立。即:这是右侧检验。10001000:1000:10HH如何建立假设如何建立假设检验结果不变:P=1-0.816=0.184如果置信水平为0.05,则没有足够的证据拒绝原假设,即我们没有足够的证据认为该厂生产的灯泡高于规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论