




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章 假设检验(Hypothesis Testing)假设检验是抽样统计推断的另一项重要内容。它是利用样本的实际观测资料来检验事先对总体某些数量特征所作的假设是否可信的统计分析方法。根据已有的知识(情报)对总体的数量特征和变动规律做出一定的假设,然后运用观测到的样本的资料和一定程序,来判断事先所作的假设是不是合理可信,从而决定接受或拒绝这个假设。8.1假设检验的概念小概率的原理假设检验的基本思想是应用小概率的原理。所谓小概率原理是指发生概率很小的随机事件在一次试验中几乎是不可能发生的。根据这一原理我们可以做出是否接受原假设的决定,即进行假设检验时必须事先确定一个作为接受或拒绝的判断界限的小概率标准。该小概率标准就是统计假设检验中的显著性水平。在假设检验过程中,我们可以依据显著性水平的大小把概率分布划分为接受区间和拒绝区间。大于给定标准的概率区间称为接受区间,小于给定的概率区间称为拒绝区间。假如给定的小概率标准为=0.1,凡概率小于10%的事件都称为小概率事件,均属于拒绝区间。而概率大于等于1-=90%的事件都称为对立事件概率,均属于接受区接受H0拒绝拒绝(图8-1) 接受区和拒绝区间。事件属于接受区间,意味着原假设成立而无显著性差异;事件属于拒绝区间,意味着原假设不成立,而认为有显著性差异。显著性水平所对应的概率度称为的临界值,记为 例如=0.1时, =1.64。我们称概率小于0.1的事件为小概率事件。但实际假设检验分析中作为接受或拒绝的判断尺度临界值比显著性水平更为常用。根据我们所研究的对象的性质和特征的不同,统计假设检验又可分为双侧检验和单侧检验两种类型。当我们的研究只对检验样本和总体的平均数,或样本和总体的平均数有没有显著性差异关心,而不问差异的方向(正差或负差)时采用双侧检验方法。但我们所要检验的是抽取样本的总体的参数值偏大于还是偏小于某个特定值时采用单侧检验方法。因此,单侧检验方法有右单侧检验和左单侧检验两种。当我们所要检验的是总体的参数值是否大于某个特定值,应采用右单侧检验;反之,应采用左单侧检验。在双侧检验中原假设与替换假设通常采用等式,在单侧检验中原假设与替换假设取不等式。双侧检验: : :右单侧检验: :左单侧检验: : 为计算值 为假设值总而言之,假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。它是进行各种经济行为、管理及决策的有力工具。8.2一个正态总体参数的假设检验根据已知条件,一个正态总体参数的检验方法通常可以分为两种。一种方法是当总体的方差为已知数时,以Z为检验统计量进行检验;另一种方法是当总体的方差为未知数时,以作为检验统计量进行检验。8.2.1 总体平均数的假设检验8.2.1.1总体的方差为已知数时设随机变量是从符合正态分布的总体中抽取的样本,且总体和样本的平均数及方差分别为、原假设与替换假设; : = :检验统计量(概率度); (8-1)设定显著性水平计算检验统计量(概率度)值: 做出统计决策: 若,则拒绝原假设,接受替换假设例8-1:设=600,=630,=30,=100, =0.05。试求双侧检验(替换假设:600)和右侧检验(替换假设:600)时的临界值。解:SAS PROGRAMDATA example1;ALPHA=0.05; n=100; sigma=30; mu0=600; barX=630;Zcal=(barX-mu0)/(sigma/SQRT(n); z1=PROBIT(ALPHA/2); 双侧检验(计算临界值)IF ABS(Zcal)=ABS(z1) THEN RESULT1=REJECT; ELSE RESULT1=ACCEPT;z2=PROBIT(1-ALPHA); 右侧检验(计算临界值)IF Zcal = z2 THEN RESULT2=REJECT; ELSE RESULT2=ACCEPT; RUN;PROC PRINT; VAR ALPHA ZCAL z1 RESULT1 z2 RESULT2; RUN;运行结果OBS ALPHA ZCAL Z1 RESULT1 Z2 RESULT21 0.05 10 -1.95996 REJECT 1.64485 REJECT利用SAS PROGRAM计算的结果得,双侧检验临界值= 右侧检验临界值=; 因为,所以双侧检验原假设:和右单侧检验的原假设:均被否定.(图8-2) 的接受区和拒绝区(a)双侧检验 (b)右侧检验接受H0 接受H0-1.96 1.96 1.645 与的关系替换假设的形态检验方法右单侧检验左单侧检验8.2.1.2总体的方差为未知数时因为总体的方差为未知数,不能直接利用-统计量。所以利用-检验统计量(详见8.6)。 (8-2)当30时,Z,即-分布和Z-分布相接近,可设,并把它作为检验统计量计算临界值,这样可以不用考虑自由度的问题。例8-2:设某百货商店的电冰箱销售量服从正态分布。已知(Xi代表第天电冰箱销售量);。并设定:12。试在=0.05的条件下检验。SAS PROGRAMDATA example2;ALPHA=0.05; MU0=12; N=10; SUMX=100; SUMX2=23500;BarX=sumX/n; s2=(sumX2-n*barX*2)/(n-1); Tcal=(barX-mu0)/SQRT(s2/n);T=TINV(ALPHA,n-1);IF Tcal=T THEN RESULT=REJECT; ELSE RESULT=ACCEPT; RUN;PROC PRINT; VAR ALPHA Tcal t RESULT; RUN; 运行结果OBS ALPHA TCAL T RESULT1 0.05 -0.12649 -1.83311 ACCEPT 解:因为总体的方差为未知数,以-统计量作为检验统计量。又因为:=12,所以替换假设为:则原假设成立。利用SAS PROGRAM计算的结果=-0.1265=-1.833,所以,一天的电冰箱平均销售量超过12台的原假设成立。例8-3:若把例8-2的样本容量由原来的10天增加到100天(N=100),并设其他的条件不变。这时我们可以利用-统计量。即 (8-3)计算结果Z=-0.4Z=-1.64485,所以原假设成立。例8-4:某生产灯泡企业的新职工,上班的第一个月生产了100只灯泡,其中随机抽出5只灯泡作了寿命试验,其寿命分别为70,75,80,85,90(天)。试检验灯泡的平均寿命为75天的可能性(设=0.1)。解:设:75, :75。即作右侧检验,若则原假设成立。因为N=100,所以利用有限总体调整系数来计算。利用SAS Program计算的结果,=1.44368=1.53321。所以灯泡的平均寿命不能超过75天的原假设成立。SAS PROGRAMDATA EXAMPEL4;INPUT X ;CARDS;70 75 80 85 90 RUN;PROC MEANS NOPRINT; VAR X; OUTPUT OUT=OUTPUT N=n MEAN=BARX VAR=S2; RUN;DATA RESULT; SET OUTPUT ;ALPHA=0.1; MU0=75; CC=(100-n)/(100-1);TCAL=(BARX-MU0)/SQRT(S2/N)*CC);T=TINV(1-ALPHA ,N-1);IF TCAL=T THEN RESULT=REJECT;ELSE RESULT=ACCEPT; RUN;PROC PRINT; VAR ALPHA TCAL T RESULT; RUN;运行结果OBS ALPHA TCAL T RESULT 1 0.1 1.44368 1.53321 ACCEPT 8.3 两个正态总体参数检验8.3.1两个正态均值之间的假设检验8.3.1.1 、为已知数时,两个总体平均值的假设检验在经济分析中,常常需要比较两个总体的参数。比如,北方地区和南方地区的经济发展水平是否有显著性差异等,对这种两个总体(地区)的参数是否有显著性差异的问题,可用两个正态总体参数检验的方法来解决,其检验步骤如下:第一步:设两个总体的平均值和方差分别为、和、,原假设可设定为两个总体的平均值相等。即:= :第二步:分别从两个总体中抽出一个样本,得到样本容量和平均数分别为、和,的样本。如果和服从正态分布,则也服从正态分布。下面计算一下新的概率变量-的平均值和方差。 (8-8)和是相互独立的,所以其协方差2Cov(,)=0 (8-9) (8-10)把进行标准化得到标准化的检验统计量; (8-11)第三步:计算检验统计量。并根据原假设设定双侧检验还是单侧检验。若原假设为 :,则需要双侧检验;若:,则左侧检验;若:,则右侧检验。第四步:根据所给定的显著性水平值和的临界值,进行判断。例8-7:某汽车公司为了检验型汽车和型汽车的耗油量,分别从型和型汽车中随机抽出9辆汽车作了试验。试验结果表明,当消耗1升汽油时,两种型号汽车的平均行驶距离分别为12Km、11Km。如果这两种型号汽车的标准差分别服从1.5Km/升和1Km/升的正态分布, 试分析在显著性水平为=1%的条件下,的原假设是否成立。解:根据题意,利用检验统计量(8-11)进行双侧检验。 与显著性水平为=1%相对应的临界值为,因为=-2.575 =ABS(Z) THEN RESUL=REJECT; ELSE RESULT=ACCEPT; RUN;PROC PRINT; VAR ALPHA Zcal z RESULT; RUN;运行结果OBS ALPHA ZCAL Z RESULT1 0.01 1.66410 -2.57583 ACCEPT8.3.1.2 、为未知数时,两个总体均值之差的假设检验1.样本容量较大的情况如果、为未知数,但样本为大样本时,我们可用样本的方差、代替总体的、,利用下面的近似公式计算检验统计量。 (8-12) 在前面的例8-6中, 假设、是未知数。 如果把样本容量由原来的9个扩大到32个时, 测得两种型号汽车的平均行驶距离分别为12Km/升、11.5Km/升。这时我们可利用(8-12)式来进行假设检验。 显著性水平为=1%的条件下,所以原假设成立。但如果给定的显著性水平为=0.05%(),则原假设不成立。2样本容量较小的情况如果、为未知数,且样本容量较小时,可利用下面的检验统计量进行假设检验(详见8.6.3)。 (8-13)但利用上面的检验统计量,必须满足这样的两个条件。首先两个总体必须满足正态分布;其次是两个总体的方差必须相等=。例8-8:在同届毕业的文科和工科毕业生中各随机抽出10、15名,其调查结果表明,文科和工科类毕业生的工资收入分别为80、75万(韩币),方差分别为300、200。试问在显著性水平=0.05的条件下,同届毕业的文科和工科类毕业生的工资水平是否有显著性差异。解:设同届毕业的文科和工科类毕业生的工资水平没有显著性差异。9)DATA example8;ALPHA=0.05; n1=10; n2=15; barX1=80; barX2=75; S1=SQRT(300); S2=SQRT(200);Spooled=(n1-1)*s1*2+(n2-1)*s2*2)/(n1+n2-2);Tcal=(barX1-barX2)/SQRT(Spooled*(1/n1+1/n2);T=TINV(ALPHA/2,n1+n2-2);IF ABS(Tcal) =ABS(t) THEN RESULT=REJECT; ELSE RESULT=ACCEPT; RUN;PROC PRINT; VAR ALPHA Tcal t RESULT; RUN;运行结果OBS ALPHA TCAL T RESULT 1 0.05 0.79201 -2.06866 ACCEPT)即:-=0=80,=75 在=0.05的条件下,自由度为-2=10+15-2=23时,相应的临界值查表可得。因为,所以同届毕业的文科和工科类毕业生的工资水平没有显著性差异的原假设成立。DATA example8;ALPHA=0.05; n1=10; n2=15; barX1=80; barX2=75; S1=SQRT(300); S2=SQRT(200);Spooled=(n1-1)*s1*2+(n2-1)*s2*2)/(n1+n2-2);Tcal=(barX1-barX2)/SQRT(Spooled*(1/n1+1/n2);T=TINV(ALPHA/2,n1+n2-2);IF ABS(Tcal) =ABS(t) THEN RESULT=REJECT; ELSE RESULT=ACCEPT; RUN;PROC PRINT; VAR ALPHA Tcal t RESULT; RUN;运行结果OBS ALPHA TCAL T RESULT 1 0.05 0.79201 -2.06866 ACCEPT8.6 假设-检验8.6.1 一个总体平均数的-检验设随机变量是从符合正态分布的总体中抽取的样本,且总体和样本的平均数及方差分别为、。当总体方差为未知数时,不能选择统计量,此时需要用样本方差代替总体方差,检验统计量服从自由度为的-分布。-检验步骤如下;1)原假设与替换假设: := :2)检验统计量(概率度): (8-17)在大样本(随机变量的容量30)的情况下,-分布和Z-分布相接近。样本统计量服从或趋近于期望值为、方差为的标准正态分布(0,1)。根据实际=0临界值接受 H0|T*| t/2拒绝H0拒绝H0临界值(图8-5)-检验的接受区和拒绝区抽样调查资料,计算样本的平均数及标准差s,就可以具体确定统计量值。设定显著性水平计算检验统计量-值()作出统计决策。若原假设成立,则检验统计量(概率度)服从自由度为-1的-分布。在显著性水准条件下,对不同的替换假设,有不同的统计决策。:, 如果 a, n-1,则原假设被否定(右单侧检验) 15)t,n-1值等于自由度为n-1的t-分布的100%。)。:,如果a/2, n-1,则原假设被否定(双侧检验)。3) -值及统计决策-值是检验样本和原假设之间一致性程度的尺度。-值可根据逻辑对立假设计算。=(n-1):右单侧检验时,检验统计量的-值是自由度为-1的-分布中,比检验统计量大的概率。如果-值越小,则检验统计量越接近-分布的右尾部,原假设被否定的可能性越大;反之-值越大,则原假设被接受的可能性越大。=(n-1|):双侧检验时,检验统计量|的-值是自由度为-1的-分布中,比检验统计量的绝对值大的概率。如果-值越大,则检验统计量越接近-分布的左尾部,原假设被否定的可能性越大,反之-值越大,则原假设被接受的可能性越大。f(x)=0拒绝H0p/2接受H01-拒绝H0p,则原假设成立;若-值 即A元件的寿命有显著提高。SAS PROGRAMDATA examp11;INPUT X ;DX=X-25; (a)CARDS;28 25 27 31 10 26 30 15 55 12 24 32 28 42 38RUN;PROC MEANS MEAN STD T PRT MAXDEC=2; TITLEONE-TAILED T TEST; VAR DX; RUN; (b)PROGRAM解释(a)DX=X-25用SAS程序分析样品和总体平均数之间的显著性差异时,SAS程序自动的进行双侧检验分析, H0:=25,H1:25。所以利用总体平均数和样本的离差变量DX=X-25。(b) PROC MEANS MEAN STD T PRT MAXDEC=2PROC MEANS MEAN STD T 是计算检验统计量的命令。PRT MAXDEC=2 表示双侧检验,PRT命令将打印检验统计量p-值。 运行结果及解释ONE-TAILED T TESTAnalysis Variable : DXMean Std Dev T Prob|T|3.20 11.44 1.08 0.2970=00.05拒绝H0P/2=0.1485接受H01-0.05=0.95=1.08,检验统计量p-值=0.2970。因为在SAS程序自动进行双侧检验,故p/2=0.14850.05。所以原假设成立。8.6.2一个总体两个对应比较-检验对应比较-检验是指对同一个总体的同一个试验单位,作两种不同的“处理”之后出现的结果进行对应比较的方法。比如,有一个电视机组装车间,现研究当引进新的组装技术后,其组装时间是否比过去的组装时间有所缩短的问题。在研究这类问题时我们发现可以采用对应比较的的方法。因为组装车间(总体)没变,试验单位(组装工人)也没变,所以测定过去的组装方法与新的组装方法的生产效率问题时,可以利用对同一个试验单位的两种不同的处理结果,作简单的-分析。资料: 设是同一个总体中,个对应样本(,)之差(= -),且对应样本的平均数()和标准差()定义如下。对应样本的平均数: = (8-18)对应样本的标准差: = (8-19)假设: 假定相互独立,且和平均数-具有相同的分布。当对应样本是小样本(30),不必检验。提出原假设 : 对应样本无差异,即:=或 =0检验统计量: = (8-20)检验统计决策若原假设成立,则检验统计量服从自由度为-1的-分布。在显著性水平条件下,对不同的替换假设,有不同的统计决策。: 如果 a, n-1,17)t,n-1值等于自由度为n-1的t-分布的100%。) 则原假设被否定(右单侧检验)。: 如果 ta/2, n-1,则原假设被否定(双侧检验)。-值及统计决策-值是检验样本和原假设之间一致性程度的尺度。-值可根据逻辑对立假设计算。=(n-1 )-右单侧检验; =(n-1 |)-双侧检验。可以利用检验统计量的-值和显著性水平相互比较的方法,作出统计决策。在SAS统计分析程序中,SAS软件自动把统计量值换算成相应的-值。如果-值大于显著性水平,则原假设成立。如果-值小于显著性水平,则原假设被否定。例8-12: 某电器组装车间研究引进新的组装方法后,组装A产品的数量是否有所提高。于是他们从组装A产品的工人中随机抽出15人,进行一个月的新组装技术培训后,和过去的组装方法作了比较。其资料见表8-3(=0.05)。(表8-3) 两种组装方法的生产量(台)生产工人1 2 3 4 5 6 7 8 9 10 11 12 13 14 15旧组装方法34 28 29 45 26 27 24 15 15 27 23 31 20 35 20新组装方法33 36 50 41 37 41 39 21 20 37 21 18 29 8 27 提出原假设。 两种组装方法的生产量差异变量(-),是否服从正态分布。 试求的平均数和标准差。 试求检验统计量及-值,并解释其结果。解:对新的变量的正态分布分析,提出原假设及替换假设。: 服从正态分布 :不服从正态分布。SAS PROGRAMDATA exampl13;INPUT X Y ;D=X-Y;CARDS; 34 33 28 36 29 50 45 41 26 37 27 41 24 39 15 21 15 20 27 37 23 21 31 18 20 29 35 38 20 27RUN;PROC UNIVARIATE NORMAL; 计算检验统计量p-值,并分析D的分布是否服从正态分布VAR D; 打印出变量D的描述性统计量,而且可计算对样本的t检验统计量。RUN;运行结果及解释: Univariate ProcedureVariable=D Moments Quantiles(Def=5) N 15 Sum Wgts 15 100% Max 13 99% 13 Mean -5.93333 Sum -89 75% Q3 1 95% 13 Std Dev 8.489209 Variance 72.06667 50% Med -7 90% 4 Skewness 0.498342 Kurtosis 0.63491 25% Q1 -11 10% -15 USS 1537 CSS 1008.933 0% Min -21 5% -21 CV -143.077 Std Mean 2.191904 1% -21 T:Mean=0 -2.70693 Pr|T| 0.0170 Range 34 Num = 0 15 Num 0 4 Q3-Q1 12 M(Sign) -3.5 Pr=|M| 0.1185 Mode -21 Sgn Rank -41 Pr=|S| 0.0181 W:Normal 0.978148 PrW 0.9275 运行结果的解释从计算结果中可知,正态分布检验统计量为W=0.9275,其p值=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自建厂房租房合同协议书
- 液体安检机采购合同范本
- 杉木木材出售协议书模板
- 自愿赔偿协议书模板模板
- 股份退股机制协议书范本
- 童装店合作合同协议范本
- 物业服务摆地摊合同范本
- 离婚夫妻财产保全协议书
- 私人购买安置房合同范本
- 阳台拆迁违建补偿协议书
- 矿业工程面试题及答案
- 2025年综合类-中医基础理论-第一单元中医学理论体系的主要特点历年真题摘选带答案(5卷单选一百题)
- 学校食堂承包季节菜品创新美食计划
- 2025年事业单位招考综合基础知识全真模拟考试试题(含答案)
- 2025-2030中国重水市场运行态势与未来竞争力剖析报告
- 2025汽车智能驾驶技术及产业发展白皮书
- 企业财务管理制度10篇
- 2025年河南省中考英语真题 (解析版)
- 2025年广西公需科目答案01
- JJF1033-2023计量标准考核规范
- 人工智能导论-第2版-全套课件
评论
0/150
提交评论