




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、假设检验(二)一一非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z检验、t检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资
2、料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5)非参数检验法目前还不能用于处理因素间的交互作用。非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。一'7检验72检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。22检验的方法主要包括适合性检验和独立性检验。(一)2检验概述7-2是实得数据与理论数据偏离程度的指标。其基本公式为:”=£(f0fe)2(公式119)fe式
3、中,fo为实际观察次数,fe为理论次数。分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,观察公式可发现,如果实际观察除以理论次数,求出比值,再将n个比值相加,其和就是次数与理论次数的差异越小,72值也就越小。当f0与fe完全相同时,72值为零。72值的特点为:?2值具有可加性。*值永远不会小于零。72值的大小随着实际次数与理论次数之差的大小而变化。利用?2值去检验实际观察次数与理论次数的差异是否显著的方法称为2-2检验。2上检验有两个主要的作用:第一,可以用来检验各种实际次数与理论次数是否吻合的问题,这类问题统称为适合性检验;第二,判断计数的两组或多组资料是否相
4、互关联还是相互独立的问题,这类问题统称为独立性检验。2的检验的具体步骤与t检验基本相同。第一,建立虚无假设。例如假定实测次数与理论次数无显著差异,差异仅由机会造成。第二,计算理论次数,并求出72值。第三,统计推断。根据df数目和选定的显著性水平,查72值表得出超过实得72值的概率。把概率的大小,作为接受或拒绝假设的依据。表11972检验统计决断规则?2值与临界值的比较P值显著性72c72(df,0.05)P>0不显著y2/2£(df,0.05)<工<0.01<P<0.05显著(*)72(df,0.01)7272人足(df,0.01)Pw0.01极其显著(
5、*)(二)适合性检验适合性检验是应用X2检验方法的一种。它主要适用于检验实际观测次数与理论次数之检查以是否显著,它所面对的研究对象主要是一个因素多项分类的计数资料,所以又称为单因素分类72检验或单项表的2-2检验。适合性检验的种类主要有无差假设的适合性检验和实际次数分布是否属于正态分布的适合性检验,下面逐一进行简要介绍1.无差假设的适合性检验所谓无差假设是指各项分类的次数没有差异,理论次数完全按概率相等的条件计算,即理论次数=总数/分类项数例1,随机抽取70名学生,调查他们对高中分文理科的意见,回答赞成的有42人,反对的有28人。问对分科的意见有无显著差异?解:此例只有两种分类。因此应有理论次
6、数fe=70X0.5=35(人)检验步骤:(1)建立假设:Ho:f0=fe=3O,Hi:f0¥fe(2)计算胃值:2、(fo-fe)2(42-35)2(28-35)2=二2.8fe3535(3)统计推断。首先确定自由度df,72检验的自由度一般等于分类项数减1,本例df=21=1。查df=1的2表,/2(1,0.05)=3.84,故有12VZ2(1,0.05),因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:学生对高中文理分科的态度的差异不显著例2,某大学某系的46位老年教师中,健康状况属于良好的有15人,中等的有20人,比较差的有11人,问该系老教师中三种健康状况
7、的人数是否一样?解:此例有三种分类。因此应有理论次数fe=46=18(人)3检验步骤:(1)建立假设:H。:健康状况好、中、差三种人数相同H1:健康状况好、中、差三种人数不相同(2)计算膂值:2_2_2_22v(f0-fe)(15-18)(20-18).(11-18)=乙=3.44fe181818(3)统计推断。首先确定自由度df,本例df=31=2。查df=2的72表,22(2,0.05)=5.99,故有/2<72(2,0.05),因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:该系老教师中,健康状况好、中、差三种人数无显著差异2.实际次数分布是否属于正态分布的适合性
8、检验2检验还可以通过将正态分布的概率转换为理论次数的数值,来检验某些实际次数分布是否属于正态分布。例3,今对某校100名学生进行操行评定,分优、良、中、差四等,评定结果为:优19人、良39人、中35人、差7人。试检验其分布的形式是否属于正态分布?解:检验步骤:(1)建立假设:H0:评定结果服从正态分布Hi:评定结果不服从正态分布(2)计算72值:首先需求出理论次数。正态分布的各部分理论次数,是通过正态分布图中面积比率乘以总次数得出的。在正态分布情况下,正态曲线底边上士3仃之内几乎包含了全部量数,因此我们可将正态分布底线长度从30至+30分为四个等分,每等分为1.5灯,其面积比率为:第一等分(优
9、)的面积:上限3。,下限为1.5仃。1.5。3。之间的面积比率为:0.49870.4332=0.0655,即7%第二等分(良)的面积:位于01.5仃之间,其面积比率为0.4332,即43%,第三等分(中)的面积:位于01.5。之间,其面积比率为0.4332,即43%第四等分(差)的面积:位于一1.5仃一3。之间的面积比率为:0.4987-0.4332=0.0655,即7%根据各等分的面积比率,乘以总人数,即可得出理论次数。如:优的人数为7%<100=7,良的人数为43%X100=43。同理可求出中的人数为43,差的人数为7。即优的fe=7,良的fe=43,中的fe=43,差的fe=7。代
10、入(公式119)有:_2_2_222_(19-7).(39-43).(35-43).(7-7)_一二22.43743437(3)统计推断。首先确定自由度df,本例df=41=3。查df=2的*表,炉(3,0.05)=7.81,2(3,0.01)=11.345,故有工2>/2(3,0.01),因此应在0.01显著性水平上拒绝虚无假设,接受备择假设。其结论为:此评定结果不服从正态分布(三)独立性检验独立性检验也是72检验的一个重要应用。如果想研究两个或两个以上因素之间是否具有独立性,就可利用72独立性检验。独立性检验一般都采用表格的形式来显示观察结果,所以独立性检验也称为列联表分析。当检验对
11、象只有两个因素而且每个因素只有两项分类的列联表就称为2X2列联表或四格表;而一个因素有R类,另一个因素有C类,这种表示尔之为RxC表。本节只讨论二维列联表的情况。关于二维列联表的独立性检验,需注意几个问题:第一,独立性检验的虚无假设是二因素(或多元素)之间是独立的或无关联,被择假设是二因素(或多因素)自荐有关联或者说差异显著。一般多用文字叙述而很少用符号代替。第二,独立性检验的理论次数是直接由列联表所提供的数据推算出来的。如果用fRi表示第i行的和,fcj表示第j列的和,N为所有数据值和,则第i行第j列的方格内的理论次数为:.fR父fcjfe=(公式1110)eijN第三,二维列联表自由度与二
12、因素各自的分类项数有关。设R为行分类项数(行数),C为列分类项数(列数),则自由度为:df=(R1)(C-1)。1.2X2列联表的独立性检验2X2列联表就是把样本按两种性质分组,并排成两行两列的表,它是最简单的列联表,简称为四格表。2X2列联表用以进行两个组彼此独立互无关联的检验。独立性检验下面我们从样本的不同情况出发,分别介绍相应的检验方法。独立样本的2X2列联表的独立性检验独立样本4格表的独立性检验,既可以用计算殍的基本公式(公式119)计算,也可用F面的简捷公式计算:2(公式 11 11)2N(ad-bc)(ab)(cd)(ac)(bd)式中:a,b,c,d分别是四格表内的实计数2表11
13、102X2列联表的2值计算示意表分类1分类2合计分类1aba+b分类2cdc+d合计a+cb+dN=a+b+c例4,设有甲乙两区,欲测验两区中学教学水平,各区随机抽取500名初三学生,进行统一试题的数学测验,其结果是:甲区及格学生为475人,不及格为25人;乙区及格学生460人,不及格为40人,问甲区中学与乙区中学的数学测验成绩的差异是否显著?解:检验步骤:(1)建立假设:H。:甲区中学与乙区中学数学测验成绩无显著差异Hi:甲区中学与乙区中学数学测验成绩差异显著(2)计算工2值:表1111甲区中学与乙区中学的数学测验成绩表及格人数不及格人数合计甲区475(a)25(b)500(a+b)乙区46
14、0(C)40(d)500(c+d)合计935(a+c)65(b+d)1000(a+b+c+d)根据简捷公式:?21000M(475父40-46025)2_36850065935500(3)统计推断。首先确定自由度df,本例df=(2-1)(2-1)=1,查df=1的工2表,2一.22(I(1,0.05)=3.84,故有/.<(.(1,0.05),因此应在0.05显者性水平上保留虚无假设,拒绝备择假设。其结论为:甲区中学与乙区中学数学测验成绩无显著差异。例5,随机抽取某校男生250名,女生240,进行体育达标考核,结果如下表问体育达标水平是否与性别有关?表1112体育达标考核情况表达标未达
15、标合计男152035女131831合计283866解:检验步骤:(1)建立假设:H0:体育达标水平与性别无关H1:体育达标水平与性别有关(2)计算充值:利用基本公式72 =工(f0 - fe),其理论次数为:fe35 28fe11 = b='85”出:20.1566fe2131 2866= 13.15fe2231 38=17.8566_2(15 -14.85)14.85一一2_2一_2.(20-20.15),(13-13.15),(18-17.85):000620.1513.1517.85(3)统计决断:首先确定自由度df,本例df=1,查df=1的/2表,,2(1,0.05)=3.8
16、4,故有?2<72(1,0.05),因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:体育达标水平与性别无关。相关样本的2X2列联表的独立性检验相关样本2X2列联表的独立性检验的简捷公式为:(公式 11 12)72=(b-c)2bc例6,110名教师培训普通话,培训2天前后两次测验通过情况如下表,问2天的训练是否有显著效果?表111340天前后两次测验通过情况表第二次测验通过未通过第一次测通过41(a)26(b)验未通过24(c)19(d)解:检验步骤:(1)建立假设:H0:2天训练无显著效果H1:2天训练有显著效果(2)计算个值:将上表中的数据代入(公式1112),有:
17、2_22=(b-c)=(26-24)=0.08bc2624b和c的理本例也可以用求理论次数的方法计算?2值。同一组教师两次测验结果只涉及到b(第一次通过而第二次未通过者)和c(第一次未通过二第二次通过者)。根据虚无假设,bc2624一论次数均为fe=bc=25,所以22222.工«一3=(26一25)+(24一25)=008fe2525用简捷公式和用理论次数计算出的/2值相同。使用时可任选一种(3)统计决断:首先确定自由度df,本例df=1,查df=1的/2表,/2(1,0.05)=3.84,故有?2<72(1,0.05),因此应在0.05显著性水平上保留虚无假设,拒绝备择假设
18、。其结论为:2天训练无显著效果。.符号检验它是非参数检验中最简单的顾名思义,符号检验是以正负号为依据所进行的假设检验方法,一种。(一)符号检验概述符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。符号检验与参数检验中相关样本显著性t检验相对应,当资料不满足参数检验条件时,可采用此法来检验两相关样本的差异显著性。根据符号检验判断差异显著性时也要查表找出相应的临界值。但特别应注意的是在某一显著性水平下,实得的r值大于表中r的临界值时,表示差异不显著,这一点与参数检验时的统计量和临界值的判断结果不同
19、。表1114单侧符号检验统计判断规则r与临界值的比P值显著性较r>r0.05P>0.05不显著r0.01<r<r0.050.01<P<0.05显著r<r0.01P<0.01极显著(二)符号检验的计算方法符号检验的具体检验方法因样本大小的不同而不同。1 .小样本(N<25)时的检验方法例7,研究人员将三岁儿童经配对而成的实验组进行颜色试验教学,对照组不进行此种教学后期测验得分如表1115。问颜色教学是否有显著效果?表1115实验组和对照组测验得分比较表配对123456789101112实验组X1182026142525211214172019
20、得对照验组X2142023122918211016131725分差数符号十0十十一十0十一十十一解:检验步骤:(1)建立假设:H0:颜色教学无显著效果Hi:颜色教学有显著效果(2)求差数并记符号:计算Xi与X2每对数据的差数,的个数n+=7,“”的个数n_=3,差数为0不予考虑。于是有:n=n+n_=7+3=10。将n+和n中较小的一个记为r,本例r=3。(3)统计决断:根据n=n+n_=7+3=10及显著性水平,查符号检验表寻找r的临界值,r0.05=i,而实际的r=3,有r>r0.05。由于符号检验表是单侧检验表,进行双侧检验时,其显著性水平应乘以2。所以本例应在0.10显著性水平上
21、保留虚无假设,拒绝备择假设。其结论为:颜色教学无显著效果。N >25)时,2 .大样本(N>25)时的检验方法对于差值的正负号差异的检验本属于二项分布的问题,当样本容量较大即(二项分布近似于正态分布,因此可用Z比率作为检验统计量。检验公式为:N(r-0.5)-(公式 11 13)Z:2.N2式中:r为n业n_的数值,N为n+与n_之和。±0.5为校正数,当r>»时用r0.5,一一2当r<N时用r+0.5。2例8,某省幼教培训中心,对30名幼儿园教师进行手工技能培训,培训前后的测验结果如表1116,试问培训前后的两次测验结果差异是否显著?序号12345
22、6789培训前X706586716190647094培训后Y766679796587738592差数符号一一十一一十一一十表111630名幼儿园教师培训前后的两次测验结果序号101112131415161718培训前X695560918582887466培训后Y745364968286907962差数符号一十一一十一一一十序号192021222324252627培训前X896762838684647274培训后Y907870779389638880差数符号一一一十一一十一一序号282930培训前X586094培训后Y607089差数符号一一十解:检验步骤:(1)建立假设:H0:手工技能培训无显
23、著效果Hi:手工技能培训有显著效果(2)求差数并记符号:计算X1与X2每对数据的差数,“+”的个数n+=9,”的个数n上21,差数为0不予考虑。于是有:N=n+n_=9+21=30。将n+和n_中较小的一个记为r,本例r=9o由于样本容量比较大,则可使用(公式1113)计算:N30-4.52.74- -1.64(r0.5)(100.5)-2=2N一3022(3)统计决断:因为Z <1.96 ,所以本例应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:手工技能培训无显著效果。符号检验法的优点是不需要对所要检验的两个总体的分布形态做任何假定,并且计算简便。其最大的缺点是它只考虑符
24、号,不考察差数的大小,因而失去样本所提供的一部分信息。对于同一样本数据,采用符号检验的精确度,只相当于t检验的60%,因此除了小样本,一般不使用符号检验。三.秩和检验秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。后来曼一惠特尼将其应用到两样本容量不等(n1#n2)的情况,因而又不为曼一惠特尼U检验。这种方法主要用于比较两个独立样本的差异。(一)适用范围如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的t检验,而需采用秩和检验。(二)检验方法1 .两个样本的容量均小于10的检验方法检验的具体步骤:第一步:将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为n1+n2)。第二步:把容量较小的样本中各数据的等级相加,即秩和,用T表示。第三步:把T值与秩和检验表中某«显著性水平下的临界值相比较,如果T1<T<T2,则两样本差异不显著;如果T<Ti或T>T2,则表明两样本差异显著。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园区规划与产业升级研究
- 工业大数据在智能工厂的应用
- 工业污染治理技术与实践
- 工业机器人与智能制造的关系研究
- 工业机器人技术及其应用案例分享
- 工业污染防治与环境保护措施
- 工业机器人发展现状及趋势分析
- 工业自动化系统的能效管理与优化
- 工业物联网安全保障方案
- 工业设计中的创新设计思维研究
- 2023海上风电场土建工程施工质量检验标准
- 2025江西南昌市江铜产融社会招聘1人笔试参考题库附带答案详解
- 2024年数据录入的注意事项试题及答案
- 2025届福建省厦门市高三下学期第二次质检(二模)历史试题
- 船舶安全隐患排查
- 竹编非遗面试题及答案
- 离婚协议书 标准版电子版(2025年版)
- 2025年服装制版师(高级)职业技能鉴定考试题库
- 2025届西藏林芝地区五下数学期末考试试题含答案
- 财政投资评审咨询服务预算和结算评审项目投标文件(技术方案)
- 手术室医疗垃圾的分类
评论
0/150
提交评论