已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育统计学,1,1,2,第十章卡方(2)检验,第一节2及其分布第二节单向表的2检验第三节双向表的2检验第四节四格表的2检验,3,第一节卡方(2)及其分布,一、卡方(2)检验的特点卡方(2)检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。即根据样本的频数分布来推断总体的分布。,4,与测量数据的假设检验不同:第一,测量数据的假设检验,其数据属于连续变量,而卡方检验的数据属于点计而来的间断变量。第二,测量数据所来自的总体要求呈正态分布,而卡方检验的数据所来自的总体分布是未知的。第三,测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验;而卡方检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。卡方检验属于自由分布的非参数检验。,第一节卡方(2)及其分布,5,比率和比率之差的假设检验,是对二项分布数据的假设检验。处理一个因素分成两类,或者两个因素,每个因素都分为两类的资料。最多只能同时比较两组比率的差异。卡方(2)检验可同时处理一个因素分为多种类别,或多种因素各有多种类别的资料。凡是可以应用比率进行检验的资料,都可以应用卡方(2)检验。,第一节卡方(2)及其分布,6,二、卡方(2)检验的统计量卡方(2)检验统计量的基本形式为:,第一节卡方(2)及其分布,f0实际频数ft理论频数,7,二、卡方(2)检验的统计量例如:从某校随机抽取50个学生,其中男生27人,女生23人,问该校男女生人数是否相同?根据男女生人数相同的假设,其理论频数应为50/2=25。于是,第一节卡方(2)及其分布,8,可列表计算2值表10.1男女学生人数的2值计算表,第一节卡方(2)及其分布,9,2值的特点:第一,2值具有可加性。如,男生+女生=总卡方值。第二,2值永远是正值。第三,2值的大小随实际频数与理论频数差的大小而变化。两者之差越小,说明样本分布与假设的理论分布越相一致;两者之差越大,说明样本分布与假设的理论分布越不相一致。究竟2值大到什么程度才能说样本分布与理论分布不一致呢?这要看样本的2值在其抽样分布上出现的概率如何而定。,第一节卡方(2)及其分布,10,三、2值的抽样分布用上例说明2的抽样分布。如果将上述所抽取的50个学生还回总体之中,再从中随机抽取50个学生,又可以计算出一个样本2值。这样反复抽下去,就会有一切可能个样本2值。这一切可能个样本2值的频数分布,就形成一个实验性的2的抽样分布。,第一节卡方(2)及其分布,11,2分布的特点:第一,2分布呈正偏态,右侧无限伸延,但永不与基线相交。第二,2分布随自由度的变化而形成一簇分布形态。所谓自由度是指实际频数与理论频数差数中,能够独立变化的个数。本例实际频数与理论频数的差数有2个,因为受到(f0-ft)=0因子的限制,其中只有一个可以独立变化,则自由度df=1。自由度越小,2分布偏斜度越大;自由度越大,分布形态越趋于对称。,第一节卡方(2)及其分布,12,2分布的特点:,第一节卡方(2)及其分布,自由度越小,2分布偏斜度越大;自由度越大,分布形态越趋于对称。,13,单向表把实得的点计数据按一种分类标准制成表就是单向表。单向表(因素)的2检验对于单向表的数据所进行的2检验就是单向表(因素)的2检验。,第二节单向表的卡方(2)检验,14,一、按一定比率决定理论频数的2检验例如大学某系54位老年教师中,健康状况属于好的有15人,中等的有23人,差的有16人,问该校老年教师健康状况好、中、差的人数比率是否为1:2:1?检验的步骤:(1)提出假设H0:健康状况好、中、差的人数比率为1:2:1H1:健康状况好、中、差的人数比率不是1:2:1,第二节单向表的卡方(2)检验,15,检验的步骤:(2)计算2值根据零假设,健康状况好、中、差的理论频数ft分别为:54(1/4)=13.554(2/4)=2754(1/4)=13.5然后根据公式求解2值,第二节单向表的卡方(2)检验,2=(15-13.5)2/13.5+(23-27)2/27+(16-13.5)2/13.5=1.22,16,也可列表计算2值,第二节单向表的卡方(2)检验,表10.2不同健康人数的2值计算表,17,检验的步骤:(3)统计决断首先决定自由度。单向表2的自由度一般等于组数减1,即df=K-1。然后根据df=K-1=3-1=2,查2值表,2(2)0.05=5.99,由于2=1.220.05,按照表10.32检验统计决断的规则,应保留H0而拒绝H1。其结论为:该校老年教师的健康状况,好、中、差人数比率为1:2:1。,第二节单向表的卡方(2)检验,18,检验的步骤:(3)统计决断表10.32检验统计决断规则,第二节单向表的卡方(2)检验,19,二、一个自由度的2检验1、各组理论频数ft5的情况例如:从小学生中随机抽取76人,其中50人喜欢体育,26人不喜欢体育,问该校学生喜欢和不喜欢体育的人数是否相等?检验的步骤:(1)提出假设H0:喜欢与不喜欢体育的人数相等H1:喜欢与不喜欢体育的人数不相等,第二节单向表的卡方(2)检验,20,二、一个自由度的2检验检验的步骤:(2)计算2值本例df=1,两组的理论频数均为ft=385。,第二节单向表的卡方(2)检验,表10.4喜欢与不喜欢体育人数的2值计算表,21,二、一个自由度的2检验检验的步骤:(3)统计决断根据df=K-1=2-1=1,查2值表,2(1)0.01=6.63,由于2=7.586.63=2(1)0.01,则P0.01,按照表10.32检验统计决断规则,应在0.01显著性水平上拒绝H0而接受H1。其结论为:该校喜欢体育的人数与不喜欢体育的人数不相等,并有极其显著性差异。,第二节单向表的卡方(2)检验,22,二、一个自由度的2检验2、某组理论频数ft5的情况当df=1,其中只要有一个组的ft5,就要用亚茨(Yates)连续性校正法,即,第二节单向表的卡方(2)检验,连续性校正的必要性:因为点计数据求得的2值是间断数列,当df=1,ft5时,间断性尤为明显。而2值表上的理论值是用连续量表示的,其2分布是一条连续的光滑曲线。,23,二、一个自由度的2检验2、某组理论频数ft5的情况例如:某区中学共青团员的比率为0.8,现从该区某中学随机抽取20人,其中共青团员有12人,问该校共青团员的比率与全区是否一样?检验的步骤:(1)提出假设H0:该校共青团员的比率与全区一样H1:该校共青团员的比率与全区不一样,第二节单向表的卡方(2)检验,24,二、一个自由度的2检验2、某组理论频数ft5的情况检验的步骤:(2)计算2值根据零假设,该校共青团员的ft=200.8=16,非共青团员的ft=200.2=4。由于本例df=1,有一个组的ft=45,在计算2值时需要进行亚茨连续性校正。,第二节单向表的卡方(2)检验,25,二、一个自由度的2检验2、某组理论频数ft5的情况检验的步骤:(2)计算2值表10.5检验某中学共青团员比率是否与全区一样的2值计算表,第二节单向表的卡方(2)检验,26,二、一个自由度的2检验2、某组理论频数ft0.05,于是保留H0而拒绝H1。其结论为:该校共青团员的比率与全区没有显著性差异。,第二节单向表的卡方(2)检验,27,三、频数分布正态性的2检验例如:120个11岁男生身高的频数分布如表,问其总体是否呈正态分布?(平均数X=139.9,标准差X=7.5)检验的步骤:(1)提出假设H0:样本所属的总体呈正态分布H1:样本所属的总体不呈正态分布,第二节单向表的卡方(2)检验,28,三、频数分布正态性的2检验检验的步骤:(2)计算2值按照样本所属的总体呈正态分布的零假设,运用正态曲线下面积的有关知识,首先求各组的理论频数,其步骤为:将各组的上下限转换为标准分数Z值。根据各组上下限Z值查表,寻找各组上下限Z值至Z=0之间的面积。求各组的面积。将各组的面积与总频数相乘,求各组的理论频数。,第二节单向表的卡方(2)检验,29,三、频数分布正态性的2检验检验的步骤:(2)计算2值在计算实际频数与理论频数差数之前,两端若有任何一组的理论频数小于5,就要进行校正。即把ft5这组的理论频数与相邻组的理论频数合并,直至大于5为止。然后将相应组的实际频数也进行合并。,第二节单向表的卡方(2)检验,求2=5.202,根据,30,三、频数分布正态性的2检验检验的步骤:(3)统计决断正态性2检验的自由度df=K-3。K是合并后保留下来的组数。df=7-3=4。自由度df=K-3的原因:1单向表的2检验受到(f0-ft)=0一个因子的限制。2应用Z=(X-X)/X的公式计算理论频数时,运用了X和X两个样本统计量,又受到两重限制,一共失去3个自由度。,第二节单向表的卡方(2)检验,31,三、频数分布正态性的2检验检验的步骤:(3)统计决断根据df=4,查2值表,2(4)0.05=9.49,由于2=5.200.05,应保留H0而拒绝H1。其结论为:11岁男生的身高总体是呈正态分布的。,第二节单向表的卡方(2)检验,32,双向表把实得的点计数据按两种分类标准编制成的表就是双向表。双向表的2检验对双向表的数据所进行的2检验,就是双向表的2检验,即双因素的2检验。rc表的2检验横向组数r,纵向组数c,那么双向表的2检验也称为rc表的2检验。如,44的2检验。独立性2检验判断两种分类特征,即两个因素之间是否有依从关系。,第三节双向表的卡方(2)检验,33,例1:家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范大学有三种不同的态度(愿意、不愿意、未定),问学生是否愿意报考师范大学与家庭经济状况是否有关系?表10.7学生对报考师范大学的态度与家庭经济状况之间关系的双向表,第三节双向表的卡方(2)检验,34,由于r=3,c=3,可进行33表的独立性2检验检验的步骤:(1)提出假设H0:学生是否愿意报考师范大学的态度与家庭经济状况没有关系H1:学生是否愿意报考师范大学的态度与家庭经济状况有关系(2)计算2值首先要计算各组的理论频数。计算双向表理论频数的公式为:,第三节双向表的卡方(2)检验,35,计算双向表理论频数的公式为:,第三节双向表的卡方(2)检验,nr横行各组实际频数的总和nc纵列各组实际频数的总和N样本容量的总和,例如:经济状况上等而又愿意报考师范大学的理论频数为:,36,计算出各组的理论频数后,根据,第三节双向表的卡方(2)检验,计算2值为:,37,rc表2值,还可由实际频数直接求得。,第三节双向表的卡方(2)检验,数据代入,f0rc表中每格的实际频数nr横行各组的实际频数总和nc纵列各组的实际频数总和N样本容量的总和,38,(3)统计决断rc表的自由度为:df=(r-1)(c-1)r双向表中横行的组数c双向表中纵列的组数根据df=(3-1)(3-1)=4,查2值表,2(4)0.05=9.49,2(4)0.01=13.28,由于9.4910.4713.28,则0.01P0.05。应在0.05显著性水平上拒绝H0而接受H1。其结论为:学生是否愿意报考师范大学的态度与家庭经济状况有关系。,第三节双向表的卡方(2)检验,39,同质性2检验在双向表2检验中,如果是判断几次重复实验的结果是否相同,这种2检验称为同质性检验。例2:从甲、乙、丙三个学校的平行班中,随机抽取三组学生,测得他们的语文成绩如表。问甲乙丙三个学校此次语文测验成绩是否相同?表10.8三个学校语文成绩的双向表,第三节双向表的卡方(2)检验,40,因为r=3,c=2,可进行32表的同质性2检验检验的步骤:(1)提出假设H0:甲乙丙三个学校语文测验成绩相同H1:甲乙丙三个学校语文测验成绩不相同(2)计算2值两种方法:,第三节双向表的卡方(2)检验,41,检验的步骤:(3)统计决断根据df=(3-1)(2-1)=2,查2值表,2(2)0.05=5.99,2(2)0.01=9.21,由于5.997.149.21,则0.01P0.05。应在0.05显著性水平上拒绝H0而接受H1。其结论为:甲乙丙三个学校语文测验成绩有显著性差异。,第三节双向表的卡方(2)检验,42,双向表的独立性2检验和同质性2检验只是检验的意义不同,而方法完全相同。对同一组数据所进行的2检验,有时既可理解为独立性2检验,又可理解为同质性2检验,两者无本质区别。如果rc表的2检验所作的结论为差异显著,但并不意味着各组之间的差异都显著。如果要进一步知道哪些组差异显著,哪些组不显著,还需进行四格表的2检验。,第三节双向表的卡方(2)检验,43,一、独立样本四格表的2检验独立样本四格表的2检验就是独立样本双向表中22表的2检验。计算方法:既可以用缩减公式由实际频数直接计算2值,又可以用理论频数的方法计算2值。,第四节四格表的卡方(2)检验,44,一、独立样本四格表的2检验1、缩减公式2值的计算独立样本四格表2值的缩减公式为,第四节四格表的卡方(2)检验,a、b、c、d四格表中的实际频数,45,一、独立样本四格表的2检验前例:甲乙丙三组语文测验成绩综合而言差异显著,现对乙丙两组成绩差异进行显著性检验。检验的步骤:(1)提出假设H0:乙丙两组语文测验成绩无本质差异H1:乙丙两组语文测验成绩有本质差异,第四节四格表的卡方(2)检验,46,一、独立样本四格表的2检验检验的步骤:(2)计算2值两种方法:方法1实际频数表10.9a乙丙两个学校语文测验成绩的四格表,第四节四格表的卡方(2)检验,47,一、独立样本四格表的2检验检验的步骤:(2)计算2值两种方法:方法2理论频数表10.9b乙丙两个学校语文测验成绩的四格表,第四节四格表的卡方(2)检验,48,一、独立样本四格表的2检验检验的步骤:(3)统计决断根据df=1,查2值表,2(1)0.05=3.84,由于2=0.0060.05。应保留H0而拒绝H1。其结论为:乙丙两组语文测验成绩无显著性差异。,第四节四格表的卡方(2)检验,49,一、独立样本四格表的2检验2、校正2值的计算当df=1,样本容量总和N30或N50时(取决于对检验结果要求的严格程度),应对2值进行亚茨连续性校正。校正公式为:,第四节四格表的卡方(2)检验,50,一、独立样本四格表的2检验2、校正2值的计算例如:高二40个学生考试焦虑测验结果如表10.10a,问男女学生考试焦虑人数分布有无本质差异?表10.10a男女学生考试焦虑人数分布的四格表,第四节四格表的卡方(2)检验,51,一、独立样本四格表的2检验2、校正2值的计算检验的步骤:(1)提出假设H0:男女生考试焦虑人数分布无本质差异H1:男女生考试焦虑人数分布有本质差异,第四节四格表的卡方(2)检验,52,一、独立样本四格表的卡方检验2、校正2值的计算(2)计算2值两种方法:方法1缩减的校正公式(实际频数)由于df=1,N=40,304050,如果对检验结果从严要求,在计算2值时,仍需进行亚茨连续性校正。,第四节四格表的卡方(2)检验,53,一、独立样本四格表的2检验2、校正2值的计算(2)方法2通过理论频数由于df=1,有一个组的理论频数小于5,ft=4.85,仍需进行亚茨连续性校正。表10.10b男女学生考试焦虑人数分布的四格表,第四节四格表的卡方(2)检验,54,一、独立样本四格表的2检验2、校正2值的计算(3)统计决断根据df=1,查2值表,2(1)0.05=3.84,由于2=0.240.05。应保留H0而拒绝H1。其结论为:高二男女生考试焦虑人数分布无显著性差异。,第四节四格表的卡方(2)检验,55,二、相关样本四格表的2检验1、缩减公式2值的计算相关样本四格表2值的缩减公式为:b、c两次测验结果发生变化的实际频数,第四节四格表的卡方(2)检验,56,二、相关样本四格表的2检验1、缩减公式2值的计算例如:124个学生1000米长跑,训练一个月前后两次测验达标情况如下表,问一个月的训练是否有显著效果?,第四节四格表的卡方(2)检验,57,二、相关样本四格表的2检验1、缩减公式2值的计算检验的步骤:(1)提出假设H0:一个月长跑无显著效果H1:一个月长跑有显著效果(2)计算2值两种方法方法1缩减公式(实际频数),第四节四格表的卡方(2)检验,58,二、相关样本四格表的2检验1、缩减公式2值的计算检验的步骤:(2)计算2值两种方法方法2理论频数同一组学生两次测验结果只涉及到b和c发生变化。根据一个月长跑训练无显著效果的零假设,b和c的理论频数均为:,第四节四格表的卡方(2)检验,则,59,二、相关样本四格表的2检验1、缩减公式2值的计算检验的步骤:(3)统计决断根据df=1,查2值表,2(1)0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025山东商河经济开发区招聘7人笔试历年常考点试题专练附带答案详解试卷3套
- 2025国投泰康信托校园招聘笔试历年典型考点题库附带答案详解试卷3套
- 甘肃甘州区公务员考试试题及答案
- 片区城中村改造项目社会稳定风险评估报告
- 2025光大兴陇信托校园招聘笔试历年常考点试题专练附带答案详解试卷3套
- 2025中联重科校园招聘笔试历年典型考点题库附带答案详解试卷3套
- 2025中国电子数据产业集团社会招聘笔试历年典型考点题库附带答案详解试卷3套
- 2025上交所技术有限责任公司校园招聘20人笔试历年典型考点题库附带答案详解试卷3套
- xx片区城中村改造项目社会稳定风险评估报告
- 芬兰市公务员考试试题及答案
- 热控检修基础知识培训课件
- 小区保洁服务投标方案(3篇)
- 2025年特种设备焊接作业特种作业操作证考试试卷(等离子焊接篇)
- 影像科护理专业课件
- 医院护理部年度运营分析报告
- 人教版九年级历史上册期末复习知识点考点背诵提纲
- 口腔修复课件教学
- 《大学语文》课件10《诗经》
- 肥料生产管理制度
- 努力才会有收获课件
- 《发电企业安全生产标准化规范及达标评级标准》(电监安全202523号)
评论
0/150
提交评论