第九讲 卡方检验ppt课件_第1页
第九讲 卡方检验ppt课件_第2页
第九讲 卡方检验ppt课件_第3页
第九讲 卡方检验ppt课件_第4页
第九讲 卡方检验ppt课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卡方检验是一种更常见的方法。(2)、(1)拟合优度检验例是指通过实际调查和观测获得的一批数据的频率分布是否服从理论上假设的某种概率分布;为了了解儿童对广播电视台提供的6个节目的偏好(态度),随机选择了300名儿童,询问他们最喜欢哪个节目(每个人只能选择一个)。获得的数据如下:问:对于300名被调查者,他们对6个项目的偏好(反映在人数上)是否有显著差异?变量之间的4、5、2独立性检验,将一批观测数据分成双向多类后,这两个分类特征是独立的还是有联合相关性?为了了解广大师生对实施“中期选拔分配”制度的态度。过去,有977名初中生、790名高中生和764名教师以问卷的形式被随机调查。调查结果如下:7、主要用于检验不同母亲群体对某一变量的反应是否存在显著差异。例从四所幼儿园中随机抽取六岁的儿童组成实验组进行记忆测试。测试材料是用红色、绿色和蓝色写的字母。以单位时间内的记忆次数为指标。结果如下。询问这四组数据是否可以结合起来进行分析。(3)同质性检验,(8)将红色字母、绿色字母和蓝色字母分组,(124171921512932020144102528),(9)理论基础是皮尔逊在1899年的工作:在分布的拟合优度检验中,实际观察数和理论数之间的差的平方除以理论数,以近似服从分布,即(2)检验的基本原理,10,-如果实际观察数和理论数之间的差-理论值()越大,拟合效果越好。注释11和k是类别的数量。是实际观察值;是理论(预期)数字;使用观测数据时使用的约束数或样本统计数;(1)卡方检验的基本公式,(12),(1)分类是互斥的,不包含的;(2)观测值相互独立;(3)预期次数应大于或等于5次(更接近卡方分布的前提);(2)卡方检验假设:如果自由度很小,就一定是,否则卡方检验需要更为阳性或用精确分布进行检验;(2)当自由度较大时,可能有几类理论次数小于5次;(3)应用卡方检验时,应注意抽样设计,以保证抽样的代表性,否则难以保证卡方检验结果的科学性;注意,14,由于测试仅涉及一个变量和多个分类的计数数据,也称为单向测试)1,适合度测试的一般问题是测试实际观察数据的分布是否与某一理论的分布显著不同。(3)卡方检验采用了一个良好的检验拟合检验(GoodnessofTest fit test),15,(1)统计假设,2)检验过程,即实际观察次数与某一分布的理论次数之间没有差异;根据统计检验公式,计算实际卡方值,计算数学基础,做出统计决策,N:的总数Pe为特定类别的理论概率,某次民意测验的答案有三种类型:同意、不同意和不同意。一项对48人的调查显示,24人同意,12人不同意,12人不同意。持有这三种观点的人数有什么显著差异吗?对于连续随机变量的测量数据,有时总体分布是未知的,需要根据样本数分布的信息来判断是否服从某种连续分布。(1)测试方法(1)将连续测量数据组织成数字分布表(2)绘制相应的数字分布曲线;(3)选择合适的理论分布;(4)进行配件检验;下表是552名学生的身高分布,询问这些学生的身高分布是否符合正态分布。20,169 170215.383.030.002371166 167712.382.440.012017163 164229.381.850.04260240.167160 161576.381.260.1088600.157167 158100.167167 164229.3850.04260.167160 161576.381.260.260.1 结论:Z检验与卡方检验一致(样本比率P的真实分布为二项分布),24岁的男女生,一个班100名学生和42名男生,问男生的比率是否与0.5有显著差异? 比率显著性检验,42585050,例,卡方检验(拟合度),25,2卡方检验公式当期望之和小于5时,26卡方检验需要修正,叶茨建议修正公式如下:注:修正结果与二项式分布结果一致,连续修正(二项式分类数据或比率),27,1,函数(例)主要通过分析两个或两个以上因素的多分类计数数据,研究两个或两个以上变量之间的相关性和相关性。(4)独立性检验(testofindependence),28)独立性检验通常以表格的形式记录观测结果的计数数据,称为列联表。rk型列联表(两个因素:一个因素有r分类,另一个有k分类),2,一个术语列联表,29,RK型列联表的一般数据结构图,因素a,b,a1a2,抗干扰.ar,b1b2.bi.bk,30,(1)两个或多个因素之间独立性的统计假设;(数据)(2)理论时间的计算,(3)独立性检验的一般问题和步骤,(3)自由度的确定,(31),(4)卡方检验,(公式1),(5)统计推断,假设的拒绝,假设的接受,32,RC卡方检验,某些格中允许的实数为0,最小理论时间为0.5;钢筋混凝土卡方试验的最小理论数小于0.5或1(2C列联表)。通常,采用合并项目的方法来代替连续性校正公式。注:33,1检验公式(每个单元的理论次数为5) 2个自由度,因子a,1类,2类,因子b,1类,2类,4,独立样本四格检验(列联表的特例),34,注:独立样本四格检验相当于独立样本比率差异的显著性检验。35,随机抽取90名学生,根据性别和学业成绩对学生进行分类,结果如下,问男女大学生学业成绩是否存在相关性?或者说,平均成绩以上的男女生比例有什么显著差异?学术水平,中等以上和中等以下,性别,男性和女性,案例,36,(1)费雪精确概率测试(略)(2)测试修正公式,如果在5,4格表中有5,37个理论次数的细胞,(1)适用范围分类变量的数量超过2 案例:讨论性别(男性和女性),婚姻(未婚,已婚)和生活满意度(刺激,规律性,厌倦)之间的关系。6,分析多个列联表,38,确定控制变量(分层变量)例性别分析列联表由另外两个变量分别在每一级控制变量上形成;示例 *男性婚姻状况和生活满意度状况的相关性分析*女性婚姻状况和生活满意度状况的相关性分析,(2)多个权变表的分析,(39),(3)不同级别控制变量的单个权变表分析(1)如果值不显著,则可以将每个级别的值相加,以推断权变表中两个变量的总值,并进行相关性验证。当控制变量的水平不一致时,个体例如,某通信公司想知道大学生最喜欢的手机品牌,并随机选取72名大学生调查性别、家庭经济水平和最喜欢的手机品牌,探讨三个变量之间的关系。调查结果如下表所示。42,甲方,乙方,丙方,经济水平,低,高,甲方,乙方,丙方,手机品牌,性别,男女,13234124937852,43,1,同质性检验(TESTFOR匀浆)几个不同因素之间是否有实质性差异判断几个重复实验的结果是否是同质的(1)单因素分类数据的同质性检验(1)样本(4),同质性检验和数据组合,44,1,计算每个样本组的值和自由度二。累加各种组值,并计算它们的总和和自由度的总和;(iii)将每个样本组原始数据按照相应的类别进行组合,生成总数据表,并计算总数据表的值和自由度;(2)测试过程,45,iv。计算每组的累积值与通过组合测试总数获得的值之间的差异(异质性值)。自由度是每个组的累积自由度和组合总数据之间的差值。异质性值大于临界值,样本组之间的数据是异质性的;混合器不显著,则同质;46,124171921512932020144102528, 例,分别从四所幼儿园随机抽取6岁儿童,每组组成一个实验组进行记忆测试。测试材料是用红色、绿色和蓝色写的字母。以单位时间的识别次数为指标,结果为:次。这四组数据可以一起分析吗?分组红色字母绿色字母蓝色字母47例对四个儿童圈的儿童颜色命名能力进行了调查,调查材料为15种颜色的彩色铅笔。那些能正确说出8种或更多颜色的人是合格的,而那些低于8种颜色的人不是。受试者分为4岁组和6岁组。下表显示了四所幼儿园的调查数据。这四所幼儿园儿童的颜色命名能力调查结果是否一致?颜色命名与年龄有关吗?(2)表格形式的同质性检验:48,4岁组49701106岁组6439103,小计113109222,不合规,年龄组,幼儿园甲,幼儿园乙,幼儿园丙,幼儿园丁,不合规,不合规,不合规,不合规,4岁组111810115201691711,年龄组,颜色命名能力,小计,组合数据表,变异原因,自由P,组合9.700(1)简单合并方法将所有数据合并到两个网格表或四个网格表中。适用条件:各子表的相同分类特征率相近;子表小样本同质性(值不显著),2。合并计数数据的方法。附加值,男性175220.773,女性65110.545231033,2。病例(四格表简单归并法),抽样年龄,性别,不同研究者的某些年龄特征,非甲非甲,甲特征比例,34岁,56岁,男123150.800,女75120.58321033。1.7931.339,1.5011.225,7-8岁,男113140.786,女119200.550221234,2.0041.416,52,a不是a,男和女,51,43,64,30,94,53,相加,相加各表值;二。df=表格数量(表格自由度之和)缺点:不太敏感、分辨率差、不考虑表格方向。54和3的值相加。一、适用条件样本量差异不超过2倍表中相应比值在0.2至0.8之间测试公式(示例),子表数量;每个表值的平方;55,适用条件多个四格表中对应的比值不在0.2和0.5之间;每个样本容量相差很大(2倍以上),样本差异方向(即变化趋势)相同;(4)加权法,56,二,显著性检验公式(例),子表数;第一个四格表的比率,第一个四格表的边际时间,57,加权计算方法和象征意义,样本组a与非AA的比率,男女之比5 9,135770016670.070318.960.8333,男女之比1012,2656820表中小样本的同质性(数值不显著)不相关因素的控制是相同的,子表中相应的比值变化也是相同的;(2)钢筋混凝土表数据合并,59,适用条件:本齐各表的比例接近且各不相同,各年龄组的总计算结果为1519,121373218172358,男女合计303030,男女合计20 25,15179412623179,合计404040,(0.3750),(0.4063),(0.21179) 具体操作首先计算每个子表中单元格的理论次数,并将每个子表的理论次数相加作为总表中相应单元格的理论次数; 然后将每个子表的实际计数合并为总表的实际计数;卡方检验DF=(R-1)(K-1)(2)表论次组合法,62,二,案例,不同年级学习方法评价,教学方法1,2和3总计算结果抽样评价,一年级,好9(10.5)6(7.0)6(3.5)21一般5(6.5)6(4.3)2(2.2)13差16(13.0)8(8.7)2(4.3)26总计很好一般不好,(35.7),(23.5),(11.8),(15.1),(10),(5.0),(37.2),(24.5),(12.2),71,30,74,88,58,29,64,1。 经检验,隐含风险列表显示因子A与因子B相关,表明因子A的多个分类之一与因子B的多个分类相关;或者b因子的多个分类中至少有一个与a因子的多个分类相关联。这种联系是整体反映还是部分反映?对这个问题的进一步分析是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论