已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。2检验类型有:四格表资料2检验(用于两样本率的检验),行列表2检验(用于两个及两个以上样本率或构成比的检验), 行列列联表2检验(用于计数资料的相关分析)。在SPSS中,所有X2检验均用Crosstabs完成。Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fishers Exact Test)值。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。界面说明【Rows框】用于选择行*列表中的行变量。【Columns框】用于选择行*列表中的列变量。【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。【Display clustered bar charts复选框】显示重叠条图。【Suppress table复选框】禁止在结果中输出行*列表。【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。Chi-square复选框:计算X2值。 Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。 Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。Contingency coefficient复选框:即列联系数,其值界于01之间;Phi and Cramers V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-11之间,在R*C表X2检验中界于01之间;Cramers V 则界于01之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。Gamma复选框:界于01之间,所有观察实际数集中于左上角和右下角时,其值为1;Somersd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;Kendalls tau-b复选框:界于-11之间;Kendalls tau-c复选框:界于-11之间;Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例; Kappa复选框:计算Kappa值,即内部一致性系数; Risk复选框:计算比数比OR值; McNemanr复选框:进行McNemanr检验,即常用的配对计数资料的X2检验(一种非参检验); Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量(分层X2,也有写为X2CMH的),可在下方输出H0假设的OR值,默认为1。【Cells】按钮弹出Cells对话框,用于定义列联表单元格中需要计算的指标:Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected); Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total); Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj. Standardized);【Format钮】用于选择行变量是升序还是降序排列。分析实例一、四格表资料的X2检验例6.1 某医生用呋喃硝胺和甲氰咪胍治疗十二指肠溃疡,结果如下表,问两种药物治疗效果有无差别? 组 别 愈合 未愈合 合计 有效率(%) 呋喃硝胺 54 8 62 87.09 甲氰咪胍 44 20 64 68.75 合 计 98 28 126 77.78【建立数据文件】由于此处给出的是频数表(大部分资料都以这种形式给出),因此在建立数据集时可以直接输入三个变量:行变量(分组变量):变量名取“R”,变量值为 1=“呋喃硝胺组”,2=“甲氰咪胍组”列变量(疗效变量):变量名取“C”,变量值为 1=“愈合”,2=“未愈合”指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。RCF1.001.0054.001.002.0044.002.001.008.002.002.0020.00【操作过程】Data=Weight Cases (对数据按频数进行加权)Weight Cases by单选框:选中 Freqency Variable:选入F单击OK钮 Analyze=Descriptive Statistics=Crosstabs Rows框:选入R Columns框:C Statistics按钮:选中Chi-square复选框,单击Continue钮 Cells.按钮: 选中Row 复选框,单击Continue钮单击OK钮【结果解释】上题分析结果如下:首先是有效记录数和处理记录缺失值情况报告,可见126例均为有效值。上表为列出的四格表,其中加入变量值和变量值标签,看起来很清楚。上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.1-sided);从上到下为:Pearson卡方(Pearson Chi-Square即常用的卡方检验)、连续性校正的卡方值(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fishers确切概率法(Fishers Exact Test)、线性相关的卡方值(Linear by Linear Association)、有效记录数(N of Valid Cases)。另外,Continuity Correction和Pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无须校正,直接采用第一行的检验结果,即X2=6.133,P=0.013。因P=0.013,可以认为两种药物疗效有差异,结合样本率,可以认为呋喃硝胺有效率高于甲氰米胍。如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的对我们而言用处不大,可以视而不见。 二、配对计数资料X2检验例6.2 有28份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果如下表,试检验甲、乙培养基生长率有无差别。 甲乙两种结核杆菌培养基的培养结果 乙培养基甲培养基 + 合 计+ 11 9 20 1 7 8 合 计 12 16 28 【建立数据文件】输入三个变量:行变量(代表甲培养基):变量名取“R”,变量值为 1=“生长”,2=“未生长”列变量(代表甲培养基):变量名取“C”,变量值为 1=“生长”,2=“未生长”指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。RCF1.001.0011.001.002.009.002.001.001.002.002.007.00【操作过程】1. Data=Weight Cases (对数据按频数进行加权)Weight Cases by单选框:选中 Freqency Variable:选入F单击OK钮 2. Analyze=Descriptive Statistics=Crosstabs Rows框:选入R Columns框:C Statistics按钮:选中Chi-square复选框(做成组X2检验,分析甲乙两培养基分析结果有无相关) 选中McNemanr复选框:(做配对X2检验,分析甲乙培养基阳性率有无差异) 单击Continue钮 Cells.按钮: 选中Row 复选框,单击Continue钮单击OK钮【结果解释】 上表为有效例数, 缺失例数和总例数的情况, 28例均有效. 上表输出配对四格表数据。上表为X2检验的结果。首先是成组X2检验,X2=4.21,P=0.040,可以认为甲乙两培养基的结果有相关性(即甲阳性,乙可能也阳性)。下面做了配对X2检验(McNemar Test),用精确概率法计算,P=0.021(双侧),可以认为甲乙两培养基阳性率差异有统计学意义。三、RC表X2检验例6.3 某市三个地区出生婴儿的畸形发生情况如下表,试比较这三个地区出生婴儿畸形率有无差异。 地区 畸形数 无畸形数 合计 发生率() 重污染区 114 3278 3392 33.61 一般市区 444 40103 40547 10.95 农村 67 8275 8342 8.03 合计 625 5165 52281 11.95这是32表资料,要进行3个样本率的比较。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取“R”,变量值为 1=“重污染区”,2=“一般市区”,“农村”。列变量(疗效变量):变量名取“C”,变量值为 1=“畸形”,2=“非畸形”指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。 RCF111141232782144422401033167328275【操作过程】1. Data=Weight Cases (对数据按频数进行加权)Weight Cases by单选框:选中 Freqency Variable:选入F 单击OK钮 2. Analyze=Descriptive Statistics=Crosstabs Rows框:选入R Columns框:C Statistics按钮:选中Chi-square复选框单击Continue钮 Cells.按钮: 选中Row 复选框单击Continue钮单击OK钮【结果解释】 上表为有效例数, 缺失例数和总例数的情况, 52281例均有效。 上表输出原始数据,并计算行百分数,重污染区畸形率为3.4%,一般市区为1.1%,农村为0.8%。上 上表为X2检验的结果,X2=148.984,自由度=2 , P=0.000,可以认为这三个区新生儿畸形率差异有统计学意义,畸形率不同或不全相同。至于哪些地区有差别,那些地区没有差别,或都有差别,可进行X2分割。四、RC列联表资料X2检验列联表是指每个观察对象按两种属性交叉分组归类,而且每种属性的分类都是有序的,这样整理出的资料称双向有序列联表。配对计数资料就是一个22列联表。例6.4 下表资料是492名不同期次矽肺患者其肺门密度级别的资料,试分析矽肺期次和肺门密度级别有无关系。不同期次矽肺患者肺门密度级别分布 肺门密度级别矽肺期次 合计 + + + 43 188 14 245 1 96 72 169 6 17 55 78 合计 50 301 141 492该资料是一个33列联表。每个矽肺病人按矽肺的期次和胸片肺门密度的级别进行交叉分类归组。使用x2检验可以分析这两个属性之间有无相关性。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取“R”,代表矽肺期次,变量值为 1=“期”,2=“期”,3=“期”。列变量(疗效变量):变量名取“C”,代表肺门密度,变量值为 1=“+”,2=“+”,3=“+”。指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。 RCF11431218813142112296237231632173355【操作过程】1. Data=Weight Cases (对数据按频数进行加权)Weight Cases by单选框:选中 Freqency Variable:选入F 单击OK钮 2. Analyze=Descriptive Statistics=Crosstabs Rows框:选入R Columns框:C Statistics按钮:选中Chi-square复选框(做X2检验) 选种Kendalls tau-b 复选框(计算列联系数)选种Kappa 复选框(计算Kappa值,分析一致性)单击Continue钮 Cells.按钮: 选中Row 复选框(计算行百分数)单击Continue钮单击OK钮【结果解释】 上表为有效例数, 缺失例数和总例数的情况, 492例均有效。 上表输出原始数据,并计算行百分数。 上表结果为X2检验的结果,X2=163.007,自由度=4,P=0.000,可以认为矽肺期次和肺门密度有关,结合下表的列联系数(Kendalls tau-b)为0.498,两者呈正相关的关系,即矽肺期别越高,肺门密度级别也越高。 上表输出Kendalls tau-b列联系数,其值为0.498,标准误为0.034,对列联系数检验的统计量为13.680,P=0.000。Kappa=0.127,其标准误=0.028,对Kappa值检验的统计量为5.070,P=0.000,可认为两者有一致性。根据经验Kappa0.75,表明两者一致性好;0.75Kappa0.4,表明一致性一般;Kappa0.4 表明一致性差。矽肺期次和肺门密度有一致性,但一致性差。习题1、某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,如下表,问两者带菌率有无差别? 采样地点 检查例数 阳性例数 带菌率() 屠宰场 28 2 7.14 零售点 14 5 35.71 合计 42 7 16.67 2.以眼为单位观察20岁以上居民眼睛的晶状体点状混浊程度与年龄间的关系得资料如下,分析两者之间有无关系。 晶状体混浊程度 年龄(岁)合计 + + + 20 225 67 44336 30 141 101 63 30
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机械制造车间主任制造业岗位绩效考核表
- 证券投资管理实训
- 财务管理自动化报表生成工具简易操作版
- 校园里的友谊记事并附带读后感标识6篇
- 教育培训工作到位确保承诺书6篇范文
- 消防工作救火总结
- 甲状腺术后护理中的人文关怀实践与患者体验研究
- 渔业养殖合作及技术支持协议
- 2026届浙江省绍兴市绍兴一中化学高三上期末预测试题含解析
- 秋分时节解析
- BOPP项目可行性研究报告
- 监理计划书保修阶段监理规划
- 项目办公用品清单表
- 2025-2030中国人工智能生成内容(AIGC)产业创新及营销策略研究报告
- 某污水处理厂监理大纲
- 大疆植保无人机培训课件
- 园林机械保养小知识培训课件
- 医院血透室停水应急预案
- 航道教学课件
- 监理加盟合同协议书范本
- 工程检测成本管理办法
评论
0/150
提交评论