X2检验简单教程一学就会_第1页
X2检验简单教程一学就会_第2页
X2检验简单教程一学就会_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。 主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系。 x2检验类型有:四格表资料x 2检验(用于两样本率的检验),行X列表X 2检验(用于两个及 两个以上样本率或构成比的检验),行X列列联表X 2检验(用于计数资料的相关分析)。在SPSS中,所有 X2检验均用 Crosstabs完成。界面说明【Rows框】用于选择行*列表中的行变量。【Columns框】用于选择行*列表中的列变量。【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置

2、, 而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我 们将进行详细的解释。【Display clustered bar charts 复选框】显示重叠条图。【Suppress table复选框】禁止在结果中输出行*列表。【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。Crosstabs: St atistics厂Qhisquard厂 CorrelationsContinueNominalOrdinalCancelConting

3、ency coefficientPhi and Cramer's VSomers* dHelpLambdaKendall's iau-bUncertainty coelfidentKendall's tau-cNominal by IntervalKappa厂EtaI RiskMcNemar厂 Cochran's and Mantel-Hacnscl statistics:st common odds ratio equals:Chi-square复选框:计算 X值。Correlations复选框:计算行、列两变量的 Pearson相关系数和Spearman等级

4、相关系数。Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。Contingency coefficient复选框:即列联系数,其值界于01之间;Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-11之间, 在R*C表X2检验中界于01之间;Cramer's V则界于01之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量

5、的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。Gamma复选框:界于01之间,所有观察实际数集中于左上角和右下角时,其值为1 ;Somers'd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;Kendall's tau-b复选框:界于-11之间;Kendall's tau-c复选框:界于-11之间;Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;Kappa复选框:计算 Kappa值,即内部一致性系数;Risk复选

6、框:计算比数比OR值;McNemanr复选框:进行McNemanr检验,即常用的配对计数资料的X检验(一种非参检验);Cochran's and Mantel-Haenszel statistics 复选框:计算 X2m-h 统计量(分层 X2,也有写为 X2cmh 的),可在下方输出 H。假设的OR值,默认为1。【Cells】按钮弹出Cells对话框,用于定义列联表单元格中需要计算的指标:Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected);Percentages复选框组:是否输出行百分数(Row)、列百分数(Column )以及合计百分数(Tot

7、al); Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized )、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj. Standardized );【Format钮】用于选择行变量是升序还是降序排列。分析实例一、四格表资料的 X2检验组另U愈合未愈合合计有效率(%)呋喃硝胺5486287.09甲氰咪胍44206468.75合计982812677.78例6.1某医生用呋喃硝胺和甲氰咪胍治疗十指肠溃疡,结果如下表,冋两种药物治疗效果 有无差别?【建立数据文件】由于此处给出的是频数表(大

8、部分资料都以这种形式给出),因此在建立数据集时可以直接输 入三个变量:行变量(分组变量):变量名取"R”,变量值为1="呋喃硝胺组”,2="甲氰咪胍组” 列变量(疗效变量):变量名取“ C”,变量值为1= “愈合”,2= “未愈合” 指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。然后用 Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。RCF1.001.0054.001.002.0044.002.001.008.002.002.0020.00【操作过程】Data=>Wei

9、ght Cases (对数据按频数进行加权 )Weight Cases by单选框:选中Freqency Variable :选入 F单击OK钮Analyze=>Descriptive Statistics=>CrosstabsRows框:选入RColumns 框: CStatistics按钮:选中 Chi-square复选框,单击 Continue钮Cells.按钮: 选中Row 复选框,单击 Continue钮 单击OK钮【结果解释】上题分析结果如下:Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPe

10、rcent组别*疗效126100.0%0.0%126100.0%首先是有效记录数和处理记录缺失值情况报告,可见126例均为有效值。组别 * 疗效 Crosstabulation疗效Total愈合未愈合组别呋喃硝胺 Count54862% within 组别87.1%12.9%100.0%甲氰米胍 Count442064% within 组别68.8%31.3%100.0%TotalCount9828126% within 组别77.8%22.2%100.0%上表为列出的四格表,其中加入变量值和变量值标签,看起来很清楚。Chi-Square TestsValuedfAsymp. Sig.(2-s

11、ided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square6.1331.013Continuity Correction a5.1181.024Likelihood Ratio6.3041.012Fisher's Exact Test.018.011Linear-by-Linear Association6.0841.014N of Valid Cases126a. Computed only for a 2x2 tableb. 0 cells (.0%) have expected count less than 5

12、. The minimum expected count is13.78.上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.l-sided);从 上到下为:Pearson卡方(Pearson Chi-Square即常用的卡方检验)、连续性校正的卡方值(ContinuityCorrection)、对数似然比方法计算的卡方(Likelihood Ratio)、Fisher's 确切概率法(Fisher's Exact

13、 Test) 、线性相关的卡方值 (Li near by Lin ear Associatio n)、有效记录数 (N of V alid Cases)。另外,Continuity Correction 和 Pearson卡方值处分别标注有a和 b,表格下方为相应的注解:a.只为2*2表计算。b.O%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无须校正,直接采用第一行的检验结果,即乂=6.133,P=0.013。因P=0.013,可以认为两种药物疗效有差异,结合样本率,可以认为呋喃硝胺有效率高于甲 氰米胍。如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡

14、方、校正卡方和确切概率法三种方法之间选择即可,其余 的对我们而言用处不大,可以视而不见。二、配对计数资料 X2检验例6.2有28份痰液标本,每份分别接种在甲、 乙两种培养基中,观察结核杆菌生长情况,结果如下表,试检验甲、乙培养基生长率有无差别。甲乙两种结核杆菌培养基的培养结果甲培养基+ 合计+11920一178合计121628【建立数据文件】输入三个变量:行变量(代表甲培养基): 列变量(代表甲培养基): 指示每个格子中频数的变量:变量名取“变量名取“变量名取“R ”,变量值为1= “生长”,2= “未生长”C ”,变量值为1= “生长”,2= “未生长”F”,直接输入各个格子的频数。所建立的

15、数据集如下表。然后用 Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。RCF1.001.0011.001.002.009.002.001.001.002.002.007.00【操作过程】1. Data=>Weight Cases (对数据按频数进行加权 ) Weight Cases by单选框:选中Freqency Variable :选入 F单击ok钮2. Analyze=>Descriptive Statistics=>CrosstabsRows框:选入RColumns 框: CStatistics |按钮:选中Chi-sq

16、uare复选框(做成组X2检验,分析甲乙两培养基分析结果有无相 关)选中McNemanr复选框:(做配对X2检验,分析甲乙培养基阳性率有无差异)单击Continue钮Cells.按钮: 选中Row 复选框,单击 Continue钮单击OK钮【结果解释】Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPercent甲培养基*乙培养基28100.0%0.0%28100.0%上表为有效例数,缺失例数和总例数的情况,28例均有效.甲 培养基*乙 培养基 Crosstabulati onCount乙培养基+-Total甲培+11

17、920养基_178Total121628上表输出配对四格表数据。Chi-Square TestsValuedfAsymp. Sig.(2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square4.215b1.040Continuity Correction a2.6581.103Likelihood Ratio4.6891.030Fisher's Exact Test.088.048Linear-by-LinearAssociation4.0641.044McNemar Test.021cN of Valid C

18、ases28a. Computed only for a 2x2 tableb. 2 cells (50.0%) have expected count less than 5. The minimum expected countis 3.43.c. Binomial distribution used.上表为X2检验的结果。首先是成组 X2检验,X2=4.21,P=0.040,可以认为甲乙两培养 基的结果有相关性(即甲阳性,乙可能也阳性)。下面做了配对X2检验(McNemar Test)用精确概率法计算,P=0.021 (双侧),可以认为甲乙两培养基阳性率差异有统计学意义。三、RX C表X

19、2检验例6.3某市三个地区出生婴儿的畸形发生情况如下表,试比较这三个地区出生婴儿畸形率有 无差异。地区畸形数无畸形数合计发生率(o)重污染区1143278339233.61一般市区444401034054710.95农村67827583428.03合计62551655228111.95这是3X 2表资料,要进行 3个样本率的比较。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取“ R”,变量值为1= “重污染区”,2= “一般市区”,“农村”。列变量(疗效变量):变量名取“ C”,变量值为1= “畸形”,2= “非畸形”指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的

20、频数。所建立的数据集如下表。RCF111141232782144422401033167328275【操作过程】1. Data=>Weight Cases (对数据按频数进行加权 ) Weight Cases by单选框:选中Freqency Variable :选入 F单击oK钮2. Analyze=>Descriptive Statistics=>CrosstabsRows框:选入RColumns 框: CStatistics按钮:选中Chi-square复选框 单击 Continue 钮Cells.按钮: 选中Row 复选框 单击Continue钮 单击OK钮【结果解释

21、】Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPercent地区*疾病52281100.0%0.0%52281100.0%上表为有效例数,缺失例数和总例数的情况,52281例均有效。地区 * 疾病 Crosstabulation疾病Total畸形非畸形地区重污染区Count11432783392% within地区3.4%96.6%100.0%一般市区Count4444010340547% within地区1.1%98.9%100.0%农村Count6782758342% within地区.8%99.2%100.0

22、%TotalCount6255165652281% within地区1.2%98.8%100.0%3.4%,一般市区为1.1%,上表输出原始数据,并计算行百分数,重污染区畸形率为 农村为0.8%。Chi-Square TestsValuedfAsymp. Sig. (2-sided)Pears on Chi-Square148.9842.000Likelihood Ratio106.2442.000Lin ear-by-L in ear Associati on84.7191.000N of Valid Cases52281a. 0 cells (.0%) have expected cou

23、nt less tha n 5. The mini mum expected cou nt is 40.55.上 上表为 X2检验的结果, X2=148.984,自由度=2,P=0.000,可以认为这三个区新生儿畸形率差异有统计学意义,畸形率不同或不全相同。至于哪些地区 有差别,那些地区没有差别,或都有差别,可进行X2分割。四、R X C列列联表资料X2检验列联表是指每个观察对象按两种属性交叉分组归类,而且每种属性的分类都是有序的,这 样整理出的资料称双向有序列联表。配对计数资料就是一个2X2列联表。例6.4下表资料是492名不同期次矽肺患者其肺门密度级别的资料,试分析矽肺期次和肺 门密度级别

24、有无关系。不同期次矽肺患者肺门密度级别分布肺门密度级别矽肺期次+合计I4318814245n19672169出6175578合计50301141492该资料是一个3X3列联表。每个矽肺病人按矽肺的期次和胸片肺门密度的级别进行交叉分类 归组。使用x2检验可以分析这两个属性之间有无相关性。【建立数据文件】直接输入三个变量:行变量(分组变量):变量名取“ R”代表矽肺期次,变量值为仁“ I期”,2= “H期”,3=“川期”。列变量(疗效变量):变量名取“C”代表肺门密度,变量值为1= “ +” 2= “+ ” 3= “ + ”。 指示每个格子中频数的变量:变量名取“F”直接输入各个格子的频数。所建立

25、的数据集如下表。RCF11431218813142112296237231632173355【操作过程】1. Data=>Weight Cases (对数据按频数进行加权 ) Weight Cases by单选框:选中Freqency Variable :选入 F单击ok钮2. Analyze=>Descriptive Statistics=>Crosstabs Rows框:选入RColumns 框: CStatistics 按钮:选中Chi-square复选框(做X2检验) 选中Kendall ' tau-b复选框(计算列联系数)选中Kappa复选框(计算 Kapp

26、a值,分析一致性)单击|Continue 钮Cells按钮: 选中Row复选框(计算行百分数)单击Continue钮单击ok钮【结果解释】Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPercent矽肺期次 *肺 门密度级别492100.0%0.0%492100.0%上表为有效例数,缺失例数和总例数的情况,492例均有效。矽 肺期次*肺门 密度级 别Crosstabulat ion肺门密度级别+Total矽肺I期 Count4318814245期次% within矽肺期次17.6%76.7%5.7%100.0%n 期 Count19672169% within矽肺期次.6%56.8%42.6%100.0%皿期Count6175578% within矽肺期次7.7%21.8%70.5%100.0%TotalCou nt50301141492% within矽肺期次10.2%61.2%28.7%100.0%上表输出原始数据,并计算行百分数。Chi-Square Tes

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论