第八章卡方检验_第1页
第八章卡方检验_第2页
第八章卡方检验_第3页
第八章卡方检验_第4页
第八章卡方检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 八 章 检 验2XX2检验检验vX2检验是一种用途较广的假设检验方法。检验是一种用途较广的假设检验方法。它常用于分类变量资料的统计推断,如:它常用于分类变量资料的统计推断,如:v(1)两个或多个总体)两个或多个总体率或构成比率或构成比v 的比较;的比较;v(2)计数资料的)计数资料的相关分析;相关分析;v(3)多个样本率比较的)多个样本率比较的X2分割分割;v(4)频数分布拟合优度的)频数分布拟合优度的X2检验。检验。对于两样本率比较的资料,可用 检验 来推断两总体率是否有差别。X222()ATT自由度v=(行数1)(列数1)A:实际频数T:理论频数2.行列分割v若P0.05,我们拒绝无效

2、假设H0,只能作出总体上有无统计学意义的总的结论,而不能对每两两之间有无统计学意义作出结论。若要进行两两比较。还需要把行列表进行分割,才能对每两两之间有无统计学意义作出结论。行列分割的种类v多组间的两两比较;v多个实验组与同一对照组比较。(1)多组间的两两比较v对进行行列卡方检验有统计学意义的资料,进一步作两两比较时,不能再用原来的检验水准作为是否拒绝H0的标准。因为重复多次的假设检验,将使第一类错误扩大。必须重新规定检验水准,作为拒绝H0的根据。v在多组间的两两比较时,其检验水准按下式估计:v / N,其中为参加检验的组数。处为所需检验的次数,此nnnCNn2) 1(212k1k(2)多个实

3、验组与同一对照组比较一般认为:此时的假设检验的水准 为: 有些书上认为为:二、例题及统计分析SPSS计数资料的统计分析分析过程Analyze Descriptive Crosstabs 打开Crosstabs 分析对话框, 如图 所示:行变量列变量是在输出结果中显示聚类条图 是隐藏表格,如果选择此项,将不输出RC 交叉表v从左侧的源变量窗口中选择两个名义变量或顺序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。选择统计分析内容v单击statistics 按钮,打开s

4、tatistics 对话框,如图所示:卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于名义变量(定类变量)或顺序变量(定序变量)。是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于顺序变量或尺度变量(定距以上变量)。是名义变量选项栏。选项栏中的各项是当分析的两个变量都为名义变量时可以选择的参数。列联相关的C 系数,由卡方系数修正而得。列联相关的V 系数,由卡方系数修正而得系数不定系数是顺序变量选项栏。选项栏中的各项是当分析的两个变量都为顺序变量时,可以选择的参数。Eta 是当一个变量为名义变量,另一个变量为尺度变量时,测量两个变量之间关系的相关比率。

5、Gramma等级相关系数Somers等级相关d 系数肯得尔等级相关tau-b 系数肯得尔等级相关tau-c 系数v系统默认状态是不输出上述参数。如用户需要可自行选择。上述选择做完以后,单击vContinue 返回到Crosstabs 对话框。单击单击Cells(单元格)按钮,打开(单元格)按钮,打开Cell Display 对话框,对话框,如图如图 所示。所示。Counts 是单元格的频次选项栏观测值的频次期望频次v(2)Percentages 是确定输出百分比的选项栏。该选项栏中的选项用于确定在输出文件中的交叉表单元格中是否要输出百分比。v1)Row:单元格中个案的数目占行总数的百分比。v2

6、)Column:单元格中个案的数目占列总数的百分比。v3)Total:单元格中个案的数目占个案总数的百分比。v(3)Residuals 是确定残差的选项栏。v1)Unstandardized:非标准化残差。v2)Standardized: 标准化残差v3) Adj. Standardized:调整的标准化残差v上述选择做完以后,单击Continue 按钮,返回到Crosstabs 对话框。单击Format(格式)按钮v打开Format 对话框,如图 所示。在该对话框中可以选择在输出的交叉表中行的排列是升序还是降序。系统默认是升序。v选择做完以后,单击Continue 按钮,返回到Crossta

7、bs 对话框。v单击OK 按钮,提交运行。即可在输出文件的Output 窗口中输出交叉表。例如v例21v感染组和非感染组,其输血次数是否有显著性差异? 感染与否手术中输血次数Total 01234 无感染感染2518125464 866122Total26261811586 感染与否手术中输血次数Total 01234 无感染感染2518125464 1866122Total26261811586感染与否感染与否 * 手术中输血次数手术中输血次数 Crosstabulation操作步骤v1Analyze Descriptive Crosstabs 打开Crosstabs 对话框。v2.从左侧的

8、源变量窗口中选择“row” 变量进入到Row(s)窗口中,选择”column”变量进入到Column(s) 窗口v3单击Statistics 按钮,打开statistics 对话框。选择Chi-square 选项。单击Continue返回到crosstabs 对话框。v4.单击Cell 按钮,打开Cell Display 对话框。选择Row 选项。单击Continue 返回到Crosstabs 对话框。v5.单击OK 按钮,提交运行。Chi-Square Tests12.317a4.01514.1544.0076.6691.01086Pearson Chi-SquareLikelihood R

9、atioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)4 cells (40.0%) have expected count less than 5. Theminimum expected count is 1.28.a. 最小期望值(理论值)为1.28,4cells(40%)格子的理论值小于5。由此可见,pearson chi-squre的结论是不可信的。可以采取如下二个措施之一:v扩大样本含量N;v根据医学合理性,作合理的合并。v根据医学合理性作合理的合并,把输血三次和四次的合并,统称为输血三次

10、以上。旧编码新编码0011223343ROW * COLUMN CrosstabulationCount251812964186722262618168612ROWTotal0123COLUMNTotalChi-Square Tests10.162a3.01712.3863.0068.4761.00486Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)2 cells (25.0%) have expected count less th

11、an 5. Theminimum expected count is 4.09.a. 最小期望值(理论值)为4.09,2cells(25%)格子的理论值小于5。由此可见,pearson chi-squre的结论是不可信的。v我们继续根据医学合并合理性作合理的合并,把输血二次、三次及四次的合并,统称为输血二次以上。旧编码新编码00112232VAR00001 * VAR00002 CrosstabulationCount251821641813222626348612VAR00001Total012VAR00002TotalChi-Square Tests9.679a2.00811.9972.0

12、028.6801.00386Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 6.65.a. 差异有统计学意义。最小理论值为6.65,0 cells的理论值小于5例82v某研究人员收集了亚洲,欧洲和北美洲人的A、B、AB、O血型资料,结果见表8.9.其目的是研究不同地区的人群血型分类构成是

13、否一样?操作步骤:v过程:DatavWeight Casesv Weight cases by freqvAnalyzevNonparametric TestsvCrosstables vRow(s):treatvColumn(s):effectvStatistics: chi-squarevCells:RowsvokROW * COLUMN Crosstabulation321369952951080411.3215.864.2388.81080.029.7%34.2%8.8%27.3%100.0%2584322194517196.9103.330.7186.1517.049.9%8.3%4

14、.3%37.5%100.0%40810637444995378.9198.859.1358.2995.041.0%10.7%3.7%44.6%100.0%9875181549332592987.0518.0154.0933.02592.038.1%20.0%5.9%36.0%100.0%CountExpected Count% within ROWCountExpected Count% within ROWCountExpected Count% within ROWCountExpected Count% within ROW亚洲欧洲北美洲ROWTotalABABOCOLUMNTotalC

15、hi-Square Tests297.375a6.000297.2336.0009.7881.0022592Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 30.72.a. Pearson chi-squre的结论是可信的,根据概率得出:不同地区血型分布的差异有统计学意义。v在行列卡方中

16、,只能作出总的结论,但不知道哪两个地区血型分布的差异有统计学意义。还要进行两两比较,即进行卡方分割。v重复多次的卡方检验,将使第一类错误扩大,必须重新规定检验水准。本例的检验水准为0.017.行列卡方分割两两比较v进行亚洲和欧洲的比较:v点击变量”area”与“missing”处的v弹出”missing values”对话框:v点击“discrete Missing values”,并在其下面的格子中输入”3“,点击ok.AREA * TYPE Crosstabulation321369952951080391.6278.679.1330.71080.029.7%34.2%8.8%27.3%1

17、00.0%2584322194517187.4133.437.9158.3517.049.9%8.3%4.3%37.5%100.0%5794121174891597579.0412.0117.0489.01597.036.3%25.8%7.3%30.6%100.0%CountExpected Count% within AREACountExpected Count% within AREACountExpected Count% within AREA亚洲欧洲AREATotalABABOTYPETotalChi-Square Tests151.574a3.000169.6243.000.41

18、61.5191597Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 37.88.a. P=0.0000.017,差异有统计学意义。即亚洲和欧洲人的血型构成有统计学意义。三、行列表的注意事项:v行列表中不宜有1/5以上的格子的理论值小于5,也不允许有理论值小于1。如果发生上述情况,可有两种

19、处理方法:v加大样本含量,从而期望增大理论值;v将理论值小于5的行和列进行合并(医学上合理性);v若多个样本比较的卡方检验结论有统计学意义,并不能判定任意两组之间的差异有统计学意义,必须用行列分割的办法进一步作两两比较,同时,必须重新规定检验水准。第二节 四格表X2检验(1)为了不计算理论频数为了不计算理论频数T,四格表资料的四格表资料的 2检验的专用公式检验的专用公式 (当当n 40,T 5时)时)dbcadcbanbcad22 a,b,c,d为四格表的实际频数;(a+b), (c+d), (a+c),(b+d)为周边合计数 n=a+b+c+d一、四格表X2检验基本概念和计算公式(2)四格表

20、资料的)四格表资料的 2检验的校正公式检验的校正公式当当 n 40,1 T5时时22(22(|0.5)(|)2()()()()ATTnadbcnabcdacbd校正)校正)(或 计数资料的实际频数为分类资料,非连续的,由公式7-3算得的卡方值是离散型分布,卡方界值表依据 2 分布,是连续型分布,当v=1时,用公式7-3所得的概率偏小,需要校正,又称Yates校正(Yates correction) 。(3)n40或或T1时,或用公式时,或用公式7-3与与7-7计算计算出卡方所得概率出卡方所得概率p ,不能用不能用X2检验,检验,需用四格表资料的需用四格表资料的Fisher 精确概率法。精确概率

21、法。二、例题及统计分析v例83 某种药物加化疗与单用某种药物治疗的两种处理方法,观察某种癌病的比较。见表8.18操作步骤:v过程:DatavWeight Casesv Weight cases by :freqvAnalyzevDescriptive StatisticsvCrosstables vRow(s):vColumn(s):vStatistics: chi-squarevCells:RowsROW * COLUMN Crosstabulation42135546.78.355.076.4%23.6%100.0%4835143.37.751.094.1%5.9%100.0%901610

22、690.016.0106.084.9%15.1%100.0%CountExpected Count% within ROWCountExpected Count% within ROWCountExpected Count% within ROW用某种药物加化疗单用某种药物ROWTotal有效无效COLUMNTotalChi-Square Tests6.508b1.0115.1971.0236.9881.008.014.0106.4471.011106Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact Te

23、stLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is7.70.b. Pearson chi-squre P=0.11,差异有统计学意义。即某种药物加化疗与单用某种药物治疗某种癌症的疗效有统计学意义例85v有22只大白

24、鼠随机分成实验组与对照组。每组12只,实验组用某种化学物质进行诱发肿瘤试验,实验结果如表8.23所示,问两组发癌率有无显著性差异?v过程如前述ROW * COLUMN Crosstabulation65113.57.511.054.5%45.5%100.0%110113.57.511.09.1%90.9%100.0%715227.015.022.031.8%68.2%100.0%CountExpected Count% within ROWCountExpected Count% within ROWCountExpected Count% within ROW实验组对照组ROWTotal发生

25、肿瘤未发生肿瘤COLUMNTotalChi-Square Tests5.238b1.0223.3521.0675.6611.017.063.0325.0001.02522Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 2

26、 cells (50.0%) have expected count less than 5. The minimum expected countis 3.50.b. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.50总例数2240,应该用确切概率法。第三节 配对X2检验一、配对X2检验的基本概念和计算公式v把每一份标本平分为两份,分别用两种方法进行化验,比较这两种化验方法的结果(两类计数资料)是否有本质不同;v或分别采用甲乙两种方法对同一批病人进行检查,比较这两种检查方法的结

27、果(两类计数资料)是否有本质不同,此时要用配对X2 检验。222()40(| 1)40bcbcbcbcbcbc2校正时,时,配对 X2 检验的基本公式:二、例题与统计分析v例8.6 有26份咽喉涂抹标本,把每份标本分成两份,依同样的条件分别接种在A和B两种白喉杆菌培养基上,观察白喉杆菌的生长情况。v数据见表8.26操作步骤(方法一)v数据格式:2个分类变量“A培养基”和” “B培养基”一个 频数变量“freq”v过程:DatavWeight Casesv Weight cases by :freqvAnalyzevDescriptive StatisticsvCrosstables vRow(

28、s):A培养基vColumn(s):B培养基vStatistics: McNemar操作步骤(方法二)v数据格式:2个分类变量“A培养基”和” “B培养基”一个 频数变量“freq”v过程:DatavWeight Casesv Weight cases by :freqvAnalyzevNonparametric testsv2-related samples vA培养基- B培养基vMcNemarA * B CrosstabulationCount10111961519726生长未生长ATotal生长未生长BTotalChi-Square Tests.021a26McNemar TestN

29、of Valid CasesValueExact Sig.(2-sided)Binomial distribution used.a. 分层卡方检验例如v国外的口服避孕药剂量都相当大,某次病例对照研究调查了口服避孕药与心肌梗死的情况,考虑到年龄是一个可能的混杂因素,将其也纳入调查,得到如下数据,请分析口服OC与心肌梗死有无关系。年龄40年龄40服用OC未服OC服用OC未服OC病例21261888对照1759795合计388525183v年龄是否为混杂因素有比较严格的判断标准。题中要求的分层分析可以用vcochrans and mantel-Haenszel statistics 来完成,同时可

30、利用risk复选框给出各层独自的OR值用于比较。具体步骤vData weight casesvWeight cases byvFrequency variable框vOk vAnalyze descriptive statistics crosstabsvRows框vColumns框vLayer框vStatistics v Riskv Cochrans and mantel-haenszel statistics v Continue v okOC * CASE * 年龄 CrosstabulationCount2117382659854776123187258895183106102208服

31、用OC未服用OCOCTotal服用OC未服用OCOCTotal年龄=40病例对照CASETotalRisk Estimate2.8031.2746.1671.8071.1762.776.645.441.9431232.7761.1066.9651.4971.1241.995.539.2831.027208Odds Ratio for OC (服用OC / 未服用OC)For cohort CASE = 病例For cohort CASE = 对照N of Valid CasesOdds Ratio for OC (服用OC / 未服用OC)For cohort CASE = 病例For cohort CASE = 对照N of Valid Cases年龄=40ValueLowerUpper95% ConfidenceInterval以变量case的不同取值为准的RR值分层给出了OR值Tests of Conditional Independence11.7821.00110.7291.001CochransMantel-HaenszelChi-SquareddfAsymp. Sig.(2-sided)Under the conditional independence assumption, Cochransstatist

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论