




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
05 03 2020 1 本资料来源 05 03 2020 2 医用SAS统计分析 第三讲 05 03 2020 3 一 分类变量的统计推断 卡方检验 在SAS系统中 对分类变量资料的基本统计分析方法主要通过FREQ过程实现的 FREQ过程的主要功能有 1 产生一维或多维频数表 2 计算各种表中格子的理论频数 构成比和各种率 3 对分类变量资料作相应的假设检验 05 03 2020 4 FREQ过程的语句及说明主要格式 PROCFREQ 选择项 TABLES表达式 选择项 WEIGHT 说明 PROC过程 选择项 data 数据集 规定PROCFREQ语句使用的数据集 formchar 1 2 7 规定用来构造列联表单元的轮廓线和分隔线的字符 只有三个字符 1为垂线 2为水平线 7为水平与垂直的交叉线 05 03 2020 5 TABLES语句 PROCFREQ过程中可有多条TABLES语句 TABLES语句后可接多个表格表达式 每个表达式可包含任何数量的变量 从而得到所需的表格 如果TABLES语句缺省 则FREQ过程对数据集中的所有变量都给出相应的一维频数表 不规定任何选项时 若需某变量的一维频数 FREQ给出该变量每一水平的频数 freqency 累积频数 cumulativefreqency 频数的百分比 percent 和累积百分比 cumulativepercent 若需二维频数表 FREQ产生交叉分组列表 即包括各格的频数 总频数的格百分数 行频数的格百分数和列频数的格百分数 05 03 2020 6 TABLES语句的表达式 表达式是要求FREQ过程分析处理的一维或多维表的清单 一维表有一个变量名表示 二维表由星号 联接两个变量名表示 如a b表示变量a与b的二维表 三维表的形式为a b c TABLES语句的 选择项 1 普通选项out 数据集建立一个包含变量值和频数计数的输出数据集 如果TABLES语句中不止一个表达式 数据集的内容相应于TABLES语句中最后一个表达式的表格 05 03 2020 7 2 统计分析主要选项 chisq对每层作 2检验 包括Pearson 2 似然比 2和Mantel Haenszel 2 此外还给出与 2检验有关的关联指标包括Phi系数 列联系数和Cramer sV 对于2 2表 给出Fisher精确概率 agree进行配对 2检验 McNemar s检验 一致性检验的Kappa值 exact对大于2 2的列联表计算Fisher精确概率 同时也给出CHISQ选项的全部统计量 cmh给出Cochran Mantel Haenszel统计量 主要用于行 列表的统计分析 对于分层2 2表 cmh过程给出总体相对危险度估计及其可信区间 还给出各层关联度指标是否齐性的Breslow检验 05 03 2020 8 measures对每层的二维表计算一系列关联指标及相应的标准误 包括Pearson和Spearman相关系数 以及Gamma和Kendall系数等 对于2 2表 还给出常用的危险度指标及其可信区间 all给出chisq measures cmh所请求的全部统计量 Alpha 给出 检验水准 缺省为0 05 expected给出期望频数 05 03 2020 9 3 禁止输出选项nofreq不给出列联表中的格频数nopct不给出列联表中的格百分数norow不给出列联表中各格的行百分数nocol不给出列联表中各格的列百分数nocum不给出频数表的累积频数和累积百分数noprint不给出表格 但给出CHISQ CMH等语句所指定的统计量 WEIGHT语句指明该变量为频数 只能使用一个WEIGHT语句 且该语句作用于所有的表 05 03 2020 10 四格表资料的卡方检验 书中例10 1datachisq1 dor 1to2 doc 1to2 inputf output end end cards 63173168 procfreqFormchar 1 2 7 weightf tablesr c chisq run 05 03 2020 11 卡方检验结果TABLEOFRBYCRCFrequency 二维表每个格子的频数Percent 每个格子的频数在总频数中的百分比 RowPct 行百分数 每格子频数占该行合计频数的百分比 ColPct 1 2 Total 1 63 17 80 35 20 9 50 44 69 78 75 21 25 列百分数 每格子频数占 67 02 20 00 该列合计频数的百分比 2 31 68 99 17 32 37 99 55 31 31 31 68 69 32 98 80 00 Total948517952 5147 49100 00 05 03 2020 12 STATISTICSFORTABLEOFRBYCStatisticDFValueProb Chi Square 139 9270 001LikelihoodRatioChi Square 141 8600 001ContinuityAdj Chi Square 138 0470 001Mantel HaenszelChi Square 139 7040 001Fisher sExactTest Left 1 000 Right 1 44E 10 2 Tail 1 64E 10PhiCoefficient 0 472ContingencyCoefficient 0 427Cramer sV 0 472SampleSize 179 2值 似然比 2值 连续性校正 2值 M H 2值 Fisher s精确概率值 Phi系数 列联系数 可莱姆的V值 05 03 2020 13 四格表 2值的校正 例王洁贞主编 医学统计学 例6 4表6 32种药物治疗白色葡萄球菌败血症结果 本例有两个格的140 故对 2值进行校正 05 03 2020 14 程序datachi dor 1to2 doc 1to2 inputf output end end cards 33263 procfreqformchar 1 2 7 weightf tablesr c chisqexpectednocolnorownopct run 05 03 2020 15 RCFrequency Expected 1 2 Total 1 33 2 35 31 023 3 9773 2 6 3 9 7 9773 1 0227 Total39544 05 03 2020 16 STATISTICSFORTABLEOFRBYCStatisticDFValueProb Chi Square15 4220 020LikelihoodRatioChi Square14 3670 037ContinuityAdj Chi Square13 0260 082Mantel HaenszelChi Square15 2990 021Fisher sExactTest Left 0 996 Right 0 050 2 Tail 0 050PhiCoefficient0 351ContingencyCoefficient0 331Cramer sV0 351SampleSize 44WARNING 50 ofthecellshaveexpectedcountslessthan5 Chi Squaremaynotbeavalidtest 05 03 2020 17 配对四格表资料的卡方检验 配对四格表资料属于2 2列联表 根据分析的目的可分为关联性检验和差别性检验 如 医学统计学 王洁贞主编例6 8某研究者用甲 乙2种试剂检验132种血清 结果见表6 7 问2种试剂的检验结果有无关系以及有无差别 05 03 2020 18 关联性检验 独立性检验 应用一般的 2检验H0 甲 乙两试剂的检验结果无关系 tables语句选择 chisq 如 2检验有统计学意义 通过列联系数 ContingencyCoefficient 说明两者的关联性 差别性检验 一致性检验 应用McNemar sTestH0 两总体的B C 即两试剂阳性率无差别 05 03 2020 19 当b c 40时 tables语句选择 agree 分析结果中给出 2检验统计量 Kappa值 一致性检验系数 ASE值 Kappa值的标准误 及Kappa值的95 可信限 Kappa值作为评价判断或诊断一致性程度的指标 Kappa Pa Pe 1 Pe Pa为实际观察到的一致率 Pe为期望观察一致率 即两次化验结果由于偶然机会所造成的一致率 本例Pa 80 11 132 0 6894 Pe T11 T22 132 75 68 6 68 132 0 6239 Kappa 0 6894 0 6239 1 0 6239 0 1745 05 03 2020 20 Kappa值应在0到1之间 若Kappa值 1 说明两次检验结果完全一致 若Kappa值 0 说明两次检验结果完全没有一致性 若Kappa值 0 75 说明一致程度相当满意 若小于0 4 说明一致程度不够理想 如95 可信限不包含负数 说明Kappa值有统计学意义 两试剂结果 或两次检验结果 有一致性 反之 无一致性 05 03 2020 21 dataa 例dor 1to2 doc 1to2 inputf output end end cards 80103111 procfreq weightf tablesr c chisqagreenoprint 禁止输出列联表 run 05 03 2020 22 STATISTICSFORTABLEOFRBYCStatisticDFValueProb Chi Square14 8670 027LikelihoodRatioChi Square14 5810 032ContinuityAdj Chi Square13 8050 051Mantel HaenszelChi Square14 8300 028Fisher sExactTest Left 0 992 Right 0 028 2 Tail 0 040PhiCoefficient0 192ContingencyCoefficient0 189Cramer sV0 192McNemar sTest Statistic 10 756DF 1Prob 0 001SimpleKappaCoefficient 95 ConfidenceBoundsKappa 0 174ASE 0 0860 0060 342SampleSize 132 05 03 2020 23 行 列表资料的卡方检验 行 列表资料可分为三种清况 双向无序行 列表 即行变量和列变量均为名义变量 如民族 职业 血型等 包括多个样本率的比较 单向有序行 列表 即行变量或列变量中有一个是名义变量 另一个为有序变量 如检验结果的 治疗效果的痊愈 良好 有效 无效等 双向有序行 列表 即行变量和列变量均为有序变量 在SAS中 三种情况的统计量是通过TABLES语句中选择CMH Cochren Mantel Haenzsel 项实现的 CMH检验主要出现三个统计量 1 NonzeroCorrelation 非零相关 针对双向有序行 列表 2 RowMeanScoresDiffer 行平均分不同 针对单向有序行 列表 05 03 2020 24 3 GeneralAssociation 一般关联 针对双向无序行 列表 对双向无序行 列表在TABLES语句中选择EXACT 可计算行 列表的精确概率值 双向无序行 列表例10 3 dataa dor 1to2 doc 1to4 inputf output end end cards 584959184327338 procfreq weightf tablesr c exactcmhnoprint run 05 03 2020 25 STATISTICSFORTABLEOFRBYCStatisticDFValueProb Chi Square31 8380 607LikelihoodRatioChi Square31 8390 606Mantel HaenszelChi Square11 5140 219Fisher sExactTest 2 Tail 0 626PhiCoefficient0 079ContingencyCoefficient0 079Cramer sV0 079SampleSize 295SUMMARYSTATISTICSFORRBYCCochran Mantel HaenszelStatistics BasedonTableScores StatisticAlternativeHypothesisDFValueProb 1NonzeroCorrelation11 5140 2192RowMeanScoresDiffer11 5140 2193GeneralAssociation31 8320 608TotalSampleSize 295 05 03 2020 26 列变量为有序变量的行 列表例10 4 datab dor 1to2 doc 1to3 inputf output end end cards 738414206 procfreq weightf tablesr c cmhnoprint run 05 03 2020 27 SUMMARYSTATISTICSFORRBYCCochran Mantel HaenszelStatistics BasedonTableScores StatisticAlternativeHypothesisDFValueProb 1NonzeroCorrelation15 9010 0152RowMeanScoresDiffer15 9010 0153GeneralAssociation27 0240 030TotalSampleSize 116 05 03 2020 28 双向有序行 列表例10 5 datac dor 1to3 doc 1to3 inputf output end end cards 581443210224128 procfreq weightf tablesr c cmhnoprint run 05 03 2020 29 SUMMARYSTATISTICSFORRBYCCochran Mantel HaenszelStatistics BasedonTableScores StatisticAlternativeHypothesisDFValueProb 1NonzeroCorrelation17 3070 0072RowMeanScoresDiffer28 9140 0123GeneralAssociation49 5120 049TotalSampleSize 164 05 03 2020 30 双向有序且属性相同的列联表的一致性检验例两名放射科医师对200名棉屑沉着病可疑患者的诊断结果见下表 问两医生诊断结果否一致 表200例棉屑沉着病可疑患者的诊断结果 05 03 2020 31 程序dataagree1 dor 1to3 doc 1to3 inputf output end end cards 78506561301032 procfreqformchar 1 2 7 weightf tablesr c agreenocolnorownopct run 05 03 2020 32 TABLEOFRBYCRCFrequency 1 2 3 Total 1 78 5 0 83 2 6 56 13 75 3 0 10 32 42 Total847145200STATISTICSFORTABLEOFRBYCTestofSymmetry Statistic 0 482DF 3Prob 0 923KappaCoefficientsStatisticValueASE95 ConfidenceBounds SimpleKappa0 7370 0410 6570 816WeightedKappa0 7940 0320 7310 858SampleSize 200 05 03 2020 33 多层行 列表资料的卡方检验CMH统计量也适用于多层行 列表资料的的卡方检验 即按一个或多个因素分层后 研究行变量和列变量间的联系 其可通过控制分层变量的影响后 检验行变量和列变量的关系 多层的2 2表表男女使用别嘌呤醇引发皮疹比较 05 03 2020 34 程序datachisq1 dosex 1to2 1为男 2为女 dodrug 1to2 1为使用 2为未使用 docase 1to2 1为发病 2为未发病 inputf output end end end cards 53336645101958518 procfreqformchar 1 2 7 weightf tablessex drug case cmhmeasuresnopctnorownocol run 05 03 2020 35 TABLE1OFDRUGBYCASECONTROLLINGFORSEX 1DRUGCASEFrequency 1 2 Total 1 5 33 38 2 36 645 681 Total41678719EstimatesoftheRelativeRisk Row1 Row2 95 TypeofStudyValueConfidenceBounds Case Control2 7151 0007 369Cohort Col1Risk 2 4891 0365 980Cohort Col2Risk 0 9170 8091 039SampleSize 719 05 03 2020 36 TABLE2OFDRUGBYCASECONTROLLINGFORSEX 2DRUGCASEFrequency 1 2 Total 1 10 19 29 2 58 518 576 Total68537605EstimatesoftheRelativeRisk Row1 Row2 95 TypeofStudyValueConfidenceBounds Case Control4 7012 08610 592Cohort Col1Risk 3 4241 9605 983Cohort Col2Risk 0 7290 5590 950SampleSize 605 05 03 2020 37 1 SUMMARYSTATISTICSFORCASEBYDRUGCONTROLLINGFORSEXCochran Mantel HaenszelStatistics BasedonTableScores StatisticAlternativeHypothesisDFValueProb 1NonzeroCorrelation119 5130 0012RowMeanScoresDiffer119 5130 0013GeneralAssociation119 5130 001 1 由于行变量和列变量都只有2个 可以看作双向无序资料 三种结果是一致的 结果为 2mch 19 513 所对应的p 0 001 说明使用别嘌呤醇与发生药物性皮疹是有关系的 05 03 2020 38 2 EstimatesoftheCommonRelativeRisk Row1 Row2 95 TypeofStudyMethodValueConfidenceBounds Case ControlMantel Haenszel3 7562 0886 757 OddsRatio Logit3 7772 0117 094CohortMantel Haenszel3 0441 8584 989 Col1Risk Logit3 1241 9515 001CohortMantel Haenszel0 8380 7740 906 Col2Risk Logit0 8790 7850 985TheconfidenceboundsfortheM Hestimatesaretest based 3 Breslow DayTestforHomogeneityoftheOddsRatiosChi Square 0 703DF 1Prob 0 402TotalSampleSize 1324 05 03 2020 39 2 本部分有3个指标 第1个指标是病例对照研究 Case Control 的比数比 OR 值及可信区间 一个是用Mantel Haenszel方法计算的值 另一个是用Logit方法计算的值 本例说明使用别嘌呤醇发生药物性皮疹的危险性是不用该药危险性的3 756倍或3 777倍 第2个和第3个指标是队列研究 Cohort 的相对危险度 RR 值及可信区间 第2个指标是使用药物发病率是不使用药物发病率的倍数 第3个指标是使用药物未发病率是不使用药物未发病率的倍数 3 Breslow Day检验是检验各层间危险度的方向是否一致 P 0 05说明总体方向是一致的 P 0 05说明总体方向是不一致的 如方向一致可以用总的OR值表示 否则不能用总的OR值表示 05 03 2020 40 多层的行 列表程序10 6datachisq2 dohospital 1to2 dotrt 1to2 doeffect 1to3 inputf output end end end cards 237220135186213132 procfreqformchar 1 2 7 weightf tableshospital trt effect cmhnopctnocol run 05 03 2020 41 二 二项分布与Poisson分布 二项分布 二项分布的统计说明二项分布的应用条件1 两分类对立结果资料 2 试验结果是相互独立 互不影响的 二项分布的概率函数 X 0 1 2 n 二项分布的分布函数至多有x例阳性的概率为 即下侧累积概率 至少有x例阳性的概率为 即上侧累积概率 05 03 2020 42 SAS中二项分布函数SAS中二项分布函数表达式为 probbnml n x 式中 为事件发生的概率 n为样本含量 x为阳性事件个数 表达式计算的结果为发生阳性事件数 x的概率 例12 1datajin p probbnml 0 5 4 2 q 1 p procprint run 05 03 2020 43 结果OBSPQ10 68750 3125表明死亡 2的概率 0 1 2的概率 为0 6875 死亡 2的概率 3 4的概率 为0 3124 用二项分布检验治疗效果 例12 3根据以往的经验用一般疗法治疗某病 其病死率为40 治愈率为60 今用某种新药治疗该病人5名 这5名均治愈了 问该项新药是否比一般疗法为优 当实际率大于理论率时 计算上则累积概率 本例应计算 p probbnml 0 6 5 5 probbnml 0 6 5 4 05 03 2020 44 程序12 3databinom2 p probbnml 0 6 5 5 probbnml 0 6 5 4 procprint run OBSP10 07776假如10名病人 结果1名死亡 9名治愈 则应计算P x 9 的概率 程序12 4databinom3 p probbnml 0 6 10 10 probbnml 0 6 10 8 Procprint Run OBSP10 046357 05 03 2020 45 求二项分布的概率分布例12 5设 0 5 n 4 求x 0 1 2 3 4的概率 databinom4 dor 0to4 p probbnml 0 5 4 r q 1 p ifr 0thend p elsed probbnml 0 5 4 r probbnml 0 5 4 r 1 output end procprint run OBSRPQD100 06250 93750 0625210 31250 68750 2500320 68750 31250 3750430 93750 06250 2500541 00000 00000 0625 05 03 2020 46 Poisson分布 Poisson分布的统计说明Poisson分布的应用条件同二项分布 Poisson分布是二项分布的特例 当 很小 n很大时 Poisson分布非常接近二项分布 Poisson分布概率函数 X 0 1 2 n Poisson分布的分布函数下侧累积概率 上侧累积概率 05 03 2020 47 SAS中Poisson分布函数SAS中Poisson分布函数表达式为 poisson x 式中 为均数 n x为事件发生个数 表达式计算的结果为发生事件数 x的概率 例12 6有人观察红细胞计数池中400个小格 数出每小格中红细胞数 其均数为3 6175 试计算每格中恰有细胞数5个的概率及小格数 datapoisson1 p poisson 3 6175 5 poisson 3 6175 4 d p 400 procprint run OBSPD10 1386155 4448 05 03 2020 48 样本计数与总体均数差别的统计意义检验例12 8已知在一培养液中 有细菌数为每毫升3个 今采集放在5 冰箱的1ml培养液的细菌数5个 能否说明培养液中细菌数有增加 本例 3 x 5 3 计算x 5的上则累积概率 可计算p 1 p n 4 的概率 Datapoisson3 P 1 poisson 3 4 Procprint Run OBSP10 18474 因P 0 05 尚不能认为培养液中细菌数有增长 05 03 2020 49 例某地区以往胃癌发病率为万分之一 现调查10万人 发现3例胃癌病人 试分析该地区现在的胃癌发病率是否低于以往的发病率 本例 0 001 n 100000 x 3 100000 0 0001 10 现X 应计算 x的下则累积概率 dataa p poisson 10 3 procprint run OBSP10 010336因P 0 05 可以认为该地区现在的胃癌发病率低于以往的发病率 05 03 2020 50 三 非参数统计 在SAS中 非参数统计主要由univariate过程和npar1way过程来实现 前者在前面的第一讲中已经介绍 它可以进行配对设计差值的符号秩和检验 Wilcoxon配对法 后者是一个单因素的非参数方差分析过程 可进行成组设计的两样本 Wilcoxon法 或多样本比 Kruskal Wallis法即H检验 的秩和检验 注意 npar1way过程不能处理按频数输入的资料 对单项有序资料的频数表 可用前面讲到的cmh过程的RowMeanScoresDiffer 行平均分不同 来检验 SAS不提供非参检验两两比较的方法 其余统计软件里也只有PEMS提供这一功能 05 03 2020 51 npar1way含意 npar 是 非参 的英文缩写 1way 代表一个因素 合起来就是 单因素的非参数检验 千万不要写成 NPAPLWAY NPAP1WAY过程的语法格式PROCNPAR1WAY DATA 选项 CLASS 必需 指定要分析的分组变量EXACT 要求程序在必要时计算确切概率OUTPUT 指定统计结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡村振兴头雁计划培训学习心得体会
- 低温轴承采购合同范本
- 第三章培训与开发(人力资源三级)案例分析题及答案
- 关于督查工作的心得体会【四篇】
- 第八章 解析几何2026年高三数学第一轮总复习
- 职测信息处理题目及答案
- 短视频营销推广方案计划
- 2025年趣味益智游戏题库及答案
- 2025年山东省政府采购评审专家考试经典试题及答案
- CN120108096A 基于多模态融合算法的火灾最优逃生路线规划方法及系统 (无锡学院)
- 人工智能文献检索方法课件
- 幼儿园经营与管理课件
- 航空发动机强度与振动:Chapter 4 Vibrations of Disc and Shells (盘和壳体的振动)
- 《英语教师职业技能训练简明教程》全册配套优质教学课件
- 光伏电站组件清洗周边除草治理方案
- 高考语文复习-引号的作用 课件37张
- 农业模型PPT讲稿课件
- 国家开放大学电大专科《政治经济学》网络课机考网考形考单项选择题题库及答案
- 核质保监查员考试复习题(答案)
- Q∕GDW 10356-2020 三相智能电能表型式规范
- 电工电子技术基础教学大纲
评论
0/150
提交评论