版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分类变量的整理(1),14名成人的婚姻状况,14名成人的原始数据,分类变量的整理(2),不同性别的婚姻状况,14名成人的原始数据,常用的比例指标,绝对数: 资料整理后各组的例数 相对数: 两个绝对数之比中得到的一种数值,1. 率: 速率(rate):与时间有关,如某年某病发病率、死亡率。 比率(proportion):与时间无关,如某病治愈率。 2. 比: 构成比(constituent ratio):部分与全部之比 相对比(relative ratio):两指标之比 3. 动态数列: 定基比:各时间的指标分别与基数(某个时间的指标)作对比 环比:以相邻的后一个时间的指标与前一个时间的指标作对
2、比 增长量:分为累积增长量、逐年增长量,常用的比例指标,率的标准误与可信区间,率的标准误,率,标准误的计算,总体率的可信区间 1、样本量足够大,总体率适中 (满足np和n(1-p)均大于5)时,样本率近似正态分布。其可信区间为,(p - u/2 Sp, p + u/2 Sp),总体率的可信区间 2、样本量较小时,查表。,附表c3(P562)百分率的置信区间 例 某药物治疗10例患者,有3例出现不良事件,试估计不良事件发生率。 解:不良事件发生率的总体率的95%可信区间为 (7%,65%),练习:某药物治疗200例患者,有130例出现不良事件,试估计不良事件发生率。,2检验 chi-square
3、 test,引例 将病情相近的乳腺癌患者随机分为两组,分别采用两种治疗方案(单纯手术治疗和手术及术后化疗联合治疗)进行治疗,观察五年,其存活情况见表1,问两种疗法的存活率是否相同?,表1 两种疗法治疗乳腺癌患者存活率比较,一、 2检验的基本思想,表1 两种疗法治疗乳腺癌患者存活率比较,四格表 (fourfold table,22 table) 实际频数(actual frequency, A) 行合计 (row total, nR) 列合计(column total, nC) 总例数 (n),一、 2检验的基本思想,表1 两种疗法治疗乳腺癌患者存活率比较,一、 2检验的基本思想,第一步:建立检
4、验假设,H0:两总体存活率相等,即1=2; H1:两总体存活率不等,即12。,表1 两种疗法的乳腺癌患者按H0成立计算的理论频数 ( Theoretical frequency ),?,39(34.44) 8(12.56) 57(61.56) 27(22.44),73.3 73.3,2检验的基本公式,上述基本公式由现代统计学的创始人之一,英国人Karl Pearson(1857-1936)于1900年提出,因此软件上常称这种检验为Pearson 2检验(Chi-square test)。,2分布是一种连续型分布,按分布的密度函数可给出不同自由度的一簇分布曲线。2分布的形状依赖于自由度的大小;当
5、自由度趋向于无穷大时, 2分布趋向正态分布。,2分布(chi-square distribution),2分布(chi-square distribution),2分布规律(附表c5.p569),自由度一定时,P值越小, 2值越大。 =1时, P=0.05, 2 =3.84 P=0.01, 2 =6.63 当P 值一定时,自由度越大, 2越大。 P=0.05时, =1, 2 =3.84 =2, 2 =5.99 当自由度取1时, u2= 2,由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以四格表的自由度=1,表1 两种疗法治疗乳腺癌患者存活情况 (行合计与列合计均固定),各种情形下
6、,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。,尚不能认为两种疗法的存活率是不相同的。,基本思想概括,若H0成立,则四个格子的实际频数A与理论频数T之差异纯系抽样误差所致,故一般不会很大,2值也就不会很大;在一次随机试验中,出现大的2值的概率P 是很小的。,因此,若根据实际样本资料求得一个很小的P,且P (检验水准),根据小概率原理,就有理由怀疑H0的真实性,因而拒绝它;若P,则没有理由拒绝H0,检验步骤,建立假设与确定检验水准 H0 1 2 H1 1 2 0.05 计算2值 确定 P 值 ( 行数1 )( 列数1 ) ( 21 )( 21 )
7、 1 以 1查 2界值表 判断结果 按 水准,将P 与 比较,作出判断。,二、四格表专用公式,为了不计算理论频数T, 可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:,应用条件:n 40,所有T5时,尚不能认为两种疗法的存活率是不相同的。,二、四格表专用公式,某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作对照,其观察结果见表3。 表3 两种药物治疗溃疡病的疗效,练习,三、连续性校正(Continuity correction)公式,当四格表资料理论频数较小时,需要对其进行校正,称为连续性校正,又称Yates校正(Yates correction)。 当n40,1
8、T5时,用连续性校正公式。校正公式为,Trick: Calculate the smallest T, then If the smallest T5, no need of correction. Otherwise, Continuity correction is needed.,1T5,且n40,应用连续性校正2检验,三、连续性校正公式,比较两种药物治疗绦虫病患者的有效率,结果见表5。 表5 两种药物治疗绦虫病的有效率,练习,Summary,Basic thinking of chi-square test Chi-square test of 2 independent sample
9、s n40 and all T5, no need of correction. n40 but 1T5, continuity correction is needed. n40 or T1, or Pa,Fisher exact test should be used.,对于四格表资料的2检验,应特别注意资料的总例数n与理论数T 的大小,1.配对资料 甲医生 乙医生 1 + + 2 + - 3 - + 4 - - ,四、配对四格表资料的2检验,表1 配对四格表资料表格 甲种属性 乙种属性 合计 + - + a b a+b - c d c+d 合计 a+c b+d n,表 某抗癌新药两种剂量
10、的毒理实验结果,配对四格表资料的2检验也称McNemar检验(McNemars test),H0:b,c来自同一个实验总体(两种剂量的死亡率无差异) H1:b,c来自不同的实验总体(两种剂量的死亡率有差别) =0.05。,配对四格表资料格式,配对四格表资料的2检验公式推导,五、行列(RC)表资料的2检验,RC表的2检验通用公式,RC表的计算举例,4、2=58.9120.05(6)=12.59,所以,P0.05 5、以=0.05水准拒绝H0 ,1、H0:病变类型与年龄无关 H1:病变类型与年龄有关 2、 3、计算统计量卡方值,行列表资料的 检验, 多个样本率比较时,有R行2列,称为R 2表; 两
11、个样本的构成比比较时,有2行C列,称2C表; 多个样本的构成比比较,以及双向无序分类资料关联性检验时,有R行C列,称为R C表。,几种RC表的检验假设H0,检验统计量(通用公式),1.多个样本率的比较,例 测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统之间是否有关联?,表 某地5801人的血型,3. 双向无序分类资料的关联性检验,RC表2检验的应用注意事项,1. 对RC表,若较多格子(1/5)的理论频数小于5 或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)
12、根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象),RC表2检验的应用注意事项,2.多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均水平。 3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。 4.多个率两两比较可采用卡方分割的方法,条件: 理论依据: 超几何分布,非 检验的范畴。,四格表资料的Fisher确切概率法,Fisher精确检验的基本思想:,在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率 ;再按检验假设用单侧或双侧的累计概率 ,依据所取的检验水准 做出
13、推断。,(1)各组合概率Pi的计算 在四格表周边合计数不变的条件下,表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例中,表内4个实际频数变动的组合数共有5+1=6个,依次为:,各组合的概率Pi服从超几何分布,其和为1。,计算公式为,!为阶乘符号,(1)成组(四格表)资料的2检验 n40,T5时,n40,1T5时 n40或T1时,不能用2检验,(2)配对资料的2检验 配对设计资料陈述形式,差异性检验,(3)行列表资料的2检验 行列表,总样本量不能太小,至少50例; 理论数不能小于1; 理论数在15间的不能多于1/5的总格子数。,检验SPSS实习,若为频数表则首先: Data-Weight Cases-Weight cases by-调频数f进入Frequency variable-Ok 然后: Analyze-Descriptive Statistics-Crosstabs-输入行、列stati
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数控磨工安全技能考核试卷含答案
- 矿井防尘工复测考核试卷含答案
- 2026中学历史中国古代史专题课件
- 合作伙伴违约责任条款解释函(8篇)
- 2025年母婴行业智能育儿报告
- 2026年远程办公工具用户体验优化创新报告
- 个人旅行遭遇恶劣天气安全应对预案
- 采购申请审批单详细填写示例模板
- 松发股份深度报告:恒力重工的三大稀缺性
- 精准广告课程设计课程设计
- 2026年国开电大建筑制图基础形考考前冲刺测试卷及完整答案详解(历年真题)
- 市场监督管理局全流程市场监管工作手册(标准版)
- 学校物业服务会议服务方案
- UPS电源售后服务承诺书范本
- 统编人教版五年级语文下册《田忌赛马》示范教学课件
- 急性气管支气管炎课件教学
- GB/T 16124-2025水利水电工程环境健康影响评价技术规范
- 压力仪表培训课件
- 卒中绿色通道与团队快速反应流程优化
- 吉林省吉林市2025-2026学年度上学期期末质量检测 八年级物理试卷(含答案)
- 人教版七年级下册语文诗歌鉴赏及答案
评论
0/150
提交评论