




已阅读5页,还剩141页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲人: :胡平成 12年11月12日下午14:00-15:40(一大班);16:00-17:40(二大班) 讲授内容:计量资料的统计推断 1 n中南大学公共卫生学院 研究生导师 n美国洛杉矶加洲大学 留美学者学者 n卫生部新生儿窒息复苏培训项目评估组 专家 n高等学校国家级精品课程医学统计学课程 主讲教师 n中国卫生信息学会卫生信息标准化专业委员会 常委 n湖南省健康管理学会社区健康管理专业委员会 副主委 n中 国 现 代 医 学 杂 志 编委 胡平成简介 2 讲述内容: n第一节 均数的抽样误差与标准误 n第二节 t 分布 n第三节 总体均数的估计 n第四节 t 检验 n第五节 假设检验的注意事项 n第六节 正态性检验和两样本方差比较的 F 检验 附件 3 第一节 均数的抽样误差与标准误 4 统计推断:由样本信息推断总体特征 。 样本统计指标 (统计量) 总体统计指标 (参数) 正态(分布)总体: 推断 ! 说明! 为说明抽样误差规律,先用一个实例,后 引出理论。 5 图3-1 1999年某市18岁男生身高N(167.7, 5.32)的抽样示意图 6 见P3436表3-1 7 将此100个样本均数看成新变量值,则这100 个样本均数构成一新分布,绘制直方图。 图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布 8 ,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本 对称。 样本均数的变异范围较之原变量的变异范围大 大缩小。 可算得这100个样本均数的均数为167.69cm、标准 差为1.69cm。 样本均数的抽样分布具有如下特点: 9 1、抽样误差: 由个体变异产生的、抽样造成的样 本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的 样本均数与总体均数的差别 原因:1)抽样 2)个体差异 10 本书以n=60为界限 11 表示样本统计量抽样误差大小的统计 指标。 均数标准误:说明均数抽样误差的 大小,总体计算公式 (3-1) 2、标准误(standard error, SE) 实质:样本均数的标准差 12 数理统计证明: 13 若用样本标准差S 来估计 , (3-2) 降低抽样误差的途径有: 通过增加样本含量n; 通过设计减少S。 14 第二节 t 分布 (t-distribution) 15 nt分布概述 n 抽样误差的分布规律 n n 样本 总体 n t分布 理论 n 手段 (桥梁) 目的 16 一、t 分布的概念 17 18 式中 为自由度(degree of freedom, df) 3实际工作中,由于 未知,用 代替, 则 不再服从标准正态分布,而 服从t 分布。 19 二、t 分布的图形与特征 分布只有一个参数,即自由度 20 图3-3 不同自由度下的t 分布图 21 1特征: 22 2 t界值表:详见附表2,可反映t分布曲 线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。 23 -tt0 24 举例: 25 第三节 总体均数的估计 26 一、参数估计 用样本统计量推断总体参数。 总体均数估计:用样本均数(和 标准差)推断总体均数。 27 28 按预先给定的概率(1)所确定的包含 未知总体参数的一个范围。 总体均数的区间估计:按预先给定的 概率(1)所确定的包含未知总体均数的一 个范围。 如给定=0.05,该范围称为参数的95%可信区 间或置信区间; 如给定=0.01,该范围称为参数的99%可信区 间或置信区间。 2区间估计(interval estimation): 29 二、总体均数可信区间的计算 30 n总体均数可信区间的计算 n需考虑: n(1)总体标准差是否已知, n (2)样本含量n的大小 n通常有两类方法: n(1)t分布法 (2)u分布法 31 1. 单一总体均数的可信区间 32 33 P25,15号样本34 35 36 例3-3 某地抽取正常成年人200名,测得 其血清胆固醇的均数为3.64 mmol/L,标准差 为1.20mmol/L,估计该地正常成年人血清胆 固醇均数的95%可信区间。 37 故该地正常成年人血清胆固醇均数的双 侧95%可信区间为(3.47, 3.81)mmolL。 38 39 40 41 例3-4 为了解氨甲喋呤(MTX)对外周血IL- 2水平的影响,某医生将61名哮喘患者随机分为 两组。其中对照组29例( ),采用安慰剂;实验 组32例( ),采用小剂量氨甲喋呤(MTX)进行治 疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),标准差为7.02 IU/ml ( );试验组 治疗前IL-2的均数为16.89 IU/ml ( ),标准差 为8.46 IU/ml ( )。问两组治疗前基线的IL-2总 体均数相差有多大? 42 第一步: 43 能否下两组IL-2的总体均数 “不同”或“有差别”的结论? 44 三、可信区间的确切涵义 45 n1. 95%的可信区间的理解: n(1)所要估计的总体参数有95%的可能在我 们所估计的可信区间内。 n(2)从正态总体中随机抽取100个样本,可算 得100个样本均数和标准差,也可算得100个均 数的可信区间,平均约有95个可信区间包含了 总体均数 。 n(3)但在实际工作中,只能根据一次试验结 果估计可信区间,我们就认为该区间包含了总 体均数。 46 n2.可信区间的两个要素 n(1)准确度:用可信度(1)表示: 即区间包含总体均数的理论概率大小 。 n当然它愈接近1愈好,如99%的可信区间 比95%的可信区间要好 。 n(2)精确度:即区间的宽度 n 区间愈窄愈好,如95%的可信区间比 99%的可信区间要好 。 47 n当n确定时,上述两者互相矛盾。 n提高准确度(可信度),则精确度降低 n(可信区间会变宽),势必降低可信区 间的实际应用价值,故不能笼统认为 99%可信区间比95%可信区间要好。 n相反,在实际应用中,95%可信区间更 为常用。 48 n在可信度确定的情况下,增加样本含量 可减小区间宽度,提高精确度。 49 四、总体均数可信区间 与参考值范围的区别 50 * 也可用对应于双尾概率时), *也可用对应于双尾概率时 ) 表3-2 总体均数的可信区间与参考值范围的区别 51 52 第四节 t 检验 53 1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。 2、两个样本均数 与 比较的t检验 目的:推断两个未知总体均数 与 是否有差 别,用成组设计。 3、配对设计资料均数比较的t检验 目的:推断两个未知总体均数 与 是否有差 别用配对设计。 t 检验,亦称student t 检验,有 下述情况: 54 对于大样本,也可以近似用 u检验 55 nt检验和u检验的应用条件: n1. t检验应用条件: n样本含量n较小时(如n0.05。按=0.05 水准,不拒绝H0,无统计学意义。还不能认为 用两种不同药物的病人其HbA1c下降值不同。 89 3. Satterthwaite近似t检验 : Cochran & Cox法是对临界值校正 而Satterthwaite法则是对自由度校正。 90 以=28.428、t=0.965查附表2的t界值 表得0.20n2),用来自两个总体的两面个样本均 数比较t的检验: (1) 95 两个大样本均数比较的u检验公式的讨论 一般认为,如果是两个大样本(比如 样本含量均大于50),则可近似用u检验: (2) 96 两个大样本均数比较的u检验公式的讨论 笔者在教学实践中,试在图n1和n2很大 的前提下,推导出 ,但却推导出: 公式(1)变形为: 97 两个大样本均数比较的u检验公式的讨论 当n1,n2 较大时,有: (3) 98 两个大样本均数比较的u检验公式的讨论 为区别起见,把(3)式的u记为u。 笔者推导出了两个样本方差相差越大或( 和)两个样本含量相差越大, u和t的差 别越大。 推导过程如下: 99 两个大样本均数比较的u检验公式的讨论 令: 100 两个大样本均数比较的u检验公式的讨论 则: (4) 由(4)式可知: 当(n1-n2)越大或(和)|s1-s2|越大时,则 |f1-f2|越 大,故有: |t-u|越大. 101 两个大样本均数比较的u检验公式的讨论 并进一步证明了,大样本对小方差(n1n2且s1uu. 证明过程如下: 令 则: 102 两个大样本均数比较的u检验公式的讨论 n (5) 103 两个大样本均数比较的u检验公式的讨论 (6) 104 两个大样本均数比较的u检验公式的讨论 由(5)、(6)式得: tuu 大样本对大方差(n1n2且s1s2),有: t60),则 可选用大样本u检验。 115 n3.正确理解“显著性”一词的含义 差别有 或无统计学意义,过去称差别有或无“显 著性”,是对样本统计量与总体参数或样 本统计量之间的比较而言,相应推断为 :可以认为或还不能认为两个或多个总 体参数有差别。 116 n4.结论不能绝对化 因统计结论具有概率 性质,故“肯定”、“一定”、“必定”等词不 要使用。在报告结论时,最好列出检验 统计量的值,尽量写出具体的P值或P值 的确切范围,如写成P=0.040或 0.02P0.05,而不简单写成P0.05,以 便读者与同类研究进行比较或进行循证 医学时采用Meta分析。 117 n5.假设检验是为专业服务的,统计结论必须和 专业结论有机地相结合,才能得出恰如其分、 符合客观实际的最终结论。若统计结论和专业 结论一致,则最终结论就和这两者均一致(即均 有或均无意义);若统计结论和专业结论不一致 ,则最终结论需根据实际情况加以考虑。若统 计结论有意义,而专业结论无意义,则可能由 于样本含量过大或设计存在问题,那么最终结 论就没有意义。 118 6.可信区间与假设检验各自不同的 作用,要结合使用。 一方面,可信区间亦可回答假设检验 的问题,算得的可信区间若包含了H0,则 按水准,不拒绝H0;若不包含H0,则按 水准,拒绝H0,接受H1。 119 另一方面,可信区间不但能回 答差别有无统计学意义,而且还能 比假设检验提供更多的信息,即提 示差别有无实际的专业意义。 120 图3-7 可信区间在统计推断上提供的信息 121 虽然可信区间亦可回答假设检验的 问题,并能提供更多的信息,但并不意 味着可信区间能够完全代替假设检验。 可信区间只能在预先规定的概率 检验 水准的前提下进行计算,而假设检验能 够获得一较为确切的概率P值。 122 第六节 正态性检验 和两样本方差比较的F检验 123 t 检验的应用条件是正态总体且方差齐性; 配对t 检验则要求每对数据差值的总体为正 态总体。 进行两小样本t检验时,一般应对资料进行 方差齐性检验,尤其两样本方差悬殊时。 若方差齐,采用一般的t 检验;若方差不齐 ,则采用t检验。 124 一、正态性检验 (normality test) 1图示法:P-P plot,Q-Q plot 2矩法 偏度系数(skewness), 峰度系数(kurtosis)。 3 W 检验法 4 D 检验法 125 图3-8 例3-1中100个样本均数的P-P图 126 图3-9 例3-1中100个样本均数的Q-Q图 127 128 129 例3-9 试用矩法对表3-1中计算机模拟抽 样所得100个样本均数进行正态性检验。 130 (2)计算检验统计量 131 二、两样本方差比较的F检验 两小样本t 检验时,检查两样本方差代表 的总体方差是否相等(决定t 检验的方法)。 1. Levene检验 2. F检验 132 133 134 图3-10 不同自由度时F分布的图形 135 (2) 计算检验统计量 例3-10 对例3-7,用F 检验判断两总 体空腹血糖下降值的方差是否不等。 (1) 建立检验假设,确定检验水准 136 (3) 确定P值,作出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水泥预制房销售合同范本
- 怎样做商品销售合同范本
- 衣柜厂投资协议合同范本
- 荆州公积金借款合同范本
- 收购商品混凝土合同范本
- 服务机器人转让合同协议
- 解除合同协议书英文范本
- 进口原材料维修合同范本
- 设备仪器租借合同协议书
- 住宅换公寓改造合同范本
- 2024年《经济法基础》教案(附件版)
- 2024年无人机相关项目招商引资方案
- 中职教育人工智能技术赋能
- 《机电一体化系统设计》第四章课件
- 《税费计算与申报》课件 项目二 增值税的计算与申报任务三 增值税的申报
- 新污染物科普知识讲座
- 运动性失语的护理课件
- 阀门检验报告汇总266黄铜球阀
- SICD植入护理配合
- 北京外国语大学611英语基础测试(技能)历年考研真题及详解
- 弱电工程施工进度表(甘特图)
评论
0/150
提交评论