医学]医学统计学 第六章.ppt_第1页
医学]医学统计学 第六章.ppt_第2页
医学]医学统计学 第六章.ppt_第3页
医学]医学统计学 第六章.ppt_第4页
医学]医学统计学 第六章.ppt_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第六章 统计推断基础 公共卫生学院 白志茂 2 统计方法的结构 3 6.1抽样误差与标准误 6.1.1 抽样误差 抽样误差:在抽样研究中产生的样本统计量 与相应的总体参数之间的差异 总体 样本 抽样 4 来自同一总体的若干样本的统计量之间,也会存在 误差,这种误差也反映了样本统计量和总体参数间 的差异 总体 样本1 样本2 样本n 5 抽样误差的表现形式: (1)样本统计量与总体参数间的差异 (2)不同样本统计量间的差异 总体 样本 抽样 总体 样本1 样本2 样本n 6 抽样误差的类型:根据资料的性质和指标 的类型不同,抽样误差有多种 (1)均数的抽样误差 (2)率的抽样误差 由于生物间的个体差异是客观存在的,因 此在抽样研究过程中,抽样误差是不可避 免的 抽样误差具有一定规律性 7 6.1.2 标准误 样本统计量的标准差称为标准误 标准误除了反映样本统计量之间的离散程度 外,同时也反映样本统计量与相应的总体参 数间的差异,即抽样误差大小。 总体 样本1 样本2 样本n 8 最常用的标准误有两种,即均数的标准 误和率的标准误 9 1)均数的标准误 将来自同一总体的若干个样本均数看作一组新的观察 值,研究这些样本均数的频数分布,包括集中趋 势与离散趋势,可计算样本均数的均数与标准差 总体 样本1 样本2 样本n 10 【例】 某市16岁女中学生的身高分布服从均数()为 155.4cm,标准差()为5.3cm的正态分布。作抽样模 拟试验,每次随机抽出10个观察值(即样本例数n=10) ,共抽取100个样本 11 当原始观察值的分布为正态分布时,样本均 数的频数分布基本接近正态分布。统计理论 还证明,如果原始观察值分布为偏态分布, 当样本例数n较大时,其样本均数的分布仍近 似服从正态分布 12 均数标准误反映来自同一总体的样本均数的离散程 度以及样本均数与总体均数的差异程度,即均数的 抽样误差大小 均数标准误的计算 理论值: 估计值: 可适当增加样本例数和减少观察值的离散程度(如选 择同质性较好的总体)来减少抽样误差。 13 均数标准误的用途 1. 衡量样本均数的可靠性 2. 估计总体均数的可信区间 3. 用于均数的假设检验 14 2)率的标准误 率的标准误衡量样本率的离散趋势和率的抽样 误差的统计指标。率的标准误愈大,则样本率的离 散程度愈高,率的抽样误差愈大,反之亦然 总体 样本1 样本2 样本n 15 率的标准误的计算 若总体率为已知,当样本例数为n时 若总体率未知,则以样本率代入,求得率 的标准误的估计值 16 6.1.3 t分布 英国统计学家 Gosset (1876-1937) 17 t分布曲线是一簇对称于0的曲线。 随着自由度增大,t分布曲线逐渐逼近标准正态曲线 ,当自由度为无穷大时,t分布曲线和标准正态曲线 完全吻合 18 单侧(双侧)t界值(t分位数) 19 6.2 参数估计 6.2.1 参数估计的意义 反映总体特征的统计指标称为参数(parameter) 在抽样研究中,对总体参数的估计是统计推断的主要 内容之一。 参数估计就是用样本统计量估计总体参数。 20 6.2.2 估计方法 1. 点估计(point estimation) 用样本统计量的值直接作为总体参数的估计值 优缺点:估计方法简单易行,但未考虑抽样误差 21 2. 区间估计(interval estimation) 以一定概率估计总体参数在哪个范围内的这种 估计方法称为区间估计 总体均数的区间估计 总体率的区间估计 22 在正态分布N(,2) 中,若总体标准差已知时 ,总体均数的区间估计 简写为 (1)总体均数的区间估计 1 已知时 23 按正态分布的原理,总体均数的区间估计 简写为 2 未知时,n足够大 24 【例6.1】 已知某地150名正常成人脉搏均数 73.53次/分,标准差11.30次/分,试估计该地正 常成人脉搏总体均数95%可信区间。 25 根据t分布的原理,当=0.05时,有95%的t值在- t0.025, 到 t0.025, 间,即P (- t0.025, 时,不拒绝H0 49 6.3.2 假设检验的步骤 1) 建立检验假设(H0)和备择假设(H1) 2) 确定检验水准和单、双侧 一般取=0.05 3) 选定检验方法和计算检验统计量 4) 确定P值 5) 推断结论 50 6.4 t检验和u检验 假设检验的方法常以选定的检验统计量的分布而命名 例如: 统计学中常用的t检验,卡方检验,F检验等。 6.4.1 t检验 1)t检验的应用条件 (1)当样本例数n较小,样本取自正态总体,总体标 准差未知。 (2)在作两个样本均数比较时,还要求两样本相应 的总体方差相等,称为方差齐性。 51 2)样本均数与总体均数比较的t检验 推断样本所属的未知的总体均数 与已知的另一总体均数 是否相等。 检验统计量为: 例题6.5就是这种t检验。 南京7岁男童 身高 北京7岁男童 身高 样本 52 3) 配对设计数值资料的t检验 【例6.6】 为研究一种新药对女性血清胆固醇含量是 否有影响,对20名女性根据同年龄和体重相近的原则 配成10对。每对中一个服用新药,另一个服用不含活 性,但形态、颜色与新药相同的安慰剂,经一段时间 后,测定血清胆固醇含量(mmol/L),结果见表6.2第 (1)(3)栏,问服新药与服安慰剂血清胆固醇含量有 无差别? 53 差值d的总体 若新药对血清胆固醇没有影响,则 理论上差值d的总体均值应为0。 54 (1)建立检验假设与备择假设 (2)确定检验水准和单、双侧 本例=0.05,双侧 (3)计算统计量 55 其中 56 (4)确定P值 (5)判断结论 按=0.05水准,不拒绝H0,可以认为服用 该新药不影响女性血清胆醇。 57 【例6.7 】 某医师用一种中药治疗高血压患 者,观察患者治疗前后舒张压(kPa)变化 (见表6.3),问该中药是否对高血压患者 治疗前后舒张压有影响? 58 59 1)建立检验假设 2)确定检验水准和单、双侧 本例=0.05,双侧 3)计算统计量 60 其中 61 4)确定P值 5)判断结论 按=0.05水准,拒绝H0,接受H1,可以认为该 中药治疗高血压患者的舒张压在治疗前后有 差别,治疗后舒张压降低。 62 4)成组设计的两样本均数比较的t检验 分别从两个总体中抽取样本,对两个样本均数作比 较,因而称为成组比较。目的是推断两个样本各自 所属总体的总体均数 和 是否有差别 总体1 总体2 63 所用的检验统计量t 64 65 【例6.8】 两组雄性大鼠分别以高蛋白和低蛋 白饲料喂养后,观察第28天到第84天间,每只 大鼠所增加的体重(见表6.4)。问两组不同 蛋白质饲料喂养大鼠,体重增加是否有差别? 表6.4 以高蛋白和低蛋白饲料喂养大鼠后体重增加(g) 高蛋白组 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组 70 118 101 85 107 132 94 66 (1)建立假设 (2)确定检验水准和单双侧 (3)计算统计量 67 (4)确定P值 (5)推断结论 68 方差齐性检验 已知:两组样本标准差s1, s2、两组样本含量n1 , n2 。检验:两组总体方差是否有差别 总体1 总体2 69 步骤: 1)建立假设,确定检验水准与单双侧 2)确定检验水准和单双侧 3)计算检验统计量 70 4)确定P值 5)推断结论 按=0.05水准不拒绝H0,可以认为两组总 体方差相同。 71 6.4.2 u检验 单个总体:不论数值变量X的分布是否服从正态分布,当样本 例数n足够大时 ; 如果X服从正态分布 ,则不论样本n的大小,都 有 总体 样本1 样本2 样本n 72 标准正态分布的界值点: 推断结论: 总体,总体均数 未知, 总体标准差已知 73 对成组设计的两个样本均数比较进行u 检验 当两个样本例数和都较大时,样本均数近似服从正态 分布,这时可以用u检验 总体1 总体2 74 标准正态分布的界值点: 推断结论: 总体1 总体2 75 【例6.9】研究正常人与高血压患者血清胆固 醇含量(mmol/L)的资料如下,试比较两 组血清胆固醇含量有无差别。 76 (1)建立假设 (2)确定检验水准和单双测 (3)计算统计量 77 (4)确定P值 (5)推断结论 78 6.5 第一类错误和第二类错误 第一类错误 检验假设H0实际上成立的,但拒绝了H0,误判 为有差别,也就是犯了假阳性错误,称为第一 类错误(type error,或弃真错误) ;第一 类错误的概率即检验水准用表示. 若定在0.05,就是当H0成立时,从理论上说 ,平均每100次抽样中允许产生推断的错误有5 次 79 第二类错误 检验假设H0实际上不成立,但却不拒绝H0,也 就是错误地判为无差别,犯了假阴性错误,称 为第二类错误(type error,或取伪错误). 第二类错误的概率用表示。 统计上将1-称为检验效能或把握度(power of a test),即两个总体确有差别存在,而以 为检验水准,假设检验能发现它们有差别的 能力。 80 推断结论和两类错误 实 际 情 况 检验结果 拒绝H0不拒绝H0 H0为真第一类错误 ( ) 结论正确 ( ) H0不真结论正确 ( ) 第二类错误 ( ) 81 当样本例数固定时, 愈小,愈大;反之 , 愈大,愈小。因而可以通过选定 控制大小 要同时减小和,唯有增加样本例数。 实际工作中应权衡两类错误中哪一个重要, 以选择检验水准的大小。 82 和 的关系 你不能同时减 少两类错误! 和和的关系就的关系就 像翘翘板,像翘翘板,小小 就大,就大, 大大 就小就小 83 6.6 假设检验时应注意的问题 1)对所比较的资料应当从同质总体中随机抽取 样本,这样的样本具有代表性和均衡可比性 。 2)应根据研究目的、研究设计的类型和资料特 点(变量的种类、样本的大小)等因素来选 用符合适用条件的假设检验方法。 84 3) 实际差别大小与统计意义的区别 统计上的“差别有显著性”不应误解为差别很大 或肯定有差别,这种差别也未必在临床上有意 义。 假设检验结果“有”,“无”统计学意义,主 要说明差异由抽样误差引起的可能性大小。 例如:某两种药物降低血压相差5mmHg,经检验 认为有统计学意义,但这种差异在临床却没有 什么意义 85 建议对检验结果用下列方式表达 P,拒绝H0,接受H1,差异有统计学意义; P,不拒绝H0 ,差异没有统计学意义 86 4) 所有统计的假设检验都是概率性质的,因此,在 作推论时,可能犯错误。 5) 单侧检验与双侧检验的选择 应事先根

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论