总体均数的估计与假设检验.ppt_第1页
总体均数的估计与假设检验.ppt_第2页
总体均数的估计与假设检验.ppt_第3页
总体均数的估计与假设检验.ppt_第4页
总体均数的估计与假设检验.ppt_第5页
已阅读5页,还剩183页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 总体均数的估计与假设检验 Estimation of Population Mean and Hypothesis Test 1 Content 1. Sampling error and standard error of mean 2. t- distribution 3. Estimation of Population Mean 4. t-test 5. Notice of hypothesis test 6. Normality test and homogeneity of variance test 2 第一节 均数的抽样误差与标准误 3 统计推断:由样本信息推断总体特征 。 样本统计指标 (统计量) 总体统计指标 (参数) 正态(分布)总体: 推断 ! 说明! 为说明抽样误差规律,先用一个实例,后 引出理论。 4 图3-1 1999年某市18岁男生身高N(167.7, 5.32)的抽样示意图 5 见P3436表3-1 6 将此100个样本均数看成新变量值,则这100 个样本均数构成一新分布,绘制直方图。 图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布 7 ,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本 对称。 样本均数的变异范围较之原变量的变异范围大 大缩小。 可算得这100个样本均数的均数为167.69cm、标准 差为1.69cm。 样本均数的抽样分布具有如下特点: 8 1、抽样误差: 由个体变异产生的、抽样造成的样 本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的 样本均数与总体均数的差别 原因:1)抽样 2)个体差异 9 本书以n=60为界限 10 表示样本统计量抽样误差大小的统计 指标。 均数标准误:说明均数抽样误差的 大小,总体计算公式 (3-1) 2、标准误(standard error, SE) 实质:样本均数的标准差 11 数理统计证明: 12 若用样本标准差S 来估计 , (3-2) 降低抽样误差的途径有: 通过增加样本含量n; 通过设计减少S。 13 第二节 t 分布 (t-distribution) 14 nt分布概述 n 抽样误差的分布规律 n n 样本 总体 n t分布 理论 n 手段 (桥梁) 目的 15 一、t 分布的概念 16 17 式中 为自由度(degree of freedom, df) 3实际工作中,由于 未知,用 代替, 则 不再服从标准正态分布,而 服从t 分布。 18 二、t 分布的图形与特征 分布只有一个参数,即自由度 19 图3-3 不同自由度下的t 分布图 20 1特征: 21 2 t界值表:详见附表2,可反映t分布曲 线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。 22 -tt0 23 举例: 24 第三节 总体均数的估计 25 一、参数估计 用样本统计量推断总体参数。 总体均数估计:用样本均数(和 标准差)推断总体均数。 26 27 按预先给定的概率(1)所确定的包含 未知总体参数的一个范围。 总体均数的区间估计:按预先给定的 概率(1)所确定的包含未知总体均数的一 个范围。 如给定=0.05,该范围称为参数的95%可信区 间或置信区间; 如给定=0.01,该范围称为参数的99%可信区 间或置信区间。 2区间估计(interval estimation): 28 二、总体均数可信区间的计算 29 n总体均数可信区间的计算 n需考虑: n(1)总体标准差是否已知, n (2)样本含量n的大小 n通常有两类方法: n(1)t分布法 (2)u分布法 30 1. 单一总体均数的可信区间 31 32 P25,15号样本33 34 35 例3-3 某地抽取正常成年人200名,测得 其血清胆固醇的均数为3.64 mmol/L,标准差 为1.20mmol/L,估计该地正常成年人血清胆 固醇均数的95%可信区间。 36 故该地正常成年人血清胆固醇均数的双 侧95%可信区间为(3.47, 3.81)mmolL。 37 38 39 40 例3-4 为了解氨甲喋呤(MTX)对外周血IL- 2水平的影响,某医生将61名哮喘患者随机分为 两组。其中对照组29例( ),采用安慰剂;实验 组32例( ),采用小剂量氨甲喋呤(MTX)进行治 疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),标准差为7.02 IU/ml ( );试验组 治疗前IL-2的均数为16.89 IU/ml ( ),标准差 为8.46 IU/ml ( )。问两组治疗前基线的IL-2总 体均数相差有多大? 41 第一步: 42 能否下:两组IL-2的总体均数“不 同”或“有差别”的结论? 43 三、可信区间的确切涵义 44 n1. 95%的可信区间的理解: n(1)所要估计的总体参数有95%的可能在我们所估计 的可信区间内。 n(2)从正态总体中随机抽取100个样本,可算得100 个样本均数和标准差,也可算得100个均数的可信区间 ,平均约有95个可信区间包含了总体均数 。 n(3)但在实际工作中,只能根据一次试验结果估计 可信区间,我们就认为该区间包含了总体均数。 45 n2.可信区间的两个要素 n(1)准确度:用可信度(1)表示:即区间包含总 体均数的理论概率大小 。 n当然它愈接近1愈好,如99%的可信区间比95%的可信 区间要好 。 n(2)精确度:即区间的宽度 n 区间愈窄愈好,如95%的可信区间比99%的可信区间 要好 。 46 n当n确定时,上述两者互相矛盾。 n提高准确度(可信度),则精确度降低 n(可信区间会变宽),势必降低可信区间的实 际应用价值,故不能笼统认为99%可信区间比 95%可信区间要好。 n相反,在实际应用中,95%可信区间更为常用 。 47 n在可信度确定的情况下,增加样本含量 可减小区间宽度,提高精确度。 48 四、总体均数可信区间 与参考值范围的区别 49 * 也可用对应于双尾概率时), *也可用对应于双尾概率时 ) 表3-2 总体均数的可信区间与参考值范围的区别 50 第四节 t 检验 51 1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。 2、两个样本均数 与 比较的t检验 目的:推断两个未知总体均数 与 是否有差 别,用成组设计。 3、配对设计资料均数比较的t检验 目的:推断两个未知总体均数 与 是否有差 别用配对设计。 t 检验,亦称student t 检验,有下述情况: 52 对于大样本,也可以近似用u检验。 53 nt检验和u检验的应用条件: n1. t检验应用条件: n样本含量n较小时(如n0.05。按=0.05水准,不拒绝 H0,无统计学意义。还不能认为用两种不同药物的病人其 HbA1c下降值不同。 87 3. Satterthwaite近似t检验 : Cochran & Cox法是对临界值校正 而Satterthwaite法则是对自由度校正。 88 以=28.428、t=0.965查附表2的t界值 表得0.2060),则可选用 大样本u检验。 99 n3.正确理解“显著性”一词的含义 差别有 或无统计学意义,过去称差别有或无“显 著性”,是对样本统计量与总体参数或样 本统计量之间的比较而言,相应推断为 :可以认为或还不能认为两个或多个总 体参数有差别。 100 n4.结论不能绝对化 因统计结论具有概率 性质,故“肯定”、“一定”、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论