版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学Medical Statistics 第三章 总体均数的估计与假设检验Parameter estimation and hypothesis testingOutline 均数的抽样误差与标准误t分布总体均数的估计假设检验的基本原理与步骤t检验假设检验的注意事项正态性检验和方差齐性检验统计学的分析思路samplepopulationSampling(抽样研究)Inferring(统计推断)统计推断(statistical inference)总体参数的估计(第3节)(parameter estimation)假设检验(第4-7节)(hypothesis testing) ? 样本含量
2、n 样本均 数 样本标准差抽样推断 参数估计Parameter estimation点估计(point estimation) :由样本统计量直接估计总体参数区间估计(interval estimation): 获得一个置信区间(confidence interval,CI)按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的估计置信区间的计算总体均数置信区间估计的通式18岁男身高第一节 均数的抽样误差与标准误抽样误差(sampling error)有两种表现形式:(1)样本统计量与总体参数间的差异,例如样本均数与总体均数间的差异。(2)样本统计量间的差异。 均数的抽样误差:
3、由个体变异产生、随机抽样造成的样本均数与总体均数的差异。抽样误差产生的条件 抽样误差的存在离不开两个基本条件。(1) 抽样研究。抽样是抽样误差产生的基本条件之一。只有抽样研究存在抽样误差;样本例数越少,抽样误差可能会越大。(2) 个体变异。变异是抽样误差产生的又一基本条件。变异是普遍存在的,也正是医学统计学所要研究的。变异大的事物其抽样误差也大,反之则小。抽样误差的意义与特点抽样误差的意义 用于参数估计和假设检验抽样误差的特点抽样研究中抽样误差不可避免可估计和控制抽样误差描述抽样误差的指标样本含量相等的样本均数的变异度可描述均数的抽样误差。样本均数的变异度如何度量? 中心极限定理(centra
4、l limit theorem)1、当原始观察值的分布为正态分布时,样 本均数的分布服从正态分布。 即使从非正态总体中随机抽样,只要样本含 量足够大,样本均数的分布也趋于正态分布。 2、样本均数的均数等于原总体的总体均数 (),样本均数的标准差等于 。标准误通常将样本统计量的标准差称为标准误(standard error,SE) (理论值) (估计值) 标准差与标准误的区别与联系应用:标准差属统计描述参考值范围 标准误为统计推断置信区间估计意义:标准差越小,均数代表性越好; 标准误越小,抽样误差越小, 样本均数估计总体均数可靠性越大。与n的关系:n越大,标准差越稳定; n越大,标准误越小。都是
5、描述变异度的指标。样本含量固定,标准差越大,标准误越大。区别联系第二节 t 分布W.S. Gosset(18761937)1908年, Gosset首次以Student为笔名,在Biometrika杂志上发表了“The probable error of a mean”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。 William Sealy GossetGosset是英国一家酿酒厂的化学技师,在长期从事实验和数据分析工作中,发现了t分布。但当时Gosset的公司害怕商业机密外泄,禁止员工对外发表文章。所以Gosset在1908年以
6、“Student”笔名发表此项结果,故后人又称它为“Student t分布”。在当时正态分布一统天下的情况下, Gosset的分布没有被外界理解和接受,只能在他的酿酒厂中使用,直到1923年英国统计学家Fisher给出分布的严格推导并于1925年编制了t分布表后,t分布才得到学术界的承认,并获得迅速的传播、发展和应用。William Sealy Gosset英国统计学家,小样本理论和方法的创立者,现代统计方法及其应用于实验设计与分析的先驱。Gosset的主要贡献是创立了t分布,开创了小样本理论的先河。由于Gosset开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把Goss
7、et推崇为推断统计学(尤其是小样本理论研究)的先驱者。随机变量XN(m,s2)标准正态分布N(0,12)u变换均数标准正态分布N(0,12)Student t分布自由度:n-1St 分布的图形(u 分布 是t 分布的特例)t分布的特征 以0为中心,左右对称的单峰分布; t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于时,t分布即为u分布。 t 界值表应用1已知 和 ,求t1.8122.228-2.228tf (t)=10的t分布图t界值表应用2已知 和t,求面积P举例: =10,t=2,
8、P的范围(单、双侧) =10,t=3,P的范围 =10,t=5,P的范围结论: 自由度一定,t绝对值越大,P值越小。自由度一定,t值一定,双侧概率为单侧概率的2倍。 参数估计Parameter estimation点估计(point estimation) :由样本统计量直接估计总体参数区间估计(interval estimation): 获得一个置信区间(confidence interval,CI)按预先给定的概率(1)所确定的包含未知总体参数的一个范围。第三节 总体均数的估计置信区间的计算总体均数置信区间估计的通式 (1)或100 (1) 称为置信度(confidence level),
9、常取95(90、99)。即95置信区间,或95%CI。置信区间的有关概念 置信区间的两个界值即两个置信限(confidence limit,CL): 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U), 换句话说,做出所有18岁男生身高总体均数为164.4 169.6cm的结论,说对的概率是95%,说错的概率是5%。置信区间的含义: 虽然不能知道某地所有18岁男生身高总体均数的确切数值,所有18岁男生身高均数在164.4 169.6cm之间的可能性是95%。置信区间的两个要素准确度:即置信度,越高越好。精 度:即区间的宽度,越窄越好。置信区间与
10、参考值范围的区别第四节 假设检验的基本原理与步骤例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业男性工人的血红蛋白含量均数是否不等于正常成年男性的均数140g/L?问题: 铅作业男性 正常成年男性? 0140 ?样本含量: 36样本均数: 130.83样本标准差: 25.74假设检验的一般步骤 步骤1:建立假设,确定检验水准。检验假设 (null hypothesis)、原假设,或零假设,记为H0,表示目前的差异是由于抽样误差引起的。H0:140g/L,铅作业男性工人与一般正常成年男 性血红蛋白总体均数相等;备择
11、假设(alternative hypothesis),记为H1,表示目前的差异是主要由于本质上的差别引起的。 H1: 140g/L,铅作业男性工人与一般正常成年 男性血红蛋白总体均数不等。假设检验的一般步骤H0假设比较单纯、明确,且在该假设的前提下有规律可寻。而H1假设包含的情况比较复杂。因此,检验是针对H0的。 假设检验的基本原理“小概率反证法”的原理提出一个假设如果假设成立,得到现有样本的可能性可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,即样本信息不支持H0,说明我们的假设有问题,拒绝之。有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设(没理由)。双侧检验与单侧检
12、验双侧检验(two-sided test)H0 : 0H1 : 0单侧检验 (one-sided test)H0 : 0 H0 : 0H1 : 0 H1 : 0.10,不拒绝H0 ,正态性满足。P0.10,拒绝H0 ,接受H1,正态性不满足。 配对t检验(例3-6)两样本t检验(例3-7)方差齐性考察Homoscedascity;Homogeneity of variances; Equal variances目测法 较大方差是较小方差的3或5倍以上,应引起怀疑。方差齐性检验方差齐性检验 新药组 常规药组?22?标准差: 2.421方差: 2.421212?标准差: 3.060方差: 3.06
13、02方差齐性检验F 检验:从同一总体随机抽取的样本之两方差, 其方差比(大方差/小方差)的分布服从 F 分布t检验应用条件不满足时的处理尝试变量变换,如对数变换等。若变换后数据满足t检验条件,再行t检验(对变换后数据)。采用非参数检验法(不要求正态性和方差齐性)。若方差不齐,可采用近似t检验(又称校正t检验或t检验)变量变换(Variable Transformation)目的:方差齐性化;正态化常用方法:对数变换平方根变换倒数变换平方根反正弦变换方差不齐时的近似t检验1. Cochran & Cox法(1950): 对t界值进行校正2. Satterthwaite法(1946): 对自由度进
14、行校正3. Welch法(1947): 对自由度进行校正结果报告(例3-6)两种方法对乳酸饮料中脂肪含量的测定结果(%) 组别 例数 哥特里-罗紫法 10 0.7950.184 脂肪酸水解法 10 0.5230.186t=7.925, P0.50。两组均数差异无统计学意义,尚不能认为两药治疗后空腹血糖下降量不同。 第六节 假设检验的注意事项客观实际假设检验的结果拒绝 H0 不拒绝 H0 H0 成立I 型错误()推断正确(1- ) H0 不成立检验效能(1-)II 型错误()健康人与肝病病人的肝大指数分布肝大指数健康人H0肝病病人H1 误诊率(假阳性率)漏诊率(假阴性率)6.1 7.0 8.45
15、6891011 4 两类错误图示mm0mm0 mm0I 型错误和 II 型错误当P 而拒绝H0接受H1,要注意I型错误(type I error)出现;当P 而不拒绝H0,要注意II型错误(type II error)的出现。1 就是对真实的H1作出正确结论之概率,常被用来表达某假设检验方法的效能或功效(power of a test),国内学者称它为把握度:假设检验对真实的H1作正确结论之把握程度。Increasing the sample size decreases the chance of Type II error but does not have any effect on t
16、he chance of Type I error.Red : Type I errorGreen: Type II error 假设检验应注意的问题严密的研究设计正确选用检验方法正确理解Significant 的意义结论的概率性正确对待统计结论和专业结论置信区间与假设检验的关系假设检验应注意的问题下统计检验结论只能说有、无统计学意义(statistical significance),而不能说明专业上的差异大小。P值越小只能说明:作出拒绝H0,接受H1的统计学证据越充分, 推论时犯错误的机会越小,与专业上两均数差异的大小无直接关系。Statistical descriptionPoint estimationStatistical inferenceInterval estimationParameter estimationConfidence interval, CIHypothesis testingConfidence levelSampling errorConfidence limit, CLStandard error, SELower limit, LStudents t distributionUpper limit, UNull hypothesi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年及未来5年市场数据中国护苗器行业发展前景预测及投资战略数据分析研究报告
- 2026年石家庄信息工程职业学院单招职业技能考试参考题库附答案详解
- 2026年广东岭南职业技术学院高职单招职业适应性考试参考题库带答案解析
- 2026年鹤壁汽车工程职业学院单招职业技能考试备考题库带答案解析
- 土地流转租赁居间服务合同协议2025年样本
- 2026年湖南高速铁路职业技术学院高职单招职业适应性测试备考试题有答案解析
- 2026年河源职业技术学院单招综合素质笔试备考试题带答案解析
- 2026年保定理工学院单招职业技能笔试模拟试题带答案解析
- 2026年甘肃有色冶金职业技术学院高职单招职业适应性测试参考题库有答案解析
- 2026年四川科技职业学院单招职业技能考试参考题库附答案详解
- 核电厂抗震设计标准
- 2026年经销商合同
- 2023-2025年中考英语真题汇编01之单项选择(时态和语态)
- 学堂在线 雨课堂 学堂云 科研伦理与学术规范 章节测试答案
- 腹腔粘液性肿瘤课件
- 坡地沟租赁合同范本
- 脑动脉瘤破裂
- (2025版)国家基层高血压防治管理指南课件
- 社区家庭医生签约培训
- 直播平台开播标准话术模板
- 2025-2026学年浙美版二年级美术上册全册教案
评论
0/150
提交评论