版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
均数标准误的含义和计算点击添加文本点击添加文本点击添加文本点击添加文本学习内容计算公式中心极限定理123均数的标准误定义均数的标准误的估计4
均数的标准误反映均数抽样误差的大小。均数的标准误越大,均数的抽样误差就越大,说明样本均数与总体均数之间的差异或者样本均数之间的差异越大。
一、均数标准误的含义
二、
计算公式
当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似服从正态分布。抽样分布三、中心极限定理
图1抽样分布与中心极限定理示意图四、
均数的标准误的估计
实际中,总体标准差σ往往未知,通常用样本标准差S估计σ,求得样本均数标准误的估计值,计算公式为:例1在某地随机抽查成年男子140人,得红细胞均数为4.77×1012/L,标准差为0.38×1012/L,试计算其标准误。按公式计算得:
五、标准差与标准误的比较均数抽样误差的概念
在医学研究中,绝大多数情况是抽样后由样本数据推断总体特征。由于个体存在差异,因此通过随机抽样得到的样本在推论总体时会存在一定的误差(如样本均数
往往不等于总体均数
μ),这种由抽样造成的样本统计量与总体参数之间的差异称为抽样误差(samplingerror)。
均数抽样误差的大小可以用均数的标准误表示。均数抽样误差的概念
从同一总体中随机抽取若干个观察单位数相等的样本,由于抽样引起样本均数与总体均数及样本均数之间的差异称作均数的抽样误差,其大小可用均数的标准差描述。为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,统计学中将样本均数的标准差称为均数的标准误。t分布点击添加文本点击添加文本点击添加文本点击添加文本学习内容t分布曲线的特征12t分布的概念正态变量X采用u=(X-μ)/σ变换,则一般的正态分布N(μ,σ)即变换为标准正态分布N(0,1)。又因从正态总体抽取的样本均数服从正态分布
N(μ,),同样可作正态变量的u变换,即
一、t分布的概念
t分布——t值与t分布的引入-1.961.960.0250.025X0N(,2)N(0,1)样本均数正态分布观察值正态分布t分布标准正态分布S代替
实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是μ变换而是t变换了,即下式:公式(1)t分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称Studentt
分布(Students’t-distribution)。二、t分布曲线的特征
t分布曲线是单峰分布,以0为中心,左右两侧对称,曲线的中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。t分布曲线随自由度υ而变化,当样本含量越小(严格地说是自由度υ=n-1越小),t分布与u分布差别越大;当逐渐增大时,t分布逐渐逼近于u分布,当υ=∞时,t分布就完全成正态分布。t分布曲线是一簇曲线,而不是一条曲线。t分布下面积分布规律:查t分布表。图1t分布示意图t分布曲线下双侧或单侧尾部合计面积
一般常把自由度为υ的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值α时,则横轴上相应的t界值记为tα,υ。如当υ=20,α=0.05时,记为t0.05,20;当υ=22,α=0.01时,记为t0.01,22。对于tα,υ值,可根据α和υ值,查t界值表。t分布是t检验的理论基础。由公式(1)可知,│t│值与样本均数和总体均数之差成正比,与标准误成反比。在t分布中│t│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小,说明在抽样中获得此│t│值以及更大│t│值的机会就越小,这种机会的大小是用概率P来表示的。│t│值越大,则P值越小;反之,│t│值越小,P值越大。根据上述的意义,在同一自由度下,│t│≥tα
,则P≤α;反之,│t│<tα,则P>α。t界值表
t分布曲线是一簇曲线,故t分布曲线下面积为95%和99%的界值不是一个常量,而是随着自由度的大小而变化,为了便于应用,编制t界值表。该表横标目为自由度,纵标目为概率P。t界值表t界值表
总体均数置信区间的概念总体均数置信区间的概念1.总体均数的点估计总体均数的点估计是使用单一的数值直接作为总体参数的估计值,如用估计相应的μ。此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。2.总体均数区间估计区间估计是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率称为可信度或置信度,计算得到的区间称为置信区间或可信区间(confidenceinterval,CI)。1-α称为可信度,常取1-α为0.95和0.99,即总体均数的95%可信区间和99%可信区间。1-α(如95%)可信区间的含义是:总体均数被包含在该区间内的可能性是1-α,即(95%),没有被包含的可能性为α,即(5%)。总体均数置信区间的含义及应用点击添加文本点击添加文本点击添加文本点击添加文本学习内容总体均数的区间估计两总体均数差值的区间估计123均数可信区间的含义一、总体均数可信区间的含义总体均数可信区间是指按预先给定的概率
,
计算得到的一个区间,该区间由下限和上限构成。1-α(如95%)总体均数可信区间的含义是:总体均数被包含在该区间内的可能性是1-α,即(95%),没有被包含的可能性为α,即(5%)。二、总体均数的区间估计(一)σ
已知如果变量服从均数为μ、标准差为的正态分布,则:服从标准正态分布。则:则95%可信区间为:
其中,为标准正态分布的双侧界值。一般情况(二)σ未知1.t分布事实上,总体标准差通常是未知的,这时我们可以用其估计量S代替,但在这种情况下,已不再服从标准正态分布,而是服从著名的t
分布。不同自由度的t分布图WilliamGosset2.可信区间的计算
1.未知σ且n较小(n<100)按t分布的原理2.已知σ或n较大(n≥100)按u分布的原理例1某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:(g/L)上限:(g/L)
例2试计算例6-1中该地成年男子红细胞总体均数的95%可信区间。本例属于大样本,可采用正态近似的方法计算可信区间(),则95%可信区间为:下限:(/L)上限:(/L)实例模拟抽样和可信区间示意图3.单侧可信区间前面涉及的都是双侧可信区间。但有些情况下,我们所关心的仅仅是单侧的可信限。单侧可信区间与双侧可信区间的计算公式基本相同,只需将公式中的抽样分布的双侧界值换成单侧界值,同时只取下限或上限。实际中,有时需要计算两个总体均数差值的可信区间,例如通过计算两种降压药物平均降压的差值比较两种药物疗效的差别,其双侧可信区间的计算公式为:三、两总体均数差值的区间估计其中,为自由度,为两样本均数之差的标准误,当两总体方差相同时,
,其中,为两样本的合并方差。当两样本的样本含量均较大时,上述计算可信区间中的可用相应的代替,而且无论两总体的方差是否相同,均有例3评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将102名患者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准差为13.55mmHg。试估计两组收缩压
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中语文古诗词大单元教学策略研究
- 人工智能辅助的个性化学习平台在初中语文教学中的应用研究课题报告教学研究课题报告
- 施工现场淹溺紧急处置方案
- 2026年注册土木工程师真题含答案详解(满分必刷)
- 2026年汽轮机考试押题卷(各地真题)附答案详解
- 电脑买卖交易合同
- 石矿交易合同
- 离岸交易合同
- 移动物业合同
- 续贷居间服务合同
- 保洁工具使用与管理规范手册
- 妊娠期垂体瘤患者产前激素准备方案
- 中国东方航空校招试题及答案
- 2025至2030中国匹克球球拍行业项目调研及市场前景预测评估报告
- 盘式制动器拆卸课件
- 82-2手榴弹使用课件
- GB/T 4960.5-2025核科学技术术语第5部分:辐射防护与辐射源安全
- 县工商业联合会2025年度落实统战工作责任制情况自查报告
- 云南中考语文5年(21-25)真题分类汇编-文言文阅读
- 医院危险化学品安全风险评估报告
- 智库项目课题申报书
评论
0/150
提交评论