版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样误差和可信区间Sampling Error & Confidence IntervalsMedical statistics医学统计学主要内容(Content)抽样误差及其规律性标准误抽样分布与t分布统计推断与参数估计总结一均数的抽样误差(sampling error)与标准误(standard error, SE)抽样研究的目的是要用样本信息推断总体特征,称统计推断1. 抽样误差的定义假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。119.41cm= 4.38cm三次抽样得到了
2、不同的结果,原因何在?个体变异随机抽样不同男童的身高不同每次抽到的人几乎不同抽样误差【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。各种参数都有抽样误差,这里我们以均数为研究对象抽样误差的定义抽样误差的表现抽样误差的表现样本均数和总体均数间的差别样本均数和样本均数间的差别抽样误差的重要性总体同质个体、个体变异总体参数未知样本代表性、抽样误差随机抽样 样本统计量 已知统计推断风 险2. 抽样误差的规律性(分布) 既然抽样误差是有规律的,那么到底它的分布规律到底是怎样的? SAMPLE 1:x11 x12 x13 x14.x
3、1nSAMPLE 2:x21 x22 x23 x24.x2nSAMPLE k:xk1 xk2 xk3 xk4.xknA Simulation Study原始总体k个样本均数的频数分布图从正态总体中随机抽样,其样本均数服从正态分布从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布均数的抽样误差 -的分布3. 标准误的定义抽样误差的标准差称为标准误(standard error)。样本统计量的标准差反映了从某个总体中随机抽样所得样本之均数分布的离散程度。标准误的计算计算公式为其中,为总体标准差,n为抽样的样本例数在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估
4、计标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。二t分布 t分布的演化由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差,这里,为自由度,取值为n-1由W.S. Gosset提出 f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3
5、自由度分别为1、5、 时的 t 分布t分布的图形t分布的性质t分布为一簇单峰分布曲线t分布以0为中心,左右对称分布的高峰位置比 u 分布低,尾部高t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布每一自由度下的t分布曲线都有其自身分布规律。t界值表 t分布曲线下的面积-tt0t界值表单侧: P(t t,)= 双侧: P(t t/2,)= 即:P(-t/2,t t/2,)= 1-例 查t界值表得t值表达式 t 0.05,10=2.228 (双侧) t 0.05,10=1.812 (单侧)-t
6、t0统计推断所谓统计推断(statistical inference),是指如何抽样,以及如何用样本性质推断总体特征。参数估计(parameter estimation)假设检验(hypothesis testing)三. 参数估计点估计(Point Estimation)区间估计 (Interval Estimation)参数估计之一:点估计用样本统计量作为总体参数的估计 例如: 用样本均数作为总体均数的一个估计区间估计可信区间的定义总体均数之可信区间的求解均数之差的可信区间可信区间的要素正确理解可信区间的含义区间估计【例4.1】 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.
7、6次/分,标准差为6.5次/分,估计正常成年男子脉搏总体均数。区间估计的实质假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即P(AB)=0.95可信区间的定义按一定的概率或可信度(1-)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-)称为可信度或者置信度(confidence level),常取95%或99%。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限均数的(1-)100%可信区间-t/2, v 0 t/2, v 1
8、-/2/2均数的95%可信区间样本含量不是很大时,样本含量较大时,t分布逼近u分布例:【例4.1】 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。【例4.2】 某市2001年120名7岁男童的身高=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。均数之差可信区间的计算 正常组 肝炎组 2?均 数: 231.86ug/dL标准差:12.17ug/dL 1?均 数:273.18ug/dL标准差:9.77ug/dL 1- 2 ?合并方差与均数之差的标准误合并方差(
9、方差的加权平均)均数之差的标准误与均数之差有关的抽样分布 “均数之差”与“均数之差的标准误”之比,服从自由度 = n1+n2 -2的 t 分布。样本含量较大时,服从标准正态分布。计算可信区间的两个要素可信度(Confidence):准确性,可靠性,即1-。一般取90%,95,可人为控制精确性(Precision):区间的大小,越小越好。必须二者兼顾可信区间的宽度及影响因素均数的(1-)可信区间为 则其宽度为可信区间的宽度可信度越大,可信区间越宽,说明用该区间来估计总体参数(总体均数)越可靠。标准差越小,可信区间就越窄,意味着如果总体内变异程度较小时,在相同的可信度下,只需要一个比较窄的可信区间就可以估计总体均数。随着样本含量的增加,可信区间逐渐变窄。正确理解可信区间可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。(每抽一百次样本,得到的100个可信区间 中有95个包含了总体的参数)这里的95%,指的是方法本身!而不是某个区间!总体参数虽未知,但却是固定的值,而不是随机变量值 。95%可信区间的含义-2 -1 0 1 2 按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。下列说法正确吗?算得某95%的可信区间,则: 总体参数有95%的可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 滁州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(夺冠系列)
- 2026年广州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(历年真题)
- 宿州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解一套
- 2026年滁州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(培优a卷)
- 四川省农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(真题汇编)
- 沧州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及一套答案详解
- 2026年东莞市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(名校卷)
- 新居间合同范本3篇
- 运城市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)完整参考答案详解
- 晋城市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及参考答案详解
- 消渴病症的应急护理
- Unit 4 Plants around us Part A Let's learn(说课稿)-2024-2025学年人教PEP版(2024)英语三年级上册
- 智能化劳务分包合同模板
- 《跟上兔子》绘本六年级第1季A-Big-Basketball-Fan教学课件
- 5S管理操作手册
- 生产线平衡培训
- 宁夏回族自治区银川市2024-2025学年上学期期中考试七年级数学题(含答案)
- UL2595标准中文版-2015电池驱动设备的要求中文版
- 《中国传统民居建筑》课件
- 淋巴瘤病病人的护理
- 美发行业用户行为分析
评论
0/150
提交评论