版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第六章 参数估计基础天津医科大学公共卫生学院卫生统计学教研室 马骏,2,总体分布(population distribution) 是总体中各元素的观察值所形成的频数或频率分布 总体分布通常是未知的 可以假定它服从某种分布,第一节 抽样分布与抽样误差,3,是一个样本中各观察值的频数或频率分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布(sample distribution),4,(一)抽样分布(sampling distribution) 是某一样本统计量的全部可能取值的概率分布。 现实中不可能抽出所有样本,因此统计量的抽样分布实际是一种理论概率分布。统计
2、推断中,常用的理论概率分布:正态分布、 2分布、t分布和F分布。 是样本统计量的函数。若样本是随机的,则样本统计量就是随机变量 ,如样本均值,样本比例,样本方差等为随机变量。 结果来自容量相同的所有可能样本。 提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。,一、样本均数的抽样分布与抽样误差,5,抽样分布(sampling distribution),6,(二)抽样误差,从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30,n=30, .,7,从正态总体 抽样得到的1000个样本均数的频数分布(ni=30),8,Mean=1
3、55.426 Std=0.966,9,抽样误差,结果: 各样本均数不一定等于总体均数; 样本均数间存在差异; 样本均数的分布规律:围绕总体均数上下波动; 样本均数的变异:由样本均数的标准差描述。,10,抽样误差,抽样误差(Sampling error ) 由抽样引起的样本统计量与总体参数间的差异 来源: 个体变异 抽样 表现: 样本统计量与总体参数间的差异 样本统计量间的差异,11,样本均数的规律性 随机的 在概率意义下是有规律的-抽样分布 通过大量重复抽样,借助频数表描述 样本均数的变异规律(抽样分布)与个体观察值变异规律有关 即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得
4、到样本均数的变异规律,抽样分布,12,正态总体样本均数的分布,已知某地高三男生的平均身高为 ,标准差为 ,将其视为一个总体。 从该总体中随机抽样 样本含量为n 每次抽取10000个样本并计算各自的样本均数 以10000个样本均数作为一个新的样本制作频数图,13,抽样1,样本含量n=4 的平均数 =168.19 的标准差 =2.9670,14,抽样2,样本含量 n=16 的平均数 =168.158 的标准差 =1.4884,15,抽样3,样本含量 n=36 的平均数 =168.1493 的标准差 =0.9997,16,从正态分布的总体 中随机抽取样本含量为n的样本X1,X2,Xn,其样本均数 服
5、从正态分布,总体均数为 ; 样本均数的总体标准差 若 ,则其中任意一个随机样本Xn的均数,正态总体样本均数的分布,17,样本均数的标准差 ,称为样本均数的标准误(standard error of mean ,SE),简称均数标准误 它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。 误差大小 ,实质是要估计 的分布特征,正态总体样本均数的分布,18,由于实际 往往未知,需要用样本 来估计 ,样本均数标准误的估计式为 注意区别: 证明:,正态总体样本均数的分布,19,非正态总体样本均数的分布,从一个不服从正态分布的总体中随机抽样,样本均数的分布会如何变化? 从总体均数为1的指数分布中
6、抽样,样本大小分别为4,9,100。每次抽10000个样本制作频数分布图,20,21,22,抽样1,样本含量n=4 的平均数 =1.0133 的标准差 =0.5031 的中位数 =0. 9298,23,抽样2,样本含量n=9 的平均数 =0.9959 的标准差 =0. 3332 的中位数 =0.9574,24,抽样3,样本含量n=100 的平均数 =0.9993 的标准差 =0.1001 的中位数 =0.9958,25,从非正态指数分布总体中随机抽样所得样本均数 : 在样本含量较小时呈偏态(非指数型); 样本含量较大时接近正态分布; 均数 始终在总体均数 附近; 均数 的标准差,非正态总体样本
7、均数的分布,26,中心极限定理(central limit theorem),当总体为非正态分布时依据以下中心极限定理。 中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大(通常n30)时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,27,中心极限定理(central limit theorem),的分布趋于正态分布的过程,28,抽样分布与总体分布的关系,29,中心极限定理及其应用,样本均数 总体标准差是个体资料X的总体标准差的 ;即理论标准误 理论标准误的样本估计值为 样本均数 与 个体资料X的集中位置相同,即样本均数 的总体均数与 个体资料X
8、的总体均数 相同,30,中心极限定理及其应用,若个体资料X服从正态总体 ,则样本均数 也服从正态分布 ; 个体资料X服从偏态分布,当样本量n较大时,样本均数 近似服从正态分布,31,第二节 t分布,一、t分布的概念 ,标准正态分布与t统计量 实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为,32,如在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值和U值并作相应t的频数图,二、t分布的图形和特征,33,t分布的图形,样本含量n=5,样本含量n=100,不同样本含量时t值的频数分布图,34,
9、结果 小样本时,t统计量和U统计量的分布有明显差别 大样本时,t统计量和U统计量的分布非常接近。 频数图 当样本量较大时,统计量t的频数图与标准正态分布曲线非常接近 样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大,t分布的图形,35,英国统计学家W. S. Gosset(1908)设 并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自由度为v,记为t(v)分布。 每个自由度v对应一个分布,因此t分布是一簇分布 t分布仅与总体均数有关,与总体标准差无关,t分布的图形,36,三条t分布密度曲线,t分布的图形特征,不同自由度下的t分布图,37,t
10、分布的图形特征,分布特征 t分布曲线是单峰的 关于t = 0对称 自由度越大, t值越小 t分布与正态分布的关系 自由度v较小时, t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积 当自由度 时, t分布逼近于标准正态分布。,38,t分布的界值,给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称 为t的双侧界值 单侧界值 :一侧尾部面积为时对应的t值 对称性得:单侧曲线下面积=2双侧曲线下面积 同样的尾部面积,t分布的界值要大于标准正态分布的界值,39,t分布界值示意图,表示阴影的面积,40,第三节 总体均数及总体概率的估计,一、参数估计的概念
11、参数估计:是指用样本指标(统计量)来估计总体指标(参数)。 它包括两种方法: (一)点(值)估计(point estimation): 即把样本统计量直接作为总体参数的估计值,如用样本均数来估计总体均数。这种方法虽然很简单,但是未涉及随机误差,而随机误差在抽样研究中是不可忽视的。 (二)区间估计(interval estimation): 即按一定的概率估计总体均数在哪个范围,它把抽样误差引入估计量,确定具有特定概率意义的区间。,41,可(置)信区间与参考值范围,可信区间:从总体中作随机抽样,每个样本可以算出一个可信区间,如95%可信区间,意味着100次抽样,算得100个可信区间,平均有95个
12、可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。5%是小概率事件,实际发生的可能性小,因此,在实际应用中就认为总体均数在算得的置信区间内, 这种估计方法会冒5%犯错误的风险。 参考值范围:指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。,42,可信区间和可信限,可信限(CL)分别指两个点值。 可信区间(常简记为CI)是以上、下可信限为界的一个范围。比如可信区间(5.31, 5.45)1012/L的下限是5.311012/L,上限是5.451012/L 。,
13、43,二、总体均数的区间估计,1、t分布法 设有一正态总体N(,2),现从中随机抽取一个样本,该样本的均数和标准差分别用 和s表示,样本均数的标准t离差服从t分布,则可信度为(1- )的t值满足: P(-t, t t,)=1- 将 代入不等式,即:,44,于是得可信度为1- 时,计算总体均数可信区间的通式为: 习惯上,常取1- =0.95, 即95%可信区间;或取1- =0.99, 即99%可信区间。,45,未知时。一般用t分布的原理作区间估计。 2、正态分布近似方法 (1)当总体标准差已知时 (2)当未知,但n足够大时(n50),46,例:对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9mm,标准差为3.86mm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 昭通卫生职业学院《中国现当代文学作品读与中学语》2026-2027学年第一学期期末试卷含解析
- 唐山工业职业技术学院《形式与政策教育》2026-2027学年第一学期期末试卷含解析
- 浙江长征职业技术学院《通信原理Ⅰ》2026-2027学年第一学期期末试卷含解析
- 益阳职业技术学院《人体工效学》2026-2027学年第一学期期末试卷含解析
- 重庆建筑工程职业学院《运动处方》2026-2027学年第一学期期末试卷含解析
- 绿化未来:包装行业新探索-推动可持续发展共筑环保新标准
- 2026年跨境电商品牌竞品优势借鉴
- 2026年宠物美容行业人才招聘标准
- 2026应聘工厂面试题及答案
- 2026英语高考面试题目及答案
- GB/T 45355-2025无压埋地排污、排水用聚乙烯(PE)管道系统
- 【MOOC】环境资源法学-西南政法大学 中国大学慕课MOOC答案
- 首都医科大学附属北京世纪坛医院
- 英文故事-狼来了
- 《机器人概论》期末试卷及答案
- 六年级下册道法练习题
- GB/T 31710.4-2015休闲露营地建设与服务规范第4部分:青少年营地
- GB/T 29347-2012法庭科学枪械射击弹壳痕迹检验规范
- 基层医疗卫生机构管理信息系统用户使用手册(V2.0)
- 机械原理课程设计-摇摆式输送机机构设计
- 电镀基础知识介绍-课件
评论
0/150
提交评论