总体均数的估计.ppt_第1页
总体均数的估计.ppt_第2页
总体均数的估计.ppt_第3页
总体均数的估计.ppt_第4页
总体均数的估计.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 总体均数的估计,参数估计(parameter estimation) 是通过样本的信息估计出其总体中相应指标的数值及数值范围的统计分析方法,即用统计量估计总体参数的方法,是统计推断的一个重要方面。,第一节 抽样分布与抽样误差,医学科研的常用方法是抽样研究。 由于个体差异的存在,测算的样本指标值很难恰好等于总体指标值。这种由个体差异和抽样造成的样本与总体、样本与样本相应统计指标之间的差异即抽样误差。,一、样本均数的抽样分布与标准误,1.样本均数的抽样分布 指某种统计量 的频数分布。 用样本统计量作为该样本的代表值,这些个样本代表值的大小就形成了一个抽样分布。,抽样分布的特点,(1)各统计量间存在差异,统计量不一定等于参数。 (2)统计量的变异范围比原变量的变异范围大大缩小。 (3)随着n增加,样本均数的变异程度减小。 (4)如果原始变量服从正态分布,则统计量也服从正态分布。 如果原始变量不服从正态分布,若n较大,则统计量服从正态分布;若n较小,则统计量为非正态分布。,3抽样误差(sampling error),是因抽样产生的样本与样本、样本与总体相应统计指标之间的差异。 由于存在个体差异,且样本又未包含总体的全部信息,因此抽样误差是无法避免的。 抽样误差的大小主要取决于样本含量的多少和研究指标的变异程度。,3.标准误(standard error,SE),表示样本指标值在抽样分布中的变异情况。 SE越小,说明抽样误差越小,用统计量来估计参数时的可靠程度越大;反之,SE越大,说明抽样误差越大,用统计量来估计参数时越不可靠。,均数的标准误 (standard error of mean,SEM),样本均数的标准差也称均数的标准误。 反映样本均数间的离散程度,反映样本均数与相应总体均数间的差异,说明均数抽样误差的大小。,估计标准误,由于往往未知,常以S替代,算得的标准误称估计标准误。其统计符号 。 由于标准误与抽样误差成正比,与样本均数的代表性成反比,故在实际工作中可将标准误作为描述统计指标可靠性的依据。,例题,已知某样本资料的2.27(mol/L),120,求其标准误。 代入公式得:,二、标准差与标准误的比较,1.意义。 2.公式。 3.与n的关系。 4.用途。,二、t分布及其应用,1.t分布(t-distribution) 若对正态分布总体多次重复抽取若干样本含量相同的样本,样本均数围绕总体均数呈现正态分布。 若将所有样本均数按公式进行数学变换,可得u围绕0的标准正态分布。,1.t分布(t-distribution),由于总体标准差未知,只能求出标准误的估计值,变换公式求t 值,可得到若干t值。 将这些t值绘成直方图,若样本无限多,可绘成一条光滑的曲线t 分布曲线,此时所得的t值围绕0呈现的就是t 分布。,2.t分布的特征,(1)是一簇单峰分布曲线,以0为中心,左右对称。 (2)其形态变化与自由度的大小有关。 越小,则t值越分散,t 分布曲线越低平,t 分布的峰部越矮而尾部翘得越高; 越大,t 分布越逼近正态分布。,(3)t分布的单侧概率和双侧概率,在t界值表中,横标目为自由度,纵标目为概率(或)。 一侧尾部面积称为单侧概率或单尾概率; 两侧尾部面积之和称为双侧概率或双尾概率。 表中数字表示当和确定时,对应的t的界值,其中与单尾概率相对应的t界值用 表示,与双尾概率相对应的t界值用 表示。,查t界值表注意,由于t 分布是以0为中心的对称分布,故附表2只列出正值,查表时,不管t值正负,均可用其绝对值t查表得概率值。 在相同自由度时,t值增大,概率减小; 在相同t值时,双尾概率是单尾概率的两倍。 如双尾 单尾 1.812。,3.t分布的用途,总体均数的区间估计。 t检验。,第二节 总体均数的估计,是根据样本分布的特点,由样本均数推测总体均数的大小及其范围。 总体均数估计的方法有点值估计和区间估计两种。,一、总体均数的点值估计,点值估计(point estimation) 是用样本确定的统计量的值来直接估计总体参数的数值。 方法是以样本统计量及其标准误作为被估计参数的点估计值,一般是以统计量加减标准误的方式给出参数的点估计值。 点估计的优点是方法简单,缺点是未考虑抽样误差的影响。,二、区间估计(interval estimation),是根据抽样分布原理,按预先给定的概率水准,给出被估计参数可能的数值范围。 统计学称这一范围为被估计参数的可信区间(confidence interval,CI)。 称预先给定的概率水准为可信度或可信系数,符号为1-,常取95或99 。 称按95或99水准确定的CI为95CI或 99CI。,1大样本资料均数的可信区间,样本例数足够大(100)时,可按正态分布原理,用以下公式估计总体均数的CI。 95CI 99CI,例题,测得某地296例成年男性发锌的均数为200.0ppm,标准差为21.8ppm。试估计该地成年男性发锌总体均数的95CI。 本例296, 200,21.8, 1.27。 95CI200.01.961.27 (197.51,202.49) 该地成年男性发锌总体均数的95CI为197.51202.4ppm。,2.小样本资料均数的可信区间,当较小(100)时,一般按t分布原理,用以下公式估计总体均数的CI。 95CI 99CI 式中t0.05/2,与t0.01/2,为t0.05与t0.01的双侧界值。,例题,测得某地12例肾虚失钠型哮喘病人甲皱微循环管袢长度的均数为208.33,标准差为67.07。试估计该地肾虚失钠型哮喘病人甲皱微循环管袢长度总体均数的95CI。,解答,本例12, 208.33,67.07, 19.36,112111。 查t界值表得t0.05/2,112.201,按公式求得: 95CI208.332.20119.36 (165.72,250.94) 该地肾虚失钠型哮喘病人甲皱微循环管袢长度总体均数的95CI为165.72250.94。,3.可信区间的要素,(1)准确度:是CI包含总体参数的概率大小,用可信度的大小1-表示。 可信度越接近1,可信程度越高,准确度越高。如可信度99比95可信程度高。 (2)精密度:是对总体参数的估计范围或长度的度量,反映在CI即长度愈小愈精密。 每一次估计间的差异越小,CI愈小,即CI的长度越小,其估计的精密度越高。,4.可信区间的特点,(1)当确定后,CI范围的大小与可信度1-的高低呈正比,与估计结果的精确度呈反比。 (2)当可信度1-确定后,的大小与CI范围的大小呈反比;与估计结果的精密度呈正比。 因为增加样本例数会减小标准误,使CI的范围缩小。CI的范围越小,真实值靠近点估计值的可能性越大,靠近CI边缘的可能性越小,估计的精确度也随之提高,其统计效力就越大。,5.可信区间与可信限的关系,CI为某一整体内的一个分段,是以上、下可信限为界的开区间(不包含界值在内)。 CL是CI的上下两个界值。 如95CI为(165.6,251.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论