参数估计基础与假设检验分析.ppt_第1页
参数估计基础与假设检验分析.ppt_第2页
参数估计基础与假设检验分析.ppt_第3页
参数估计基础与假设检验分析.ppt_第4页
参数估计基础与假设检验分析.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本资料来源,参数估计基础,均数的抽样误差和标准误 t分布 总体均数的估计,参数估计基础,统计推断:参数估计 假设检验,inference,一、均数的抽样误差和标准误,抽样研究,一定存在着抽样误差。因此,估计抽样误差的大小,就成为统计推断必须要解决的问题。,抽样误差的概念? 抽样误差的大小?,抽样误差的概念,定义:由抽样引起的样本统计量与总体参数间、以及样本统计量与样本统计量之间的差别。 原因:个体变异随机抽样 表现: 样本统计量与总体参数间的差别 不同样本统计量间的差别,假设一个已知总体,从该总体中重复抽取样本含量相等的样本若干,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规

2、律抽样分布规律。 考察: 不同的分布-正态分布、偏态分布 不同的样本含量,抽样试验,由中心极限定理及大数定理得出: 若原变量X服从正态分布,随机抽取样本含量为n的样本均数 也服从正态分布。 即使从偏态总体中随机抽样,当n足够大(n50),样本均数也近似服从正态分布。 这个定理不仅具有理论价值,而且具有很高的实用价值。因为在实际工作当中,许多医学测量结果并不知道它的确切分布,有了这个性质,就可以利用正态分布的原理对其特征进行统计推断。,样本均数的分布:,从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000

3、份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。,抽样试验(n=5),抽样试验(n=10),抽样试验(n=30),3个抽样实验结果图示,样本均数的抽样分布特点,各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布; 样本均数的变异较原变量的变异大大缩小。 随着样本含量的增加,样本均数的变异范围逐渐缩小。,均数的标准误(standard error of mean):,样本均数的正态分布的两个特征指标是什么? 均数:反映了样本均数的

4、集中水平,近似等于总体均数。 标准差:样本均数之间的差异,反映了样本均数的离散程度,即为抽样误差。这时的样本均数的标准差,称为样本均数的标准误,简称标准误。,标准误是反映样本抽样误差大小的统计指标。,标准误与标准差的关系有:,标准误的估计值为:,标准误的概念,抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数之间的差异。当标准误大时,用样本均数对总体均数的估计的可靠程度就小;反之亦然。,标准误用途,衡量样本均数的可靠性:标准误越小,表明样本均数越可靠; 参数估计:估计总体均数的置信区间(区域); 假设检验:用于总体均

5、数的假设检验(比较)。,例,2000年某研究者随机调查某地健康成年男子27人,测其血红蛋白量均数为125 g /L,标准差为15 g /L。试估计该样本均数的抽样误差。,27,2.89,标准差与标准误,意义:标准差用于描述个体值之间的变异,即观察值间的离散度, 标准差小,表明观察值围绕均数的波动小;标准误描述统计量的抽样误差,即样本统计量与总体参数的接近程度。标准误小,表明抽样误差小,则统计量稳定,与参数接近。 用途:标准差表示观察值间波动的大小,用于医学参考值范围;标准误表示抽样误差的大小,用于参数估计。 关系:随着样本含量增加,都减小。 联系:都是表示变异度的指标,当样本量一定时,两者成正

6、比。,二、t分布,t 分布是一抽样分布,t 分布不是一条曲线,而是一簇曲线,因为t 值的分布与自由度 有关。其特点:,t分布曲线下面积(附表2),双侧t0.05/2,92.262 单侧t0.025,9 单侧t0.05,91.833 双侧t0.01/2,93.250 单侧t0.005,9 单侧t0.01,92.821 双侧t0.05/2,1.96 单侧t0.025, 单侧t0.05, 1.64,三、总体均数的估计:,点值估计(point estimation):例,120名成年男子血清铁含量的均数是18.57。那么,该总体范围(这个地区)的成年男子血清铁含量的均数就是18.57。这种方法虽简单,

7、但未考虑抽样误差,一般不用。 区间估计(interval estimation) :是按一定的概率如95%,估计总体均数所在的范围,即总体均数的可信区间或置信区间,通常用样本均数和均数的标准误来估计。,t分布方法,应用条件:总体方差未知,样本量小,例 某医师侧的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15.19umol/d,标准差为5.03umol/d,试估计该种病人尿17-酮类固醇排出量总体均数的95%可信区间。,分析条件:总体方差未知,样本量小,(13.5816.80),正态分布近似法,应用条件:当总体标准差已知时;或总体标准差未知,而样本量较大时(n50),1、单一总体

8、均数的可信区间:,双侧可信区间为:,单侧可信区间为:,例,测得某市16名正常成年男子的血清胆固醇平均含量= 174.63mg/dl,标准差= 36.27 mg/dl。试问该市正常成年男子血清胆固醇平均含量的95%置信区间和99%置信区间各是多少?,例, 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2 cm,标准差为4.5 cm,试估计该市2000年19岁健康男大学生平均身高的95%置信区间?,2、两总体均数之差的可信区间:,双侧可信区间为:,单侧可信区间为:,可信区间的意义:用样本均数估计出一个总体均数的范围,可信的程度有95%。也就是说总体均数落在这个范围的可能性有95%。 从理论上讲,这样估计100次,约有95次是对的,也就是总体均数在这个范围的可能性是95%,约有5次是不对的,也就是总体均数没有在这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论