定量资料的统计学推断(1-3)_第1页
定量资料的统计学推断(1-3)_第2页
定量资料的统计学推断(1-3)_第3页
定量资料的统计学推断(1-3)_第4页
定量资料的统计学推断(1-3)_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学高职高专“十四五”医学检验技术专业系列教材高职高专“十四五”医学检验技术专业系列教材第四章定量资料的统计学推断尹文琴 江苏护理职业学院目

录第一节

均数的抽样误差与标准误01第二节t分布02第三节总体均数置信区间估计03学习目标知识目标能力目标素质目标能进行总体均数的区间估计;根据不同的设计类型,选择对应的统计学方法进行统计推断。培养缜密的统计学思维,提升数据分析的能力。掌握均数抽样误差和标准误概念、计算公式和应用;t分布的特征;可信区间的概念及计算;假设检验的步骤及注意事项;t检验、z检验和方差分析的运用条件。第一节

均数的抽样误差与标准误一、均数的抽样误差

如要了解某地7岁男童身高的总体均数,抽得120名7岁男童,求出样本均数=119.43cm,估计该地岁男童身高的总体均数μ,由于抽样误差≠μ,与μ的差别称均数的抽样误差。

医学研究中常常从总体中随机抽取样本进行研究,目的是由样本的信息去推断总体。通常情况下样本均数不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本均数与样本均数之间、样本均数与总体均数之间的差异称为抽样误差(samplingerror)。一、均数的标准误

中心极限定理:样本量n足够大(一般n≥100)的情况下,无论原始变量是什么分布,样本均数的分布近似正态分布。从均数为μ,标准差为σ的正态总体中抽取样本例数为n的样本,样本均数的均数仍等于原总体均数μ,样本均数的标准差为

,即标准误。标准误的计算:

标准误的计算:

某地成年男子红细胞数的抽样调查,n=144人,=5.38×1012/L,s=0.44×1012/L,求其标准误。标准误的应用:

1.反映抽样误差的大小,衡量样本均数的可靠性。均数标准误越小,说明样本均数间的离散程度越小,用样本均数估计总体均数越可靠;反之,均数标准误越大,说明样本均数间的离散程度越大,用样本均数估计总体均数的可靠性越小。2.进行总体均数的区间估计。3.用于均数的假设检验。第二节

t分布一、t分布的概念

对正态变量X采用z变换,z=(X-μ)/σ,则一般的正态分布N(μ,σ2)即变换为标准正态分布N(0,1)。样本均数服从正态分布,同样可作正态变量的z变换,即:z=(-μ)/一、t分布的概念

实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是z变换而是t变换了,即t=(-μ)/

t分布于1908年由英国统计学家W.S.Gosset以“student”笔名发表,故又称studentt分布(Students’t-distribution)。t分布示意图二、t分布曲线的特征1.以0为中心,左右对称的单峰分布;2.t分布曲线是一簇曲线,其形态与自由度ν的大小有关。自由度ν越小,则t值越分散,曲线越低平;自由度ν逐渐增大时,t分布逐渐逼近z分布(标准正态分布),当ν趋近于∞时,t分布即为z分布。三、t分布曲线下的面积分布规律1.t分布曲线的两端尾部面积表示的含义

表示在随机抽样中获得的t值达到及超越横轴上该t值的概率,即P值。2.t分布曲线的两端尾部面积的表示方法

与正态分布类似,t分布曲线与横轴所包含的面积定义为1(100%),在横轴上0的左右截取一个范围,同样可以得到范围所夹面积与总面积的比值,以及范围外所夹的面积与总面积的比值,也就是t值落在范围内与范围外的概率。将范围外的面积称为尾部面积,并定义为α,则范围内为1-α。三、t分布曲线下的面积分布规律

当自由度为ν的t分布曲线下,双侧尾部合计面积为指定值α时,横轴上相应的t界值记为tα/2,ν;单侧尾部面积为指定值α时,则横轴上相应的t界值记为tα,ν。如单侧α=0.05,ν=9可查得tα,ν=1.833表示p(t≥1.833)=0.05由t分布的对称性p(t≤-1.833)=0.05第三节

总体均数置信区间的估计第三节

总体均数可信区间的估计

参数估计(parameterestimation)是指用样本统计量估计总体参数,是统计推断的一个重要内容。估计总体均数的方法有两种,即点值估计(pointestimation)和区间估计(intervalestimation)。参数估计

点值估计:用相应样本统计量直接作为其总体参数的估计值。其方法简单,但未考虑抽样误差的影响,无法评价参数估计的准确度,并不常用。区间估计:按预先给定的概率(1-α)估计总体参数所在范围,由此估计的区间称为总体参数1-α可信区间(CI),亦称置信区间。1-α称为可信度或置信度,常取95%或99%。可信区间的下限记为CL,上限记为CU。总体均数可信区间的计算

1.总体标准差σ已知95%的可信区间

总体标准差σ未知但样本含量n较大(n≥100)95%的可信区间总体标准差σ未知但样本含量n较小95%的可信区间例

某地健康男子中抽得26人的样本,求得血红蛋白均数为13.25g/dl,标准差为0.7g/dl,试估计该地健康男子血红蛋白总体均数的95%可信区间。

可信区间应用的注意事项

1.标准误越小,估计总体均数可信区间的范围也越窄,说明样本均数与总体均数越接近,对总体均数的估计也越精确;反之,标准误越大,估计总体均数可信区间的范围也越宽,说明样本均数距总体均数越远,对总体均数的估计也越差。可信区间应用的注意事项

2.可信区间具有两个要素:一是准确度,即可信区间包含μ的概率(1-α)的大小,一般而言概率越大,估计的准确度越高,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论