正态分布参考值抽样误差课件_第1页
正态分布参考值抽样误差课件_第2页
正态分布参考值抽样误差课件_第3页
正态分布参考值抽样误差课件_第4页
正态分布参考值抽样误差课件_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正态分布Normaldistribution正态分布参考值抽样误差课件例某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-15.953.82正态分布和医学参考值范围例某地用随机抽样方法检查了140名成年男子的红细胞数,检测红细胞数组中值频数频率(%)3.80~3.9021.44.00~4.1064.34.20~4.30117.94.40~4.502517.94.60~4.703222.94.80~4.902719.35.00~5.101712.15.20~5.30139.35.40~5.5042.95.60~5.7021.45.80~6.005.9010.7某地140名正常男子红细胞数频数表红细胞数组中值频数频率(%)3.80~3.9021.直方图直方图f(x)=(fi/n)以频率为纵坐标f(x)=(fi/n)以频率为纵坐标随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光滑的曲线,如下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,形状似座钟。类似于数学上的正态分布曲线。因为频率的总和等于1,故横轴上曲线下的面积等于1。频率密度f(x)=(fi/n)/i(i=0.1)随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光正态分布参考值抽样误差课件这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正态分布。正态分布是自然界最常见的一种分布,例如,测量的误差、人体的身高、体重、许多生化指标的值(例如血压、血红蛋白含量、红细胞数等等)等都属于正态分布或近似正态分布。还有些偏态资料可经数据转换成正态或近似正态分布,例如抗体滴度、血铅值等。这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正一、正态分布的密度函数式中μ为总体均数,σ为总体标准差,π为圆周率,e为自然对数的底,x为变量,当μ、σ已知,以x为横轴,f(x)为纵轴,即可给出正态分布曲线的图形。一、正态分布的密度函数式中μ为总体均数,σ为总体标准差,π为二、正态分布的特征1.正态分布在横轴上方,均数处最高,以均数μ为中心,左右对称。2.正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0。3.正态分布曲线下的面积分布有一定的规律。所有的正态分布曲线,在μ左右任意个标准差范围内面积相同。二、正态分布的特征所有的正态分布曲线,在μ左右任意个标准差4.正态分布完全由两个参数即均数μ与标准差σ决定,其中μ是位置参数,σ是变异参数。常用N(μ,σ2)来表示。4.正态分布完全由两个参数即均数μ与标准差σ决定,其中μ是位μ=0、σ=1的标准正态分布μ=0、σ=1的标准正态分布标准正态分布曲线及其面积分布标准正态分布曲线及其面积分布三、正态分布的应用不少医学现象服从正态分布或近似正态分布确定医学参考值范围质量控制图正态分布是很多统计方法的理论基础三、正态分布的应用医学参考值范围的估计1.医学参考值范围的概念

指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。2.医学参考值范围的确定要求确定研究总体,例如“正常人”。选择足够数量的观察对象。统一测定方法,控制实验误差,保证数据的可靠性。决定取单侧范围还是双侧范围值选择恰当的百分范围医学参考值范围的估计1.医学参考值范围的概念医学参考值范围的估计3.医学参考值范围的计算方法正态分布法百分位数法医学参考值范围的估计3.医学参考值范围的计算方法正态分布法正态分布法

适用于正态或近似分布资料

式中为均数,s为标准差,u值可根据要求查表。公式为:正态分布法式中为均数,s为标准差,u值可根据要求查表。常用的u界值参考值范围(%)单侧双侧9095991.2821.6452.3261.6451.9602.576常用的u界值参考值范围(%)单侧双侧90正态分布参考值抽样误差课件例某地调查正常成年男子144人的红细胞数近似正态分布,得均数为5.38(1012/L),标准差为0.44(1012/L),试估计该地成年男子红细胞数的95%参考值范围。例某地调查正常成年男子144人的红细胞数近似正态分布,得均数百分位数法:

适用于偏态分布资料

例如白细胞数的95%参考值范围:因为白细胞数无论过高或过低均属异常,则分别计算P2.5和P97.5,这是双侧95%参考值范围。百分范围(%)单侧双侧下限上限下限上限95P5P95P2.5P97.599P1P99P0.5P99.5百分位数法:

适用于偏态分布资料例某年某市调查了200例正常成人血铅含量(μg/100g)如下,试估计该市成人血铅含量95%医学参考值范围(用百分位数法计算)。例某年某市调查了200例正常成人血铅含量(μg/100g正态分布参考值抽样误差课件练习1:调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。

血红蛋白过高、过低均为异常,应按双侧计算:练习1:血红蛋白过高、过低均为异常,应按双侧计算:一、均数的抽样分布与抽样误差抽样研究的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数(X)往往不等于总体均数(),因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。数值变量的参数估计一、均数的抽样分布与抽样误差抽样研究的目的就是要用样本信息来正态分布参考值抽样误差课件正态分布参考值抽样误差课件110名20岁健康男大学生的身高均数为172.73cm。110名20岁健康男大学生的身高均数为172.73cm。已知Σf=110,ΣfX=19000,需要在该表中增加fx2栏,由第(3)、(4)栏相乘,再将该栏数据相加,将ΣfX2=3283646代入公式正态分布参考值抽样误差课件110名20岁男大学生的平均身高X=172.73cm,标准差s=4.09cm。假设该110个身高数值作为假设的有限总体,即:

μ=172.73cm,σ=4.09cm现在从该总体中随机抽10个学生身高为1号样本。计算得:X1=173.22cms1=4.05cm110名20岁男大学生的平均身高X=172.73cm,标准差正态分布参考值抽样误差课件重复100次刚才的抽样,得到100个样本(每个样本含量均为10个),可算得100个样本均数X。重复100次刚才的抽样,得到100个样本(每个样本含量均为1各样本均数的均数X=172.66cmμ=172.73cm各样本均数的均数X=172.66cmμ=172.73cm正态分布参考值抽样误差课件样本均数的抽样分布具有以下特点:各样本均数未必等于总体均数;样本均数之间存在差异;样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;样本均数的变异较之原变量的变异大大缩小。样本均数的抽样分布具有以下特点:总体均数为μ,标准差σ样本1(,s)样本2(,s)样本3(,s)样本m(,s)抽样,样本量为n…总体均数为μ,标准差σ样本1(,s)样本2(根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服从正态分布。随机变量X:N(μ,2)

样本均数:N(μ,)

根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服均数的标准误及计算

反映均数抽样误差大小的指标是样本均数X的标准差简称标准误(理论值),用表示,或SE、SEM。由于在实际抽样研究中往往未知,通常用某一样本标准差s来替代,得标准误的估计值(通常也简称为标准误),其计算公式为:均数的标准误及计算以1号样本=173.22cm,s1=4.05cm为例:均数的标准误及计算以1号样本=173.22cm,s1=4.05cm为例

一般情况下未知,常用估计抽样误差的大小,也即的估计值。例2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。将X=125g/L,s=15g/L,n=27代入一般情况下未知,常用例2000年某例:已知s=6.85,

n=100则样本均数的抽样误差为多少?例:已知s=6.85,标准误的应用1.反映样本均数的可靠性;

标准误反映抽样误差的大小。标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。2.估计总体均数的可信区间;3.用于均数的假设检验。

标准误的应用二、总体均数的可信区间估计即用样本指标(统计量)估计总体指标(参数)有两种常用方法:点估计和区间估计(一)点估计:样本均数()就是总体均数的点估计值(μ)

该法简单,但未考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。二、总体均数的可信区间估计即用样本指标(统计量)估计总体指标(二)区间估计:结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(confidenceinterval,CI)(二)区间估计:即按一定的概率估计未知总体均数的所在范围。

习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数的概率为95%(或99%),用此范围估计总体平均数,表示100次抽样中,有95(99)次包含总体均数。例如:总体均数的可信区间即按一定的概率估计未知总体均数的所在范围。例如:总体均数的(1)未知,但样本例数n足够大(如n﹥50),总体均数的1-α双侧可信区间为总体均数95%的双侧可信区间为:总体均数可信区间的计算总体均数99%的双侧可信区间为:(1)未知,但样本例数n足够大(如n﹥50),总体均数的例某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%可信区间。本例n=90,可按正态分布近似法计算故该市2000年19岁健康男大学生平均身高的95%可信区间为(171.3,173.1)cm。例某市2000年随机测量了90名19岁健康男大学生的身高,t分布t分布

前面讲过,通过u变换,可将正态分布N(μ,2)转换成标准正态分布N(0,1)。同样,若从正态分布N(μ,2)总体中随机抽样并算得多个样本均数,它们仍服从总体均数为μ,总体标准差为的正态分布N(μ,),则服从前面讲过,通过u变换,可将正态分布N(μ标准正态分布N(0,1)。在实际工作中,往往是未知,常用替代,即

这时,对正态变量X采取的不是u变换而是t变换了,t值的分布称为t分布。标准正态分布N(0,1)。在实际工作中,往往是未知,常用正态分布参考值抽样误差课件1.单峰分布,以0为中心,左右对称;2.t分布是一簇曲线,其形态变化与自由度的大小有关n-1。越小,与的差别越大,t值越分散,曲线的峰部越矮,尾部越粗。越大,t分布越接近于标准正态分布。t分布的特征:1.单峰分布,以0为中心,左右对称;t分布的特征:自由度分别为1、5、∞的t分布自由度分别为1、5、∞的t分布由于t分布不是一条曲线,而是一簇曲线。因此,t分布曲线下面积的95%或99%界值不是一个常量,而是随着自由度大小而变化的。为便于使用,可根据t界值表查找。由于t分布不是一条曲线,而是一簇曲线。因此,t分布曲正态分布参考值抽样误差课件(2)未知,且n较小时,总体均数可信区间的计算或简写为:(2)未知,且n较小时,总体均数可信区间的计算或简写为:df=5时,若“砍去”t分布双侧尾部面积α=0.05=5%,则有95%的t值满足:df=5时,若“砍去”t分布双侧尾部面积α=0.05=5%,例已知某地27名健康成年男子的血红蛋白量的均数为125g/L,标准差为15g/L。试问该地健康成年男子的血红蛋白平均含量的95%可信区间和99%可信区间各是多少?将X=125g/L,s=15g/L,n=27代入同时查t界值表:t0.05/2,26=2.056,t0.01/2,26=2.779例已知某地27名健康成年男子的血红蛋白量的均数为125g练习1要减小抽样误差,最切实可行的方法是

。(1)增加样本例数(2)控制个体变异(3)遵循随机化原则(4)严格挑选观察对象练习1练习2某地调查正常成年男子144人的红细胞数近似正态分布,得均数为5.38×1012/L,标准差为0.44×1012/L,试估计该该样本均数的抽样误差。将s=0.44×1012

,n=144代入练习2将s=0.44×1012,n=144代入练习3

某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的95%CI。本例σ虽未知,但n较大该地正常成人血清胆固醇均数的95%CI为3.47~3.81mmol/L。练习3某地抽得正常成人200名,测得其血清胆固醇的均数为正态分布Normaldistribution正态分布参考值抽样误差课件例某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-15.953.82正态分布和医学参考值范围例某地用随机抽样方法检查了140名成年男子的红细胞数,检测红细胞数组中值频数频率(%)3.80~3.9021.44.00~4.1064.34.20~4.30117.94.40~4.502517.94.60~4.703222.94.80~4.902719.35.00~5.101712.15.20~5.30139.35.40~5.5042.95.60~5.7021.45.80~6.005.9010.7某地140名正常男子红细胞数频数表红细胞数组中值频数频率(%)3.80~3.9021.直方图直方图f(x)=(fi/n)以频率为纵坐标f(x)=(fi/n)以频率为纵坐标随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光滑的曲线,如下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,形状似座钟。类似于数学上的正态分布曲线。因为频率的总和等于1,故横轴上曲线下的面积等于1。频率密度f(x)=(fi/n)/i(i=0.1)随着组段不断分细和观察人数的增多,直条顶端将逐渐接近于一条光正态分布参考值抽样误差课件这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正态分布。正态分布是自然界最常见的一种分布,例如,测量的误差、人体的身高、体重、许多生化指标的值(例如血压、血红蛋白含量、红细胞数等等)等都属于正态分布或近似正态分布。还有些偏态资料可经数据转换成正态或近似正态分布,例如抗体滴度、血铅值等。这条所描述的分布,便近似于我们通常所说的正态概率分布,简称正一、正态分布的密度函数式中μ为总体均数,σ为总体标准差,π为圆周率,e为自然对数的底,x为变量,当μ、σ已知,以x为横轴,f(x)为纵轴,即可给出正态分布曲线的图形。一、正态分布的密度函数式中μ为总体均数,σ为总体标准差,π为二、正态分布的特征1.正态分布在横轴上方,均数处最高,以均数μ为中心,左右对称。2.正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0。3.正态分布曲线下的面积分布有一定的规律。所有的正态分布曲线,在μ左右任意个标准差范围内面积相同。二、正态分布的特征所有的正态分布曲线,在μ左右任意个标准差4.正态分布完全由两个参数即均数μ与标准差σ决定,其中μ是位置参数,σ是变异参数。常用N(μ,σ2)来表示。4.正态分布完全由两个参数即均数μ与标准差σ决定,其中μ是位μ=0、σ=1的标准正态分布μ=0、σ=1的标准正态分布标准正态分布曲线及其面积分布标准正态分布曲线及其面积分布三、正态分布的应用不少医学现象服从正态分布或近似正态分布确定医学参考值范围质量控制图正态分布是很多统计方法的理论基础三、正态分布的应用医学参考值范围的估计1.医学参考值范围的概念

指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。2.医学参考值范围的确定要求确定研究总体,例如“正常人”。选择足够数量的观察对象。统一测定方法,控制实验误差,保证数据的可靠性。决定取单侧范围还是双侧范围值选择恰当的百分范围医学参考值范围的估计1.医学参考值范围的概念医学参考值范围的估计3.医学参考值范围的计算方法正态分布法百分位数法医学参考值范围的估计3.医学参考值范围的计算方法正态分布法正态分布法

适用于正态或近似分布资料

式中为均数,s为标准差,u值可根据要求查表。公式为:正态分布法式中为均数,s为标准差,u值可根据要求查表。常用的u界值参考值范围(%)单侧双侧9095991.2821.6452.3261.6451.9602.576常用的u界值参考值范围(%)单侧双侧90正态分布参考值抽样误差课件例某地调查正常成年男子144人的红细胞数近似正态分布,得均数为5.38(1012/L),标准差为0.44(1012/L),试估计该地成年男子红细胞数的95%参考值范围。例某地调查正常成年男子144人的红细胞数近似正态分布,得均数百分位数法:

适用于偏态分布资料

例如白细胞数的95%参考值范围:因为白细胞数无论过高或过低均属异常,则分别计算P2.5和P97.5,这是双侧95%参考值范围。百分范围(%)单侧双侧下限上限下限上限95P5P95P2.5P97.599P1P99P0.5P99.5百分位数法:

适用于偏态分布资料例某年某市调查了200例正常成人血铅含量(μg/100g)如下,试估计该市成人血铅含量95%医学参考值范围(用百分位数法计算)。例某年某市调查了200例正常成人血铅含量(μg/100g正态分布参考值抽样误差课件练习1:调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4(g/L),标准差为10.2(g/L),试估计该地健康女性血红蛋白的95%医学参考值范围。

血红蛋白过高、过低均为异常,应按双侧计算:练习1:血红蛋白过高、过低均为异常,应按双侧计算:一、均数的抽样分布与抽样误差抽样研究的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数(X)往往不等于总体均数(),因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。数值变量的参数估计一、均数的抽样分布与抽样误差抽样研究的目的就是要用样本信息来正态分布参考值抽样误差课件正态分布参考值抽样误差课件110名20岁健康男大学生的身高均数为172.73cm。110名20岁健康男大学生的身高均数为172.73cm。已知Σf=110,ΣfX=19000,需要在该表中增加fx2栏,由第(3)、(4)栏相乘,再将该栏数据相加,将ΣfX2=3283646代入公式正态分布参考值抽样误差课件110名20岁男大学生的平均身高X=172.73cm,标准差s=4.09cm。假设该110个身高数值作为假设的有限总体,即:

μ=172.73cm,σ=4.09cm现在从该总体中随机抽10个学生身高为1号样本。计算得:X1=173.22cms1=4.05cm110名20岁男大学生的平均身高X=172.73cm,标准差正态分布参考值抽样误差课件重复100次刚才的抽样,得到100个样本(每个样本含量均为10个),可算得100个样本均数X。重复100次刚才的抽样,得到100个样本(每个样本含量均为1各样本均数的均数X=172.66cmμ=172.73cm各样本均数的均数X=172.66cmμ=172.73cm正态分布参考值抽样误差课件样本均数的抽样分布具有以下特点:各样本均数未必等于总体均数;样本均数之间存在差异;样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;样本均数的变异较之原变量的变异大大缩小。样本均数的抽样分布具有以下特点:总体均数为μ,标准差σ样本1(,s)样本2(,s)样本3(,s)样本m(,s)抽样,样本量为n…总体均数为μ,标准差σ样本1(,s)样本2(根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服从正态分布。随机变量X:N(μ,2)

样本均数:N(μ,)

根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服均数的标准误及计算

反映均数抽样误差大小的指标是样本均数X的标准差简称标准误(理论值),用表示,或SE、SEM。由于在实际抽样研究中往往未知,通常用某一样本标准差s来替代,得标准误的估计值(通常也简称为标准误),其计算公式为:均数的标准误及计算以1号样本=173.22cm,s1=4.05cm为例:均数的标准误及计算以1号样本=173.22cm,s1=4.05cm为例

一般情况下未知,常用估计抽样误差的大小,也即的估计值。例2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。将X=125g/L,s=15g/L,n=27代入一般情况下未知,常用例2000年某例:已知s=6.85,

n=100则样本均数的抽样误差为多少?例:已知s=6.85,标准误的应用1.反映样本均数的可靠性;

标准误反映抽样误差的大小。标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。2.估计总体均数的可信区间;3.用于均数的假设检验。

标准误的应用二、总体均数的可信区间估计即用样本指标(统计量)估计总体指标(参数)有两种常用方法:点估计和区间估计(一)点估计:样本均数()就是总体均数的点估计值(μ)

该法简单,但未考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。二、总体均数的可信区间估计即用样本指标(统计量)估计总体指标(二)区间估计:结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(confidenceinterval,CI)(二)区间估计:即按一定的概率估计未知总体均数的所在范围。

习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数的概率为95%(或99%),用此范围估计总体平均数,表示100次抽样中,有95(99)次包含总体均数。例如:总体均数的可信区间即按一定的概率估计未知总体均数的所在范围。例如:总体均数的(1)未知,但样本例数n足够大(如n﹥50),总体均数的1-α双侧可信区间为总体均数95%的双侧可信区间为:总体均数可信区间的计算总体均数99%的双侧可信区间为:(1)未知,但样本例数n足够大(如n﹥50),总体均数的例某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%可信区间。本例n=90,可按正态分布近似法计算故该市2000年19岁健康男大学生平均身高的95%可信区间为(171.3,173.1)cm。例某市2000年随机测量了90名19岁健康男大学生的身高,t分布t分布

前面讲过,通过u变换,可将正态分布N(μ,2)转换成标准正态分布N(0,1)。同样,若从正态分布N(μ,2)总体中随机抽样并算得多个样本均数,它们仍服从总体均数为μ,总体标准差为的正态分布N(μ,),则服从前面讲过,通过u变换,可将正态分布N(μ标准正态分布N(0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论