正态分布及均数抽样误差ppt课件_第1页
正态分布及均数抽样误差ppt课件_第2页
正态分布及均数抽样误差ppt课件_第3页
正态分布及均数抽样误差ppt课件_第4页
正态分布及均数抽样误差ppt课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表215.953.82正态分布和医学参考值范围1.红细胞数组中值频数频率()3.803.902 1.44.00 4.106 4.34.20 4.3011 7.94.40 4.502517.94.60 4.703222.94.80 4.902719.35.00 5.101712.15.20 5.3013 9.35.40 5.504 2.95.60 5.702 1.45.806.005.901 0.7某地140名正常男子红细胞数频数表2.直方图3.f(x)=(fi/n)以频率为纵坐标4.随着组段不断分细和察看人数的增多,直条顶

2、端将逐渐接近于一条光滑的曲线,如以下图。这条曲线称为频率密度曲线,呈中间高、两边低、左右对称,外形似座钟。类似于数学上的正态分布曲线。 由于频率的总和等于1,故横轴上曲线下的面积等于1。频率密度 f(x)=(fi/n)/ii0.15.6.这条所描画的分布,便近似于我们通常所说的正态概率分布,简称正态分布。正态分布是自然界最常见的一种分布,例如,丈量的误差、人体的身高、体重、许多生化目的的值例如血压、血红蛋白含量、红细胞数等等等都属于正态分布或近似正态分布。还有些偏态资料可经数据转换成正态或近似正态分布,例如抗体滴度、血铅值等。7.一、正态分布的密度函数式中为总体均数,为总体规范差,为圆周率,e

3、为自然对数的底,x为变量,当、知,以x为横轴,f(x)为纵轴,即可给出正态分布曲线的图形。8.二、 正态分布的特征1.正态分布在横轴上方,均数处最高,以均数为中心,左右对称。2.正态分布的X取值范围实际上没有边境,X离越远,f(X)值越接近0,但不会等于0。3.正态分布曲线下的面积分布有一定的规律。 一切的正态分布曲线,在左右恣意个规范差范围内面积一样。9.4.正态分布完全由两个参数即均数与规范差决议,其中是位置参数,是变异参数。常用N(,2 )来表示。10.0、1的规范正态分布11.规范正态分布曲线及其面积分布12.三、正态分布的运用不少医学景象服从正态分布或近似正态分布估计医学参考值范围质

4、量控制正态分布是很多统计方法的实际根底13.医学参考值范围的估计1. 医学参考值范围的概念 指特定的“正常人群的解剖、生理、生化目的及组织代谢产物含量等数据中大多数个体的取值所在的范围。2. 医学参考值范围确实定要求确定研讨总体,例如 “正常人。选择足够数量的察看对象。一致测定方法,控制实验误差,保证数据的可靠性。决议取单侧范围还是双侧范围值选择恰当的百分范围14.医学参考值范围的估计3. 医学参考值范围的计算方法正态分布法百分位数法15.正态分布法 适用于正态或近似分布资料 式中 为均数,s为规范差,u值可根据要求查表14-5。 公式为:16.常用的u界值参考值范围(%)单侧双侧 90 95

5、 99 1.282 1.645 2.326 1.645 1.960 2.57617.18.例某地调查正常成年男子144人的红细胞数近似正态分布,得均数为5.381012/L,规范差为0.441012/L,试估计该地成年男子红细胞数的95%参考值范围。19.百分位数法: 适用于偏态分布资料 例如白细胞数的95参考值范围:由于白细胞数无论过高或过低均属异常,那么分别计算P2.5和P97.5,这是双侧95参考值范围。百分范围(%)单侧双侧下限上限下限上限95P5P95P2.5P97.599P1P99P0.5P99.520.例7.13 某年某市调查了200例正常成人血铅含量g/100g如下,试估计该市

6、成人血铅含量95医学参考值范围用百分位数法计算。21.22.练习1:调查某地120名安康女性血红蛋白,直方图显示,其分布近似于正态分布,其血红蛋白平均值为117.4g/L,规范差为10.2 g/L,试估计该地安康女性血红蛋白的95医学参考值范围。 血红蛋白过高、过低均为异常,应按双侧计算:23.一、均数的抽样分布与抽样误差抽样研讨的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数X往往不等于总体均数,因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样呵斥的样本均数与总体均数的差别或各样本均数之间的差别称为抽样误差,抽样误差是不可防止的。第15章

7、 数值变量的统计推断24.25.26.110名20岁安康男大学生的身高均数为172.73cm。27.知f110,fX19000,需求在该表中添加fx2栏,由第(3)、(4)栏相乘,再将该栏数据相加,将fX23283646代入公式28.110名20岁男大学生的平均身高X172.73cm,规范差s4.09cm。假设该110个身高数值作为假设的有限总体,即: 172.73cm, 4.09cm如今从该总体中随机抽10个学生身高为1号样本。计算得:X1=173.22s1=4.0529.计算得:X1=173.22s1=4.051号样本30.反复100次刚刚的抽样,得到100个样本每个样本含量均为10个,可

8、算得100个样本均数X。31.各样本均数的均数X172.66cm172.73cm32.33.总体均数为,规范差样本1( ,s)样本2( ,s)样本3( ,s)样本m( ,s)抽样,样本量为n34.根据正态分布原理,假设随机变量X服从正态分布,那么样本均数X也服从正态分布。随机变量 X:N(, 2) 样本均数 X:N(, x2) 35.样本均数的抽样分布具有以下特点:各样本均数未必等于总体均数;样本均数之间存在差别;样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右根本对称,也服从正态分布;样本均数的变异较之原变量的变异大大减少。36.均数的规范误及计算反映均数抽样误差大小的目的是样本

9、均数 X 的规范差简称规范误实际值,用 表示,或SE、SEM。37. 由于在实践抽样研讨中往往未知,通常用某一样本规范差s来替代,得规范误的估计值 (通常也简称为规范误),其计算公式为:以X1=173.22,s1=4.05为例:38. 普通情况下未知,常用 估计抽样误差的大小。 作为 的估计值。例 2000年某研讨者随机调查某地安康成年男子27人,得到血红蛋白量的均数为125g/L,规范差为15g/L。试估计该样本均数的抽样误差。将X=125g/L,s= 15g/L,n=27代入39.例:知 s6.85, n100那么样本均数的抽样误差 为多少?40.规范误的运用1.反映样本均数的可靠性; 规

10、范误反映抽样误差的大小。规范误大,表示抽样误差大,那么样本均数估计总体均数的可靠性差。反之,规范误小,抽样误差小,样本均数估计总体均数的可靠性好。2.估计总体均数的可信区间;3.用于均数的假设检验。 41.二、总体均数的可信区间估计即用样本目的统计量估计总体目的参数有两种常用方法:点估计和区间估计。一点估计:样本均数X就是总体均数的点估计值 该法简单,但未思索抽样误差,而抽样误差在抽样研讨中是不可忽视的。42.二区间估计:结合样本统计量和规范误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1可信区间confidence interval,CI43.即按一定的概率估计未知总

11、体均数的所在范围。 习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数的概率为95%(或99%),用此范围估计总体平均数,表示100次抽样中,有 95(99)次包含总体均数。例如:总体均数的可信区间44.1未知,但样本例数n足够大如n50,总体均数的1双侧可信区间为总体均数95%的双侧可信区间为: 1.96 总体均数可信区间的计算总体均数99%的双侧可信区间为: 2.58 45.例 某市2000年随机丈量了90名19岁安康男大学生的身高,其均数为172.2cm,规范差为4.5cm,试估计该市2000年19岁安康男大学生平均身高的95可信区间。本例n90,可按正态分布近似法计算

12、故该市2000年19岁安康男大学生平均身高的95可信区间为171.3,173.1cm。46.t 分 布47. 前面讲过,经过u变换,可将正态分布N(, 2)转换成规范正态分布N(0,1)。同样,假设从正态分布N(, 2)总体中随机抽样并算得多个样本均数Xj ,它们仍服从总体均数为、总体规范差为 的正态分布N(, x2),那么 服从48.规范正态分布N(0,1)。在实践任务中,往往是未知,常用 替代 ,即 这时,对正态变量X采取的不是u变换而是t变换了,t值的分布为t分布。49.50.1.单峰分布,以0为中心,左右对称;2.t分布是一簇曲线,其形状变化与自在度的大小有关 n-1。越小, 越大,t

13、值越分散,曲线的峰部越矮,尾部越粗。越大,t分布越接近于规范正态分布。t分布的特征:51.图2-1 自在度分别为1、5、 的 t 分 布52.由于t分布不是一条曲线,而是一簇曲线(如图82)。因此,t分布曲线下面积的 95%或99%界值不是一个常量,而是随着自在度大小而变化的。为便于运用,可根据t值表查找。查t界值表附表8-1 53.54.2未知,且n较小时,总体均数可信区间的计算或简写为:55.t分布56.df5时,假设“砍去t分布双侧尾部面积0.055,那么有95的t值满足:57.例53 知例51中某地27名安康成年男子的血红蛋白量的均数为125g/L,规范差为15g/L。试问该地安康成年男子的血红蛋白平均含量的95可信区间和99可信区间各是多少?将X=125g/L,s=15g/L,n=27代入同时查t界值表:t0.05/2,26=2.056, t0.01/2,26=2.77958.练习1要减小抽样误差,最真实可行的方法是。1添加察看数 2控制个体变异3遵照随机化原那么 4严厉挑选察看对象59.练习2 某地调查正常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论