统计第7讲4章正态分布_第1页
统计第7讲4章正态分布_第2页
统计第7讲4章正态分布_第3页
统计第7讲4章正态分布_第4页
统计第7讲4章正态分布_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、随量的性质取决于它的分布。分为:离散型变量和连续型变量本章介绍三种分布:第一节 二项分布(binomial distribution)第二节 Poisson分布 (Poisson distribution)第三节 正态分布(normal distribution)第四章 常用概率分布第三节正态分布一、正态分布的概念和特征二、正态曲线下面积的分布规律三、正态分布的应用正态分布具特征?参见表4-3和4-4频数表数据的分布特征,共同点是中间频数最多,两边频数渐少且近似对称。为直观起见将表4-4数据绘成直方图(图4-4),一、正态分布的概念数频正态分布又称Gauss分布,是医学和生物学中常见的总体分布

2、。用样本变量值的频数表和图来推断该变量的分布,其符合正态分布的条件为:频数分布以均数为中心、左右两侧基本对称,靠近均数两侧的频数较多,而两侧距均数较远时,频数逐渐减少如果频数分布符合这些必要条件,该指标符合正态分布。图4-4所示:看见参考图图 3-1 该曲线称为正态分布曲线用 N(,)表示因为频率的总和等于1或100%,故横轴上曲线下的面积等于1或100%。正态曲线是一条完全对称,曲线两端位于,两侧逐渐下降并不与横轴相交的钟型曲线,该曲线的函数表达式 f(X) 称为正态分布密度函数,函数式表达:(4-15)f总体均数和标准差1 ( X )2(X )e22 2从以上分析中可以看出正态分布五个特征

3、正态分布曲线在横轴上方,均数所在处最高;正态分布以均数为中心,左右对称;正态分布有两个重要参数;正态曲线1,标准正态1处各有1个拐点;正态分布的面积分布有一定的规律性。均数为位置参数 S不变的情况下, 均数越大, 曲线向右 移动,形状不变。1 23S为形状参数, 在均数固定不变的情况下,S 越大, 离散程度越大,正态分布曲线越平坦, 反之越陡峭。二、正态曲线下面积分布规律无论和 取什么值,正态分布与横轴之间的总面积等于1或100%。正态曲线下的面积分布很有规律。无论均数和标准差是多大,这个规律是由正态分布的性质所决定的。常用正态分布曲线下的规律:士范围内占正态曲线下面积的68.27,也就是说有

4、68.27的变量值分布在此范围内。士l.96范围内占正态曲线下面积的95.0也就是说有95.0的变量值分布在此范围内。士2.58范围内占正态曲线下面积的99.0也就是说有99.0的变量值分布在此范围内。对任意一个服从正态分布N (,2) 的随机变量,作如下标准化变换,称为Z变换。经变换,公式4-15变为4-17公式:1 ( X )2f ( X ) 2 e2 2Z服从总体均数为0、总体标准差为1的正态分布称此正态分布为标准正态分布,用N(0,1)表示。标准正态分布由Z变换后,给研究带来方便。统计学家编制了标准正态分布曲线下面积分布表(见附表1),因为正态分布两边对称,所以只给出Z取负值的情况。Z

5、 注:(Z)=1(Z)-Z例如:从- 到Z= 0.0范围内的面积为0.5000.0图形说明:对于任意两个值Z1 与Z 2,求标准正态曲线下( Z1 ,Z 2)范围的面积,可以先查附表1,分别找到从-到Z 2与-到Z 1的面积,然后两者相减,就可求得所要求的面积。例题4-11已知X服从均数为、标准差为的正态分布,试估计: X取值在区间 1.96上的概率? X取值在区间 2.58上的概率?求X取值在相应区间的概率,首先要确定区间两端点所对应的Z值,由公式(4-16)(z)查附表1得到(-1.96)0.025(z)因为曲线下两侧面积对称,区间(1.96,)相应面积也是0.025,故Z取值于(-1.9

6、6,1.96)的概率为120.0250.95,即X取值在区间 1.96上的概率为 0.95。同理也可求出X取值在 2.58上的概率为0.99。例 4-12某地 1986年 120名 8岁男孩身高均数为X123.02cm,标准差为 S4.79cm,试估计:该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;身高在120cm128cm者占该地8岁男 孩总数的百分比?该地80的男孩身高集中在那个范围?首先计算130对应的Z值。求8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比,如图4-9所示正态曲线下Z1.46右侧面积,因对称,查附表1,得到(-1.46)0.0721(z)即理论上

7、该地8岁男孩身高在130cm者占本地8岁男孩总数的7.21 例4-12 解题2:先计算120和128所对应的Z值而(, 1.04) 上的面积等于1减( ,1.04)上的面积,即(1.04)1 (1.04)10.14920.8508(0.63)0.2643查附表1正态曲线下区间(-0.63,1.04)上的面积等于理论上身高在120 cm128cm者占该地8岁男孩总数的百分比为58.65。例题3求该地80的8岁男孩身高集中在哪个范围,可查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为-1.28,所以80的8岁男孩身高集中在X1.28S区间内,即116.9cm与129.2cm之间。(1.

8、04)(-0.63) 0.85080.26430.5865三、正态分布的应用 确定参考值范围 质量控制 二项分布、Poisson分布的正态分布近似确定医学参考值范围(也称为正常值范围)概念:医学上常把绝大多数正常人的某指标范围称为 该指标的正常值范围。“绝大多数”可以是90%、 95%、99%等等人群,最常用的是95%。“正常人”不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关的同质人群。最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.57。是变异还是有病?条件:对于服从正态分布的指标,其参考值范围的制定可根据正态曲线下面积的分布规律。对于从正态分布

9、的指标,可先进行变量变换使该指标服从正态分布或直接用百分位数定参考值范围。根据专业知识确定单侧和双侧。根据条件可参考表3.2所示的内容:如何确定?首先要根据专业知识决定范围,是上限和下限(两个界限)还是光有上限或下限(一个界值)?这样就引出重要的专业词:单侧和双侧单侧的下限单侧的上限双侧的上下限无此表注意:单侧双侧的界值不一样例正常成年男子144人的红细胞某地数(近似正态分布),得均数55.381012/L,标准差0.441012/L。估计该地成年男子红细胞数的95%参考值范围。题意分析:红细胞过多过少均为异常,范围为双侧,该指标为近似正态分布,故用正态分布法求95%参考值范围。.X 38S1

10、S1 ( ( 44 441255.969600.)L54.X125538L56例110名健康成年某地的第一秒肺通气量得均数4.2(L),标准差0.7(L)。请估计该地成年男子第一秒肺通气量的95%的参考值范围?分析题意:因第一秒肺通气量仅过低为异常,此参考值范围仅属于下限(单侧)的范围。又因此指标属于近似正态分布,用正态分布法求95%的参考值范围。3.低于3.025(L)为异常?X4.2 S1. 64 0.7L 质量控制为控制实验中的检测误差,常以 X 2S 作为上、下警戒值,以 X 3S 作为上、下控制值。依据是:正常情况下检测误差服从正态分布。测定 0.3+3S+2S上控制线上警戒值X-2S-3S均数下警戒值下控制线结 0.2果 0.1mg/l采样点的天数例4-14 显示骨密度体模“测定值的控制图 二项分布、Poisson分布的正态分布近似二项分布、Poisson分布和正态分布之间有着密切的渐近关系。如图4-11所示:随着n的增大,二项分布趋于对称。理论上可以证明:当n相当大时,只要不太靠近0或1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论