语文版中职数学拓展模块36《正态分布》课件1_第1页
语文版中职数学拓展模块36《正态分布》课件1_第2页
语文版中职数学拓展模块36《正态分布》课件1_第3页
语文版中职数学拓展模块36《正态分布》课件1_第4页
语文版中职数学拓展模块36《正态分布》课件1_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正态分布

第三讲2023/7/261陈学芬制作第二节正态分布及其应用正态分布标准正态分布正态分布的应用26七月20232陈学芬制作N组段分细根据频数分布表绘制直方图各直条顶端中点连线频数分布逐渐接近正态分布示意图频数分布图以均数为中心两侧逐渐减少左右基本对称中间高(均数)两侧逐渐减少完全对称26七月20233陈学芬制作1.正态分布的概念和特征1.正态分布图形正态分布(normaldistribution)又称Gauss分布(Gaussdistribution),是以均数为中心,中间频数分布多,两侧逐渐减少的对称分布,由于频率的总和等于100%或1,故横轴上曲线下的面积等于100%或1。f(x)μx26七月20234陈学芬制作正态分布的密度函数,即正态分布的方程1.正态分布的概念和特征π、e分别为圆周率和自然对数的底,μ为总体均数,σ为总体标准差

X为连续随机变量当x确定后,就可由此式求得其密度函数f(x),即纵坐标的高度了,嘿嘿26七月20235陈学芬制作当μ、σ已知时,仅x为变量;同时可按上述公式绘出正态曲线(normalcurve)的图形。x服从正态分布,记作N(u,σ2)。1.正态分布的概念和特征xf(x)m26七月20236陈学芬制作正态分布的参数总体均数μ是位置参数:描述正态分布的集中趋势位置。总体标准差σ是变异度参数:描述正态分布离散趋势,越小,分布越集中,曲线形状越“瘦高”;反之越“矮胖”。1.正态分布的概念和特征正态曲线由两个参数共同决定26七月20237陈学芬制作1.正态分布的概念和特征μ

3三种不同均值的正态分布-∞+∞σ恒定

μ

1<μ

2<μ

3μ越大,曲线沿横轴越向右移动26七月20238陈学芬制作1.正态分布的概念和特征σ3σ2σ1三种不同标准差的正态分布μ恒定σ1<σ2<σ3σ越大,表示数据越分散,曲线越“胖”σ越小,表示数据越集中,曲线越“瘦”26七月20239陈学芬制作曲线1:μ=2.4,σ=0.8

曲线2:μ=3.4,σ=0.8

曲线3:μ=3.4,σ=1.21.正态分布的概念和特征26七月202310陈学芬制作1.正态分布的概念和特征①②③26七月202311陈学芬制作正态分布的主要特征(1)正态分布以均数μ

为中心,左右对称;(2)正态曲线(normalcurve)在横轴上方,且均数所在处最高,X离μ

越远,f(x)越小,逐渐接近0,但不会等于0,故正态曲线永远不与横轴相交;(3)正态分布的面积分布有一定的规律性,总面积=1;(4)正态分布有两个参数,即均数与标准差(与)26七月202312陈学芬制作标准正态分布u为标准化变量值标准正态分布概率密度函数,记作N(0,1)。1.正态分布的概念和特征正态分布标准正态离差标准正态分布(standardnormaldistribution)26七月202313陈学芬制作标准正态分布将正态分布曲线的原点移到的位置,横轴尺度以σ为单位,令μ=0,σ=1,则将正态分布变换为标准正态分布2.标准正态分布-4-3-2-101234uΦ(u)-∞0+∞uΦ(u)u→±∞Φ(u)→026七月202314陈学芬制作一般正态分布为一个分布簇:N(μ,σ2);标准正态分布只有一个N(0,1);这样简化了应用。标准正态分布的曲线是唯一的。2.标准正态分布26七月202315陈学芬制作2.正态分布的特征(1)正态曲线(normalcurve)在横轴上方均数处最高

标准正态方程中,u取何值,无论正负,e

-u2/2

值均为正,故φ(u)必为正。因此曲线在横轴上方。式中为常量,因此u的绝对值越小,则e

-u2/2

值越大,u的绝对值最小为0(均数位置),因此该处φ(u)值最大。也就是均数处曲线最高,φ(u)=0.39892.标准正态分布26七月202316陈学芬制作正态分布的特征(2)正态分布以均数为中心,左右对称。式中u为平方,故u值无论正负,只要绝对值相等,则其纵高φ(u)相等,因此正态分布以均数为中心,左右对称。1.正态分布的概念和特征-4-3-2-101234uΦ(u)-∞0+∞uΦ(u)26七月202317陈学芬制作正态分布的特征(3)正态分布有两个参数,即均数与标准差(与)(4)正态分布的面积分布有一定规律*。1.正态分布的概念和特征26七月202318陈学芬制作

四、曲线下面积3.正态曲线下面积的分布规律是正态变量x的累计分布函数,反映正态曲线下,横轴自-∞到x的面积,即下侧累计面积(概率)标准正态分布曲线下面积左侧任一区间的面积可以通过对下式积分求得附表1(P245)就是根据此公式和图形制定的φ(u)表示从-∞到u值范围内X分布面积26七月202320陈学芬制作

概率密度函数与累积分布函数曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%3.正态曲线下面积的分布规律标准正态曲线横轴为u值3.正态曲线下面积的分布规律将变量值(x)转换为u值后,统计学家按φ(u)公式编制成了附表1,即标准正态分布表查表注意事项:1.μ、σ和x已知时,先求出u值,再查表,得所求面积占总面积的比例。μ、σ未知时,常分别用样本均数和样本标准差来估计。2.曲线下对称于0的区间,面积相等。比如区间(-∞,-2.58)与区间(2.58,+∞)的面积相等。因为附表只列出φ(-u)值。3.曲线下横轴上的总面积为100%或1。

根据2.3.可以计算上侧累计面积。26七月202323陈学芬制作例1.求区间(2.58,+∞)的面积。因为区间(2.58,+∞)和区间(-∞,-2.58)对称所以只需求出(-∞,-2.58)的面积即可,即查表φ(-2.58)=0.0049φ(-u)对应的u值区间是(-∞,-u)2.求区间(-∞,2.58)的面积。φ(2.58)=1-φ(-2.58)3.正态曲线下面积的分布规律26七月202324陈学芬制作医学常用的三个X分布范围及u界值任意正态分布变量值(X)理论上分布规律变量值分布的范围X占的百分比(%)3.正态曲线下面积的分布规律26七月202325陈学芬制作统计中常用尾部面积的u值,记,称为u界值。

(双侧)(双侧)

(单侧)(单侧)3.正态曲线下面积的分布规律26七月202326陈学芬制作4.正态分布的应用概括估计变量值频数分布范围例:在例8.1中,n=132,=4.653mmol/L,s=0.40066mmol/L,试估计95%和99%的频数分布范围。(3.868~5.438,3.619~5.687)制定医学参考值范围控制实验误差:上下警戒限:上下控制限:26七月202327陈学芬制作101名正常成年女子的血清总胆固醇。试估计该总体正常女子血清总胆固醇在4mmol/L以下者的百分比。

假定该资料服从正态分布,将X1=4转换为u值,查正态分布表

4.正态分布的应用26七月202328陈学芬制作标准正态变量(u1)=-0.09

查附表8-1,在表的左侧找到-0.0,在表的上方找到0.09,,两者的相交处为0.4641=46.41%。该地正常女子血清总胆固醇在4mmol/l以下者的百分比为46.41%。4.正态分布的应用26七月202329陈学芬制作实例图示46.41%4.正态分布的应用一、医学参考值的意义医学参考值范围(referenceranges)亦称正常值范围,它是指正常人的解剖、生理、生化等各种指标测定值的波动范围正常人是指排除了有关疾病和因素对所研究指标有影响的人,不同于“健康人”由于存在个体差异,正常值并非为常数,而是在一定范围内波动。确定医学参考值范围,不是用该人群样本观察值的极差,而是常用95%或99%的分布范围作为判定正常和异常的参考标准。第三节医学参考值范围26七月202331陈学芬制作二、制定参考值范围的基本步骤从正常人总体中抽样,明确研究的总体统一测定方法控制测量误差;判定是否需分组(性别、年龄)确定参考值范围;根据专业知识决定取单侧还是双侧界值;医学参考值范围单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常

单侧下限—过低异常单侧上限—过高异双侧---过高/低均异常

26七月202332陈学芬制作二、制定参考值范围的基本步骤

5.选定合适的百分界限;6.对资料的分布进行正态性检验;7.根据资料的分布类型选定适当的方法进行参考值范围的估计。

医学参考值范围26七月202333陈学芬制作1、正态分布法2、百分位数法三、医学参考值范围的计算方法:医学参考值范围26七月202334陈学芬制作医学参考值范围三、医学参考值范围的计算方法1.正态分布法应用条件:正态分布或近似正态分布资料

计算双侧100(1-α)%正常值范围:单侧100(1-α)%正常值范围:双侧95%正常值范围:单侧95%正常值范围:26七月202335陈学芬制作例2.10

利用例1某地55~58岁健康成人的血糖值,求95%的参考值范围。26七月202336陈学芬制作解:

假定该资料服从正态分布,因此采用正态分布法公式

计算双侧95%的参考值范围:

所以该地健康成年人的血糖值95%的参考值范围为3.87~5.44(mmol/L)26七月202337陈学芬制作2.百分位数法适用于偏态分布资料双侧95%正常值范围:

P2.5~P97.5单侧95%正常值范围:<P95(上限)或>P5(下限)医学参考值范围26七月202338陈学芬制作例如:1.确定白细胞总数的95%参考值范围

由于白细胞数过高过低均为异常,故应分别计算P2.5和P97.52.确定肺活量的95%参考值范围

由于肺活量只过低为异常,故只计算P5

3.确定尿铅的95%参考值范围

由于尿铅只以过高为异常,应计算P95

26七月202339陈学芬制作小结1.正态分布是一种很重要的连续型分布,不少的医学现象服从正态分布或近似正态分布,或经变量变换转换为正态分布,可按正态分布规律来处理。它也是许多统计方法的理论基础。2.正态分布的特征:(1)曲线在横轴上方,均数处最高(2)以均数为中心,左右对称(3)确定正态分布的两个参数是均数μ和标准差σ26七月202340陈学芬制作小结3.正态分布用N(μ,σ2)

表示,为了应用方便,常对变量x作变换,使μ=0,σ=1,则正态分布转换为标准正态分布,用N(0,1)表示。4.正态曲线下面积的分布有一定规律。理论上μ±1σ,μ±1.96σ和μ±2.58σ区间的面积(观察单位数)各占总面积的(总观察单位数)的68.27%,95%和99%,可用来估计医学参考值范围和质量控制等方面。26七月202341陈学芬制作一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布习题26七月202342陈学芬制作习题二、是非题1.不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。()2.少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。()3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。()4.四分位数间距也是描述连续分布数据离散度的指标。()5.理论上,对于正态分布资料,总体百分位数的P5~P95和μ±1.96σ范围内都包含95%的变量值。()26七月202343陈学芬制作三、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。A.全距B.标准差C.变异系数

D.四分位间距E.方差2、用均数和标准差可以全面描述()资料的特征/A.正偏态分布B.负偏态分布C.正态分布

D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对习题26七月202344陈学芬制作4、比较身高和体重两组数据变异度大小宜采用()。A.变异系数B.方差C.极差

D.标准差E.四分位间距5、偏态分布宜用()描述其分布的集中趋势。A.算术均数B.标准差C.中位数

D.四分位间距E.方差6、各观察值同乘以一个不等于0的常数后,()不变。A.算术均数B.标准差C.几何均数

D.中位数E.变异系数7、()分布的资料,均数等于中位数。A.对数正态B.正偏态C.负偏态

D.偏态E.正态习题26七月202345陈学芬制作8、对数正态分布是一种()分布。(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态

D.右偏态E.对称9、最小组段无下限或最大组段无上限的频数分布资料,可用()描述集中趋势。A.均数B.标准差C.中位数D.四分位间距E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是()。A.算术均数B.中位数C.几何均数D.变异系数E.标准差习题26七月202346陈学芬制作11、中位数是表示变量值

的指标。A.平均水平B.变化范围C.频数分布D.相互间差别大小E.以上都不对12、某项指标仅以过高为异常,且资料呈偏态分布,则其95%的参考值范围为

。A.≤P95B.≤P97.5C.≥P5D.P2.5~P97.5E.≥P2.5习题26七月202347陈学芬制作13、在同一总体中随机抽样,样本含量n越大,则理论上

越小。A.样本标准差sB.中位数C.标准误

D.第95百分位数E..变异系数14、原始数据减去一个不为0的常数后,

。A.均数不变,标准差变B.均数变,标准差不变C.均数和标准差都不变D.均数和标准差都变E.以上都不对习题26七月202348陈学芬制作15.若X服从以μ,

σ2为均数和方差的正态分布,则X的95%百分位数即____ABCDE16、计算平均潜伏期宜用:A.算术均数B.全距C.离均差积和D.中位数E.变异系数17、正态分布有两个参数μ与σ,_____曲线的形状越扁平。A.μ越大B.μ越小C.σ越大D.σ越小E.μ与σ越接近0习题26七月202349陈学芬制作18、在医学和卫生学研究中,下面_____不是近似正态分布:A.正常成人的血铅含量B.正常成人的身高C.正常成人的红细胞数D.正常成人的血清总蛋白含量E.正常成人的脉搏数19、在抽样研究中“总体均数”,“总体标准差”:A.一般是不知道的

B.不知道但可以由样本推论C.总是知道的D.是给定的两个已知量E二者相等习题26七月202350陈学芬制作习题20、对120名大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布是____A.正态分布B.标准正态分布C.正偏态分布D.负偏态分布E.偏态分布21、若一组数据呈正态分布,其中大于的变量值占____A.99.5%B.99%C.1%D.0.5%E.5%26七月202351陈学芬制作四、计算分析题1、根据1999年某地某单位的体检资料,116名正常成年女子的血清甘油三脂(mmol/L)测量结果如下表,请据此资料:(1)描述集中趋势应选择何指标?并计算之。(2)描述离散趋势应选择何指标?并计算之。(3)求该地正常成年女子血清甘油三脂的95%参考值范围。(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L以下者各占正常女子总人数的百分比。习题26七月202352陈学芬制作组段频数0.6~10.7~30.8~90.9~131.0~191.1~251.2~181.3~131.4~91.5~51

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论