研究生医学统计学概率分布分析课件_第1页
研究生医学统计学概率分布分析课件_第2页
研究生医学统计学概率分布分析课件_第3页
研究生医学统计学概率分布分析课件_第4页
研究生医学统计学概率分布分析课件_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、研究生医学统计学概率分布分析研究生医学统计学概率分布分析2022/9/93.1 正态分布 正态分布的图形正态分布的特征正态曲线下面积分布的规律标准正态分布正态分布的应用2022/9/63.1 正态分布 正态分布的图形2022/9/9一、 正态分布曲线(normal distribution curve)1.正态分布的图形2022/9/6一、 正态分布曲线2022/9/9频数分布逐渐接近正态分布示意图 2022/9/6频数分布逐渐接近正态分布示意图 2022/9/9图 体模“骨密度”测量值的分布接近正态分布示意图(频率密度=频率/组距)面积的意义2022/9/6图 体模“骨密度”测量值的分布接近

2、正态分布2022/9/9正态分布曲线图示2022/9/6正态分布曲线图示2022/9/9该曲线表现为中间高,两边低,左右对称,略显钟形,类似于数学上的正态分布曲线。因而这种分布也称为正态分布。正态曲线(normal curve)是一条高峰位于中央,两侧完全对称,而且逐渐降低,两端在无穷远处与底线相靠,但永远不与横轴相交的钟型曲线。正态曲线是有固定函数式的一条曲线。因为频率的总和等于1,因此横轴上曲线下的总面积为100或1,其面积分布有一定的规律性。2022/9/6该曲线表现为中间高,两边低,左右对称,略显钟2022/9/9正态分布又称Gauss分布,是医学上和生物界常见的分布形式。 是指变量值

3、以均数为中心,左右两侧完全对称,靠近均数两侧的频数较多,而远离均数两侧的频数逐渐减少。2022/9/6正态分布又称Gauss分布,是医学上和生物界2022/9/9 2.正态分布的概率密度函数2022/9/6 2.正态分布的概率密度函数2022/9/9二、正态分布的特征正态分布以均数为中心( = ),左右对称;正态分布有两个参数,即均数和标准差,正态分布记作XN(,2), 决定曲线在横轴上的位置,决定曲线的形状。正态曲线在横轴上方均数处最高(在=处取得密度函数的最大值),表现为钟型曲线正态曲线下总面积为1,正态曲线下的面积分布有一定规律。三、面积规律2022/9/6二、正态分布的特征正态分布以均

4、数为中心( 2022/9/9正态分布 1 2 3 不同均数2022/9/6正态分布不同均数2022/9/9正态分布不同标准差2022/9/6正态分布不同标准差2022/9/9尖峭峰正态峰平阔峰正态分布的特征2022/9/6尖峭峰正态分布的特征2022/9/9三、正态曲线下面积分布规律1.正态曲线下面积的意义:表示该区间(x1,x2)包含的观察例数占总例数的百分数或变量值落在该区间的概率。频数分布图示2022/9/6三、正态曲线下面积分布规律1.正态曲线下面积2022/9/9正态曲线下面积示意图x1 x22022/9/6正态曲线下面积示意图x1 2022/9/92022/9/62022/9/9图

5、3-3 正态分布的概率密度函数与分布函数2022/9/62022/9/9图3-4 正态分布的概率2022/9/62022/9/92.正态曲线下面积的分布规律2022/9/62.正态曲线下面积的分布规律2022/9/92022/9/62022/9/92022/9/62022/9/9四、标准正态分布 (standard normal distribution)标准正态分布变换标准正态分布曲线下面积的分布规律标准正态分布表的使用2022/9/6四、标准正态分布 (standard no2022/9/91、标准正态分布变换一般正态分布为一个分布族:N(,2)。 为了应用方便,可以进行变量变换,正态分布

6、就变换为标准正态分布。标准正态分布的=0,=1,记为 N(0,1) 2022/9/61、标准正态分布变换2022/9/92022/9/62022/9/9z(z)2022/9/6z(z)2022/9/9(z)2022/9/6(z)2022/9/9z(z)(z)02022/9/6z(z)(z)02022/9/91.961.960.0250.0252022/9/61.961.960.0250.0252022/9/92、标准正态曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%2022/9/62、标准正态曲线下面积分布规律0-11-1.2022/9/9正

7、态曲线与标准正态曲线的面积分布规律 2022/9/6正态曲线与标准正态曲线的面积分布规律 2022/9/92022/9/62022/9/93、标准正态分布表的使用附表c1标准正态分布表p559查表求面积时注意: 表中曲线下面积为-到z的面积; 当、已知时,先进行变量变换求得z值,再 查表; 当、未知且样本含量足够大时,可用 和S 分别代替和,求得z的估计值,再查表。 曲线下对称于0的区间面积相等; 曲线下横轴上的总面积为100%或1。2022/9/63、标准正态分布表的使用附表c1标准正态分布2022/9/9五、正态分布的应用(一)确定医学参考值(正常值)范围(二)质量控制图。警戒限 ,控制限

8、(三)统计方法的理论基础。二项分布2022/9/6五、正态分布的应用(一)确定医学参考值(正常2022/9/9医学研究中的某些观察指标服从或近似服从正态分布;很多统计方法是建立在正态分布的基础之上的,如t分布、2分布、F分布都是在正态分布的基础上推演出来的。很多其他分布的极限为正态分布。二项分布和Poission分布样本含量足够大时近似正态分布。2022/9/6医学研究中的某些观察指标服从或近似服从正态分2022/9/9医学参考值范围1. 正态分布法2. 百分位数法 3. 对数正态分布法2022/9/6医学参考值范围1. 正态分布法2022/9/91.医学参考值概念是指大多数处于相同生理状态下

9、的“正常人” 的某项指标(形态、机能及代谢产物等)数值变化波动的范围。由于正常个体间存在变异、机体内外环境改变,时间、地点、条件的不同,使这些生理指标有一定的波动范围,因此,实际应用中,一般采用正常值范围.2022/9/61.医学参考值概念是指大多数处于相同生理状态2022/9/92.用途1.划分正常与异常的界限。如作诊断指标。2.反映某人群的某项指标的动态变化。如某地不同时期发汞值的正常范围可反映环境污染的变化或环境保护的效果。2022/9/62.用途1.划分正常与异常的界限。如作诊断指2022/9/93.确定医学参考值范围的方法确定一批样本含量足够大(n100)的“正常人”或动物作为研究对

10、象。 “正常人”不是指机体任何器官、组织的形态及机能都正常的人,而是指排除了影响所研究指标的疾病和有关因素对所研究指标的影响的同质人群。2022/9/63.确定医学参考值范围的方法确定一批样本含2022/9/9根据指标的实际用途确定单、双侧。确定百分数范围。根据资料的分布特点,选用恰当的界值计算方法。 2022/9/6根据指标的实际用途确定单、双侧。2022/9/94.常用参考值范围估计方法95%正常值范围:同质总体中包含95%的个体值所在的范围。.正态分布法.百分位数法. 对数正态分布法2022/9/64.常用参考值范围估计方法95%正常值范围:2022/9/91) 正态分布法适应资料:正态

11、或近似正态分布资料。计算: 以95%正常值范围为例双侧:单侧:2022/9/61) 正态分布法适应资料:正态或近似正态分2022/9/92) 百分位数法适用资料:适用于任意分布类型的资料,主要用于偏态分布或分布类型不清楚的资料。计算: 以95%正常值范围为例双侧: P2.5P97.5单侧: P5(下限) 正态分布应用2022/9/62) 百分位数法适用资料:适用于任意分布类 200例血铅值频数表及Px计算表 200例血铅值频数表及Px计算表 2022/9/92022/9/62022/9/93)对数正态分布法适用资料:适用于对数正态分布资料。计算:双侧:单侧:2022/9/63)对数正态分布法适

12、用资料:适用于对数正态 200例血铅值对数变换后的频数计算表 200例血铅值对数变换后的频数计算表 2022/9/92022/9/62022/9/93.2 二项分布二项分布的概念二项分布的概率二项分布的条件 二项分布的均数与标准差二项分布的图形 二项分布应用实例2022/9/63.2 二项分布二项分布的概念2022/9/9一、二项分布的概念一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行摸球游戏,每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。三个特点:1.各次摸球是彼此独立的;2.每次摸球只有二种可能的结果,或黄球或白球;3.每次摸到黄球(或摸到白球)的概率是固定的。n次中摸到

13、x次黄球(或白球)的概率分布就是二项分布。 2022/9/6一、二项分布的概念一个袋子里有5个乒乓球,其2022/9/9 医学研究中很多现象观察结果是以两分类变量来表示的,如阳性与阴性、治愈与未愈、生存与死亡等等。如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1);而且各个观察对象的结果是相互独立的,那么,重复观察n个人,发生阳性结果的人数x的概率分布为二项分布。 2022/9/6 医学研究中很多现象观察结果是2022/9/9例 设小白鼠接受某种毒物一定剂量时,其死亡率为80,对于每只小白鼠来说,其死亡概率为0.8,生存概率为0.2,若每组各用甲乙丙三只小白鼠做实验,观察每只

14、小白鼠存亡情况,如果计算生与死的顺序,则共有8种排列方式,如果只计生与死的数目,则只有四种组合方式,如下表表2022/9/6例 设小白鼠接受某种毒物一定剂量时,其死亡率2022/9/92022/9/62022/9/9概率的乘法法则 和加法法则乘法法则 : 几个独立事件同时发生的概率,等于各独立事件的概率之积。 加法法则 : 互不相容事件和的概率等于各事件的概率之和2022/9/6概率的乘法法则 和加法法则乘法法则 :2022/9/93只小白鼠均生存的概率:P=0.20.20.2=0.0083只小白鼠2生1死的概率:P1=0.20.20.8=0.032(甲生乙生丙死)P2=0.20.80.2=0

15、.032(甲生乙死丙生)P3=0.80.20.2=0.032(甲死乙生丙生)P=0.0962022/9/63只小白鼠均生存的概率:2022/9/93只小白鼠1生2死的概率:P1=0.20.80.8=0.128(甲生乙死丙死)P2=0.80.20.8=0.128(甲死乙生丙死)P3=0.80.80.2=0.128(甲死乙死丙生)P=0.3843只小白鼠均死亡的概率:P=0.80.80.8=0.5122022/9/63只小白鼠1生2死的概率:2022/9/92022/9/62022/9/9由于实验是逐只进行,因此实验结果是互相独立的,如病人的治愈或死亡,性别的雌雄,生存死亡,阳性或阴性。根据概率的

16、乘法法则(几个独立事件发生的概率,等于各独立事件发生的概率之和),可以算出每种排列方式的概率,也可以得到每种组合的概率,它可以用二项式加以概括,二项式展开的各项就是每种组合的概率。2022/9/6由于实验是逐只进行,因此实验结果是互相独立的2022/9/9二项展开式:2022/9/6二项展开式:2022/9/92022/9/62022/9/9二项分布的定义 :从阳性率为的总体中随机抽取观察单位数为n的样本,其中出现阳性结果的次数为X,则X=0,1,2,n的概率服从参数为n和的二项分布,记为:XB(n,)。此分布的概率函数符合前述二项式展开式中的各展开项,故此分布称二项分布又称Bernoulli

17、分布(瑞士数学家和统计学家)。2022/9/6二项分布的定义 :2022/9/9二、二项分布的概率1.二项分布的概率函数: X=0,1,2,n 如已知n=3,=0.8,则恰有例阳性的概率P(1)为: 2022/9/6二、二项分布的概率X=0,1,2,n 如2022/9/9例 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中两例有效的概率是多大? 2022/9/6例 临床上用针灸治疗某型头痛,有效的概率为62022/9/9表 治疗3例可能的有效例数及其概率有效人数(x)x(1)n-x出现该结果概率P(x)010.60=10.40.40.40.064130.60.40.40.2

18、88230.60.60.40.432310.60.60.60.400.2162022/9/6表 治疗3例可能的有效例数及其概率有效人数2022/9/9由表可知,各种可能结果出现的概率合计为1,即P(X)=1(X=0,1,n)。因此,如果欲求1例及以上有效的概率可以是P(x1)=P(1)+P(2)+P(3)=0.288+0.432+0.216 =0.936也可以是P(x1)=1P(0)=10.064=0.9362022/9/6由表可知,各种可能结果出现的概率合计为1,即2022/9/92.二项分布的累积概率单侧累积概率计算最多有k 例阳性的概率(下侧累积概率)最少有k 例阳性的概率(上侧累积概率

19、)2022/9/62.二项分布的累积概率2022/9/9递推公式2022/9/6递推公式2022/9/9例 某地钩虫感染率为13%,随机抽查当地150人,其中至多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大?2022/9/6例 某地钩虫感染率为13%,随机抽查当地12022/9/9至多有2名感染钩虫的概率为至少有2名感染钩虫的概率为 2022/9/6至多有2名感染钩虫的概率为2022/9/9至少有20名感染钩虫的概率为 2022/9/6至少有20名感染钩虫的概率为 2022/9/9三、 二项分布的条件 各观察单位只具有互相对立的一种结果,如阳性或

20、阴性,属于二项分类资料。已知发生某一结果(如阳性)的概率为,其对立结果(如阳性)的概率则为1-。n个观察单位的结果互相独立。即每个观察单位的结果,不会影响其它观察单位的结果。2022/9/6三、 二项分布的条件 各观察单位只具有互相对2022/9/9四、二项分布的均数与标准差 观察单位数为n时,其阳性结果发生数X的均数与标准差:2022/9/6四、二项分布的均数与标准差 观察单位数为n时2022/9/9如果将出现阳性结果的频率记为总体均数:标准差: 2022/9/6如果将出现阳性结果的频率记为2022/9/9二项分布例4-4 研究者随机抽查某地150人,其中有10人感染了钩虫,钩虫感染率为6.

21、7%,求此率的标准差。2022/9/6二项分布例4-4 研究者随机抽查某地152022/9/9五、二项分布的图形已知,n,计算x=0,1,2,n时的P(x),以x 为横坐标,以P(x)为纵坐标,在方格坐标纸上绘图,即可绘出二项分布的图形,其形状取决于和n的大小。2022/9/6五、二项分布的图形2022/9/900.50.40.30.20.10.0123P(X)X(0.2+0.8)3 二项分布示意图2022/9/600.50.40.30.20.10.01232022/9/9图 =0.5时,不同n值对应的二项分布2022/9/62022/9/9 图 =0.3时, 不同n值对应的二项分布 2022

22、/9/62022/9/92022/9/62022/9/92022/9/62022/9/9=0.5时,分布对称,近似正态分布;0.5时,分布呈偏态,特别是n 值不大时, 偏离0.5越远,分布越偏。特别是1%或99%时,非常偏,但随着n的增大,分布逐渐逼近正态分布。2022/9/6=0.5时,分布对称,近似正态分布;2022/9/9二项分布趋近正态分布的条件:当n与n(1-)均5时,二项分布趋近正态分布。当n 时,二项分布的极限形式即是正态分布,其总体均数= n ,总体方差为2= n(1-)。2022/9/6二项分布趋近正态分布的条件:2022/9/9六、二项分布的应用(一)概率估计例4-6 某地

23、钩虫感染率为13%,随机抽查当地150人,其中至多有2名感染钩虫的概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大?2022/9/6六、二项分布的应用(一)概率估计2022/9/9可以得出150人中有10人感染钩虫的概率为2022/9/6可以得出150人中有10人感染钩虫的概率为2022/9/9150人中无感染、有1人、2人感染钩虫的概率为:2022/9/6150人中无感染、有1人、2人感染钩虫的概率2022/9/9(二)单侧累积概率计算二项分布出现阳性的次数至多为k次的概率为出现阳性的次数至少为k次的概率为2022/9/6(二)单侧累积概率计算2022/9/9据以

24、往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问: 至少3人有效的概率为多少? 最多1人有效的概率为多少? 2022/9/6据以往经验,用某药治疗小儿上呼吸道感染、支气2022/9/9 至少3人有效的概率:P(X3)=P(3)+P(4)+P(5)P(X3)=0.1381781250.3915046880.443705313 =0.973388126 2022/9/6 至少3人有效的概率:P(X3)=0.12022/9/9 最多1人有效的概率为: P(X 1)=P(0)+P(1)2022/9/6 最多1人有效的概率为:2022/9/93.3 Poisson

25、分布一、Poisson分布的概念二、Piosson分布的概率三、Piosson分布的条件四、Piosson分布的图形五、Poisson分布的特征 六、Poisson分布的应用 2022/9/63.3 Poisson 分布一、Poiss2022/9/9医学上人群中出生缺陷、多胞胎、染色体异常、恶性肿瘤等事件都是罕见的,而可能发生这些事件的观察例数n常常很大 ,但实际上发生类似事件的数目x却很小很小。2022/9/6医学上人群中出生缺陷、多胞胎、染色体异常、恶2022/9/9Poisson分布可用来描述这种罕见事件发生次数的概率分布。Poisson分布是二项分布的特例。Poisson分布可以看作某

26、种现象发生的概率(或未发生的概率1)很小(如 0.001) ,而观察例数n很大时的二项分布。除二项分布的三个基本条以外,Poisson分布还要求或(1)接近于0或1(例如0.999)。2022/9/6Poisson分布可用来描述这种罕见事件发生2022/9/9一、Poisson 分布的概念Poisson分布专用于研究单位时间、单位体积、单位面积或单位人群(较大)中某事件的发生数,若发生数X服从参数为的Poisson分布,记为X()。取名于法国数学家SD Poisson(1781-1840)例如:放射性物质每分钟放射的脉冲数、每ml水中大肠菌群数、每升空气中粉尘数、每1万个细胞中有多少个发生突变

27、、某地每天的交通事故数、某工矿企业每天的工伤人数、一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布等。 2022/9/6一、Poisson 分布的概念Poisson2022/9/9二、Poisson分布的概率1、Poisson分布的概率函数X为观察单位内某稀有事件的发生次数; P(X)为事件发生数为X时的概率,参数=n 为Poisson分布的总体均数, 表示观察单位内事件平均发生的次数,又称强度参数。e为自然对数的底。2022/9/6二、Poisson分布的概率1、Poisso2022/9/9例如果某地新生儿先天性心脏病的发病概率为8,那么该地120名新生儿中有4人患先天性心脏病的概

28、率有多大?n=120,=0.008, = n =1200.08=0.962022/9/6例如果某地新生儿先天性心脏病的发病概率为82022/9/92、Poisson分布的累计概率函数最多为k次的概率(下侧累积):最少为k次的概率(上侧累积): 递推公式: 2022/9/62、Poisson分布的累计概率函数最多为k2022/9/9 实例至多有4人患先天性心脏病的概率有多大?2022/9/6 实例至2022/9/9 实例至少有5人患心脏病的概率有多大?2022/9/6 2022/9/9例实验显示某100cm2的培养皿菌落数为6个,试估计该培养皿菌落数小于3个的概率,大于1个的概率。=6,该培养皿菌落数小于3个的概率2022/9/6例实验显示某100cm2的培养皿菌落数为6个2022/9/9该培养皿菌落数大于1个的概率2022/9/6该培养皿菌落数大于1个的概率2022/9/9三、Piosson分布的应用条件 Piosson分布是二项分布的特例,因此二项分布的三个条件也是Piosson分布的应用条件。某事件发生概率很小(如0.001 ),而观察例数n很大;单位时间、面积、容积、人群中观察事件的分布均匀。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论