第三概率与概率分布演示文稿_第1页
第三概率与概率分布演示文稿_第2页
第三概率与概率分布演示文稿_第3页
第三概率与概率分布演示文稿_第4页
第三概率与概率分布演示文稿_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三概率与概率分布演示文稿目前一页\总数九十六页\编于十七点(优选)第三概率与概率分布目前二页\总数九十六页\编于十七点一、概率基本概念(一)事件定义:在一定条件下,某种事物出现与否就称为是事件。自然界和社会生活上发生的现象是各种各样的,常见的有两类。目前三页\总数九十六页\编于十七点在一定条件下必然出现某种结果或必然不出现某种结果。确定性事件必然事件(U)(certainevent)不可能事件(V)(impossibleevent)目前四页\总数九十六页\编于十七点在一定条件下可能发生也可能不发生。随机事件(randomevent)不确定事件(indefiniteevent)为了研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。目前五页\总数九十六页\编于十七点(二)频率(frequency)若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率(frequency),记为W(A)=m/n。0≤W(A)≤1目前六页\总数九十六页\编于十七点

表3-1玉米种子发芽试验结果种子总数(n)1020501002005001000发芽种子数(m)9194791186458920种子发芽率(m/n)0.9000.9500.9400.9100.9300.9180.920种子发芽与否是不能事先确定的,但从表中可以看出,试验随着n值的不同,种子发芽率也不相同,当n充分大时,发芽率在0.92附近摆动。例:目前七页\总数九十六页\编于十七点频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。概率目前八页\总数九十六页\编于十七点(三)概率(probability,P)概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。P(A)=p目前九页\总数九十六页\编于十七点

抛掷一枚硬币发生正面朝上的试验记录实验者投掷次数发生正面朝上的次数频率(m/n)

蒲丰404020480.5069K皮尔逊1200060190.5016K皮尔逊24000120120.5005随着实验次数的增多,正面朝上这个事件发生的频率稳定接近0.5,我们称0.5作为这个事件的概率。目前十页\总数九十六页\编于十七点P(A)=p=lim

在一般情况下,随机事件的概率P是不可能准确得到的。通常以试验次数n充分大时,随机事件A的频率作为该随机事件概率的近似值。mnmnn∝目前十一页\总数九十六页\编于十七点0≤P(A)≤1

任何事件P(U)=1

必然事件P(V)=0

不可能事件0<P(A)<1

随机事件概率的基本性质目前十二页\总数九十六页\编于十七点概率的计算第二部分目前十三页\总数九十六页\编于十七点二、概率的计算(一)事件的相互关系和事件积事件互斥事件对立事件独立事件完全事件系目前十四页\总数九十六页\编于十七点1和事件事件A和事件B中至少有一个发生而构成的新事件称为事件A和事件B的和事件,记作A+B。n个事件的和,可表示为A1+A2+…+An如:随机抽取一样品的出粉率为81%以下,称事件A,另一81-85%为B,现取一新样品出粉率85以下,则其为A和B的和事件目前十五页\总数九十六页\编于十七点2积事件事件A和事件B中同时发生而构成的新事件称为事件A和事件B的积事件,记作A•B。n个事件的积,可表示为A1•

A2•

…•An如调查田间病害发生情况,棉铃虫发生为事件A,黄萎病发生为B,则棉铃虫与黄萎病同时发生的新事件为A和B的积事件目前十六页\总数九十六页\编于十七点3互斥事件(互不相容事件)事件A和事件B不能同时发生,则称这两个事件A和B互不相容或互斥。n个事件两两互不相容,则称这n个事件互斥。豌豆开红花、白花事件目前十七页\总数九十六页\编于十七点4对立事件事件A和事件B必有一个发生,但二者不能同时发生,且A和B的和事件组成整个样本空间。即A+B=U,AB=V。我们称事件B为事件A的对立事件。B=A生男孩、女孩目前十八页\总数九十六页\编于十七点5独立事件事件A和事件B的发生无关,事件B的发生与事件A的发生无关,则事件A和事件B为独立事件。如果多个事件A1、A2、A3、…、An

彼此独立,则称之为独立事件群。如播种两粒玉米,它们的发芽目前十九页\总数九十六页\编于十七点6完全事件系如果多个事件A1、A2、A3、…、An两两互斥,且每次试验结果必然发生其一,则称事件A1、A2、A3、…、An为完全事件系。完全事件系的和事件概率为1,任何一个事件发生的概率为1/n。即:

P(A1+A2+…+An)=1如,抽取一位阿拉伯数字,抽取数字为0、1、2….8、9构成了完全事件系目前二十页\总数九十六页\编于十七点例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空穗株(C)占2.1%,试计算一穗株和双穗株的概率。P(A+B)=P(A)+P(B)=0.672+0.307=0.979因为P(A)+P(B)+P(C)=1

P(A+B)=1-P(C)=1-0.021=0.979或(二)概率的计算法则1互斥事件加法定理目前二十一页\总数九十六页\编于十七点定理:若事件A与B互斥,则P(A+B)=P(A)+P(B)推理1P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)推理2P(A)=1-P(A)推理3完全事件系的和事件的概率为1。目前二十二页\总数九十六页\编于十七点2独立事件乘法定理例:播种玉米,种子的发芽率为90%,每穴两粒,则:A:第一粒种子发芽,P(A)=0.9,P(A)=0.1B:第二粒种子发芽,P(B)=0.9,P(B)=0.1C:两粒种子均发芽,D:一粒种子发芽:D=AB+AB,P(D)=0.9*0.1+0.1*0.9=0.18E:两粒种子均不发芽:E=AB,P(E)=P(A)P(B)=0.1*0.1=0.01求:C:两粒种子均发芽D:一粒种子发芽E:两粒种子均不发芽C=AB,P(C)=P(A)P(B)=0.81目前二十三页\总数九十六页\编于十七点2独立事件乘法定理定理:事件A和事件B为独立事件,则事件A与事件B同时发生的概率为各自概率的乘积。

P(AB)=P(A)P(B)推理:A1、A2、…An彼此独立,则

P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)目前二十四页\总数九十六页\编于十七点三、概率分布(一)离散型变量的概率分布要了解离散型随机变量x的统计规律,必须知道它的一切可能值xi及取每种可能值的概率pi。对离散型变量x的一切可能值xi(i=1,2,3…),及其对应的概率piP(x=xi)=pi,i=1,2,3…目前二十五页\总数九十六页\编于十七点例:

表3-2某鱼群的年龄组成年龄(x)1234567频率(W)0.45970.33350.12540.05070.02150.00800.0012此表给出了该鱼群年龄构成的全部,我们称之为该鱼群年龄的概率分布。目前二十六页\总数九十六页\编于十七点

表婴儿的性别情况表性别(x)0(男)1(女)概率(P)0.5170.483此表列出了性别变量的取值及相应值的概率,揭示了观察婴儿性别试验的统计规律。用随机变量的可能取值及取相应值的概率来表示随机试验的规律称为随机变量的分布律或概率函数。例:目前二十七页\总数九十六页\编于十七点

表3-3离散型变量的概率分布变量(x)x1x2x3x4……..xn概率(P)p1p2p3p4…….pnP(x=xi)=pi,i=1,2,3…设离散型变量x的所有一切可能值xi(i=1,2,3…),取相应值的概率为pi,则P(x=xi)称为离散型随机变量x的概率函数。目前二十八页\总数九十六页\编于十七点离散型变量的概率分布的特点1≥

Pi≥0(i=1,2,…)=1目前二十九页\总数九十六页\编于十七点(二)连续型变量的概率分布当试验资料为连续型变量,一般通过分组整理成频率分布表。如果从总体中抽取样本的容量n相当大,则频率分布就趋于稳定,我们将它近似地看成总体概率分布。目前三十页\总数九十六页\编于十七点图3.1鲢鱼体长的频率分布图354045505560657075808590直方图中同一组内的频率是相等的。0.05一0.10一0.15一0.20一0.25一频率密度目前三十一页\总数九十六页\编于十七点直方图中每一矩形的面积就表示该组的频率。目前三十二页\总数九十六页\编于十七点当n无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线,曲线函数f(x)称为概率密度函数。目前三十三页\总数九十六页\编于十七点对于一个连续型随机变量x,取值于区间[a,b]内的概率为函数f(x)从a到b的积分,即:连续型随机变量的概率由概率分布密度函数所确定。ab目前三十四页\总数九十六页\编于十七点概率密度函数f(x)曲线与x轴所围成的面积为1。目前三十五页\总数九十六页\编于十七点三、大数定律目前三十六页\总数九十六页\编于十七点几种常见的理论分布第二节目前三十七页\总数九十六页\编于十七点随机变量的概率分布(probabilitydistribution)

离散型变量

(非连续变量资料)

连续型变量二项分布泊松分布正态分布变量第二节:几种常见的理论分布目前三十八页\总数九十六页\编于十七点一、二项分布目前三十九页\总数九十六页\编于十七点离散型随机变量的分布哺乳动物种子穗子生物个体雄性雌性发芽不发芽有芒无芒成活死亡对立事件一、二项分布的概率函数非此即彼目前四十页\总数九十六页\编于十七点二项总体:这种“非此即彼”的事件构成的整体二项分布:二项总体的概率分布目前四十一页\总数九十六页\编于十七点一、二项分布设有一随机试验,每次试验结果出现且只出现对立事件A与之一,这两种结果是互不相容的,在每次试验中出现A的概率是p(0<p<1),则出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努里试验,简称贝努里试验。目前四十二页\总数九十六页\编于十七点

在种子发芽试验中,设事件A为“种子发芽”,则A为“种子不发芽”。取4粒种子(n=4)来做试验,求有2粒种子发芽(x=2)的概率。

在贝努里试验中,独立将此试验重复n次,求在n次试验中,一种结果A出现x次的概率P(x)是多少。

在4次试验中,事件A发生2次的方式有以下种:目前四十三页\总数九十六页\编于十七点

又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4粒种子中正好有2粒种子发芽的概率为:P4(2)=P()+P()+…+P()=

一般,在n重贝努利试验中,事件A恰好发生x(0≤x≤n)次的概率为

x=0,1,2…,nx目前四十四页\总数九十六页\编于十七点公式称作二项分布概率函数

,其中,p>0,q>0,p+q=1,x是一个离散型随机变量,取值为0,1,2,…,n。p(x)=Cnxpxqn-xCnx=n!x!(n-x)!目前四十五页\总数九十六页\编于十七点n=试验次数(或样本含量)n=4x=在n次试验中事件A出现的次数x=2p=事件A发生的概率(每次试验是恒定的)p=0.91-p=事件A不发生的概率1-p=0.1p(x)=X的概率函数=P(X=x)P(2)则4粒种子有两粒发芽的概率为:

P(x)=p2q4-2=6×0.92×0.12=0.0486

例:目前四十六页\总数九十六页\编于十七点

现已求出某事件发生的概率,若试验N次,则该事件发生的理论次数为:理论次数=NP(x)

二项分布的概率累积函数为:

F(x)=ΣP(x)=1目前四十七页\总数九十六页\编于十七点二项总体试验只有两个对立结果,记为A和A,出现概率分别为p和q=1-p。重复性:每次试验条件不变时,事件A出现为恒定概率p;独立性:任何一次试验中事件A的出现与其余各次试验结果无关。二项分布的两个条件:目前四十八页\总数九十六页\编于十七点3:1若每次观察4株,共观察100次,问红花为0、1、2、3、4株的概率各为多少?(二)二项分布的计算例:豌豆F1为红花和白花,杂交后F2红花:白花=3:1F1F2目前四十九页\总数九十六页\编于十七点概率函数Cnxpxqn-xP(x)F(x)NP(x)P(0)C40p0q40.00390.00390.39P(1)C41p1q30.04690.05084.69P(2)C42p2q20.21090.261721.09P(3)C43p3q10.42190.683642.19P(4)C44p4q00.31641.00031.64

合计1.000

100

表观察4株出现红花的概率分布表(p=0.75q=1-p=0.25)目前五十页\总数九十六页\编于十七点概率函数Cnxpxqn-xP(x)F(x)NP(x)P(0)C50p0q50.000010.000010.01P(1)C51p1q40.000450.000460.45P(2)C52p2q30.00810.008568.1P(3)C53p3q20.07290.0804672.9P(4)C54p4q10.328050.40951328.05P(5)C55p5q00.590491.0000590.49

孵化小鸡的概率分布表(p=0.90q=0.10)例2:鸡蛋孵化率为0.9,每次选5个进行孵化,试求孵出小鸡的各种可能概率,若做1000次试验,其理论次数分别为多少?目前五十一页\总数九十六页\编于十七点二项分布概率函数概率的计算样本容量的确定p(x)=Cnxpx(1-p)n-x目前五十二页\总数九十六页\编于十七点例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?(1)n=100,p=0.0045P(x≥2)=1-P(0)-P(1)=1-0.6370-0.2879=0.0751

p(0)=C1000p0(1-p)100=0.6370p(1)=0.2879(2)应调查的的株数应满足p(0)=1-0.99=0.01p(0)=Cn0p0(1-p)n(0.9955)n=0.01n=1021(株)目前五十三页\总数九十六页\编于十七点二、泊松分布泊松分布(Poissondistribution)是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也是一种离散型随机变量的分布。

泊松分布是描述一定空间(长度、面积和体积)或一定时间间隔内点子散布状况的理想化模型。目前五十四页\总数九十六页\编于十七点在二项分布中,当某事件出现的概率极小(p→0),而试验次数又极多(n→∞)时,二项分布就趋近于泊松分布,即泊松分布是二项分布的一种特殊类型。λ为参数,λ=npx=0,1,2,…目前五十五页\总数九十六页\编于十七点二、泊松分布泊松分布的概率函数可由二项分布概率函数推导出来!)(xexPl=-λ

xλ为参数,λ=np

x=0,1,2,…p(x)=Cnxpx(1-p)n-xμ=λσ2=λσ=目前五十六页\总数九十六页\编于十七点二、泊松分布对于小概率事件,可用泊松分布描述其概率分布。二项分布当p<0.1和np<5时,可用泊松分布来近似。21应用应用应用!)(xexPl=-λ

x目前五十七页\总数九十六页\编于十七点目前五十八页\总数九十六页\编于十七点例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查100株,获得两株或两株以上变异植株的概率是多少?(2)期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?(1)λ=np=100x0.0045=0.45代入公式P(x≥2)=1-P(0)-P(1)=1-0.6376-0.2869=0.0755

p(0)=0.6376p(1)=0.2869(2)应调查的的株数应满足p(0)=1-0.99=0.01p(0)=λ=npn=1023(株)目前五十九页\总数九十六页\编于十七点上节课主要内容一、概率的概念二、概率的计算三、概率的分布目前六十页\总数九十六页\编于十七点三、正态分布目前六十一页\总数九十六页\编于十七点围绕在平均值左右,由平均值到分布的两侧,变量数减少,即两头少,中间多,两侧对称。正态分布通常记为N(µ,σ2),µ与σ均为常数,且σ>0。正态分布(normaldistribution)特点正态分布也称为高斯分布(Gaussdistribution),是一种连续型随机变量的概率分布。目前六十二页\总数九十六页\编于十七点n大p与1-p接近λ大二项分布泊松分布正态分布正态分布是生物统计学的重要基础。目前六十三页\总数九十六页\编于十七点(一)正态分布的概率函数连续型随机变量的概率分布是用概率密度函数来描述的。目前六十四页\总数九十六页\编于十七点(一)正态分布的概率函数f(x)为正态分布的概率密度函数,表示某一定x值出现的概率密度函数值。μ总体平均数σ总体标准差π圆周率,3.14159e为自然对数底,2.71828目前六十五页\总数九十六页\编于十七点N(μ,σ2)(一)正态分布的概率函数目前六十六页\总数九十六页\编于十七点x=μ时,f(x)值最大,正态分布曲线以平均数μ为中心的分布。(二)正态分布的特征1目前六十七页\总数九十六页\编于十七点x-μ的绝对值相等时,f(x)也相等,正态分布密度曲线以μ为中心向左右两侧对称。(二)正态分布的特征2目前六十八页\总数九十六页\编于十七点f(x)是非负函数,以x轴为渐近线,x的取值区间为(-∞,+∞)

。(二)正态分布的特征3目前六十九页\总数九十六页\编于十七点正态分布曲线由参数μ,σ决定,μ确定正态分布曲线在x轴上的中心位置,σ确定正态分布的变异度。幻灯片73(二)正态分布的特征4目前七十页\总数九十六页\编于十七点正态分布曲线在x=μ±σ处各有一个拐点,曲线通过拐点时改变弯曲度。(二)正态分布的特征5目前七十一页\总数九十六页\编于十七点分布曲线与x轴围成的全部面积为1(二)正态分布的特征6目前七十二页\总数九十六页\编于十七点若一个连续型随机变量x取值于区间[a,b],其概率为ab目前七十三页\总数九十六页\编于十七点(三)标准正态分布N(μ,σ2)正态分布是依赖于参数(μ,σ2)的一个曲线系,正态曲线的位置及形态随(μ,σ2)的不同而不同,这就给研究具体的正态分布总体带来了困难,我们现将其标准化。目前七十四页\总数九十六页\编于十七点N(μ,σ2)N(0,1)u表示标准正态离差(standardnormaldeviate),它表示离开平均数μ有几个标准差σ。f(u)称为标准正态分布(standardnormaldistribution)或u分布方程。目前七十五页\总数九十六页\编于十七点

标准正态分布的概率累积函数记作F(u),它是变量u小于某一定值的概率。ui目前七十六页\总数九十六页\编于十七点

为了计算方便,对于不同的u值,计算出不同的F(x),编成函数表,称为正态分布表,从中可以查到u任意一个区间内取值的概率。目前七十七页\总数九十六页\编于十七点标准正态分布u落在区间[a,b]的概率目前七十八页\总数九十六页\编于十七点(四)正态分布的概率计算ab-a目前七十九页\总数九十六页\编于十七点P(x≥μ+1.96σ)=

0.05P(x≥μ+2.58σ)=

0.01P(-1.96≤u≤1.96)=0.95P(x≤μ+1.96σ)=P(x≤μ+2.58σ)=P(-2.58≤u≤2.58)=0.99目前八十页\总数九十六页\编于十七点(五)正态分布的应用估计参考值范围20株小麦株高(cm)为82,79,85,84,86,84,83,82,83,83,84,81,80,81,82,81,82,82,82,80其平均值为82.3cm,标准差为1.7502cm。问1:小麦株高95%的正常范围值。小麦株高服从正态分布。总体平均数μ和标准差σ未知,可以用样本平均数x和标准差s来估计μ和σ

。[78.57,85.73]95%目前八十一页\总数九十六页\编于十七点问2:x≥85(cm)

的概率?P(x≥85)=P(u≥1.54)

=1-F(u=1.54)

=1-0.9382=0.0618

目前八十二页\总数九十六页\编于十七点第三节:样本平均数的分布目前八十三页\总数九十六页\编于十七点

由于从总体中抽出的样本为每一个可能样本,且每个样本中的变量均为随机变量,所以其样本平均数也为随机变量,也形成一定的理论分布,这种理论分布称为样本平均数的概率分布,或称样本平均数的分布。样本平均数的平均数:样本平均数的方差:目前八十四页\总数九十六页\编于十七点对N=3(3,4,5),n=2抽样试验所得的9个样本平均数,整理成次数分布表。xffxfx23.0139.03.52724.54.031248.04.52940.55.01525.0Σ936147.0n=2目前八十五页\总数九十六页\编于十七点xffxfx23.0139.03.52724.54.031248.04.52940.55.01525.0Σ936147.0n=23,4,5μ=4σ2

=0.6667目前八十六页\总数九十六页\编于十七点

xffxfx23.00139.003.2541342.253.501035122.503.751660225.004.001976304.004.251668289.004.501045202.504.7541990.255.001525.00Σ813241309.50n=4如果对这个N=3(3,4,5)

所组成的总体,再进行n=4的抽样试验,则可得81个样本平均数,将其整理成次数分布表。目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论