




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章理论分布与抽样分布1西南科技大学生命科学与工程学院周海廷制作第三章1西南科技大学生命科学与工程学院周海廷制作3.1
事件、概率和随机变量3.1.1事件和事件发生的概率3.1.2事件间的关系3.1.3计算事件概率的法则3.1.4随机变量2西南科技大学生命科学与工程学院周海廷制作3.1事件、概率和随机变量3.1.1事件和事件发生3.1.1事件和事件发生的概率事件(event):在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件。概率(probability):每一事件出现的可能性,称为该事件的概率。随机事件(randomevent):若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件。3西南科技大学生命科学与工程学院周海廷制作3.1.1事件和事件发生的概率事件(event):在自然要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大量的实验中才能观察到。下面用棉田发生盲椿象为害的情况来说明这一问题。调查株数(n)受害株数(a)受害频率(a/n)52.402512.485015.3010033.3320072.36500177.3541000351.3511500525.3502000704.3524西南科技大学生命科学与工程学院周海廷制作要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公式表示为:式中P代表概率,P(A)代表事件A的概率。P(A)的取集范围为:0≤P(A)≤1。随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。5西南科技大学生命科学与工程学院周海廷制作统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公小概率原理:若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率实际不可能性原理,简称小概率原理。必然事件:对于一类事件来说,如在同一组条件的实现之下必然要发生的事件。不可能事件:如果在同一组条件下必然不发生的事件。6西南科技大学生命科学与工程学院周海廷制作小概率原理:若事件A发生的概率较小,如小于0.05或0.013.1.2事件间的关系一、和事件事件A和事件B至少有一个发生构成的新事件称为事件A和事件B的和事件,记为A+B,读作“或A发生,或B发生”。例如测定棉花的纤维长度,以<28毫米为事件A,28至30毫米为事件B,则抽取一根≤30毫米的这一新事件为A+B。7西南科技大学生命科学与工程学院周海廷制作3.1.2事件间的关系一、和事件7西南科技大学生命科学与二、积事件事件A和B同时发生而构成的新事件,称为事件A和B的积事件,记为AB,读作“A和B同时发生或相续发生”。例如某小麦品种,以发生锈病为事件A,发生白粉病为事件B,则锈病和白粉病同时发生这一新事件为AB。8西南科技大学生命科学与工程学院周海廷制作二、积事件8西南科技大学生命科学与工程学院周海廷制作三、互斥事件如果事件A和B不能同时发生,即A和B是不可能事件,则称事件A和B互斥。例如棉花纤维长度“<28毫米”和“等于28毫米”不可能同时发生,为互斥事件。9西南科技大学生命科学与工程学院周海廷制作三、互斥事件9西南科技大学生命科学与工程学院周海廷制作四、对立事件事件A和B不可能同时发生,但必发生其一,即A+B为必然事件(记为A+B=U),AB为不可能事件(记为A·B=V),则称事件B为事件A的对立事件,并记B为例如,有一袋种子,按种皮分黄色和白色,事件A为“取到黄色”,事件B为“取到白色”,A与B不能同时发生,但是,任意取一粒种子,其皮色不是黄色就是白色,即A和B必发生其一,因此A和B互为对立事件。10西南科技大学生命科学与工程学院周海廷制作四、对立事件10西南科技大学生命科学与工程学院周海廷制作五、完全事件系若事件A1、A2、···An两两互斥,且每次试验结果必发生其一,则称A1、A2、···An为完全事件系。例如对于棉花纤维长度,<28毫米、≥28毫米和<30毫米、≥30毫米均构成了完全事件系。11西南科技大学生命科学与工程学院周海廷制作五、完全事件系11西南科技大学生命科学与工程学院周海廷制作六、事件的独立性若事件A发生与否不影响B发生的可能性,则称事件A和事件B相互独立。例如,事件A为“花的颜色为黄色”,事件B为“产量高”,显然如果花的颜色与产量无关,则事件A和B相互独立。12西南科技大学生命科学与工程学院周海廷制作六、事件的独立性12西南科技大学生命科学与工程学院周海廷制作3.1.3计算事件概率的法则一、互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B),则
P(A+B)=P(A)+P(B)例如:荣昌猪的每胎产仔数≤9头的概率P(A)=0.65,为10头的概率P(B)=0.18,则每胎产仔≤10头的概率为:P(A+B)=P(A)+P(B)=0.65+0.18=0.8313西南科技大学生命科学与工程学院周海廷制作3.1.3计算事件概率的法则一、互斥事件的加法13西南科二、独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则:
P(AB)=P(A)P(B)例:现有4粒种子,其中3粒是黄色、1粒是白色,采用复置抽样。试求下列两事件的概率(1)第一次抽到黄色,第二次抽到白色;(2)两次都抽到黄色。14西南科技大学生命科学与工程学院周海廷制作二、独立事件的乘法14西南科技大学生命科学与工程学院周海廷制先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概率为1/4=0.25.P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.75×0.25=0.1875P(B)=P(第一次抽到黄色种子)P(第二次抽到黄色种子)=0.75×0.75=0.562515西南科技大学生命科学与工程学院周海廷制作先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概三、对立事件的概率若事件A的概率为P(A),那么其对立事件的概率为:
P()=1-P(A)四、完全事件系的概率例如上例,黄色种子和白色种子构成完全事件系,其概率为1。16西南科技大学生命科学与工程学院周海廷制作三、对立事件的概率16西南科技大学生命科学与工程学院周海廷制五、非独立事件的乘法P(AB)=P(A)P(B|A)17西南科技大学生命科学与工程学院周海廷制作五、非独立事件的乘法17西南科技大学生命科学与工程学院周海廷3.1.4随机变量定义:随机变量是指随机变数所取的某一个实数值。例如:在抛硬币试验中,币值面向上的用数“1”表示,国徽面向上的用“0”表示。把0,1作为变量y的取值。
P(y=1)=0.5P(y=0)=0.518西南科技大学生命科学与工程学院周海廷制作3.1.4随机变量定义:随机变量是指随机变数所取的某一个一、离散型随机变量变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量的所有可能取值及其对应的概率一一列出所形成的分布,称为离散型随机变量的概率分布:变量yi
y1
y2
y3…yn概率P(y=yi)P1
P2
P3…Pn19西南科技大学生命科学与工程学院周海廷制作一、离散型随机变量19西南科技大学生命科学与工程学院周海廷制二、连续型随机变量变量y的取值仅为一范围,且y在该范围内取值时,其概率是确定的,这种类型的变量称为连续型随机变量(continuousrandomvariate)。式中,f(y)称为y的概率密度函数(probabilitydensityfunction)或分布密度(distributiondensity)20西南科技大学生命科学与工程学院周海廷制作二、连续型随机变量式中,f(y)称为y的概率密度函数(pro随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应概率于其对应的,这就是所要研究和掌握的规律,这个规律称为随机变量的概率分布。21西南科技大学生命科学与工程学院周海廷制作随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应3.2
二项式分布3.2.1二项总体与二项式分布3.2.2二项式分布的概率计算方法3.2.3二项式分布的形状和参数3.2.4多项式分布3.2.5泊松分布—二项分布的一种极限分布22西南科技大学生命科学与工程学院周海廷制作3.2二项式分布3.2.1二项总体与二项式分布3.3.2.1二项总体与二项式分布有些总体的各个个体的某些性状,只能发生非此即彼的两种结果,“此”和“彼”是对立事件。例如种子的发芽与不发芽,施药后害虫的死或活,产品的合格与不合格。这种由非此及彼事件构成的总体,称之为二项总体(binomialpopulation)。23西南科技大学生命科学与工程学院周海廷制作3.2.1二项总体与二项式分布有些总体的各个个体的为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”事件以变量“0”,具概率q其概率关系为:
p+q=1q-1=p如果我们每次抽取0、1总体的n个个体,则所得变量y将可能有0,1,…n,共n+1种。这n+1变量有它各自的概率而组成一个分布。这个分布叫做二项概率分布,简称二项分布(binomialdistribution)。24西南科技大学生命科学与工程学院周海廷制作为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”为1。如果每次观察5只,则观察的结果将有0(5只全死)、1(4死1活)、2(3死2活)、3(2死3活)、4(1死4活)、5(5只全活),共6种变量。由这6种变量的相应概率组成的分布,就是n=5时活虫数的二项分布。25西南科技大学生命科学与工程学院周海廷制作例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”3.2.2二项式分布的概率计算方法下面用一个例子来讲解这一问题。红花豌豆和白花豌豆杂交,F2代出现红花的概率为p=3/4,出现白花的概率为q=1/4。如果将F1代种子成行种植,每行种4粒。问一行全是红花、三株红花、二株红花、一株红花、0红花的概率各是多少。26西南科技大学生命科学与工程学院周海廷制作3.2.2二项式分布的概率计算方法下面用一个例子来讲解这这实际上是以n=4,从p=3/4,q=1/4的二项总体中抽样构成二项分布的问题。为方便,以“1”代表出现红花的事件,“0”代表出现白花的事件。27西南科技大学生命科学与工程学院周海廷制作这实际上是以n=4,从p=3/4,q=1/4的二项总体中抽红花数组合数xf(x)4红3红2红1红0红(1,1,1,1)4P(x=4)=1p4=0.754=0.3164(1,1,1,0)(1,1,0,1)(1,0,1,1)(0,1,1,1)3P(x=3)=4p3q1=4×0.753×0.25=0.4219(1,1,0,0)(1,0,1,0)(1,0,0,1)(0,1,1,0)(0,1,0,1)(0,0,1,1)2P(x=2)=6p2q2=6×0.752×0.252=0.2109(1,0,0,0)(0,1,0,0)(0,0,1,0)(0,0,0,1)1P(x=1)=4p1q3=4×0.75×0.253=0.0409(0,0,0,0)0P(x=0)=1q4=0.254=0.003928西南科技大学生命科学与工程学院周海廷制作红花数组合数xf(x)4红3红2红1红0红(1,1,1,1)上例各项的概率相当于(p+q)4的展开:(p+q)4=p4+4p3q+6p2q2+4pq3+q4同理,以样本容量为n进行的抽样,得到的概率分布为(p+q)n的展开。每一项的系数为:(0≤k≤n)29西南科技大学生命科学与工程学院周海廷制作上例各项的概率相当于(p+q)4的展开:(0≤k≤n)29西计算二项分布任何一项概率的通式为:例4.2某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少?30西南科技大学生命科学与工程学院周海廷制作计算二项分布任何一项概率的通式为:例4.28头愈好,2头死去的概率为:7头愈好,3头死去的概率为:31西南科技大学生命科学与工程学院周海廷制作8头愈好,2头死去的概率为:7头愈好,3头死去的概率为:319头愈好,1头死去的概率为:10头全部愈好的概率为:若计算10头中不超过2头死去的概率为多少?则应该应用累积概率,即:32西南科技大学生命科学与工程学院周海廷制作9头愈好,1头死去的概率为:10头全部愈好的概率为:若计算13.2.3二项式分布的形状和参数一、形状P=0.35,n=5的概率分布图33西南科技大学生命科学与工程学院周海廷制作3.2.3二项式分布的形状和参数一、形状P=0.35,(p=0.5,n=5)的概率分布图34西南科技大学生命科学与工程学院周海廷制作(p=0.5,n=5)的概率分布图34西南科技大学生命科学与当p=q时。二项分布呈对称形状,如p≠q,则表现偏斜形状。但从理论和实践检验,当n很大时即使p≠q,它也接近对称形状。所以这一理论分布是由n和p两个参数决定的。二、参数凡描述一个总体,平均数和方差(或标准差)两个参数是重要的。二项总体,其平均数μ、方差σ2和标准差σ为:
μ=np,σ2=npqσ=35西南科技大学生命科学与工程学院周海廷制作当p=q时。二项分布呈对称形状,如p≠q,则表现偏斜形状。但3.2.4多项式分布若总体内包含几种特性或分类标志,可以将总体中的个体分为几类,例如在给某一人群使用一种新药,可能有好的疗效,有的没有疗效,而另有疗效为副作用的,象这种将变数资料分为3类或多类的总体称为多项总体,研究其随机变量的概率分布可使用多项式分布(multinomialdistribution)。36西南科技大学生命科学与工程学院周海廷制作3.2.4多项式分布若总体内包含几种特性或分类标志,可以设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、…、pk,显然p1+p2+p3+…+pk=1。若从这个总体随机抽取n个个体,那么可能得到这k项的个数分别为y1、y2、y3、…、yk,而y1
+y2
+y3
+…+yk
=n。其事件的概率为:这一概率分布称为多项式分布。37西南科技大学生命科学与工程学院周海廷制作设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、例4.3某药对病人有效的概率为1/2,对病人无效的概率为1/3,有副作用的概率为1/6,若随机抽取2个使用该药的病人,那么我们的结果可能包括这样几种事件:2个病人有副作用;一个无效、一个有副作用;两个无效;一个有效、一个有副作用;一个有效、一个无效;两个均有效。试计算出现这些事件的概率。38西南科技大学生命科学与工程学院周海廷制作例4.3某药对病人有效的概率为1/2,对病人无效的概率为1解:分别用y1、y2、y3分别代表用药有效的个体数、用药无效的个体数和用药有副作用的个体数。这些事件的概率的计算见下表:39西南科技大学生命科学与工程学院周海廷制作解:39西南科技大学生命科学与工程学院周海廷制作变量(y1、y2、y3)概率及其计算P(y1、y2、y3)(0,0,2)(0,1,1)(0,2,0)(1,0,1)(1,1,0)(2,0,0)40西南科技大学生命科学与工程学院周海廷制作变量概率及其计算(0,0,2)(0,1,1)(0,2,0)(3.2.5泊松分布—二项分布的一种极限分布应用二项分布时,有时会遇到一个概率p或q很小的值,例如小于0.1,另一方面n又相当大,这样二项分布必将为另一分布所接近,或者为一极限分布。这种分布称为泊松概率分布,简称泊松分布(Poissondistribution)。如将np=m,则接近分布如下式:y=0,1,2,…,∞41西南科技大学生命科学与工程学院周海廷制作3.2.5泊松分布—二项分布的一种极限分布应用二项分凡在观察次数n(n相当大)中,某一事件出现的平均次数m(m是一个定值)很小,那么,这一事件出现的次数将符合泊松分布。泊松分布在生物学研究中是经常遇到的,例如,昆虫与植物种类在一定面积的分布,病菌侵害作物的分布,一个显微镜视野内的细菌计数以及原子衰变的规律等随机变数。泊松分布的平均数、方差和标准差为:42西南科技大学生命科学与工程学院周海廷制作凡在观察次数n(n相当大)中,某一事件出现的平均次数m(3.3
正态分布3.3.1二项分布的极限—正态分布3.3.2正态分布曲线的特性3.3.3计算正态分布曲线区间概率的方法43西南科技大学生命科学与工程学院周海廷制作3.3正态分布3.3.1二项分布的极限—正态分布33.3.1二项分布的极限—正态分布P=0.5,n=5的二项分布44西南科技大学生命科学与工程学院周海廷制作3.3.1二项分布的极限—正态分布P=0.5,n=5的二p=0.5,n=20的二项分布45西南科技大学生命科学与工程学院周海廷制作p=0.5,n=20的二项分布45西南科技大学生命科学与工程从图中看出,若n→∞,每个组的直方形都一一变为纵轴线,连接的直线也一一变成点了。这时多边形折线应表现为一个光滑的曲线,在数学意义上它是一个二项分布的极限曲线。这一曲线称之为正态分布曲线或正态概率曲线。其概率密度函数为:46西南科技大学生命科学与工程学院周海廷制作从图中看出,若n→∞,每个组的直方形都一一变为纵轴线,连接的3.3.2正态分布曲线的特性1、以y=μ为对称轴,向左右两侧作对称分布,其算术平均数、中数、众数相等,均在μ点上。2、正态分布曲线由参数μ和σ决定,所以它是曲线簇而不是单一的曲线。47西南科技大学生命科学与工程学院周海廷制作3.3.2正态分布曲线的特性1、以y=μ为对称轴,向左右μ
1μ2μ30.00.10.20.30.40.5012345-1-2-3-4f(y)y0.00.10.20.30.40.5012345-1-2-3-4f(y)yσ=1σ=1.5σ=248西南科技大学生命科学与工程学院周海廷制作μ1μ2μ30.00.10.20.30.40.5012343、正态分布资料的分布表现为多数次数位于算术平均数μ附近,在|y-μ|≥3σ以上其次数极少,在实际应用中,y通常在±3σ范围之内取值,这就是6σ法则。0.00.10.20.30.40.5012345-1-2-3-4f(y)y68.27%95.45%99.73%49西南科技大学生命科学与工程学院周海廷制作3、正态分布资料的分布表现为多数次数位于算术平均数μ附近,在4、正态曲线在|y-μ|=1σ处有拐点,并以横轴为渐进线,因此曲线全距从-∞到+∞。5、正态曲线与横轴之间的面积等于1,因此曲线下横轴的任何定值,等于介于这两个面积占总面积的成数。下面是几组常用值:
μ±1σ概率=0.6827μ±2σ概率=0.9545μ±3σ概率=0.9973μ±1.960σ概率=0.9500μ±2.576σ概率=0.990050西南科技大学生命科学与工程学院周海廷制作4、正态曲线在|y-μ|=1σ处有拐点,并以横轴为渐进线3.3.3计算正态分布曲线区间概率的方法在正态分布曲线下,y的定值从y=a到y=b间的概率可用曲线区间的面积表示:计算曲线下从-∞到y0的面积,公式如下:FN(y)称为正态分布的累积函数。51西南科技大学生命科学与工程学院周海廷制作3.3.3计算正态分布曲线区间概率的方法在正态分布曲线下52西南科技大学生命科学与工程学院周海廷制作52西南科技大学生命科学与工程学院周海廷制作为了便于使用,通常是将正态分布±3σ分成很小的距离单位,比如0.01,进行积分,然后制成概率分布表。使用者只需查表,而无需进行复杂的积分运算。一个首先需要解决的问题是,正态分布是一个曲线簇,而非单一的曲线,用曲线簇进行制表几乎是无法完成的事情。因此要设法将其转化为一条曲线。53西南科技大学生命科学与工程学院周海廷制作为了便于使用,通常是将正态分布±3σ分成很小的距离单位,比由于正态曲线受μ和σ的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去μ和σ的影响。假定新变数用u来表示,则:54西南科技大学生命科学与工程学院周海廷制作由于正态曲线受μ和σ的制约,曲线随这两个参数的变化而改变。5u称为正态离差,由之可将正态方程标准化为:上式为标准化正态分布方程,它是参数μ=0,σ2=1时的正态分布,记作N(0,1)。55西南科技大学生命科学与工程学院周海廷制作u称为正态离差,由之可将正态方程标准化为:上式为标准化正态分有了标准曲线之后,就可以将y值从-3到3范围内的FN(y)的值,以0.01的间隔列于附表2(P357)。计算一定区间的概率值,只要查表就可以了。例4.4假定y是一随机变数具有正态分布,平均数μ=30,标准差σ=5,试计算小于26,小于40的概率,介于26和40区间的概率以及大于40的概率。56西南科技大学生命科学与工程学院周海廷制作有了标准曲线之后,就可以将y值从-3到3范围内的FN(y)的首先计算:P(y≤26)=FN(26)
先将y转换成u值:u=(y-μ)/σ=(26-30)/5=-0.8查附表2,当u=-0.8时FN(26)=0.2119同样计算:P(y≤40)=FN(40)u=(y-μ)/σ=(40-30)/5=2.0查附表2,当u=2.0时FN(40)=0.9773计算:P(26<y≤40)=FN(40)-FN(26)=0.9773-0.2119=0.765457西南科技大学生命科学与工程学院周海廷制作首先计算:P(y≤26)=FN(26)57西南科技大学生命计算:P(y>40)=1-P(y≤40)=1-0.973=0.02270.0000.0040.0080.0120.0160.0203035404525201510fN
(y)yP(y<26)=0.21190.0000.0040.0080.0120.0160.0203035404525201510fN
(y)yP(y<40)=0.977358西南科技大学生命科学与工程学院周海廷制作计算:P(y>40)=1-P(y≤40)=1-0.973=00.0000.0040.0080.0120.0160.0203035404525201510fN
(y)y0.0000.0040.0080.0120.0160.0203035404525201510fN
(y)yP(y<40)=0.0227P(26<y≤40)=0.765459西南科技大学生命科学与工程学院周海廷制作0.0000.0040.0080.0120.0160.020例4.6(P64)计算正态分布曲线的中间概率为0.99时,其y或u值应为多少?因为正态分布是对称的,故在曲线左边从-∞到-u的概率和曲线右边从u到∞的概率应等于1/2(1-0.99)=0.005。查附表3,u=-2.58σ时,FN(y)=0.00494≈0.005。故当y=μ±2.58σ时,在其范围内包括99%的变量。60西南科技大学生命科学与工程学院周海廷制作例4.6(P64)计算正态分布曲线的中间概率为0.99时,f(y)y0.00.10.20.30.40.5012345-1-2-3-4左尾概率右尾概率61西南科技大学生命科学与工程学院周海廷制作f(y)y0.00.10.20.30.40.50123453.4
抽样分布3.4.1统计数的抽样分布及其分布参数3.4.2正态总体抽样的分布规律3.4.3二项总体的抽样分布62西南科技大学生命科学与工程学院周海廷制作3.4抽样分布3.4.1统计数的抽样分布及其分布参3.4.1统计数的抽样分布及其分布参数前面我们谈到总体的参数是无法得到的,需要用样本的统计数进行估计。用统计数估计总体的相应参数,首先必须知道统计数与参数的关系,即要弄清楚总体和样本的关系。通过本节抽样分布的讨论,目的就是要搞清楚从总体中抽出所有可能的样本统计量的分布与原总体之间的关系。63西南科技大学生命科学与工程学院周海廷制作3.4.1统计数的抽样分布及其分布参数前面我们谈到总体的总体随机样本1234……无穷多个样本总体和样本的关系示意图64西南科技大学生命科学与工程学院周海廷制作总体随机样本1234……无穷多个样本总体和样本的关系示意图6一、样本平均数的抽样及其分布如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到Nn个样本。每个样本可以计算一个平均数,这样就得到许多平均数,如果将这些平均数集合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为平均数的抽样分布。65西南科技大学生命科学与工程学院周海廷制作一、样本平均数的抽样及其分布65西南科技大学生命科学与工程学下面用一个抽样实验进一步说明样本平均数的抽样分布及其分布的参数。假定用一个很小的总体N=3,其观察值为2、4、6以样本容量n=2从中进行抽样。首先计算出总体参数:
μ=(2+4+6)/3=4σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3所有可能的样本数=Nn=32=966西南科技大学生命科学与工程学院周海廷制作下面用一个抽样实验进一步说明样本平均数的抽样分布及其分布的参总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表第一个观察值第二个观察值样本∑(y)s2s222242000.0000242463121.4142262684482.8284424263121.4142444484000.00004646105121.4142626284482.82846464105121.41426666126000.0000总和7236122411.313667西南科技大学生命科学与工程学院周海廷制作总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表从表中我们可以算出样本平均数的平均数:以自由度为除数的样本方差的平均数:以样本容量为除数的样本方差的平均数:68西南科技大学生命科学与工程学院周海廷制作从表中我们可以算出以自由度为除数的样本方差的平均数:以样本容样本标准差s的平均数:在统计上,如果所有可能样本的某一统计数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值(unbiasedestimate)1、是μ的无偏估计值。2、s2是σ2的无偏估计值69西南科技大学生命科学与工程学院周海廷制作样本标准差s的平均数:在统计上,如果所有可能样本的某一统计数3、以n为除数的样本方差不是σ2的无偏估计值。4、s不是σ的无偏估计值。再以样本容量n=4,n=8从上述总体中抽样,并将抽出的全部样本列入表4.6(P67)根据表4.6,可算得n=2时样本平均数分布的平均数为:70西南科技大学生命科学与工程学院周海廷制作3、以n为除数的样本方差不是σ2的无偏估计值。再以样本平均数分布的方差为:同样,可算得n=4时:71西南科技大学生命科学与工程学院周海廷制作样本平均数分布的方差为:同样,可算得n=4时:71西南科技大当n=8时:72西南科技大学生命科学与工程学院周海廷制作当n=8时:72西南科技大学生命科学与工程学院周海廷制作不同样本容量的平均数的抽样分布形状为:抽样误差的概念:称为标准误。抽样误差的度量:73西南科技大学生命科学与工程学院周海廷制作不同样本容量的平均数的抽样分布形状为:抽样误差的概念:称为标n=1fyfn=2yfn=4yfn=8y74西南科技大学生命科学与工程学院周海廷制作n=1fyfn=2yfn=4yfn=8y74西南科技大学生命二、样本总和数的抽样及其分布参数样本总和数(用Σy代表)的抽样分布参数与母总体间存在如下关系:1、该抽样分布的平均数μΣy与母总体平均数间的关系为:
μΣy=nμ。75西南科技大学生命科学与工程学院周海廷制作二、样本总和数的抽样及其分布参数75西南科技大学生命科学与工2、该抽样分布的方差μΣy与母总体方差间的关系为:76西南科技大学生命科学与工程学院周海廷制作2、该抽样分布的方差μΣy与母总体方差间的关系为:76西南科三、两个独立随机样本平均数差数的抽样分布及其分布参数我们用一个例子来阐述这一问题。假定第一个总体包括3个观察值,2、4、6(N1=3,n1=2)所有样本数为Nn=32=9,总体的平均数和方差μ1=4,σ21=8/3。77西南科技大学生命科学与工程学院周海廷制作三、两个独立随机样本平均数差数的抽样分布及其分布参数77西南第二个总体包括2个观察值,3和6(N2=2),抽出的样本容量为3(n2=3),所有样本的个数为23=8,总体平均数和方差μ2=4.5,σ22=2.2578西南科技大学生命科学与工程学院周海廷制作第二个总体包括2个观察值,3和6(N2=2),抽出的样本容ff213132434353526162总和9总和8从两个总体抽出的样本平均数的次数分布表79西南科技大学生命科学与工程学院周海廷制作ff213132434353526162总和9总和8从两个总22223333444455556666总和34563456345634563456--1-2-3-40-1-2-310-1-2210-13210f1331266239932662133172样本平均数差数的次数分布表80西南科技大学生命科学与工程学院周海廷制作22223333444455556666总和34563456
ff(
)(+0.5)(+0.5)2f(+0.5)2-41-4-3.512.2512.25-35-15-2.56.2531.25-212-24-1.52.2527.00-118-18-0.50.254.5001800.50.254.50112121.52.2527.0025102.56.2531.253133.512.2512.25总72-36150.00-样本平均数差数分布的平均数和方差计算表-----81西南科技大学生命科学与工程学院周海廷制作ff()(由上表可算得:而:82西南科技大学生命科学与工程学院周海廷制作由上表可算得:而:82西南科技大学生命科学与工程学院周海廷制3.4.2正态总体抽样的分布规律一、样本平均数的分布1、从正态总体抽取的样本,无论样本容量多大,其样本平均数的抽样分布必做成正态分布,具有平均数和方差记作N(μ,σ2/n)。83西南科技大学生命科学与工程学院周海廷制作3.4.2正态总体抽样的分布规律一、样本平均数的分布832、若母总体不是正态分布,从中抽出的分布不一定属于正态分布,但当样本容量n增大时,从这总体抽出样本平均数的抽样分布趋于正态分布,具有平均数μ和方差σ2/n。这称之为中心极限定理。84西南科技大学生命科学与工程学院周海廷制作2、若母总体不是正态分布,从中抽出的分布不一定属于正下面是不同样本容量的抽样分布0.00.20.40.81.01.21230-1-2-3fN
(
)n=9n=4n=185西南科技大学生命科学与工程学院周海廷制作下面是不同样本容量的抽样分布0.00.20.40.81.01二、两个独立样本平均数差数的分布1、如果两个总体各作正态分布,则其样本平均数差数准确地遵循正态分布,无论样本容量大小都有。-86西南科技大学生命科学与工程学院周海廷制作二、两个独立样本平均数差数的分布-86西南科技大学生命科学与2、两个样本平均数差数的平均数等于两个总体平均数的差数。3、两个独立的样本平均数差数分布的方差等于两个总体的样本平均数的方差总和。87西南科技大学生命科学与工程学院周海廷制作2、两个样本平均数差数的平均数等于两个总体平均数的差数。873.4.3二项总体的抽样分布一、二项总体的分布参数以一个含有5个个体的总体为例进行说明,设这5个观察值为:0,1,0,1,1,则总体平均数和方差为:μ=(0+1+0+1+1)/5=3/5=0.688西南科技大学生命科学与工程学院周海廷制作3.4.3二项总体的抽样分布一、二项总体的分布参数88西σ2=[(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2+(1-0.6)2]/5=0.24σ=0.49在这个二项总体中1事件的概率p=3/5=0.6,0事件的概率q=2/5=0.4由此可见:二项总体的平均数为μ=0.6=p,方差为σ2=0.24=0.6×0.4=pq。89西南科技大学生命科学与工程学院周海廷制作σ2=[(0-0.6)2+(1-0.6)2+(0-0.6)2,标准误三、样本总和数(次数)的抽样分布,标准误平均数,方差平均数,方差二、样本平均数(成数)的抽样分布90西南科技大学生命科学与工程学院周海廷制作,标准误三、样本总和数(次数)的抽样分布,标准误平均数,方差第三章理论分布与抽样分布91西南科技大学生命科学与工程学院周海廷制作第三章1西南科技大学生命科学与工程学院周海廷制作3.1
事件、概率和随机变量3.1.1事件和事件发生的概率3.1.2事件间的关系3.1.3计算事件概率的法则3.1.4随机变量92西南科技大学生命科学与工程学院周海廷制作3.1事件、概率和随机变量3.1.1事件和事件发生3.1.1事件和事件发生的概率事件(event):在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件。概率(probability):每一事件出现的可能性,称为该事件的概率。随机事件(randomevent):若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件。93西南科技大学生命科学与工程学院周海廷制作3.1.1事件和事件发生的概率事件(event):在自然要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大量的实验中才能观察到。下面用棉田发生盲椿象为害的情况来说明这一问题。调查株数(n)受害株数(a)受害频率(a/n)52.402512.485015.3010033.3320072.36500177.3541000351.3511500525.3502000704.35294西南科技大学生命科学与工程学院周海廷制作要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公式表示为:式中P代表概率,P(A)代表事件A的概率。P(A)的取集范围为:0≤P(A)≤1。随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。95西南科技大学生命科学与工程学院周海廷制作统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公小概率原理:若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率实际不可能性原理,简称小概率原理。必然事件:对于一类事件来说,如在同一组条件的实现之下必然要发生的事件。不可能事件:如果在同一组条件下必然不发生的事件。96西南科技大学生命科学与工程学院周海廷制作小概率原理:若事件A发生的概率较小,如小于0.05或0.013.1.2事件间的关系一、和事件事件A和事件B至少有一个发生构成的新事件称为事件A和事件B的和事件,记为A+B,读作“或A发生,或B发生”。例如测定棉花的纤维长度,以<28毫米为事件A,28至30毫米为事件B,则抽取一根≤30毫米的这一新事件为A+B。97西南科技大学生命科学与工程学院周海廷制作3.1.2事件间的关系一、和事件7西南科技大学生命科学与二、积事件事件A和B同时发生而构成的新事件,称为事件A和B的积事件,记为AB,读作“A和B同时发生或相续发生”。例如某小麦品种,以发生锈病为事件A,发生白粉病为事件B,则锈病和白粉病同时发生这一新事件为AB。98西南科技大学生命科学与工程学院周海廷制作二、积事件8西南科技大学生命科学与工程学院周海廷制作三、互斥事件如果事件A和B不能同时发生,即A和B是不可能事件,则称事件A和B互斥。例如棉花纤维长度“<28毫米”和“等于28毫米”不可能同时发生,为互斥事件。99西南科技大学生命科学与工程学院周海廷制作三、互斥事件9西南科技大学生命科学与工程学院周海廷制作四、对立事件事件A和B不可能同时发生,但必发生其一,即A+B为必然事件(记为A+B=U),AB为不可能事件(记为A·B=V),则称事件B为事件A的对立事件,并记B为例如,有一袋种子,按种皮分黄色和白色,事件A为“取到黄色”,事件B为“取到白色”,A与B不能同时发生,但是,任意取一粒种子,其皮色不是黄色就是白色,即A和B必发生其一,因此A和B互为对立事件。100西南科技大学生命科学与工程学院周海廷制作四、对立事件10西南科技大学生命科学与工程学院周海廷制作五、完全事件系若事件A1、A2、···An两两互斥,且每次试验结果必发生其一,则称A1、A2、···An为完全事件系。例如对于棉花纤维长度,<28毫米、≥28毫米和<30毫米、≥30毫米均构成了完全事件系。101西南科技大学生命科学与工程学院周海廷制作五、完全事件系11西南科技大学生命科学与工程学院周海廷制作六、事件的独立性若事件A发生与否不影响B发生的可能性,则称事件A和事件B相互独立。例如,事件A为“花的颜色为黄色”,事件B为“产量高”,显然如果花的颜色与产量无关,则事件A和B相互独立。102西南科技大学生命科学与工程学院周海廷制作六、事件的独立性12西南科技大学生命科学与工程学院周海廷制作3.1.3计算事件概率的法则一、互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B),则
P(A+B)=P(A)+P(B)例如:荣昌猪的每胎产仔数≤9头的概率P(A)=0.65,为10头的概率P(B)=0.18,则每胎产仔≤10头的概率为:P(A+B)=P(A)+P(B)=0.65+0.18=0.83103西南科技大学生命科学与工程学院周海廷制作3.1.3计算事件概率的法则一、互斥事件的加法13西南科二、独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则:
P(AB)=P(A)P(B)例:现有4粒种子,其中3粒是黄色、1粒是白色,采用复置抽样。试求下列两事件的概率(1)第一次抽到黄色,第二次抽到白色;(2)两次都抽到黄色。104西南科技大学生命科学与工程学院周海廷制作二、独立事件的乘法14西南科技大学生命科学与工程学院周海廷制先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概率为1/4=0.25.P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.75×0.25=0.1875P(B)=P(第一次抽到黄色种子)P(第二次抽到黄色种子)=0.75×0.75=0.5625105西南科技大学生命科学与工程学院周海廷制作先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概三、对立事件的概率若事件A的概率为P(A),那么其对立事件的概率为:
P()=1-P(A)四、完全事件系的概率例如上例,黄色种子和白色种子构成完全事件系,其概率为1。106西南科技大学生命科学与工程学院周海廷制作三、对立事件的概率16西南科技大学生命科学与工程学院周海廷制五、非独立事件的乘法P(AB)=P(A)P(B|A)107西南科技大学生命科学与工程学院周海廷制作五、非独立事件的乘法17西南科技大学生命科学与工程学院周海廷3.1.4随机变量定义:随机变量是指随机变数所取的某一个实数值。例如:在抛硬币试验中,币值面向上的用数“1”表示,国徽面向上的用“0”表示。把0,1作为变量y的取值。
P(y=1)=0.5P(y=0)=0.5108西南科技大学生命科学与工程学院周海廷制作3.1.4随机变量定义:随机变量是指随机变数所取的某一个一、离散型随机变量变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量的所有可能取值及其对应的概率一一列出所形成的分布,称为离散型随机变量的概率分布:变量yi
y1
y2
y3…yn概率P(y=yi)P1
P2
P3…Pn109西南科技大学生命科学与工程学院周海廷制作一、离散型随机变量19西南科技大学生命科学与工程学院周海廷制二、连续型随机变量变量y的取值仅为一范围,且y在该范围内取值时,其概率是确定的,这种类型的变量称为连续型随机变量(continuousrandomvariate)。式中,f(y)称为y的概率密度函数(probabilitydensityfunction)或分布密度(distributiondensity)110西南科技大学生命科学与工程学院周海廷制作二、连续型随机变量式中,f(y)称为y的概率密度函数(pro随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应概率于其对应的,这就是所要研究和掌握的规律,这个规律称为随机变量的概率分布。111西南科技大学生命科学与工程学院周海廷制作随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应3.2
二项式分布3.2.1二项总体与二项式分布3.2.2二项式分布的概率计算方法3.2.3二项式分布的形状和参数3.2.4多项式分布3.2.5泊松分布—二项分布的一种极限分布112西南科技大学生命科学与工程学院周海廷制作3.2二项式分布3.2.1二项总体与二项式分布3.3.2.1二项总体与二项式分布有些总体的各个个体的某些性状,只能发生非此即彼的两种结果,“此”和“彼”是对立事件。例如种子的发芽与不发芽,施药后害虫的死或活,产品的合格与不合格。这种由非此及彼事件构成的总体,称之为二项总体(binomialpopulation)。113西南科技大学生命科学与工程学院周海廷制作3.2.1二项总体与二项式分布有些总体的各个个体的为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”事件以变量“0”,具概率q其概率关系为:
p+q=1q-1=p如果我们每次抽取0、1总体的n个个体,则所得变量y将可能有0,1,…n,共n+1种。这n+1变量有它各自的概率而组成一个分布。这个分布叫做二项概率分布,简称二项分布(binomialdistribution)。114西南科技大学生命科学与工程学院周海廷制作为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”为1。如果每次观察5只,则观察的结果将有0(5只全死)、1(4死1活)、2(3死2活)、3(2死3活)、4(1死4活)、5(5只全活),共6种变量。由这6种变量的相应概率组成的分布,就是n=5时活虫数的二项分布。115西南科技大学生命科学与工程学院周海廷制作例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”3.2.2二项式分布的概率计算方法下面用一个例子来讲解这一问题。红花豌豆和白花豌豆杂交,F2代出现红花的概率为p=3/4,出现白花的概率为q=1/4。如果将F1代种子成行种植,每行种4粒。问一行全是红花、三株红花、二株红花、一株红花、0红花的概率各是多少。116西南科技大学生命科学与工程学院周海廷制作3.2.2二项式分布的概率计算方法下面用一个例子来讲解这这实际上是以n=4,从p=3/4,q=1/4的二项总体中抽样构成二项分布的问题。为方便,以“1”代表出现红花的事件,“0”代表出现白花的事件。117西南科技大学生命科学与工程学院周海廷制作这实际上是以n=4,从p=3/4,q=1/4的二项总体中抽红花数组合数xf(x)4红3红2红1红0红(1,1,1,1)4P(x=4)=1p4=0.754=0.3164(1,1,1,0)(1,1,0,1)(1,0,1,1)(0,1,1,1)3P(x=3)=4p3q1=4×0.753×0.25=0.4219(1,1,0,0)(1,0,1,0)(1,0,0,1)(0,1,1,0)(0,1,0,1)(0,0,1,1)2P(x=2)=6p2q2=6×0.752×0.252=0.2109(1,0,0,0)(0,1,0,0)(0,0,1,0)(0,0,0,1)1P(x=1)=4p1q3=4×0.75×0.253=0.0409(0,0,0,0)0P(x=0)=1q4=0.254=0.0039118西南科技大学生命科学与工程学院周海廷制作红花数组合数xf(x)4红3红2红1红0红(1,1,1,1)上例各项的概率相当于(p+q)4的展开:(p+q)4=p4+4p3q+6p2q2+4pq3+q4同理,以样本容量为n进行的抽样,得到的概率分布为(p+q)n的展开。每一项的系数为:(0≤k≤n)119西南科技大学生命科学与工程学院周海廷制作上例各项的概率相当于(p+q)4的展开:(0≤k≤n)29西计算二项分布任何一项概率的通式为:例4.2某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少?120西南科技大学生命科学与工程学院周海廷制作计算二项分布任何一项概率的通式为:例4.28头愈好,2头死去的概率为:7头愈好,3头死去的概率为:121西南科技大学生命科学与工程学院周海廷制作8头愈好,2头死去的概率为:7头愈好,3头死去的概率为:319头愈好,1头死去的概率为:10头全部愈好的概率为:若计算10头中不超过2头死去的概率为多少?则应该应用累积概率,即:122西南科技大学生命科学与工程学院周海廷制作9头愈好,1头死去的概率为:10头全部愈好的概率为:若计算13.2.3二项式分布的形状和参数一、形状P=0.35,n=5的概率分布图123西南科技大学生命科学与工程学院周海廷制作3.2.3二项式分布的形状和参数一、形状P=0.35,(p=0.5,n=5)的概率分布图124西南科技大学生命科学与工程学院周海廷制作(p=0.5,n=5)的概率分布图34西南科技大学生命科学与当p=q时。二项分布呈对称形状,如p≠q,则表现偏斜形状。但从理论和实践检验,当n很大时即使p≠q,它也接近对称形状。所以这一理论分布是由n和p两个参数决定的。二、参数凡描述一个总体,平均数和方差(或标准差)两个参数是重要的。二项总体,其平均数μ、方差σ2和标准差σ为:
μ=np,σ2=npqσ=125西南科技大学生命科学与工程学院周海廷制作当p=q时。二项分布呈对称形状,如p≠q,则表现偏斜形状。但3.2.4多项式分布若总体内包含几种特性或分类标志,可以将总体中的个体分为几类,例如在给某一人群使用一种新药,可能有好的疗效,有的没有疗效,而另有疗效为副作用的,象这种将变数资料分为3类或多类的总体称为多项总体,研究其随机变量的概率分布可使用多项式分布(multinomialdistribution)。126西南科技大学生命科学与工程学院周海廷制作3.2.4多项式分布若总体内包含几种特性或分类标志,可以设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、…、pk,显然p1+p2+p3+…+pk=1。若从这个总体随机抽取n个个体,那么可能得到这k项的个数分别为y1、y2、y3、…、yk,而y1
+y2
+y3
+…+yk
=n。其事件的概率为:这一概率分布称为多项式分布。127西南科技大学生命科学与工程学院周海廷制作设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、例4.3某药对病人有效的概率为1/2,对病人无效的概率为1/3,有副作用的概率为1/6,若随机抽取2个使用该药的病人,那么我们的结果可能包括这样几种事件:2个病人有副作用;一个无效、一个有副作用;两个无效;一个有效、一个有副作用;一个有效、一个无效;两个均有效。试计算出现这些事件的概率。128西南科技大学生命科学与工程学院周海廷制作例4.3某药对病人有效的概率为1/2,对病人无效的概率为1解:分别用y1、y2、y3分别代表用药有效的个体数、用药无效的个体数和用药有副作用的个体数。这些事件的概率的计算见下表:129西南科技大学生命科学与工程学院周海廷制作解:39西南科技大学生命科学与工程学院周海廷制作变量(y1、y2、y3)概率及其计算P(y1、y2、y3)(0,0,2)(0,1,1)(0,2,0)(1,0,1)(1,1,0)(2,0,0)130西南科技大学生命科学与工程学院周海廷制作变量概率及其计算(0,0,2)(0,1,1)(0,2,0)(3.2.5泊松分布—二项分布的一种极限分布应用二项分布时,有时会遇到一个概率p或q很小的值,例如小于0.1,另一方面n又相当大,这样二项分布必将为另一分布所接近,或者为一极限分布。这种分布称为泊松概率分布,简称泊松分布(Poissondistribution)。如将np=m,则接近分布如下式:y=0,1,2,…,∞131西南科技大学生命科学与工程学院周海廷制作3.2.5泊松分布—二项分布的一种极限分布应用二项分凡在观察次数n(n相当大)中,某一事件出现的平均次数m(m是一个定值)很小,那么,这一事件出现的次数将符合泊松分布。泊松分布在生物学研究中是经常遇到的,例如,昆虫与植物种类在一定面积的分布,病菌侵害作物的分布,一个显微镜视野内的细菌计数以及原子衰变的规律等随机变数。泊松分布的平均数、方差和标准差为:132西南科技大学生命科学与工程学院周海廷制作凡在观察次数n(n相当大)中,某一事件出现的平均次数m(3.3
正态分布3.3.1二项分布的极限—正态分布3.3.2正态分布曲线的特性3.3.3计算正态分布曲线区间概率的方法133西南科技大学生命科学与工程学院周海廷制作3.3正态分布3.3.1二项分布的极限—正态分布33.3.1二项分布的极限—正态分布P=0.5,n=5的二项分布134西南科技大学生命科学与工程学院周海廷制作3.3.1二项分布的极限—正态分布P=0.5,n=5的二p=0.5,n=20的二项分布135西南科技大学生命科学与工程学院周海廷制作p=0.5,n=20的二项分布45西南科技大学生命科学与工程从图中看出,若n→∞,每个组的直方形都一一变为纵轴线,连接的直线也一一变成点了。这时多边形折线应表现为一个光滑的曲线,在数学意义上它是一个二项分布的极限曲线。这一曲线称之为正态分布曲线或正态概率曲线。其概率密度函数为:136西南科技大学生命科学与工程学院周海廷制作从图中看出,若n→∞,每个组的直方形都一一变为纵轴线,连接的3.3.2正态分布曲线的特性1、以y=μ为对称轴,向左右两侧作对称分布,其算术平均数、中数、众数相等,均在μ点上。2、正态分布曲线由参数μ和σ决定,所以它是曲线簇而不是单一的曲线。137西南科技大学生命科学与工程学院周海廷制作3.3.2正态分布曲线的特性1、以y=μ为对称轴,向左右μ
1μ2μ30.00.10.20.30.40.5012345-1-2-3-4f(y)y0.00.10.20.30.40.5012345-1-2-3-4f(y)yσ=1σ=1.5σ=2138西南科技大学生命科学与工程学院周海廷制作μ1μ2μ30.00.10.20.30.40.5012343、正态分布资料的分布表现为多数次数位于算术平均数μ附近,在|y-μ|≥3σ以上其次数极少,在实际应用中,y通常在±3σ范围之内取值,这就是6σ法则。0.00.10.20.30.40.5012345-1-2-3-4f(y)y68.27%95.45%99.73%139西南科技大学生命科学与工程学院周海廷制作3、正态分布资料的分布表现为多数次数位于算术平均数μ附近,在4、正态曲线在|y-μ|=1σ处有拐点,并以横轴为渐进线,因此曲线全距从-∞到+∞。5、正态曲线与横轴之间的面积等于1,因此曲线下横轴的任何定值,等于介于这两个面积占总面积的成数。下面是几组常用值:
μ±1σ概率=0.6827μ±2σ概率=0.9545μ±3σ概率=0.9973μ±1.960σ概率=0.9500μ±2.576σ概率=0.9900140西南科技大学生命科学与工程学院周海廷制作4、正态曲线在|y-μ|=1σ处有拐点,并以横轴为渐进线3.3.3计算正态分布曲线区间概率的方法在正态分布曲线下,y的定值从y=a到y=b间的概率可用曲线区间的面积表示:计算曲线下从-∞到y0的面积,公式如下:FN(y)称为正态分布的累积函数。141西南科技大学生命科学与工程学院周海廷制作3.3.3计算正态分布曲线区间概率的方法在正态分布曲线下142西南科技大学生命科学与工程学院周海廷制作52西南科技大学生命科学与工程学院周海廷制作为了便于使用,通常是将正态分布±3σ分成很小的距离单位,比如0.01,进行积分,然后制成概率分布表。使用者只需查表,而无需进行复杂的积分运算。一个首先需要解决的问题是,正态分布是一个曲线簇,而非单一的曲线,用曲线簇进行制表几乎是无法完成的事情。因此要设法将其转化为一条曲线。143西南科技大学生命科学与工程学院周海廷制作为了便于使用,通常是将正态分布±3σ分成很小的距离单位,比由于正态曲线受μ和σ的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去μ和σ的影响。假定新变数用u来表示,则:144西南科技大学生命科学与工程学院周海廷制作由于正态曲线受μ和σ的制约,曲线随这两个参数的变化而改变。5u称为正态离差,由之可将正态方程标准化为:上式为标准化正态分布方程,它是参数μ=0,σ2=1时的正态分布,记作N(0,1)。145西南科技大学生命科学与工程学院周海廷制作u称为正态离差,由之可将正态方程标准化为:上式为标准化正态分有了标准曲线之后,就可以将y值从-3到3范围内的FN(y)的值,以0.01的间隔列于附表2(P357)。计算一定区间的概率值,只要查表就可以了。例4.4假定y是一随机变数具有正态分布,平均数μ=30,标准差σ=5,试计算小于26,小于40的概率,介于26和40区间的概率以及大于40的概率。146西南科技大学生命科学与工程学院周海廷制作有了标准曲线之后,就可以将y值从-3到3范围内的FN(y)的首先计算:P(y≤26)=FN(26)
先将y转换成u值:u=(y-μ)/σ=(26-30)/5=-0.8查附表2,当u=-0.8时FN(26)=0.2119同样计算:P(y≤40)=FN(40)u=(y-μ)/σ=(40-30)/5=2.0查附表2,当u=2.0时FN(40)=0.9773计算:P(26<y≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654147西南科技大学生命科学与工程学院周海廷制作首先计算:P(y≤26)=FN(26)57西南科技大学生命计算:P(y>40)=1-P(y≤40)=1-0.973=0.02270.0000.0040.0080.0120.0160.0203035404525201510fN
(y)yP(y<26)=0.21190.0000.0040.0080.0120.0160.0203035404525201510fN
(y)yP(y<40)=0.9773148西南科技大学生命科学与工程学院周海廷制作计算:P(y>40)=1-P(y≤40)=1-0.973=00.0000.0040.0080.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025工厂员工安全培训考试试题及答案考题
- 25年企业员工安全培训考试试题及参考答案(基础题)
- 2025企业员工岗前安全培训考试试题含完整答案(易错题)
- 2024-2025全员安全培训考试试题附答案【培优A卷】
- 25年公司厂级员工安全培训考试试题【综合题】
- 2025年企业管理人员安全培训考试试题【必考】
- 2024-2025安全管理员安全培训考试试题附答案(综合卷)
- 2024-2025新员工入职安全培训考试试题及答案全套
- 初中英语教师教学技能大赛 说题 读写综合 课件
- 2025至2031年中国电话交换机行业投资前景及策略咨询研究报告
- 用工单位与劳务派遣公司合同
- 我的家乡浙江衢州
- 国家开放大学国开电大《儿童心理学》形考任务+大作业答案
- 股骨下端骨折的临床特征
- 学校食堂蔬菜配送合同范本
- 建筑物外墙广告牌拆除方案
- 2024高考物理一轮复习第66讲分子动理论内能(练习)(学生版+解析)
- 辅警考试公安基础知识考试试题库及答案
- TWJQMA 010-2024 露地甜瓜改良式滴灌栽培技术
- 8推翻帝制 民族觉醒 (第三课时)教学设计-五年级下册道德与法治
- 2024年北京东城区中考一模数学试题(含答案解析)
评论
0/150
提交评论