田间试验与统计方法理论分布和抽样分布PPT学习教案_第1页
田间试验与统计方法理论分布和抽样分布PPT学习教案_第2页
田间试验与统计方法理论分布和抽样分布PPT学习教案_第3页
田间试验与统计方法理论分布和抽样分布PPT学习教案_第4页
田间试验与统计方法理论分布和抽样分布PPT学习教案_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1 田间试验与统计方法理论分布和抽样分田间试验与统计方法理论分布和抽样分 布布 必然现象必然现象(inevitable phenomena)或或确定性现象确定性现象(definite phenomena):): 结果可预言,确定的,必然的,可重复结果可预言,确定的,必然的,可重复 例,标准大气压下,水加热到例,标准大气压下,水加热到100C必然沸腾必然沸腾 随机现象随机现象(random phenomena )或或不确定性现象不确定性现象(indefinite phenomena):): 结果事前不可预言,呈偶然性、不确定性结果事前不可预言,呈偶然性、不确定性 例,种子发芽,抛硬币例,种

2、子发芽,抛硬币 第1页/共87页 第2页/共87页 第3页/共87页 第4页/共87页 第5页/共87页 第6页/共87页 第7页/共87页 第8页/共87页 积事积事 件件AB 和事件和事件A+B A B AB 互斥事件互斥事件 对立事件对立事件 AB A+B, “或或A发生,或发生,或B发生发生”。 AB, “A和和B同时发生或相继发生同时发生或相继发生” AB=V,事件,事件A和B互斥或互不相容互斥或互不相容 A+B=U,AB=V,事件,事件B为事件为事件A的对立事件,并记的对立事件,并记B为为 A 事件间的关系 第9页/共87页 第10页/共87页 英国数学家皮尔逊做英国数学家皮尔逊做

3、24000次抛硬币试验次抛硬币试验 正面向上正面向上12012 次次 频率频率 = 随着试验次数的增多,正面朝上的频率越来越接近随着试验次数的增多,正面朝上的频率越来越接近0.5. 5005. 0 24000 12012 二、概率二、概率 第11页/共87页 例,例, 表表 在相同条件下盲蝽象在某棉田危害程度的调查结果在相同条件下盲蝽象在某棉田危害程度的调查结果 调查株数调查株数 (n) 52550100200500100015002000 受害株数受害株数 (a) 21215 33 72177 351 525 704 棉株受害棉株受害 频率频率(a/n) 0.400.480.300.330.

4、360.354 0.351 0.350 0.352 调查株数调查株数n较多时的稳定频率才能较好地代表棉株受害的可能性较多时的稳定频率才能较好地代表棉株受害的可能性 第12页/共87页 统计学上用统计学上用n较大时稳定的较大时稳定的p近似代表概率。通过大量实验而近似代表概率。通过大量实验而 估计的概率称为估计的概率称为实验概率或统计概率实验概率或统计概率,以,以 表示。表示。 此处此处P代表概率,代表概率,P(A)代表事件代表事件A的概率,的概率,P(A)变化的范围为变化的范围为 01,即,即0P(A)1。 naP n limA )( 第13页/共87页 第14页/共87页 例,在例,在1、2、

5、3、20这这20个数字中随机抽取个数字中随机抽取1个个 ,求下列事件的概率,求下列事件的概率 (1)A“抽得抽得1个数字小于个数字小于5” (2)B=“抽得抽得1个数字是个数字是2的倍数的倍数” 第15页/共87页 小概率事件小概率事件-随机事件的概率表示随机事件在试验中出现的随机事件的概率表示随机事件在试验中出现的 可能性大小。随机事件的概率很小如,小于可能性大小。随机事件的概率很小如,小于0.05或或0.01或 0.001 小概率原理小概率原理-统计学上,把小概率事件在一次试验中看成是统计学上,把小概率事件在一次试验中看成是 实际不可能发生的事件,称为小概率事件实际不可能性原理,实际不可能

6、发生的事件,称为小概率事件实际不可能性原理, 简称小概率原理。简称小概率原理。 这里的这里的0.05或或0.01称为小概率标准,农业试验研究中通常使用称为小概率标准,农业试验研究中通常使用 这两个小概率标准。这两个小概率标准。 小概率事件实际不可能性原理是统计学上进行小概率事件实际不可能性原理是统计学上进行假设检验(显著假设检验(显著 性检验)的基本依据性检验)的基本依据。 (三)(三) 小概率事件实际不可能性原理小概率事件实际不可能性原理 第16页/共87页 (四)(四) 概率的性质概率的性质 第17页/共87页 第二节第二节 概率分布概率分布 (probability distributi

7、on) 一、随机变量一、随机变量 二、概率分布二、概率分布 第18页/共87页 一、随机变量一、随机变量(random variable) 随机变量随机变量是指随机变数所取的某一个实数值。表示随机现象是指随机变数所取的某一个实数值。表示随机现象 结果的变量结果的变量,也就是在随机试验中被测定的量,所取得的值称也就是在随机试验中被测定的量,所取得的值称 为观察值。为观察值。 例例1:抛硬币试验,两种结果:抛硬币试验,两种结果: 用数用数“1”表示表示“币值面向上币值面向上”, “0”表示表示“国徽国徽 面向上面向上” 把把 0,1作为变量作为变量y的取值的取值 可以简单地把抛硬币试验用取值为可以

8、简单地把抛硬币试验用取值为0,1的变量来表示:的变量来表示: P(y=1)=0.5,P(y=0)=0.5 第19页/共87页 例例2:用:用“1”表示表示“能发芽种子能发芽种子”,其概率为,其概率为p;用;用 “0”表示表示“不能发芽种子不能发芽种子”,其概率为,其概率为q。 显然显然 p+q=1, 则则 P(y=1)=p,P(y=0)=q=1p。 第20页/共87页 例例3:用变量:用变量y表示水稻产量,若表示水稻产量,若y大于大于500kg的概率为的概率为 0.25,大于,大于300kg且等于小于且等于小于500kg的概率为的概率为0.65,等于,等于 小于小于300kg的概率为的概率为0

9、.1。 则用变量则用变量y的取值范围来表示的试验结果为的取值范围来表示的试验结果为 P(y300)=0.10, P(300y500)=0.65, P(y500)=0.25。 第21页/共87页 随机变量随机变量 离散型离散型连续型连续型 (与我们前面所讲的连续型数据和离散型数据的意义一样)(与我们前面所讲的连续型数据和离散型数据的意义一样) 第22页/共87页 (一)(一) 离散型随机变量离散型随机变量 -当试验只有几个确定的结果,并当试验只有几个确定的结果,并 可一一列出,变量可一一列出,变量y的取值可用实数表示,且的取值可用实数表示,且y取某一值时,取某一值时, 其概率是确定的,这种类型的

10、变量称为离散型随机变量。其概率是确定的,这种类型的变量称为离散型随机变量。 将这种变量的所有可能取值及其对应概率一一列出所形成将这种变量的所有可能取值及其对应概率一一列出所形成 的分布称为离散型随机变量的概率分布:的分布称为离散型随机变量的概率分布: 概率概率)( i yyP 变量变量yiy1y2y3yn P1P2P3Pn 也可用函数也可用函数f(y)表述,称为表述,称为概率函数概率函数。)( i yyP 第23页/共87页 前面例前面例1、例、例2中的中的y就是离散型随机变量,将其可能取值与对应就是离散型随机变量,将其可能取值与对应 概率一一列出,即为:概率一一列出,即为: 变量变量y01

11、概率概率0.50.5 )( i yyP 变量变量y01 概率概率qp )( i yyP 第24页/共87页 图图 离散型随机变量概率分布图离散型随机变量概率分布图 X x1 x2 x3 xn Pi p1 p2 p3 pn 第25页/共87页 0 )()()( 00 xx i i xXPxpxF 第26页/共87页 xp(x) 0 1 2 3 4 5 0.583752367 0.339390911 0.070218809 0.006383528 0.000251038 0.000003347 概概率率分分布布图图 0 0 0 0. .1 1 0 0. .2 2 0 0. .3 3 0 0. .4

12、 4 0 0. .5 5 0 0. .6 6 0 0. .7 7 0 01 12 23 34 45 5 分分布布函函数数图图 0 0 0 0. .2 2 0 0. .4 4 0 0. .6 6 0 0. .8 8 1 1 0 01 12 23 34 45 5 xF(x) 0 1 2 3 4 5 0.583752367 0.923143278 0.993362077 0.999745605 0.999996653 1.000000000 第27页/共87页 (二)(二)连续型随机变量连续型随机变量(continuous random variate) - 对于随机变量,若存在非负可积函数对于随机

13、变量,若存在非负可积函数f(y)(y ),对任意,对任意a和和b (ab)都有都有P(ayb)= , 则则 称称y为为连续型随机变量连续型随机变量(continuous random variate), f(y)称为称为y的的概率密度函数概率密度函数(probability density function)或或分布密度分布密度(distribution density)。 b a dyyf)( 上述例上述例3中的中的y就是一个连续型随机变量。就是一个连续型随机变量。 第28页/共87页 X ab dxxfbXaP b a )( 0 0 x o dx)x(f)xX(P)x(F 第29页/共87

14、页 概率密度函数图概率密度函数图 概率分布函数图概率分布函数图 或或 或或 概率分布曲线概率分布曲线 累积分布函数图累积分布函数图 yp(x) y F(x) x1x2 x2x1 P(x1xx2)=F(x2)F(x1) 第30页/共87页 c c dxxfcxP0)()( 第31页/共87页 第三节第三节 二项式分布二项式分布 一、二项总体及二项式分布一、二项总体及二项式分布 二、二项式分布的概率计算方法二、二项式分布的概率计算方法 三、二项式分布的形状和参数三、二项式分布的形状和参数 四、多项式分布四、多项式分布 第32页/共87页 一、二项总体及二项式分布一、二项总体及二项式分布 二项总体二

15、项总体(binary population),就是非此即彼的两项构成的总,就是非此即彼的两项构成的总 体体 例:例:小麦种子发芽和不发芽,小麦种子发芽和不发芽, 大豆子叶色为黄色和青色,大豆子叶色为黄色和青色, 调查棉田危害分为受害株和不受害株等等。调查棉田危害分为受害株和不受害株等等。 通常将二项总体中的通常将二项总体中的“此此”事件以变量事件以变量“1”表示,具概率表示,具概率p ; 将将“彼彼”事件以变量事件以变量“0”表示,具概率表示,具概率q。 因而二项总体又称为因而二项总体又称为0、1总体总体,其概率则显然有:,其概率则显然有:p+q=1 第33页/共87页 如果从二项总体进行如果

16、从二项总体进行n次重复抽样,设出现次重复抽样,设出现“此此”的次数的次数 为为y,那么,那么y的取值可能为的取值可能为0、1、2、n,共有,共有n+1种可种可 能取值,这能取值,这n+1种取值各有其概率,因而由变量种取值各有其概率,因而由变量y及其概率及其概率 就构成了一个分布,这个分布叫做就构成了一个分布,这个分布叫做二项式概率分布二项式概率分布, 简称简称二项分布二项分布( binomial distribution )。B(n,p) 二项总体的抽样试验具有二项总体的抽样试验具有重复性和独立性重复性和独立性 重复性重复性是指每次试验条件不变,即在每次试验中是指每次试验条件不变,即在每次试验

17、中“此此 ”事件出现的概率皆为事件出现的概率皆为p 独立性独立性是指任何一次试验中是指任何一次试验中“此此”事件的出现与其余事件的出现与其余 各次试验中出现何种结果无关各次试验中出现何种结果无关 第34页/共87页 二、二项式分布的概率计算方法二、二项式分布的概率计算方法 数学上的组合公式为:数学上的组合公式为: )!( ! ! yny n C y n 第35页/共87页 二项式中包含两项,这两项的概率为二项式中包含两项,这两项的概率为p、q,并且,并且p+ +q=1 ,可推知变量,可推知变量y的概率函数的概率函数为:为: ynyy n qpCyP )( n y yP 0 )(1 累积函数累积

18、函数F(y)F(y):变量小于等于:变量小于等于y的所有可能取值的的所有可能取值的概率之和概率之和 y i iyPyF 0 )()( 理论次数理论次数:对于任意:对于任意y,理论次数,理论次数=nP(y) 这一分布律也称这一分布律也称贝努里贝努里( Bernoulli )分布分布,并有,并有 第36页/共87页 n qp)(的泰勒展开式为:的泰勒展开式为: .)( 222111 ynyy n n n n n n qpCqpCqpCqp n y ynyy n qpC 0 可以看到,上式右边的每一项即为二项分布中变量可以看到,上式右边的每一项即为二项分布中变量y 取取 0、1、2、n时的概率,又时

19、的概率,又p+q=1,从而,从而 (p+q)n=1 1)( 00 n y ynyy n n y qpCyP 第37页/共87页 例例4.1 棉田盲危害的统计概率乃从调查棉田盲危害的统计概率乃从调查2000株后获得近似值株后获得近似值 p=0.35。现受害株事件为。现受害株事件为A,其概率为,其概率为p=0.35,未受害株事,未受害株事 件为对立事件,其概率件为对立事件,其概率q=(10.35)=0.65。 第38页/共87页 如调查如调查5株为一个抽样单位,即株为一个抽样单位,即n=5,则受害株数,则受害株数y=0, 1,2,3,4和和5的概率可以计算出来,的概率可以计算出来, inii n

20、qpCiyP )( 如果每次抽如果每次抽5个单株,抽个单株,抽n=400次,则理论上我们能够得次,则理论上我们能够得 到到y=2的次数应为:的次数应为: 理论次数理论次数=400P(2)=4000.3364=134.56(次次) y i iyPyF 0 )()( 和其累计函数和其累计函数 第39页/共87页 表表4.2 调查单位为调查单位为5株的概率分布表株的概率分布表( (p=0.35,q=0.65) ) 受害株数 概率函数 P(y) P(y)F(y)nP(y) P(0)0.11600.116046.40 P(1)0.31240.4284124.96 P(2)0.33640.7648134.

21、56 P(3)0.18110.945972.44 P(4)0.04880.994719.52 P(5)0.00531.00002.12 ynyy n qpC 500 5 650350.C 411 5 650350.C 322 5 650350.C 233 5 650350.C 144 5 650350.C 055 5 650350.C 第40页/共87页 0.0 0.1 0.2 0.3 0.4 012345 0.0 0.2 0.4 0.6 0.8 1.0 012345 )(yP )(yF 受害株数受害株数(y) 受害株数受害株数(y) 图图4.1 棉株受危害的概率分布图棉株受危害的概率分布图

22、(p=0.35,n=5) 图图4.2 棉株受危害的累积概率函数图棉株受危害的累积概率函数图 (p=0.35,n=5) 第41页/共87页 三、二项式分布的形状和参数三、二项式分布的形状和参数 如如p=q,二项式分布呈对称形状,如,二项式分布呈对称形状,如pq,则表现偏斜形状,则表现偏斜形状 0.0 0.1 0.2 0.3 0.4 012345 )(yf 受害株数受害株数( y) 图4.3 棉株受盲椿害的概率函数f(y)图 (p=0.5,n=5株) 受害株数受害株数(y) )(yP 图图4.1 棉株受盲蝽象为害的概率分布图棉株受盲蝽象为害的概率分布图(p=0.35,n=5) 第42页/共87页

23、二项式分布的参数二项式分布的参数 平均数、方差和标准差如下式平均数、方差和标准差如下式 np npq 2 npq 上述棉田受害率调查结果,上述棉田受害率调查结果,n=5,p=0.35,可求得总体参数,可求得总体参数 为:为: =50.35=1.75株,株, 株。株。 067. 11375. 165. 035. 05 第43页/共87页 四、多项式分布四、多项式分布 所谓所谓多项总体多项总体,是指将变数资料分为,是指将变数资料分为3类或多类的总体。类或多类的总体。 例如在给某一人群使用一种新药,可能有的疗效好,有的没例如在给某一人群使用一种新药,可能有的疗效好,有的没 有疗效,而另有疗效为副作用

24、的,就是三项分布。有疗效,而另有疗效为副作用的,就是三项分布。 多项总体的随机变量的概率分布即为多项总体的随机变量的概率分布即为多项式分布多项式分布 (multinomial distribution)。 第44页/共87页 五、泊松分布五、泊松分布二项分布的一种极限分布二项分布的一种极限分布 ( Poisson distribution ) 二项分布中往往会遇到一个概率p或q是很小的值,例如小 于0.1,另一方面n又相当大,这样的二项分布必将为另一 种分布所接近,或者为一种极限分布。这一种分布称泊松 概率分布,简称泊松分布。 令令np=m,则泊松分布如下式:,则泊松分布如下式: ! )( y

25、 em yP my y=0,1,2, 第45页/共87页 泊松分布的平均数泊松分布的平均数 、方差、方差 和标准差和标准差 如下式如下式: mm 2 m m的大小决定其分布的大小决定其分布 形状。当形状。当m值小时分值小时分 布呈很偏斜形状,布呈很偏斜形状,m 增大后则逐渐对称增大后则逐渐对称 。 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0246810 m=0.5 m=1.5 m=2.5 )(yP y 图4.4 不同m值的泊松分布 2 第46页/共87页 第四节第四节 正态分布正态分布 一、二项分布的极限一、二项分布的极限正态分布正态分布 二、正态分布曲线的特性二、正态分布

26、曲线的特性 三、计算正态分布曲线区间面积或概率的方法三、计算正态分布曲线区间面积或概率的方法 第47页/共87页 研究正态分布的意义意义: 1.客观世界的许多现象的数据是服从正态分布规律的。 2.在适当条件下,正态分布可以用来作二项分布及其它 间断性变数或连续性变数分布的近似分布。 3.虽然某些总体不作正态分布,但从总体中随机抽出的 样本平均数及其它一些统计数的分布,在样本容量适 当大时仍然趋于正态分布。 正态分正态分 布布 第48页/共87页 一、二项分布的极限一、二项分布的极限正态分布正态分布 以上述二项分布棉株受害率为例,假定受害概率以上述二项分布棉株受害率为例,假定受害概率p=1/2,

27、 那么,那么,p=q=1/2。现假定每个抽样单位包括。现假定每个抽样单位包括20株,这样将株,这样将 有有21个组,其受害株的概率函数为个组,其受害株的概率函数为 )20( 20 5050)( yyy .CyP 于是概率分布计算如下:于是概率分布计算如下: 00000. 000002. 000018. 000002. 000000. 0 ) 2 1 ( 1) 2 1 (20) 2 1 (190) 2 1 (20) 2 1 ( 1) 2 1 2 1 ( 202020202020 第49页/共87页 现将这概率分布绘于图现将这概率分布绘于图4.5。从图。从图4.5看出它是对称的看出它是对称的 ,分

28、布的平均数,分布的平均数 和方差和方差 为:为: 2 =npq=20(1/2)(1/2)=5(株株)2 。 =np=20(1/2)=10(株株), 2 第50页/共87页 02468101214161820 0.00 0.03 0.06 0.09 0.12 0.15 0.18 图4.5 棉株受害率(0.5+0.5)20分布图 如如p=q,不论,不论n值值 大或小,二项分布大或小,二项分布 的多边形图必形成的多边形图必形成 对称;对称; 如如pq,而,而n很大很大 时,这多边形仍趋时,这多边形仍趋 对称对称。 第51页/共87页 可以推导出正态分布的概率密度函数为:可以推导出正态分布的概率密度函

29、数为: e yf y N 2 2 1 2 1 )( (49) 其中,其中,y是所研究的变数;是所研究的变数; 是概率是概率 密度函数;密度函数; )(yfN 和和 为总体参数,为总体参数, 表示所研究总体平均数,表示所研究总体平均数, 表表 示所研究总体标准差示所研究总体标准差 第52页/共87页 2 参数参数 和和 有如下的数学表述有如下的数学表述 22 dyyfy dyyyf N N )()( )( (410) )( y u令令 可将可将(49)式标准化为:式标准化为: e u u 2 2 1 2 1 )( (411) 上式称为标准化正态分布方程,它是参数上式称为标准化正态分布方程,它是参

30、数 时的正态分布时的正态分布(图图4.7)。记作。记作N(0,1)。 1, 0 2 第53页/共87页 0.0 0.1 0.2 0.3 0.4 68.27% 95.45% 正态分布的曲线图正态分布的曲线图 0.0 0.1 0.2 0.3 0.4 fN(u) u 68.27% 95.45% )(yfN 2 2 -3 -2 -1 0 1 2 3 图图4.6 正态分布曲线图正态分布曲线图 (平均数为平均数为 ,标准差为,标准差为 ) 图图4.7 标准正态分布曲线图标准正态分布曲线图 (平均数平均数 为为0,标准差,标准差 为为1) 第54页/共87页 二、正态分布曲线的特点二、正态分布曲线的特点:

31、1.曲线以平均数为对称轴,左右对称; 2.算术平均数、中数、众数三位合一; 3.正态分布曲线是以平均数和标准差的不同而表现为 一系列曲线; 4.正态分布资料的次数分布表现为多数次数集中在算 是平均数附近,距之俞远,次数俞少; 5.正态分布曲线在离开平均数一个标准差处有拐点, 且曲线是以x轴为渐进线; 6.正态分布曲线与x轴间的面积为1,任何两个x定值间 的面积或概率由平均数和标准差确定。 正态分正态分 布布 第55页/共87页 -3-2-10123456 0.0 0.1 0.2 0.3 0.4 0.5 y fN(y) -6-5-4-3-2-10123456 0.0 0.1 0.2 0.3 0.

32、4 0.5 y )(yfN 1 1 1.5 2 2 3 1 2 3 图图4.8 标准差相同标准差相同( 1)而平均数不而平均数不 同同( =0、 =1、 =2)的三个正态分布的三个正态分布 曲线曲线 1 2 3 图图4.9 平均数相同平均数相同( 0)而标准差而标准差 不同不同( =1、 =1.5、 =2)的三个正的三个正 态分布曲线态分布曲线 1 2 3 第56页/共87页 例如,上章水稻例如,上章水稻140行产量资料的样本分布表现出接近行产量资料的样本分布表现出接近 正态分布正态分布 yks数值(g)区间(g) 区间内包括的次数 次数% 1s157.9 36.4121.5194.5 99

33、70.71 2s157.9 72.8 85.1230.7134 95.71 3s157.9109.2 48.7267.1140100.00 表表4.5 140行水稻产量在行水稻产量在 1s, 2s, 3s范围内所包括的次数表范围内所包括的次数表yyy y y y 第57页/共87页 三、计算正态分布曲线区间面积或概率的方法三、计算正态分布曲线区间面积或概率的方法 概率可用曲线下区间的概率可用曲线下区间的面积面积来表示,来表示, 或者说,用其定积分的值表示或者说,用其定积分的值表示 b a y dybyaP e 2 2 1 2 1 )( (413) 同样可以计算曲线下从同样可以计算曲线下从到到y

34、的面积,其公式如下:的面积,其公式如下: 0 )( 0 y NN dyyfyF)( (414) 这里这里FN(y)称为正态分布的称为正态分布的累积函数累积函数,具有平均数,具有平均数 和和 标准差标准差 。 第58页/共87页 A=P(ayb) fN(y) 图图4.10正态分布密度函数的积分说明图面积正态分布密度函数的积分说明图面积A=P(ayb) 第59页/共87页 现如给予变数任何一定值,例如现如给予变数任何一定值,例如a,那么,可以计算,那么,可以计算ya 的概率为的概率为FN(a),即,即)()(aFayP N (415) 如果如果a与与b(a30就可就可 以应用这一定理。以应用这一定

35、理。 y n 2 平均数的标准化分布是将上述平均数平均数的标准化分布是将上述平均数 转换为转换为u变数。变数。 y n yy u y )()( (423) 第76页/共87页 例例4.9 在江苏沛县调查在江苏沛县调查336个个m2小地老虎虫危害情况的结果小地老虎虫危害情况的结果 , =4.73头,头, =2.63,试问样本容量,试问样本容量n=30时,由于随机抽样时,由于随机抽样 得到样本平均数得到样本平均数 等于或小于等于或小于4.37的概率为多少?的概率为多少? y 查附表查附表2,P(u0.75)=0.2266,即概率为,即概率为22.66% (属一属一 尾概率尾概率)。 (头)480.

36、 0 30 63. 2 n y 75. 0 48. 0 36. 0 480. 0 )73. 437. 4( y y u 第77页/共87页 (二二) 两个独立样本平均数差数的分布两个独立样本平均数差数的分布 假定有两个正态总体各具有平均数和标准差为假定有两个正态总体各具有平均数和标准差为 , 和和 , ,从第一个总体随机抽取,从第一个总体随机抽取n1个观察值,同时独立个观察值,同时独立 地从第二个总体随时机抽取地从第二个总体随时机抽取n2个观察值。这样计算出样本个观察值。这样计算出样本 平均数和标准差平均数和标准差 ,s1和和 ,s2。 1 1 2 2 1 y 2 y 从统计理论可以推导出其样

37、本平均数的差数从统计理论可以推导出其样本平均数的差数( ) 的抽样分布,具有以下特性:的抽样分布,具有以下特性: 21 yy (1) 如果两个总体各作正态分布,则其样本平均数差如果两个总体各作正态分布,则其样本平均数差 数数 ( )准确地遵循正态分布律,无论样本容量大或小,准确地遵循正态分布律,无论样本容量大或小, 都有都有N( , )。 21 yy 21 yy 2 21 yy 第78页/共87页 (2) 两个样本平均数差数分布的平均数必等于两个总两个样本平均数差数分布的平均数必等于两个总 体平均数的差数,即体平均数的差数,即 21 21 yy (3) 两个独立的样本平均数差数分布的方差等于两

38、个两个独立的样本平均数差数分布的方差等于两个 总体的样本平均数的方差总和,即总体的样本平均数的方差总和,即 其差数标准差为:其差数标准差为: 2 2 2 1 2 1222 2121 nn yyyy nn yy 2 2 2 1 2 1 21 (424) 这个分布也可标准化,获得这个分布也可标准化,获得u值。值。 nn yy u 2 2 2 1 2 1 2121 )()( (425) 第79页/共87页 小结:小结: l若两个样本抽自于同一正态总体,则其平均数差数的抽若两个样本抽自于同一正态总体,则其平均数差数的抽 样分布不论容量大小亦作正态分布具:样分布不论容量大小亦作正态分布具: l若两个样本

39、抽自于同一总体,但并非正态总体,则其平均若两个样本抽自于同一总体,但并非正态总体,则其平均 数差数的抽样分布按中心极限定理在数差数的抽样分布按中心极限定理在n1和和n2相当大时相当大时(大于大于 30)才逐渐接近于正态分布。才逐渐接近于正态分布。 l若两个样本抽自于两个非正态总体,当若两个样本抽自于两个非正态总体,当n1和和n2相当大、而相当大、而 与与 相差不太远时,也可近似地应用正态接近方法估计相差不太远时,也可近似地应用正态接近方法估计 平均数差数出现的概率,当然这种估计的可靠性得依两总平均数差数出现的概率,当然这种估计的可靠性得依两总 体偏离正态的程度和相差大小而转移。体偏离正态的程度和相差大小而转移。 2 1 2 2 nn yyyy 21 11 0 2121 , 第80页/共87页 三、二项总体的抽样分布三、二项总体的抽样分布 (一一) 二项总体的分布参数二项总体的分布参数 p pqpp)(1 2 pqpp)(1 其中其中p为二项总体中要研究的属性事件发生的概率,为二项总体中要研究的属性事件发生的概率, q=1p 。 标准差标准差: 方差方差: 平均数平均数: 第81页/共87页 (二二) 样本平均数样本平均数(成数成数)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论