




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 统计分析的基本原理,1、事件及概率 一、事件的类型: 1、必然事件:在一定条件下一定会发生的事件。 2、不可能事件:在一定条件下一定不会发生的事件 3、随机事件:在一定条件下可能发生,也可能不发生。或者发生这样的结果也可能发生另一种结果。,二、随机试验,1、试验 通常我们把根据某一研究目的 , 在一定条件下对自然现象所进行的观察或试验统称为试验,2、随机试验的特性 (1)试验可以在相同条件下多次重复进行; (2)每次试验的可能结果不止一个 ,并且事先知道会有哪些可能的结果; (3)每次试验总是恰好出现这些可能结果中的一个 ,但在一次试验之前却不能肯定这次试验会出现哪一个结果。,三 、
2、概 率,1、概率的定义: 例:一批种子的发芽试验:,在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值 p , 那么 就 把 p称为随机事件A的概率。,2、概率的基本性质:,1)对于任何事件概率: 0P(A)1; 2)必然事件的概率为1,即P()=1 3)不可能事件的概率为0,即P()=0。 4)随机事件的概率为大于0,小于 1 即:0P(A)1,概率记作: 记作:P(A) ,3、小概率事件: 若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概
3、率事件。,4、小概率原理: 如果事件的概率为0.05、0.01、0.001以至接近0时, 这种小概率事件我们在一次试验中看成实际上不可能发生的事件。这被称为“小概率事件实际不可能性原理”。,2、概率分布,一、随机变量 做一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示, 这个数称为随机变量,用x表示。,1、离 散 型 随 机 变 量 ( discrete random variable): 如果表示试验结果的变量x,其可能取值可以一一列举 ,这样的随机变量 则 称 x 为 离 散 型 随 机 变 量,2、连续 型 随 机 变 量 (continuous random variabl
4、e ): 如果表示试验结果的变量x ,其可能取值为某范围内的任何数值,且不能一一列举,这样的随机变量称为连续 型 随 机 变 量 。,1、概率分布意义: 例 1: 一粒种子的发芽试验,种子的发芽率为0.8,二、概率分布,例2、一批种子检验其 合格率为p=0.9,不合格率q=0.1,从中随机抽取5颗,其合格种子的概率分布,通式:,pxqn-x=(p+q)n,概率分布的定义: 对于确定的随机变量x可能取的值为:x1,x2,x3, xn,与之对应的概率之间的任何一一对应的关系称为随机变量的概率分布。,2、概率分布密度函数: 一组随机变量必定有一个概率分布,且是唯一确定的,并且这种概率可以用一个函数式
5、来表示,这个函数式称为概率分布函数,f(x) 0,3、几个重要的概率分布,一、二项式分布 1、二项式分布的意义: 设事件A和 组成完备事件,事件A要么发生要么不发生,二者必居其一,且每次试验中事件A发生的概率为常数p,事件A不发生的概率为q1-p,在n次独立重复试验中,用x表示n次试验中事件A发生的次数,所以x取值为0、1、2 n,这n+1种取值有各自对应的概率分布,这样的概率分布称为二项式分布。 *从定义可以看出,二项式分布是非连续型随机变量的概率分布,2、二项式分布的函数,1)密度函数(分布函数):,f(x),2)累积函数:指x取值在某一范围内的概率之和。,F(x)P(m1xm2)=,F(
6、x)P(0 xn)= =1,3、二项式分布的平均数和标准差,样本总和数的抽样分布 1)平均数:= np 2)标准差:=,4、二项式概率分布图象,p=0.9 q=0.1 n=5,p=0.4,q=0.6, n= 20的二项分布图示,p=q=0.5, n= 5的二项分布图示,(p+q)n=(0.1+0.9)n二项式分布图象,二项式分布图像的特点: 1)n很小,pq时,图像是偏峰的折线 2)n很小,pq时,图像是一个对称的折线 3)若n充分大时,图像逐渐变成对称平滑的曲线。,(p+q)20二项式分布图像,三、正态分布,1. 正态分布的定义: 若连续型随机变量x的概率分布密度函数为: 其中为平均数,2为
7、方差,则称随机变量x服从正态分布(normal distribution), 记为xN(,2)。,累积函数为 :,2、正态分布图像:,3、正态分布的性质:,1)正态分布曲线是单峰,左右对称的钟形曲线,对称轴在x= 处。 2) 的绝对值愈大时,f(x)愈小,f(x)恒大于0;所以f(x)为正函数,曲线向x轴两端无限延伸,以x轴为渐近线。 3)当x=u时,f(x)为最大 4)x取值范围为整个x轴,即:-x + 。所以曲线与x轴围成的面积等于1。 即:,因此变量x取任何两个定值a,b之间的概率等于曲线下介于这两个定值间的面积占总面积的成数。 即:P(axb)=,5)任何正态分布曲线都由两个参数、决定
8、的。,确定曲线在x轴上的位置;确定曲线峰的高低,6)x在下列取值区间时的累积概率,P(axb)=,4、正态分布的概率计算:,1)一般正态分布的概率:,P(x1xx2)=,正态分布的概率,概率是阴影的面积,2)标准的正态分布,设随机变量x服从正态分布:即:xN( ,2),令:U,密度函数式:,这个函数式中 =0, =1,所以:UN(0,1) 这个函数称为标准的正态分布函数 即: xN( ,2)转换成 UN(0,1) 变 量 x 转 换 成 U,U 称 为 标 准 正 态变量,累积函数为:,随机变量U服从标准正态分布,记作UN(0,1),这样可以计算出U取任意值时的累积概率。 累积概率见表2(p3
9、57页),标准正态分布的三个常用概率,U,关于标准正态分布,以下几种概率应当熟记: P(-1U1)=0.6826 P(-2U2)=0.9545 P(-3U3)=0.9973 P(-1.96U1.96)=0.95 P (-2.58U2.58)=0.99,设u服从标准正态分布,则 U 在U1,U2 )内取值的概率为:,3) 标准正态分布的概率计算,(U2)(U1),而(U1)与(U2)可由附表2查得,计算u所在一定区间的概率:,例1:U N(0,12)计算U取值在 -2 至+3 区间的概率 解:由题意可知:变量U所在总体的 =0,=1 变量U服从标准的正态分布,所以: P(U-2 UU+3 )=
10、P(-2 U3 ) = P(- U3 )- P(- U-2 ) =(3)(-2) =0.998650.02275 查附表2得 =0.97889,计算x取值所在区间的概率,例2、 xN(10,52)求x取值为15至25的概率 解:依题意可知,变量x所在的总体的平均数 10 ,标准差5,该总体不是服从标准的正态分布。所以必须先进行标准化,将x变量转换成U变量 变量标准化转换:x U,变量U所在总体的 =0,=1,P(U+1 UU+3 )= P(1 U3 ) = P(- U3 )- P(- U1 ) =(3)(1) =0.99865-0.84134 (查表2) =0.15731,例3、P63页例4.
11、4,解:依题意,变量xN(30,52) 求小于26的概率,P(- UU-0.8 ) P( - U-0.8 ) (-0.8)0.2119,变量U所在总体的 =0,=1, 介于26至40区间的概率 P(-0.8U2)F(2)-F(-0.8)0.97725-0.211860.76539,小于40的概率U 2P(-U2)0.97725 ( 2)F(40)0.97725, 求大于40的概率,P( U+2 U ) P( 2U ) () (2)1 0.97725 0.02275,作业: 桂花一年生苗木平均高35cm,标准差15cm,问这批苗木(1)高于60cm苗木所占比例;(2)在20cm至60cm之间的苗
12、木所占比例;(3)小于20cm的苗木所占比例,3、平均数的抽样分布,一、样本平均数:,1、样本平均数:,s1 s2 sn,2、样本的平均数 :样本平均数的平均数等于总体的平均数,:样本平均数的平均数,:总体平均数,即:,3、样本平均数的标准差(又称 标准误):,其中:,:为样本平均数的标准差;,:总体的标准差;n为样本单元数(样本容量),注意: 标准差与标准误是既有联系又有区别的两个统计量,上式已表明了二者的联系。二者的区别在于: 样 本 标 准 差 S 是 反 映 样 本中各 观测值 , , 变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样本平均数 的
13、标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。,二、样本平均数的概率分布:,其统计量(如 , ,)也将随样本的不同而有所不同,因而样本统计量也是随机变量, 也有其概率分布。我们把统计量的概率分布称为抽样分布。,从有限总体做重复随机抽样,所有可能的样本数为Nn , 其中n为样本含量(样本容量) 例如:如果从总体N=4中抽取n=2的样本, 共可得 42=16 个样本;如果样本含量n为4 ,则 一 共可抽得44=256个样本。,例:设有一总体N3 观察值为:2、4、6,总体N=3,每次抽取2个单元组成样本,,第一次抽取的数 2 4 6 第二次抽取的数 2 4 6 2
14、 4 6 2 4 6 样本的和 4 6 8 6 8 10 8 10 12 样本平均数 2 3 4 3 4 5 4 5 6,例2:设有一总体N3 观察值为:2、4、6,以样本容量n1、n2、n4、n8 (p67例4.7),N3,n1,k31 ,平均数概率分布图 N3,n2,k32 ,平均数概率分布图,N3,n4,k34 ,平均数概率分布图 N3,n8,k38 ,平均数概率分布图,各种不同样本容量的平均数( )的抽样分布表(p67页表),N=4, n=2 N=4, n=4,1、样本平均数的概率分布,不管原总体并非正态分布,但从中随机抽取样本, 即使样本含量很小(n =4),样本平均数的分布却趋向于
15、正态分布形式。随着样本含量 n 的增大, 样本平均数的分布愈来愈从不连续趋向于连续的正态分布 ,当n30时, 的分布就近似正态分布了。,平均数服从正态分布。 记作:,N( , ),2、中心极限定律:,1) 若随机变量x 服从态分布xN(,2) x1、x2 、x n , 是由 总体得来的随机样本,则统计量 =x n的概率分布也是正态分布, =, 服从正态分布 即: N(,2n)。,2)若随机变量x 平均数是 ,方差是2的 总体不是正态分布; , , 是由此总体得来的随机样本,则 统 计 量 =xn的概率分布,当n相当大时逼近正态分布 即: N(,2n)。,中心极限定理告诉我们:不论变量x是连续型
16、还是离散型,也无论x服从何种分布,一般只要n30,就可认为 的分布是正态的。 若x的分布不很偏倚,在n20时 , 的分布就近似于正态分布了。,三、“t”分布:,1、t分布函数: (tdistribution) 由样本平均数抽样分布的性质知道: 若xN(, 2), 则 N(, 2/n)。 将随机变量 标准化得: , 则UN(0,1)。 当总体标准差未知时, 以样本标准差S代替将随机变量 标准化,标准化的变量记为t 。 在计算 时,由于采用S来代替,使得 t 变量不再服从标准正态分布,而是服从t分布,概率分布密度函数如下:,t的取值范围是(-,+) df=n-1为自由度。,2、分布曲线,1)t分布
17、受自由度的制约,每一个自由度都有一条t分布密度曲线。,不同自由度的t分布密度曲线,2)t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值。 3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t 分布与标准正态分布完全一致。,通俗的说: 在样本容量充分大(n30)时,或者总体的方差已知,样本的平均数就服从正态分布,即: N( ), 在样本容量比较小(n30)时,或者总体的方差未知,样本的平均数就服从df
18、=n-1的t分布。,四、两个样本平均数的差数概率分布:,如果从一个总体随机抽取一个样本,样本容量为n1总体平均数为1,方差为 ,从另一个总体随机抽取一个样本,样本容量为n2,总体平均数为2,方差为 ,根据数理统计推导,两个随机独立抽取的样本平均数间的差数( )的抽样分布参数与两个总体间存在如下关系:,1)差数的平均数等于两个总体平均数之差 即: (2)差数的方差为:,通俗的说: 在样本容量充分大(n30)时,或者总体的方差已知,两个样本的平均数的差数就服从正态分布,即: N( ), 在样本容量比较小(n130,n2 30 )时,或者两个总体的方差未知,两个样本平均数的差数就服从df=(n1-1
19、)+(n2-1)的 t 分布。,4、统计假设检验,一、假设检验的基本原理 1、几个基本概念: 、假设检验:用一定标准检验样本的特征数与总体参数或两个样本特征数之间是否存在真正差异的一种统计方法叫假设检验,或差异显著性测验。 样本统计量与总体参数的差异可能的原因: 随机因素引起的,这是由于抽样所产生的,叫做抽样误差。 两者本质上存在的差异引起的 ,样本的统计量与总体参数存在着本质的差异 。,假设检验又叫显著性检验 (test of significance)类型:,U检验 t检验 F检验 2检验等,、无效假设 H0:假定样本来源的总体参数u与假设的总体参数u0没有真正的差异 即:H0 u=u0
20、u为样本来自的总体数,u0为假定的总体参数,、备择假设 HA:假定样本来源的总体参数u与假设的总体参数u0间存在真正的差异 即: HA : uu0,、显著性水平():在假设检验中选用的概率标准,也就是说对概率规定的数量界限, 通常用= 0.05, =0.01,=0.001,2、假设检验的原理,小概率原理: 概率很小(5%)的事件,在一定试验(抽样)中不可能会出现,若真正出现,则认为无效假设不正确而推翻无效假设 。,样本平均数分布规律是:从总体中抽出100个样本,有95%的样本平均数在总体平均数左右各1.96个标准误差范围内,只有5%的样本平均数在总体平均数左右1.96个标准差范围以外。但是从总
21、体中抽出一个样本时,一般是在总体平均数左右各1.96标准范围之内,决不会在以外 。因此认为样本平均数 与总体参数u之差( u)不超过1.96个标准差,以95%的概率保证样本平均数与总体平均数不存在差异故接受H0,样本平均数与总体u0存在的差异是抽样误差 。,若从总体中抽一个样本时,它的平均数 落总体平均数1.96个标准误差范围以外,即5%的概率范围。这是不可能的。说明样本平均数 与假定的总体u0存在的差异不是抽样误差,而是样本所在的总体与假定总体存在实质性的差异。 即uu0,故接受HA。,双侧检验,单侧检验,3、两种错误,1) 第一类错误是真实情况为H0成立,却否定了它,犯了“弃真”错误,也叫
22、型错误。 型错误:就是把非真实差异错判为真实差异。 即: 为 真 , 却 接 受了 。,2) 第二类错误是H0不成立,却接受了它,犯了“纳伪”错误,也叫型错误。 型错误:就是把真实差异错判为非真实差异。 即 : 为真 , 却接受了 。,两类错误示意图,降低错误的措施:,将(小概率)值规定小一些 增加试验的重复次数降低误差 =,4、一尾测验、两尾测验,否定区间在分布曲线的两端称为两尾检验 否定区间在分布曲线的一端, 称为是一尾测验。,双侧检验,单侧检验,5、差异显著性测验的基本方法,1)、建立无效假设H0、备择假设HA 2)、选取适当的检验显著性水平 并确定是一尾还是两尾检验。 3)、确定统计量
23、的分布,正态分布(大样本), t分布(小样本)。 4)、计算样本的统计量U(t),同时列出自由度df 5)、据自由度及 查表的临界值U ( t) 6)、统计推断:用计算的U(t)与查表得的U( t)比较, 判断接受H0或HA U 或 t 则接受H0 否则接受HA,二、平均数差异显著性测验,1、一个样本的显著性测验 假定总体X N(u0,2)分布,样本容量为大样本,测验该样本是否来源于假定总体。,1)建立无效假设 H0: u=u0, 所在的总体u与总体u0没有差异 2)选择: =0.05或=0.01 两尾或一尾,3)计算统计量,U= ,U0: 假定总体标准差及平均数 n :样本容量 4)依查表3
24、,得U值 5)判断 U U 否定H0,则 认为不属于 总体u0 。 样本平均数 所在的总体u与总体u0差异显著或极显著。,例:据测定某当地板栗品系一年生苗高110cm,今引进一个新品种40株,一年生高为100cm,标准差=8.8cm 试问这个新品种株高与当地品种是否存在显著性差异。,、建立无效假设:H0 :u=u0=110cm,HA :uu0,、选择=0.05 两尾测验,=-7.19 (大样本,总体的已知),、计算U = =,、依=0.05 , 查表3得 U0.05=1.96 (查正态分布表),、推断 U0.05 说明值落在1.96标准差以外,故否 定H0,说明新品种与当地的品系存在着显著差异
25、。,例2(P82页5.1例):,依题意:U034g ,n8,、建立无效假设:H0: u=u034g HA : uu034g 、 选择=0.05 两尾测验,、计算样本平均数: 35.2g,、计算样本标准差: 1.64 g,、计算统计量: 0.58g,、依据df8-17,依=0.05 查表4 t0.052.365,、判断:t t0.05 接受假设H0,说明新引进的品种的千粒重与当地良种没有显著性差异。,(小样本,总体的未知),t=,2、两个大样本平均数差异显著性测验1) 成组数据的平均数的比较:,、两个大样本或总体方差已知时,用u检验(正态分布检验),和,的差数标准误 为:,统计量 : U,例:(
26、P83页5.2题),2 0.4 1.2 n112 1.4g n28,H0:A、B两种方法的产量相等,即:H0:, 0.2887(kg),- 0.69 U0.05 1.96 查表,U,UU0.05 故接受H0 ,说明A、B两种方法的产量没有差异。,HA: u1u2,0,、两小样本平均数或总体方差未知时差异显著性测验 用t检验,建立无效假设 H0 :,=,确定显著性水平,两样本差数 标准差,计算统计量,t,判断:依自由度df(n1-1)+(n2-1)查t分布表得t,t 则接受H0 否则接受HA,HA : u1 u2,u1= u2,即:u1=u2,例:P84页例5.3 依表计算得:428kg n15
27、 440kg n25, 482.5 137.5,df(51)(51)8 查表 t 2.306,t2.306 两种栽培密度的水稻产量没有差异。,2) 成对数据的差异显著性测验,建立无效假设 H0 : u1=u2 选择,计算统计量,=,、依与df=n-1查附表4得t,与 t 比较, t 则接受H0,例:P87例5.6,解 H0 : u1=u2 选择 : =0.01、,计算,t 值,11.997,t =,依=0.01 , df=7-1=6查表3得 t=3.707 判断tt0.01认为u1与u2有显著差异,说明 A、B两种产量对钝化病毒的效果有极显著的差异。,-4.16,三、百分数的假设检验:,1、单
28、个样本百分数(成数)的假设检验 检验的步骤: 建立无效假设 即H0 :pp0 即:HA : p p0,确定显著性水平,计算统计量,(样本百分数标准误),=,U,判断:依查u分布表得U,U 则接受H0 否则接受HA,(p:样本百分数; p0 :理论百分数),例:P88页5.8例,开紫花的大豆为 =2082890.7197,理论:p00.75,选择显著性水平 0.05,计算统计量:,0.0255,U 1.96 (查表3),U 接受H0,说明大豆的花色符合遗传的分离规律。,2、两个样本百分数相比较的假设检验:,统计量:两样本百分数的差数标准误,未知知p1、P2:求两个样本百分数的平均数,1,U,已知
29、p1、P2(总体百分数):,例:(P89页5.9题),93.92 87.31 n1378 n2396,建立无效假设:H0:,选择显著性水平:0.05,计算统计量:, 0.906,10.9060.094,U 3.16,U 1.96,U 否定H0,说明两个麦田锈病率有显著差异。,n30, np5时必须进行连续型矫正; 样本较大时,可以不作矫正,用u测验; (见90页),假设检验公式汇总表,4 参数的区间估计,一、概念: 1、参数估计:通过样本资料的统计量来估计总体参数的一种统计方法。 2、点估计:用样本的统计量直接估计总体的参数的方法称为点估计。,4、置信区间:估计参数所在的区间范围。 5、置信度
30、(可靠性):保证参数在一定区间范围内的概率,3、区间估计:以样本的统计量,在一定的概率保证下估计总体参数在一定的区间内,这样的估计方法称为区间估计。这个区间称为置信区间。区间的上、下限称为置信限。,二、区间估计的原理,P (-1.96 +1.96 ) 1,-1.96 +1.96 (每一项减),-1.96 1.96 ,1.96 1.96 (每一项减 ), 1.96 1.96 (每一项除以1),1.96 1.96,置信度为:P1,下限为: L1 1.96,上限为: L2 1.96,置信区间为: 1.96 , 1.96 ,通式:,大样本: ( U )( U ),误差限为:U,小样本:,误差限为:t,
31、三、总体平均数的置信限:,下限:L1 U 上限: L2 U,例:(P92页5.13例) 解:已知,4.1(kg) 0.3(kg) n36 置信度:P199 0.01 查表3,( 4.12.58 0.05)(4.12.580.05) 4.04.2,U0.012.58, 0.05,1、总体方差2已知,2、总体方差2未知,下限:L1( t ) 上限:L2( t ) 依dfn1, 查表4的t值 例:(P93页5.14例) 解:已知 35.2(kg) 0.58/8-2=0.3(kg) n8 P99 依 dfn1817,查表 t0.052.365 L1(35.22.3650.3)33.8 L2(35.22
32、.3650.3)36.6,四、两个总体平均数差数(12)的置信限 1、两个总体方差已知或大样本 下限:L1( )U 上限: L2( )U 2、总体方差未知: 下限: L1( )t 上限 :L2( )+t,区间估计公式汇总表,6、方差分析原理,t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验, 但在生产和科学研究中经常会遇到比较 多个处理优劣的问题, 即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为:,检验过程烦琐 无统一的试验误差,误差估计的精确性和检验的灵敏性低 推断的可靠性低,检验的 I 型错误率大,一、方差分析的意义:,方差分析就是将试
33、验的总的变异剖分为各个变异来源的相应部分,从而找出产生变异的主要原因,将总变异中各种产生变异的原因分析出来后剩余部分就是试验误差 。然后以试验误差作为假设检验的依据,将其它原因的产生的变异与试验误差比较进行统计推断 .,方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术。 方差分析实质:是关于观测值变异原因的数量分析。就是从总的变异中将各种可能的变异原因逐个分出,以误差方差为标准去判断其已知变因方差的性质 。,二、自由度和平方和的分解,我们可以将平方和和自由度分别进行分解。,平方和,自由度,k个处理每个处理有n个观测值的 数据模式,总变异有nk个观察值,总自由
34、度有df=nk-1,总变异有nk个观察值,总自由度有df=nk-1,表中Xij表示第i个处理的第j个观测值 (i=1,2,k;j =1,2,,n) 表示第i个处理n个观测值的和 表示全部观测值的总和 表示第i个处理的平均数 表示全部观测值的总平均数,表示第i个处理观测值的平均数。 为了看出各处理的影响大小,将 再进行分解,令 : 则 称单因素试验 的 线 性 模 型 其中 表示全部试验观测值总体的平均数; i 是 第 i 个 处理的效应 ;ij是试验误差,也是单因素试验的数学模型的性质,1)、效应的可加性 2)、分布的正态性 3)、方差的同质性,方差分析的前提或基本假定条件,试验结果的总平方和
35、,SST = 令:C = c 为校正系数,总平方和:SST =,1、平方和的分解:,总平方和=组内平方和(误差) +组间平方和(处理平方和) 即: SST= SSe + SSk,SST = =,组间平方和:SSk= =,误差平方和:SSe = SST - SSk,2、自由度的分解:,总自由度 = 组间自由度 + 组内自由度 即:dfT= dfk + dfe 总自由度:dfT =nk-1 处理间自由度:dfk =k-1 误差自由度: dfe = dfT - dfk =k(n-1) 其中:k:处理数 n:重复次数,3. 方差(均方)的分解,总均方(方差): MST =,处理间(组间)均方(方差):
36、,误差(组内)均方(方差):,MSk =,MSe =,三、F检验:,1、F值: : 组间方差(处理间方差) :组内方差(试验误差),理论上,如果,和,来源于一个总体。则F1,也就是说,它们都可以作为总体的方差估计值。,由于随机抽样误差存在,F常常不等于1。如果F值小于1(F1)说明处理间的差异(方差)与误差相同,认为这种差异就是由误差造成的。如果F值大于1(F1),则根据小概率原理进行判断。,2、F分布:,若在给定的k和n的条件下, 从该总体进行一系列抽样,可获得一系列样本,得到一系列的方差(值),将这些方差进行求比值,则可获得一系列的F值。这些F值所有的概率分布称为F 分布。 F 分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称。(见下图),附 表 5 列 出 的 是 不 同 df1 和 df2 下 , P(F )=0.05 和 P(F ) =0.01时的F值,即右尾概率=0.05 和=0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国智慧高速公路行业市场发展现状及前景趋势与投资分析研究报告(2024-2030)
- 健康知识普及课件
- 健康的生活-生物课件
- 2024年标签贴纸项目项目投资申请报告代可行性研究报告
- 营销全业务管控管理办法
- 蚌埠市数据共享管理办法
- 街道办事处考勤管理办法
- 西藏大学勤工俭学管理办法
- 装修与机电配合管理办法
- 西咸新区自行车管理办法
- 直流屏检修作业指导书(word文档)
- YY/T 1293.2-2022接触性创面敷料第2部分:聚氨酯泡沫敷料
- GB/T 19404-2003微波铁氧体器件主要性能测量方法
- GB/T 18418-2017家用卫生杀虫用品电热蚊香液
- GB/T 17456.2-2010球墨铸铁管外表面锌涂层第2部分:带终饰层的富锌涂料涂层
- 政府用地项目用地报批流程
- 高校毕业生学籍档案管理课件
- 老年人的生理变化特点课件
- 徐健顺吟诵文集(.12.16)
- 临床药师用药干预记录表
- 特种设备管理“332211”工作法
评论
0/150
提交评论