生物统计学讲稿_第1页
生物统计学讲稿_第2页
生物统计学讲稿_第3页
生物统计学讲稿_第4页
生物统计学讲稿_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流生物统计学讲稿.精品文档.生物统计学讲 稿福建农林大学林学院绪 论学时数:1学时(一)学时:1学时(二)教学目的:使学生掌握生物统计学研究的基本问题,生物统计的发展历史,生物统计的研究方法及其应用与发展。(三)教学进程与内容:1概率论与生物统计研究的对象必然现象与随机现象随机现象的统计规律性2生物统计发展简史3生物统计研究方法研究如何抽样问题如何进行整理、分析,进而进行估计推断4生物统计的应用与发展(四)参考资料:1贾乃光等编著数理统计(第四版)中国林业出版社,20062洪伟等林业应用数理统计大连海运学院出版社,19883毕庆雨数理统计中国林

2、业出版社,19924贾乃光数理统计(第三版)中国林业出版社,19935洪伟林业试验设计技术与方法北京科学技术出版社,1993第一章 随机事件及其概率随机变量及其分布学时数:21学时§1-1 随机事件(一)学时:1学时(二)教学目的:使学生掌握本学科最重要的概念之一-随机事件,掌握事件的概念、事件之间关系及事件的运算,掌握互斥事件完备群的概念。(三)教学进程与内容: 1随机事件随机事件:定义:在某一随机试验中有可能出现、也可能不出现的事件被称为随机事件,或简称为事件,用A、B、C等表示。 必然事件、不可能事件与集合(举例说明):并给全集与子集的概念。2事件之间的关系及运算(以图示进行说

3、明) 包含关系:事件A包含事件B,记为AB;或者事件B被事件A包含,记为。 事件的相等A=B:若AB且,则称A、B相等,记为A=B。事件的和(或并)A+B:事件A、B中至少一个发生的事件被称为事件A、B的和,记为A+B。引出交换律、结合律事件的积(或交)AB:事件A、B同时发生的事件被称为A、B的积,记为AB。引出分配律事件的差A-B:事件A发生但事件B不发生的事件被称为A-B。事件的补(或逆):事件A未发生也是一个事件,被称为A的补或逆。引出摩尔律事件的互斥(或互不相容):若,则称A、B互斥或互不相容。互斥事件完备群:若A1、A2Ak两两互斥,且A1+A2+Ak=,则称A1、A2Ak为互斥事

4、件完备群。§1-2 概率 (一)学时:5学时 (二)教学目的: 使学生掌握概率的定义、古典概型、概率的性质、条件概率、乘法法测及事件的独立性等定义并能熟练地加以应用,掌握全概率公式与逆概率公式。 (三)教学过程与内容:1事件出现的频率 设同一试验被重复地做了n次,其中事件A出现了m次,则称m?n为事件A在此n次试验中出现的频率。2概率的定义当同一试验重复进行了n次,若事件A的频率随着n的增大而愈趋于稳定地在某一常数p的附近摆动时,则称常数p为事件A的概率。3古典概型若实验结果是由有限个基本事件组成,可设有n个基本事件,而且每一基本事件发生的概率相等,则事件A的概率为:P(A)=有利于

5、A的基本事件的个数/n4概率的性质(1)(2)(3)(4)概率的加法定理: 任给事件A、B有P(A+B)=P(A)+P(B)P(AB)(重点) (给出证明过程)。(5)当A、B为互斥事件时,P(A+B)=P(A)+P(B) 推论:若A1、A2An为两两互斥,则P(A1+A2+An)=P(A1+P(A2)+P(An)(6)P()=1-P(A)或P(A)=1-P()5条件概率、乘法法则及事件的独立性 条件概率的定义及其计算公式: 若P(A)=0或P(B)=0,规定P(AB),规定P(AB)=0 概率乘法定理:(可由条件概率直接得到)P(AB)=P(A)P(BA)=P(B)P(AB) 进一步推广 P

6、(A1A2An)=p(A1)P(A2A1)P(A3A2A1)P(AnA1A2An-1) 事件的独立性)定义1:若P(AB)=P(A)或P(BA)=P(B)称A、B相互独立。)定义1:若P(AB)=P(A)P(B),则称事件A、B相互独立)定义2:若定义A1、A2k这k个事件中的任一事件Ai都满足。P(AiAj1)=P(AiA1Aj2)=P(AiAj1Aj2Ajk-1)=P(Ai)其中j1、j2jk-1为i除外的1、2k中k-1个数的任意种排列,则称A1、A2Ak相互独立)推论: 若A、B相互独立,则与B,与,A与 相互独立 若A1、A2Ak(k2)相互独立,则 举例 6全概率公式与逆概率公式

7、互斥事件完备群: 若A1、A2Ak两两互斥,且A1+A2+Ak=,则称A1、A2Ak为互斥事件完备群。 全概率公式 设B1、B2Bk为互斥事件完备群,则任给事件A有 (给出证明过程) 逆概率公式(Bayes公式) 设B1、B2Bk为互斥事件完备群,且有P(A)>0 则 (给出证明过程,并说明与全概率公式间的联系) 举例(四)作业:P46:1、2、3、4、5、6、14、18题§1-3 随机变量(一)学时:3学时(二)教学目的: 为了更深入研究随机现象,要求学生掌握随机变量概念,重点掌握一维随机变量的有关内容,让学生了解几种常见的随机变量类型及其有关函数。(三)教学过程与内容:1、

8、随机变量的概念(从实际例子中引入随机变量的概念)定义:在一定条件下进行试验,如果所要观察的试验结果是某一变量或某一组变量,并且该变量或该组变量小于任意一个特定值或小于某一组特征数值的概率存在,则称所观察的试验结果是随机变量,当试验结果为一个变量时,称为一维随机变量;当所观察的试验结果是一组变量时,称为多维随机变量;当所观察的试验结果是一组变量时,称为多维随机变量。说明:随机变量的特性:a)随机性; b)统计规律性 随机变量与普通变量的联系与区别2、一维随机变量及其概率分布 分布函数的概念:如果表示随机变量,x表示任一实数,则随机变量小于x的概率为x的函数,记作F(x)=P(<x)称F(x

9、)为随机变量为概率分布函数。 分布函数性质: a)F(x)是x的非减函数 b)F(-)=0;F(+)=1 c)F(x)函数至多有可列个间断点,而在其间断点上也是右连续。 随机变量的类型及其性质)离散性随机变量的概念)概率函数的性质:a)非负性:(Xi)=Pi 0; b)归一性: )连续型随机变量的概念)概率密度函数的性质:a)非负性:f(x)0;b)连续性:f(x)连续; c)归一性:)两类随机变量的区别)举例(四)作业:P48:29-31题§1-4 一些常见的概率分布(一)学时:4学时(二)教学目的: 让学生了解几种常见的重要的概率分布,了解各种概率分布的概率函数或密度函数,重点掌

10、握正态分布的有关性质、计算。(三)教学过程与内容:1离散型随机变量的概率分布 两点分布(0-1分布):P(=1)=p;P(=0)=q=(1-p) 二项分布B(n,p): P(=k)=(k=0,1,2n) 几何分布G(p):P(=k)=pq (k=1,2) 超几何分布H(n,M,N):P(=k)=(k=0,1,2,min(n.M)) 负二项分布NB(r,p):P(=k)=(k=0,1,2) 泊松分布P():P(=k)=(k=0,1,2) 其中重点掌握B(n,p)、P()、H(n,M,N)、分布,对于其它分布举例说明2连续型随机变量的分布均匀分布U(a,b):指数分布e():正态分布N: )f(x

11、)图象性质 )标准正态分布N(0,1)及其正态分布表的应用)正态分布标准变换)一般正态分布的概率计算对数正态分布:Weibull分布:W(,):c2分布:c2(k)t分布:t(k)F分布 F(k1,k2)在连续型概率分布中,重点掌握正态分布的性质、计算,对于每一种分布,举例说明它们在各个领域中的应用。3有关正态分布及统计学三大分布的定理(1)定理1 若,则对任意的及任意的d有(2)定理2 若相互独立,且有,则(3)定理3 若相互独立,且有,则(4)定理4 若,且相互独立,则(5)定理5 若。有,且相互独立,则(6)定理6 若,且相互独立,则(7)定理7 若,且相互独立,则(四)作业:P48:3

12、4-35题;P49:54题§1-5 随机变量的特征数(一)学时:4学时(二)教学目的: 使学生掌握随机变量的几种特征数,进而对描述随机变量有更深入的了解,其中重点掌握随机变量的期望与方差的有关概念、性质。(三)教学过程与内容:1数学期望定义:离散型:=连续型:=随机变量函数的数学期望: 离散型:h=Eg()=连续型:h= Eg()=举例说明有关数学期望的计算性质:)c=c (c为常数))(1±2)=1+2可进一步推广到有限个。)若1,2相互独立,则(1·2)=2·2推论:a) (c)=cb) (1··k)= 1·2·

13、;·k (其中1k相互独立)2方差(D,)与标准差()定义:离散型:连续型:性质:) )若1,2相互独立,则举例说明方差的计算及其性质的作用说明:方差与标准差的联系与区别3协方差与相关系数定义:协方差Cov(1,2)=(11)(22)相关系数: 性质:)若1,2相互独立,则Cov(1, 2)=0)若C为常数,则 Cov(,C)=0计算公式举例4、矩:5、众数和分位数(中位数、四分位数)6、常用统计分布表(四)作业:P49:40、41、43、44、47§1-6 随机变量序列的极限性质(一)学时:2学时(二)教学目的: 让学生重点掌握二项分布的两个极限,包括其条件、结论及其在实

14、际中的应用,对随机变量函数的概率分布作一般性了解。(三)教学过程与内容: 1、二次分布的两个极限分布:(进行证明) 超几何分布以二项分布为极限定理1:若,则当N、M、N-M皆充分大,而M/N充分接近p时,有以正态分布为极限:定理2:若随机变量B(n,p),当n>50时,且np>5,nq>5时,以泊松分布为极限: 定理3:若随机变量B(n,p), 当n>50时,且p<0.1或q<0.1时 即 举例说明这个定理的应用,并对三种计算方法进行比较。(四)作业:P49:50、53§1-7 大数定律与中心极限定理(一)学时:2学时(二)教学目的: 向学生介绍数

15、理统计的理论基础概率论的基本定理,从而对前面所学的知识有了更深的理解。(三)教学过程与内容: 1、切贝谢夫不等式: 设x存在Ex及x,则任给x>0有给出证明过程并举例加以给证及其应用分析2、大数定律:(给出证明) 引理:若x1,x2为随机变量,uk,分别为xk的期望与标准差,若=0,则 切贝谢夫定理: 设x1,x2为相互独立的随机变量,Exi,的期望与标准差,如果)则 贝努里定理: 设在一系列独立进行的试验中,若每次试验某事件A出现的概率皆为P,在n次试验中事件A出现的次数为m,则 泊松定理: 设有一系列独立进行的试验,在第i次试验中,事件A出现的概率为Pi,在n次试验中,事件A出现m次

16、,则 注:大数定律中的这些定理不仅要给出证明过程,而且要详细说明每个定理的意义。3、中心极限定理:(不作证明) 定理:设X1,X2Xn为相互独立同分布的随机变量系列, , 令,设其分布函数为 则第二章 统计中的一些基本概念学时数:2学时(一)学时:2学时(二)教学目的: 使学生掌握生物统计中的一些基本概念,了解频率分布的有关内容。 (三)教学过程与内容: 1、总体与样本 总体:研究对象的全体。 涉及:总体单元、总体单元划分方法及总体类型 标志:说明总体单元在某一方面的特征而采用的名称。 标志值:总体单元为数量标志所作出的回答。样本:在全部总体单元中,按照预先设计的方法抽出一部分单元,所抽取的这

17、一部分单元称为样本。 抽样及抽样类型 等概抽样方法 )抽签法; )随机数法; )经验数据法2、样本特征数与统计量样本特征数与统计量的概念总体特征数与样本特征数的内容(见对比表)并举例说明其计算方法3、频率分布频率分布定义方法样本频率分布4、平均数与方差:简便计算方法数据分组后的计算方法利用线性变换进行计算(四)作业:P73 4、10附表:总体平均数与样本平均数对比表特征数总体样本平均数总 量平方平均数方 差标准差极 差变动系数频 率第三章 参数估计学时数:8学时§3-1 概述(一)学时:2学时(二)教学目的: 使学生了解本章所要解决的基本问题及制定估计量的方法,判断估计量好坏的标准。

18、(三)教学过程与内容:1、参数估计的三个基本问题 估计量的制定 优良性的判断 误差限、可靠性及精度问题2、估计量的确定 矩估计法 极大似然估计法 3、估计量的评价标准 无偏性(渐近无偏性):举例 一致性(拟合性):举例 有效性4、估计量的误差限与可靠性 误差限与可靠性的定义 参数估计的类型:)点估计 )区间估计 估计精度§3-2 总体平均数u的矩估计(一)学时:3学时(二)教学目的:使学生掌握总体平均数的参数估计方法,重点掌握大样本、重复抽样及小样本的估计方法。(三)教学过程与内容 1、大样本估计方法(n50) 重复抽样估计方法 a)估计值的确定: b)估计量概率分布: c)估计方法

19、 )点估计: )区间估计: 当s未知时,用近似代替d)样本单元数的确定: e)举例说明其应用 不重复抽样的估计方法(作简单介绍) a) 已知的估计方法 区间估计: b)未知估计方法 区间估计: 2、小样本估计方法(n<50) 条件:总体服从或近似服从正态分布 已知时的估计方法 (与大样本一致) 未知时的估计方法 a)估计原理:N(0,1); b)估计量的制定:T=t(n-1) c)估计方法: )点估计: )区间估计 d)举例说明其应用 e)说明大样本与小样本方法间的关系(四)作业:P96:10、11§3-3 总体频率W的抽样估计(一)学时:3学时(二)教学目的: 使学生掌握有关

20、总体频率的估计方法,重点掌握大样本重复抽样时总体频率的估计方法。(三)教学过程和内容: 1、估计量的确定:W 2、估计方法 大样本估计方法 a)重复抽样条件下 )用正态分布估计总体频率(n50,np>5,nq>5) 点估计:W=w, 区间估计: )用泊松分布估计总体频率(n50,p<0.1或q<0.1) 由mB(n,w) ,(=nw)查泊松分布参数的置信区间表(附表7)得到的置信区间从而推及W的置信区间。 )举例说明 b)不重复抽样的估计方法(简单介绍) 点估计: 区间估计: 小样本估计方法(二项分布估计方法) 利用二项分布参数的置信区间(附表5)进行求解,具体方法以例

21、题形式给出。(四);作业:P97:13、19、20§3-4 总体方差的区间估计(一)学时:1学时(二)教学目的:使学生初步掌握总体方差的估计方法,学会简单运用。(三)教学过程与内容: 1、设总体为正态或近似正态分布,与分别为样本均值与样本方差,有 2、通过分布的上侧分位数表计算a、b。(四)作业:P97:21第四章 统计假设检验§4-1 一般概念一、统计假设和假设检验的概念 1 统计假设:任何一个有关随机变量未知分布的假设称为统计假设,简称假设。 引例:设某厂生产一种灯管,其寿命N(u,40000),长期生产情况看,此管平均寿命u1500小时。问采用新工艺后,此管寿命是否会

22、提高?分析:上述问题要判别新产品寿命是服从u1500的正态分布(显著提高),还是服从u=1500的正态分布(设有显著提高),这两种情况用统计假设的形式表示:第一个统计假设u=1500表示采用新工艺后产品平均寿命设有显著提高称之为原假设(零假设,解消假设),记为:u=1500第二个统计假设u1500表示寿命显著提高,称为备择假设。用符号:u1500表示在许多问题中,总体分母的类型已知(如上例),仅是一个或几个参数未知,只要对这一个或几个参数的值作出假设,就完全确定了总体的分布。这种仅涉及到总体分布的的未知参数的统计假设称参数假设。但有些问题,我们无法知道总体分布的具体类型。如某种农作物农药的残留

23、量,之和服从对数正态分布,也可能服从其它分布。因此,统计假设只能对未知分布函数的类型或其它的某些特征提出某种假设,称之非参数假设。2 假设检验:通过抽取一个样本进行考 ,从而决定它能否合理地被认为与假设相符,这一过程称假设检验。判别参数假设检验称参数检验。二、假设检验的基本思想引例2:设袋中有白球及黑球1000个,但不知它们各是多少。现提出原假设:白球是999个,H:白球999如果为真,则从袋中任取一球“得黑球”的概率是0.001,也就是说若为真,抽到黑球的可能性很小,即“得黑球”是个小概率事件,在一次试验中几乎不至于发生。但假如实际抽样“得黑球”这个事件竟然发生了,这就在为真的情况下产生了一

24、个不合理的现象。于是怀疑为真,从而拒绝原假设而接受备择假设,即白球不是999个;相反,如果“得黑球”事件没有发生,这就只得接受。但是注意不否定,并不意味着H一定成立。三、假设检验的步骤1 根据问题的要求建立原假设 及备择假设。2 选择一个合适的统计量(该统计量一般是在假设成立前提下构造)。3 给定显著水平,确定的拒绝域或接受域。所谓拒绝域:接受备择假设的样本观测值的集合。4 根据一次抽样结果和小概率原理作出结论。四、关于两类错误由于小概率事件在一次试验中有发生可能性,因此,按小概率原理进行检验,会犯两类错误。1 第一类错误(弃真错误):事实上是正确的,但结论却拒绝犯第一类错误的概率为,1为可靠

25、性。2 第二类错误(采伪错误):事实上 是不正确的,但结论却接受犯第二类错误的概率为,1为检验功效。一般地,与是此消彼长,不可能同时很小。若要同时变小,必须加大样本容量,又不合实际。§4-2 总体平均数 u的假设检验 一、类型:u,:u 1大样本方法:重复抽样条件下在大样本,重复抽样条件下,N(0,1)于是对于给定,P当成立时。有PP 或者P也就是说,在成立下,出现“”事件概率很小,只有若令u=,则“”事件发生是个概率事件,在一次试验中一般不会发生。如果真不发生,则依小概率原理,接受 ;如果发生,则没有理由接受,要拒绝即接受。于是得如下步骤:1 建立假设:,:。即现实总体平

26、均数与规定总体平均数间无显著差异。2 计算统计量:(已知) (未知)3 小概率标准,查表得4 当时,接受,当时,拒绝:不重复抽样条件下在大样本不重复抽样条件下,有因此,在成立下,有令则接受域:,拒绝域:。例1:某林场内造了一块杉木速生生产林,5年后调查其树高,从中重复抽样得50株,10.8m,2.2m,问是否可以认为该丰产林平均高与10m无显著差异。(=0.05)解:设:(m):计算:故根据原假设,即平均高与10m有显著差异。例2:某杨树品种10年生平均高可达15m,另有一新杨树品种,10年后采取重复析样方式随机抽取60株进行调查,得其平均高为17.2m,标准差2.3m,问新杨树品种平均高与1

27、5m是否有显著差异?(=0.05)解:设: :计算: 根据原假设,即平均高与15m有显著差异。例3:某树种仔在某地区的千粒重为185克,现从其它地方调来一批种子,随机抽取65个样本测得平均千粒重169克,标准差13克,问所调来种子是否与该地区种子的千粒重有显著差异?(=0.05)解:设:克:计算: 根据原假设,即所调来的种子与该地区种子千粒重有显著差异。2小样本方法(前提:小样本,总体服从正态分布) 由第二章参数统计可知,在小样本及总体服从正态分布前提下:故在成立下,因此对于显著水平,查分布表有或例5作杨树育苗试验,得一定生长后,从株距为20cm的苗种随机抽取了12株,苗高数据为221、244

28、、240、243、288、233、226、210、258、245、264、200(cm),得苗高分布近似正态,问能否认为该杨树苗高与240cm无显著差异?(=0.05)解:依题可得cm,cm,. 设:cm. 计算: 杨树苗高与240cm无显著差异例6为调查某林杨滞尺蛾蛹密度,由该林志随机抽取10个1土方,资料为(头/):289、342、412、297、191、440、351、337、304、357假定蛾蛹密度服从正态分布,问该林场滞尺蛾蛹密度与352(头/)是否有显著差异?(=0.01)解:. 设:(头/). 计算,. 对于,得 该林场滞尺蛾蛹与352(头/)无显著差异例7某营林局用一定投资按

29、技术规程育苗,在正常管理下,A树种1年生苗木高服从平均高为65cm的正态分布,现从苗圃中抽取5样本,平均高为72.5、76.5、58.0、65.0、46.0(cm)解:,. 设:. 计算:. 对于,得二、类型:(a):,:;(b):,:在实际问题中,我们碰到的问题并不是想知道总体平均数是否向某一值无显著差异,而是想知道总体平均数能否(超过或低于)某一规定的标准,前面检验问题可以从两侧分边进行检验,而现在则规定只能从一个方向上进行,故称单侧检验。对于双侧检验来说,两边各2.5属推翻假设的区域,而现在必然将5概率全部归到一侧来,是否大于某一标准,集中于右侧,而是否小于某一标准,集中于左侧。以大样本

30、情况说,集中一侧等于把2个2.5搬到一边来,相当于分属两侧时,一侧占5,从而两侧将是10的情形。其检验方法与从侧检验基本相同,所不的是临界值(即 )与拒绝域。类型确定方法由而定。1、样本方法1)、重复抽样条件下检验步骤: 建立假设:,:() 计算: 对于给定,查表得由正态分布对称性知, , 对于(a)式,拒绝域为: 对于(b)式,拒绝域为:例1规定白杨插条育苗一年生平均高达160cm以上可以出圃,今在圃地上随机抽取65株作为调查的平均高为155cm,标准差不24cm,问这批毛白杨能否出圃?解:=155cm160cm。毛白杨扦条苗高有可能低于160cm标准 设:,:cm 计算: 对于, 故拒绝,

31、接受。例2某苗圃规定杨树苗平均高达60cm以上才能出圃,今从中随机抽取64株,并求得cm,cm,试问该苗木能否出圃?()解:cm>62cm 设:cm,: 计算: 对于, 拒绝,接受,即这批苗木可以出圃。例3某苗圃规定杨树苗平均高达60 cm以上才能出圃,今从中抽取50株,得平均高为62.5,标准差为9cm,问该批苗木能否出圃?()解:.5cm>60cm 设:,:=60 计算: 对于, 拒绝,接受,即可以出圃。2)不重复抽样(简述):由得于是对于(a)型,拒绝域: (b)型,拒绝域:2、小样本方法:仍用t分布,即将双侧检验中改为即有检验方法: 建立假设:,:() 计算: 对

32、于给定,查t分布双侧分位数表得 对于(a)型,拒绝域: (b)型,拒绝域:例4某木材公司购买木材时,按质论价,现从一批木材中随机抽取16根,测得它们的小头直径为12、10.2、11.4、13.6、14.5、16、8.4、9.6、18、8.0、12.4、13.6、10.8、15.4、7.6、16.6(cm)。假定木材的小头直径服从正态分布,试问这批木材小头直径可达12cm以上?解:, 设:,: 计算: 对于, 接受,即小头直径未达到以上。例5对某种杀虫剂规定平均每瓶()杂质含量低于时才能出厂,今随机抽取20瓶进行检验,得资料为(g)2.7、3.1、2.5、3.3、2.6、2.8、2.4、3.4、

33、3.2、2.5,设杂质含量服从正态分布,试问该杀虫剂能否出厂?()解:, 设:,: 计算: 对于,得 接受,拒绝。即该批杀虫剂不能出厂。§4-3 总体频率的假设检验一、大样本方法设表示总体频率,为抽取样本计算所得的频率由前面知识已知: ()于是对于给定,在:成立条件下,可以得到不同类型的拒绝域: 双侧: 单侧:(a)型: (b)型:二、小样本(用二次分布表检验) 双侧检验:查二次分布参数P的置级区间表(附表5),若属于该区间,则接受,否则,接受 单侧:(a)型:查二次分布表(附表4)若,则拒绝 (b)型:(同上)若,拒绝例1已知某种子的发芽率为90,现用辐射方法对种子进行处理,从处理

34、后种子随机抽取500粒作发芽试验,结果有465粒发芽。问这批种子经过处理后,是否明显变了种子的发芽率?解: 设: 计算:, 对于, 接受§4-4 两个总体平均数与频率的差异显著性检验差异显著性检验(也称差异的假设检验),在实际中应用十分广泛。如可比较不同立地条件下林木生产的差异;不同抚育措施对林木生产的影响;不同的杀虫药剂对昆虫的毒杀作用等,其实质是解决两个或多个总体的同一特征数是否有显著差异问题。本节主要讨论两个总体平均数或频率之间的差异显著性问题。一、两个总体平均数的差异显著性检验思想:有两个独立抽取的样本,要检验它们是否来自是否有相同总体平均数的总体,解决方法是计算样本平均数,

35、与样本标准差,然后判断与0是否有显著差异,若与0没有显著差异,则说明,所来自的总体可能具有相同的总体平均数;否则,则认为差异显著。1 大样本方法:前提:独立,重复抽样、等方差设:(即两总体平均数差异不显著)并设:则有在大样本情况下:,由于两总体相互独立,即与相互独立于是有 令,则于是对于给定,得,= 当时,接受原假设当时,拒绝原假设由于通常未知,在此用近似代替这时,统计量变为:得检验: 双侧: 单侧:即(右侧):即(左侧)例1为比较林分对红松结实量的影响,现分别从缓坡灌林红松针阔混交林(A)及缓坡灌林云冷杉红松林(B)中测得红松一株木的结果如下表: 林分 株数一株木结果平均值 标准差 A 60

36、 111 67 B 80 107 50试问:这两种不同的林分对红松的结实量不无显著影响?解: 设: 计算: 接受假设例2对甲、乙两块落叶松林地松毛虫蛹密度进行调查,甲、乙两林地各调查了100株,得到如下资料:甲林地(枚/株),(枚/株);乙林地(枚/株),(枚/株)。问两林地松毛虫蛹密度有无显著差异?解: 设:() 计算: 对于, 接受原假设例3某林场调查了一种危害林木的昆虫的两个世代的卵块中卵粒数,第一代调查了128块,得平均数,标准差;第二代调查了69块,得。试检验两个世代卵块数差异性。解: 设: 计算: 对于, 拒绝原假设2 小样本方法:前提:独立、正态、等方差设:,由已知的前提条件得在

37、成立下,若令,则有又,由于与相互独立,若令则有由于与相互独立。令,则即于是对于给定,有,检验方法: 设: 计算:T 对于给定,查表得 若,拒绝例4在不同的土壤上进行较在面积的育苗试验,然后进行随机抽样调查,得苗高资料如下表:(设苗高服从正态分布)砂土32347672756466403842壤土505155879193555762747672问:砂土与壤土对苗高的生长是否有显著影响?解: 设: 计算:, 对于, ,接受例5在山坡上、下两个部位造林,5年后抽样调查其胸径(cm)上部867993107112114989510185下部126102117123111105106122该林木胸径服从正态

38、分布。问上、下两个部位造林其林木胸径有无显著差异?解: 设: 计算:, 对于, 拒绝例6为研究赤松和刚松的生物量差异,分别对每种松抽样调查测定8个样品的针叶生物量服从正态分布,试比较两种松树针叶生物量的差异性赤松113109114120126117117119刚松120125125131124123128122解: 设: 计算:, 拒绝二、两总体频率的差异显著性检验 前提:大样本、重复抽样、相互独立设:总体1:、;总体2:、,则,; ,在成立下由于大样本有 未知,用, 近似代替即有 于是得到三种不同检验类型拒绝域。例7.为比较林分类型对结实株率(结实株数/总株数)的影响,现由灌林云冷杉红松林中

39、随机抽取370株红松,查得有129株结实; 灌林红松针阔混交林中抽得200株红松,查得115结实,问这两种不同的林分的红松结实株率有无显著差异? 解:设:计算:,对于,拒绝例8一个林场用年生杉木苗造林,秋后调查400株,成活300株,问用,年生杉木苗在相同条件下造林,成活率有无显著差异?解:设: 计算:,接受例9:甲,乙两工人在相同条件下,对同种苗木进行嫁接,后调查它们的嫁接成活率,对甲调查200株,成活了180株,对乙调查了160株,成活135株,问甲、乙两人的嫁接水平有无显著差异?解:设: 计算:,;, 接受例10某苗圃为鉴定两畦杨树扦条成活率,在第一畦中观察500株,成活450株,第二畦

40、观察350株,成活322株,试以0.05检验水平检验两畦杨树扦条成活率有无显著差异?解:设: 计算:,;, 接受§4-5方差齐性检验前几节讨论了总体平均数与总体频率的假设及检验问题。它们常是实践中最关心的问题,因为诸如林分的生长、苗木的高、地径、林木的心腐率、昆虫的死亡率等都是通过平均数、频率表达出来的。但代表作用的强弱度各单元值的变动程度或相对地说爱各单元值稳定程度的制约。因此,有必要来讨论方差这个特征数。另外,在前几节讨论中曾指出,要对平均数的差异显著性作t检验,要以“等方差”假设为前提,否则,结论亦将不正确。能否判断方差相同或不同,涉及到方差的差异显著性检验问题。方差是否相同的

41、假设检验统计上称方差齐性检验。一、两个正态总体的方差齐性检验(重复抽样)设两个总体方差为要检验:(即两个方差无显著差异)由前面可知,由于相互独立当成立时,有令,则由于F检验临界值表构造(拒绝域在右侧)及F分布随机变量期望值=特点,在检验中,要求上式于是对于给定,拒绝域为,若,则令再作检验例1在不同的土壤进行较大面积的育苗试验,秋后进行随机抽样调查,得到苗高效资料如下表。砂土32347672756466403842壤土505155879193555762747672试检验它们所来自的两个正态总体的方差是否相等?解: 设: 计算: 于, 接受例2设有甲、乙两块10年生人工马尾松林,所研究标致为林木

42、胸径。已知林木胸径分布近似正态分布,用重复抽样方式分别从两总体中抽取若干林木,测得其胸径数据如下表,试以水平判断甲、乙两块林地胸径总体方差是否相等?甲45805020355550755575乙3050204050503030解: 设: 计算: 对于, 接受二、多个正态总体的方差齐性检验设有m个正态总体,其方差分别为,要检验: 中至少两个不相等1检验法(巴特勒Bartlett检验法) 设从m个总体中抽取了n个样本,其变量分别为 则统计量为 其中:于是对于给定,查自由度为m-1的分布临界值表(附表9)得若,则拒绝2Hartleg(哈特勤)检验 若在m个总体中所抽取的样本容量相等,即 则统计量 其中

43、:分别为m个样本方差的最大与最小者 若,则拒绝三、数据变换目的:将不服从方差齐性的数据通过变换后变成服从方差齐性,这在方差分析中是十分重要的。变换方法:平方根变换:(遵从泊松分布) 反正弦变换:(为百分率,为相应角度值) 适用于数据的近似遵从二次分布的情况。对数变换:,适用于标准差与平均数成比例的数据。§4-6 总体分布的假设检验前面所讨论的各种假设检验,大部分要求总体服从正态分布,但在实际问题,对总体分布的类型我们常无法知道或了解甚少。因此,如何根据样本资料对总体分布的假设进行检验,如是否遵从正态分布、二次分布、泊松分布等。关于总体是否遵从某一分布的判断,称为总体分布的假设检验问题

44、。理论基础:皮尔逊定理Pearson定理:设总体服从某分布,将的取值范围分成互不相交的m个小区间。以表示样本观测值落入第个小区间的个数(称实测频率)。表示落入第个小区间的概率,则当n充分大时,不论总体服从何分布(不含末知参数),统计量,当总体的分布有r个末知参数时。检验法:设:总体遵从某一分布,:总体不遵从某一分布。步骤: 设取值范围为(),将()分成m个小区间(一般7-14个): 统计落入上述每个小区间的观测值个数(实测频数),记为。 再假定成立下,计算落入每个小区间:概率(理论频率):,于是得到落入每个小区间理论频数: 计算统计量:,则或(含有r 个末知参数) 若,则拒绝例1某林区随机抽取

45、200株落中叶松得胸径资料如下表,试检验该地我落叶松用径是否服从正态分布?胸径分组 株数 组中值1014 3 121418 14 161822 22 20 2226 52 242630 59 283034 31 323438 15 363842 4 40解:正态分布中有二个参数与均末知,需作相应估计于是设 :落叶松胸径 计算:落入每个小区间概率;( 正态分布表)同样有 于是得到理论频数:从而: 对于,查表得 接受例2对500个小土样方内查数得到的某种虫卵数资料如下:虫卵数01234567土方数941681316832511试检验卵在土中的分布是否服从泊松分布解:设:虫卵数(末知)由于末知,用作

46、估计于是:虫卵数计算:区间: 则由泊松分布表得(理论频率)同样有, 于是理论频数,对于,查表得接受 §4-7 适合性检验与独立性检验一、适合性检验检验法不仅可以用来检验总体分布,而且也可以用来检验实际试验中测定的结果与科学试验中所作的某种理论推断或某种科学假设是否相符合的问题。或者说,在科学试验中,常根据理论与推断,对实际数据提出种种科学假设。由于很多假设是定量性质的,如何证实或推翻这些假设呢?当然一般只有从总体中进行抽样,把实际内得样本数据与假设推翻的理论数据进行比较,从表达式可以看出,可理解为一批(m个)实测频数的相对差异之和,值越小,说明吻合情况越好。象这样利用统计量来检验实测

47、与理论是否符合的问题,称适合性检验。例1孟德尔在其著名的碗豆杂交试验中,用黄色光滑的种子与绿色皱皮的碗豆种子杂交;第二代种子的外形株数如下表,试问这种分离比率是否符合9:3:3:1的比例关系。(这个比例就是孟德尔提出的假设,并由此获得基因分离法测)。第二代种子外形黄色光滑黄色皱皮绿色光滑绿色皱皮合计株数31510110832556解: 设:分离比例符合9:3:3:1 计算:(在成立下,计算四种类型植株的理论频数)而实测频数为 ,故接受二、独立性检验:(同质性检验)在实测与理论是否相符的适合性检验问题中,有时是以属性资料形式(不是数量形式)如病腐木、树叶颜色等。这种要判断的是在若干个不同条件下得

48、到的若干组(一个条件一组)数据是否成比例的形式的问题,称为独立性检验。例2在三种不同灌溉方式下考察水稻叶子的衰老情况得下表数据,试问:不同灌溉方式对叶子的衰老有何显著差异?灌溉方式绿叶数黄叶数枯叶数总数深水146 (140.69)7 (8.78)7 (10.53)160浅水183 (180.07)9 (11.24)13 (13.49)205湿润152 (160.04)14 (9.98)16 (11.98)182总和4813036547解:上表称3*3列联表 设:三种不同灌溉方式对叶子衰老无显著差异,即三种不同方式,三个绿叶,黄叶,枯叶的理论频数均无显著差异。因此,这是多个总体频率显著性检验问题,不能用前面方法检验。具体方法如下:首先计算深水灌溉方式下各种叶片的理论频数:深水*绿叶:深水*黄叶:深水*枯叶:同样可以得到其他交叉格内理论频数。(列于表中)于是,对于一般r*c联列表(r为横数,c为列数),自由度为(r-1)(c-1)于是对于 接受第五章 方差分析方差分析是R.A.Fisher于1923年提出的,它首先是被应用于生物学研究,特别是农业试验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论