已阅读5页,还剩72页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物统计学 讲 稿福建农林大学林学院 绪 论学时数:1学时(一)学时:1学时(二)教学目的:使学生掌握生物统计学研究的基本问题,生物统计的发展历史,生物统计的研究方法及其应用与发展。(三)教学进程与内容:1概率论与生物统计研究的对象必然现象与随机现象随机现象的统计规律性2生物统计发展简史3生物统计研究方法研究如何抽样问题如何进行整理、分析,进而进行估计推断4生物统计的应用与发展(四)参考资料:1贾乃光等编著数理统计(第四版)中国林业出版社,20062洪伟等林业应用数理统计大连海运学院出版社,19883毕庆雨数理统计中国林业出版社,19924贾乃光数理统计(第三版)中国林业出版社,19935洪伟林业试验设计技术与方法北京科学技术出版社,1993第一章 随机事件及其概率随机变量及其分布学时数:21学时1-1 随机事件(一)学时:1学时(二)教学目的:使学生掌握本学科最重要的概念之一-随机事件,掌握事件的概念、事件之间关系及事件的运算,掌握互斥事件完备群的概念。(三)教学进程与内容: 1随机事件随机事件:定义:在某一随机试验中有可能出现、也可能不出现的事件被称为随机事件,或简称为事件,用A、B、C等表示。 必然事件、不可能事件与集合(举例说明):并给全集与子集的概念。2事件之间的关系及运算(以图示进行说明) 包含关系:事件A包含事件B,记为AB;或者事件B被事件A包含,记为。 事件的相等A=B:若AB且,则称A、B相等,记为A=B。事件的和(或并)A+B:事件A、B中至少一个发生的事件被称为事件A、B的和,记为A+B。引出交换律、结合律事件的积(或交)AB:事件A、B同时发生的事件被称为A、B的积,记为AB。引出分配律事件的差A-B:事件A发生但事件B不发生的事件被称为A-B。事件的补(或逆):事件A未发生也是一个事件,被称为A的补或逆。引出摩尔律事件的互斥(或互不相容):若,则称A、B互斥或互不相容。互斥事件完备群:若A1、A2Ak两两互斥,且A1+A2+Ak=,则称A1、A2Ak为互斥事件完备群。1-2 概率 (一)学时:5学时 (二)教学目的: 使学生掌握概率的定义、古典概型、概率的性质、条件概率、乘法法测及事件的独立性等定义并能熟练地加以应用,掌握全概率公式与逆概率公式。 (三)教学过程与内容:1事件出现的频率 设同一试验被重复地做了n次,其中事件A出现了m次,则称m?n为事件A在此n次试验中出现的频率。2概率的定义当同一试验重复进行了n次,若事件A的频率随着n的增大而愈趋于稳定地在某一常数p的附近摆动时,则称常数p为事件A的概率。3古典概型若实验结果是由有限个基本事件组成,可设有n个基本事件,而且每一基本事件发生的概率相等,则事件A的概率为:P(A)=有利于A的基本事件的个数/n4概率的性质(1)(2)(3)(4)概率的加法定理: 任给事件A、B有P(A+B)=P(A)+P(B)P(AB)(重点) (给出证明过程)。(5)当A、B为互斥事件时,P(A+B)=P(A)+P(B) 推论:若A1、A2An为两两互斥,则P(A1+A2+An)=P(A1+P(A2)+P(An)(6)P()=1-P(A)或P(A)=1-P()5条件概率、乘法法则及事件的独立性 条件概率的定义及其计算公式: 若P(A)=0或P(B)=0,规定P(AB),规定P(AB)=0 概率乘法定理:(可由条件概率直接得到)P(AB)=P(A)P(BA)=P(B)P(AB) 进一步推广 P(A1A2An)=p(A1)P(A2A1)P(A3A2A1)P(AnA1A2An-1) 事件的独立性)定义1:若P(AB)=P(A)或P(BA)=P(B)称A、B相互独立。)定义1:若P(AB)=P(A)P(B),则称事件A、B相互独立)定义2:若定义A1、A2k这k个事件中的任一事件Ai都满足。P(AiAj1)=P(AiA1Aj2)=P(AiAj1Aj2Ajk-1)=P(Ai)其中j1、j2jk-1为i除外的1、2k中k-1个数的任意种排列,则称A1、A2Ak相互独立)推论: 若A、B相互独立,则与B,与,A与 相互独立 若A1、A2Ak(k2)相互独立,则 举例 6全概率公式与逆概率公式 互斥事件完备群: 若A1、A2Ak两两互斥,且A1+A2+Ak=,则称A1、A2Ak为互斥事件完备群。 全概率公式 设B1、B2Bk为互斥事件完备群,则任给事件A有 (给出证明过程) 逆概率公式(Bayes公式) 设B1、B2Bk为互斥事件完备群,且有P(A)0 则 (给出证明过程,并说明与全概率公式间的联系) 举例(四)作业:P46:1、2、3、4、5、6、14、18题1-3 随机变量(一)学时:3学时(二)教学目的: 为了更深入研究随机现象,要求学生掌握随机变量概念,重点掌握一维随机变量的有关内容,让学生了解几种常见的随机变量类型及其有关函数。(三)教学过程与内容:1、随机变量的概念(从实际例子中引入随机变量的概念)定义:在一定条件下进行试验,如果所要观察的试验结果是某一变量或某一组变量,并且该变量或该组变量小于任意一个特定值或小于某一组特征数值的概率存在,则称所观察的试验结果是随机变量,当试验结果为一个变量时,称为一维随机变量;当所观察的试验结果是一组变量时,称为多维随机变量;当所观察的试验结果是一组变量时,称为多维随机变量。说明:随机变量的特性:a)随机性; b)统计规律性 随机变量与普通变量的联系与区别2、一维随机变量及其概率分布 分布函数的概念:如果表示随机变量,x表示任一实数,则随机变量小于x的概率为x的函数,记作F(x)=P(50时,且np5,nq5时,以泊松分布为极限: 定理3:若随机变量B(n,p), 当n50时,且p0.1或q0有给出证明过程并举例加以给证及其应用分析2、大数定律:(给出证明) 引理:若x1,x2为随机变量,uk,分别为xk的期望与标准差,若=0,则 切贝谢夫定理: 设x1,x2为相互独立的随机变量,Exi,的期望与标准差,如果)则 贝努里定理: 设在一系列独立进行的试验中,若每次试验某事件A出现的概率皆为P,在n次试验中事件A出现的次数为m,则 泊松定理: 设有一系列独立进行的试验,在第i次试验中,事件A出现的概率为Pi,在n次试验中,事件A出现m次,则 注:大数定律中的这些定理不仅要给出证明过程,而且要详细说明每个定理的意义。3、中心极限定理:(不作证明) 定理:设X1,X2Xn为相互独立同分布的随机变量系列, , 令,设其分布函数为 则第二章 统计中的一些基本概念学时数:2学时(一)学时:2学时(二)教学目的: 使学生掌握生物统计中的一些基本概念,了解频率分布的有关内容。 (三)教学过程与内容: 1、总体与样本 总体:研究对象的全体。 涉及:总体单元、总体单元划分方法及总体类型 标志:说明总体单元在某一方面的特征而采用的名称。 标志值:总体单元为数量标志所作出的回答。样本:在全部总体单元中,按照预先设计的方法抽出一部分单元,所抽取的这一部分单元称为样本。 抽样及抽样类型 等概抽样方法 )抽签法; )随机数法; )经验数据法2、样本特征数与统计量样本特征数与统计量的概念总体特征数与样本特征数的内容(见对比表)并举例说明其计算方法3、频率分布频率分布定义方法样本频率分布4、平均数与方差:简便计算方法数据分组后的计算方法利用线性变换进行计算(四)作业:P73 4、10附表:总体平均数与样本平均数对比表特征数总体样本平均数总 量平方平均数方 差标准差极 差变动系数频 率第三章 参数估计学时数:8学时3-1 概述(一)学时:2学时(二)教学目的: 使学生了解本章所要解决的基本问题及制定估计量的方法,判断估计量好坏的标准。(三)教学过程与内容:1、参数估计的三个基本问题 估计量的制定 优良性的判断 误差限、可靠性及精度问题2、估计量的确定 矩估计法 极大似然估计法 3、估计量的评价标准 无偏性(渐近无偏性):举例 一致性(拟合性):举例 有效性4、估计量的误差限与可靠性 误差限与可靠性的定义 参数估计的类型:)点估计 )区间估计 估计精度3-2 总体平均数u的矩估计(一)学时:3学时(二)教学目的:使学生掌握总体平均数的参数估计方法,重点掌握大样本、重复抽样及小样本的估计方法。(三)教学过程与内容 1、大样本估计方法(n50) 重复抽样估计方法 a)估计值的确定: b)估计量概率分布: c)估计方法 )点估计: )区间估计: 当s未知时,用近似代替d)样本单元数的确定: e)举例说明其应用 不重复抽样的估计方法(作简单介绍) a) 已知的估计方法 区间估计: b)未知估计方法 区间估计: 2、小样本估计方法(n5,nq5) 点估计:W=w, 区间估计: )用泊松分布估计总体频率(n50,p0.1或q62cm 设:cm,: 计算: 对于, 拒绝,接受,即这批苗木可以出圃。例3某苗圃规定杨树苗平均高达60cm以上才能出圃,今从中抽取50株,得平均高为62.5,标准差为9cm,问该批苗木能否出圃?()解:.5cm60cm 设:,:=60 计算: 对于, 拒绝,接受,即可以出圃。2)不重复抽样(简述):由得于是对于(a)型,拒绝域: (b)型,拒绝域:2、小样本方法:仍用t分布,即将双侧检验中改为即有检验方法: 建立假设:,:() 计算: 对于给定,查t分布双侧分位数表得 对于(a)型,拒绝域: (b)型,拒绝域:例4某木材公司购买木材时,按质论价,现从一批木材中随机抽取16根,测得它们的小头直径为12、10.2、11.4、13.6、14.5、16、8.4、9.6、18、8.0、12.4、13.6、10.8、15.4、7.6、16.6(cm)。假定木材的小头直径服从正态分布,试问这批木材小头直径可达12cm以上?解:, , 设:,: 计算: 对于, 接受,即小头直径未达到以上。例5对某种杀虫剂规定平均每瓶()杂质含量低于时才能出厂,今随机抽取20瓶进行检验,得资料为(g)2.7、3.1、2.5、3.3、2.6、2.8、2.4、3.4、3.2、2.5,设杂质含量服从正态分布,试问该杀虫剂能否出厂?()解:, 设:,: 计算: 对于,得 接受,拒绝。即该批杀虫剂不能出厂。 4-3 总体频率的假设检验一、大样本方法设表示总体频率,为抽取样本计算所得的频率由前面知识已知: ()于是对于给定,在:成立条件下,可以得到不同类型的拒绝域: 双侧: 单侧:(a)型: (b)型:二、小样本(用二次分布表检验) 双侧检验:查二次分布参数P的置级区间表(附表5),若属于该区间,则接受,否则,接受 单侧:(a)型:查二次分布表(附表4)若,则拒绝 (b)型:(同上)若,拒绝例1已知某种子的发芽率为90,现用辐射方法对种子进行处理,从处理后种子随机抽取500粒作发芽试验,结果有465粒发芽。问这批种子经过处理后,是否明显变了种子的发芽率?解: 设: 计算:, 对于, 接受 4-4 两个总体平均数与频率的差异显著性检验差异显著性检验(也称差异的假设检验),在实际中应用十分广泛。如可比较不同立地条件下林木生产的差异;不同抚育措施对林木生产的影响;不同的杀虫药剂对昆虫的毒杀作用等,其实质是解决两个或多个总体的同一特征数是否有显著差异问题。本节主要讨论两个总体平均数或频率之间的差异显著性问题。一、两个总体平均数的差异显著性检验思想:有两个独立抽取的样本,要检验它们是否来自是否有相同总体平均数的总体,解决方法是计算样本平均数,与样本标准差,然后判断与0是否有显著差异,若与0没有显著差异,则说明,所来自的总体可能具有相同的总体平均数;否则,则认为差异显著。1 大样本方法:前提:独立,重复抽样、等方差设:(即两总体平均数差异不显著)并设:则有 在大样本情况下:,由于两总体相互独立,即与相互独立于是有 令,则于是对于给定,得,= 当时,接受原假设当时,拒绝原假设由于通常未知,在此用近似代替这时,统计量变为:得检验: 双侧: 单侧:即(右侧):即(左侧)例1为比较林分对红松结实量的影响,现分别从缓坡灌林红松针阔混交林(A)及缓坡灌林云冷杉红松林(B)中测得红松一株木的结果如下表: 林分 株数一株木结果平均值 标准差 A 60 111 67 B 80 107 50试问:这两种不同的林分对红松的结实量不无显著影响?解: 设: 计算: 接受假设例2对甲、乙两块落叶松林地松毛虫蛹密度进行调查,甲、乙两林地各调查了100株,得到如下资料:甲林地(枚/株),(枚/株);乙林地(枚/株),(枚/株)。问两林地松毛虫蛹密度有无显著差异?解: 设:() 计算: 对于, 接受原假设例3某林场调查了一种危害林木的昆虫的两个世代的卵块中卵粒数,第一代调查了128块,得平均数,标准差;第二代调查了69块,得。试检验两个世代卵块数差异性。解: 设: 计算: 对于, 拒绝原假设2 小样本方法:前提:独立、正态、等方差设:,由已知的前提条件得,在成立下,若令,则有又,由于与相互独立,若令则有由于与相互独立。令,则即于是对于给定,有,检验方法: 设: 计算:T 对于给定,查表得 若,拒绝例4在不同的土壤上进行较在面积的育苗试验,然后进行随机抽样调查,得苗高资料如下表:(设苗高服从正态分布)砂土32347672756466403842壤土505155879193555762747672问:砂土与壤土对苗高的生长是否有显著影响?解: 设: 计算:, , 对于, ,接受例5在山坡上、下两个部位造林,5年后抽样调查其胸径(cm)上部867993107112114989510185下部126102117123111105106122该林木胸径服从正态分布。问上、下两个部位造林其林木胸径有无显著差异?解: 设: 计算:, , 对于, 拒绝例6为研究赤松和刚松的生物量差异,分别对每种松抽样调查测定8个样品的针叶生物量服从正态分布,试比较两种松树针叶生物量的差异性赤松113109114120126117117119刚松120125125131124123128122解: 设: 计算:, 拒绝二、两总体频率的差异显著性检验 前提:大样本、重复抽样、相互独立设:总体1:、;总体2:、,则,; ,在成立下由于大样本有 未知,用, 近似代替即有 于是得到三种不同检验类型拒绝域。例7.为比较林分类型对结实株率(结实株数/总株数)的影响,现由灌林云冷杉红松林中随机抽取370株红松,查得有129株结实; 灌林红松针阔混交林中抽得200株红松,查得115结实,问这两种不同的林分的红松结实株率有无显著差异? 解:设:计算:,对于,拒绝例8一个林场用年生杉木苗造林,秋后调查400株,成活300株,问用,年生杉木苗在相同条件下造林,成活率有无显著差异?解:设: 计算:,接受例9:甲,乙两工人在相同条件下,对同种苗木进行嫁接,后调查它们的嫁接成活率,对甲调查200株,成活了180株,对乙调查了160株,成活135株,问甲、乙两人的嫁接水平有无显著差异?解:设: 计算:,;, 接受例10某苗圃为鉴定两畦杨树扦条成活率,在第一畦中观察500株,成活450株,第二畦观察350株,成活322株,试以0.05检验水平检验两畦杨树扦条成活率有无显著差异?解:设: 计算:,;, 接受4-5方差齐性检验前几节讨论了总体平均数与总体频率的假设及检验问题。它们常是实践中最关心的问题,因为诸如林分的生长、苗木的高、地径、林木的心腐率、昆虫的死亡率等都是通过平均数、频率表达出来的。但代表作用的强弱度各单元值的变动程度或相对地说爱各单元值稳定程度的制约。因此,有必要来讨论方差这个特征数。另外,在前几节讨论中曾指出,要对平均数的差异显著性作t检验,要以“等方差”假设为前提,否则,结论亦将不正确。能否判断方差相同或不同,涉及到方差的差异显著性检验问题。方差是否相同的假设检验统计上称方差齐性检验。一、两个正态总体的方差齐性检验(重复抽样)设两个总体方差为要检验:(即两个方差无显著差异)由前面可知,由于相互独立 当成立时,有令,则由于F检验临界值表构造(拒绝域在右侧)及F分布随机变量期望值=特点,在检验中,要求上式于是对于给定,拒绝域为,若,则令再作检验例1在不同的土壤进行较大面积的育苗试验,秋后进行随机抽样调查,得到苗高效资料如下表。砂土32347672756466403842壤土505155879193555762747672试检验它们所来自的两个正态总体的方差是否相等?解: 设: 计算: 于, 接受例2设有甲、乙两块10年生人工马尾松林,所研究标致为林木胸径。已知林木胸径分布近似正态分布,用重复抽样方式分别从两总体中抽取若干林木,测得其胸径数据如下表,试以水平判断甲、乙两块林地胸径总体方差是否相等?甲45805020355550755575乙3050204050503030解: 设: 计算: 对于, 接受二、多个正态总体的方差齐性检验设有m个正态总体,其方差分别为,要检验: 中至少两个不相等1检验法(巴特勒Bartlett检验法) 设从m个总体中抽取了n个样本,其变量分别为 则统计量为 其中: , 于是对于给定,查自由度为m-1的分布临界值表(附表9)得若,则拒绝2Hartleg(哈特勤)检验 若在m个总体中所抽取的样本容量相等,即 则统计量 其中:分别为m个样本方差的最大与最小者 若,则拒绝三、数据变换目的:将不服从方差齐性的数据通过变换后变成服从方差齐性,这在方差分析中是十分重要的。变换方法:平方根变换:(遵从泊松分布) 反正弦变换:(为百分率,为相应角度值) 适用于数据的近似遵从二次分布的情况。对数变换:,适用于标准差与平均数成比例的数据。4-6 总体分布的假设检验前面所讨论的各种假设检验,大部分要求总体服从正态分布,但在实际问题,对总体分布的类型我们常无法知道或了解甚少。因此,如何根据样本资料对总体分布的假设进行检验,如是否遵从正态分布、二次分布、泊松分布等。关于总体是否遵从某一分布的判断,称为总体分布的假设检验问题。理论基础:皮尔逊定理Pearson定理:设总体服从某分布,将的取值范围分成互不相交的m个小区间。以表示样本观测值落入第个小区间的个数(称实测频率)。表示落入第个小区间的概率,则当n充分大时,不论总体服从何分布(不含末知参数),统计量,当总体的分布有r个末知参数时。检验法:设:总体遵从某一分布,:总体不遵从某一分布。步骤: 设取值范围为(),将()分成m个小区间(一般7-14个): 统计落入上述每个小区间的观测值个数(实测频数),记为。 再假定成立下,计算落入每个小区间:概率(理论频率):,于是得到落入每个小区间理论频数: 计算统计量:,则或(含有r 个末知参数) 若,则拒绝例1某林区随机抽取200株落中叶松得胸径资料如下表,试检验该地我落叶松用径是否服从正态分布?胸径分组 株数 组中值1014 3 121418 14 161822 22 20 2226 52 242630 59 283034 31 323438 15 363842 4 40解:正态分布中有二个参数与均末知,需作相应估计,于是设 :落叶松胸径 计算:落入每个小区间概率;( 正态分布表)同样有 于是得到理论频数: 从而: 对于,查表得 接受例2对500个小土样方内查数得到的某种虫卵数资料如下:虫卵数01234567土方数941681316832511试检验卵在土中的分布是否服从泊松分布解:设:虫卵数(末知)由于末知,用作估计于是:虫卵数计算:区间: 则由泊松分布表得(理论频率)同样有, 于是理论频数,对于,查表得接受 4-7 适合性检验与独立性检验一、适合性检验检验法不仅可以用来检验总体分布,而且也可以用来检验实际试验中测定的结果与科学试验中所作的某种理论推断或某种科学假设是否相符合的问题。或者说,在科学试验中,常根据理论与推断,对实际数据提出种种科学假设。由于很多假设是定量性质的,如何证实或推翻这些假设呢?当然一般只有从总体中进行抽样,把实际内得样本数据与假设推翻的理论数据进行比较,从表达式可以看出,可理解为一批(m个)实测频数的相对差异之和,值越小,说明吻合情况越好。象这样利用统计量来检验实测与理论是否符合的问题,称适合性检验。例1孟德尔在其著名的碗豆杂交试验中,用黄色光滑的种子与绿色皱皮的碗豆种子杂交;第二代种子的外形株数如下表,试问这种分离比率是否符合9:3:3:1的比例关系。(这个比例就是孟德尔提出的假设,并由此获得基因分离法测)。第二代种子外形黄色光滑黄色皱皮绿色光滑绿色皱皮合计株数31510110832556解: 设:分离比例符合9:3:3:1 计算:(在成立下,计算四种类型植株的理论频数)而实测频数为 ,故接受二、独立性检验:(同质性检验)在实测与理论是否相符的适合性检验问题中,有时是以属性资料形式(不是数量形式)如病腐木、树叶颜色等。这种要判断的是在若干个不同条件下得到的若干组(一个条件一组)数据是否成比例的形式的问题,称为独立性检验。例2在三种不同灌溉方式下考察水稻叶子的衰老情况得下表数据,试问:不同灌溉方式对叶子的衰老有何显著差异?灌溉方式绿叶数黄叶数枯叶数总数深水146 (140.69)7 (8.78)7 (10.53)160浅水183 (180.07)9 (11.24)13 (13.49)205湿润152 (160.04)14 (9.98)16 (11.98)182总和4813036547解:上表称3*3列联表 设:三种不同灌溉方式对叶子衰老无显著差异,即三种不同方式,三个绿叶,黄叶,枯叶的理论频数均无显著差异。因此,这是多个总体频率显著性检验问题,不能用前面方法检验。具体方法如下:首先计算深水灌溉方式下各种叶片的理论频数:深水*绿叶:深水*黄叶:深水*枯叶:同样可以得到其他交叉格内理论频数。(列于表中)于是,对于一般r*c联列表(r为横数,c为列数),自由度为(r-1)(c-1)于是对于 接受第五章 方差分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 46356-2025公共安全视频图像共享交换平台技术要求
- 成都市 2024-2025 学年小学五年级上学期道德与法治期中模拟卷及答案解析
- 2025年弹簧制造工艺试题及答案
- 湖北省公务员2025年行测模拟试卷
- 2025年职高化妆专业试题及答案
- 2025年防台防汛试题及答案
- 2025年二甲评审院感应知应会试题及答案(共140题)
- 海南省2025年公务员笔试专项训练卷
- 2025年安徽省公务员考试申论模拟押题卷
- 2025国际货物买卖合同样本
- 2022年长春财经学院公共课《思想道德基础与法律修养》科目期末试卷B
- 生物育种方法
- 建筑企业法人a证考试及答案
- 2025年秋统编版小学语文四年级上册第六单元综合测试卷及参考答案
- 《国有企业管理人员处分条例》测试题(名校卷)附答案详解
- 鸡蛋采购项目服务方案投标文件(技术方案)
- 医院进修人员培训报告
- 冬季燃气管道施工安全方案
- 化工仪表维保知识培训课件
- 2025-2030中国宠物经济市场现状分析与前景预测报告
- 消防安全管理制度(完整版)
评论
0/150
提交评论