生物统计附试验设计.doc_第1页
生物统计附试验设计.doc_第2页
生物统计附试验设计.doc_第3页
生物统计附试验设计.doc_第4页
生物统计附试验设计.doc_第5页
免费预览已结束,剩余11页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计附试验设计复习资料第一章绪论1.生物统计学的内容:统计原理、统计方法和试验设计。2.生物统计的作用:a.科学地整理分析数据;b.判断试验结果的可能性;c.确定事物之间的相互关系;d.提供试验设计的原理。3.样本容量常记为n,通常把n30的样本称为小样本,n.30的样本称为大样本。4.名解:(重)生物统计:生物统计是应用概率论和数据统计的原理和方法来研究生物界数量变化的学科;总体:是被研究对象的全体,据所含的个体的多少,总体分为有限总体和无限总体。样本:是指总体内随机抽取出来若干个体所组成的单位。随机误差:由于许多无法控制的内在和外在的偶然因素所造成的误差,内在如个体差异,外在如环境,它影响试验的精确性。(了)参数:从总体计算出来的数量特征值,它是一个真值,没有抽样变动的影响,一般用平均数u,标准差s。统计量:是从样本计算出来的数量特征值,它是参数的估计值,受样本变动的影响,一般用拉丁字母表示,如平均数。系统误差:主要是试验动物的初始条件不同,试验条件相差较大,仪器不准,标准试剂未经校正,药品批次不同,药品用量与种类不符合试验计划要求,以及观察,记录抄案,计算中的错误所引起的误差,它影响试验的准确性。准确性:指在试验或调查中某试验指标或形状的观测值与其真值接近的程度。精确性:指试验或调查中一试验指标或形状的重复观测值彼此接近的程度。第二章资料的整理1.统计资按性质分为:计量资料、次数资料和半定量资料。2.计量资料是指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测量获得的数量性状资料。计量资料整理的五步骤如下:(1)求全距,即资料中最大值和最小值之差R=Max(x)Min(x);(2)确定组数即按样本大小而定;样本含量与组数样本含量 组数3060 6860100 810100200 1012200500 1217500以上 1730(3)确定组距,每组最大值与最小值之差记为i ,公式:组距(i)全距(R)组数k ;(4)确定组中值及组限,各组的最大值和最小值称为组限,最小值为下限,最大值为上限,每组的中点值称为组中值,组中值=(下限+上限)2=下限+组距2=上限-组距2;(5)归组划线计数,作次数分布表。3.常用的五种统计图为长条图、圆图、线图、直方图、折线图,掌握直方图和折线图的绘制。4.原始资料的检查核对主要进行下面三性的检查:检查资料的完整性;检查资料的正确性;检查资料的精确性。5大样本资料需整理成次数分布表。第三章资料的统计描述1.平均数包括以下五种算术平均数、中位数、众数、几何平均数及调和平均数。2.用来度量资料变异程度的指标主要有极差、方差、标准差、变异系数。3.平均数的基本性质是(1)样本各观测值与平均数之差的和为零,简述为离均差之和为;(2)样本各观测值与平均数之差的平方和为最小,简述为离均差平方和为最小。4.10头母猪第一胎产仔数为9、8、7、10、12、10、11、14、8、9(头)计算10头母猪第一胎产仔数的平均数、中位数、标准差和变异系数。 解:平均数x=9+8+7+10+12+10+11+14+8+9=98,n=10 资料数据按小到大排列如:7、8、8、9、9、10、10、11、12、14 中位数标准差变异系数第四章常用概率分布1.事件概率具有以下性质:对于任何事件A,有0P(A)1;必然事件的概率为1,即P()=1:不可能的事件概率为0,即P()=0。2.(1)正态分布:若连续型随机变量X的概率分布密度函数为其中为平均数,2为方差,则称随机变量X服从正态分布,记为X。相应的概率分布函数为正态分布密度曲线为: 正态分布密度曲线(2)标准正态分布:当=0、=l时,正态总体称为标准正态总体,其相应的函数表示式是,(-x+)其相应的曲线称为标准曲线;.标准正态总体的概率问题: 对于标准正态总体N(0,1),是总体取值小于的概率,即 ,其中,图中阴影部分的面积表示为概率 只要有标准正态分布表即可查表解决.从图中不难发现:当时,;而当时,(0)=0.5;标准正态总体在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”在这个表中,对应于的值是指总体取值小于的概率,即 ,若,则利用标准正态分布表,可以求出标准正态总体在任意区间内取值的概率,即直线,与正态曲线、x轴所围成的曲边梯形的面积(3)有关概率计算的公式: P(0uu1)(u1)-0.5 P(uu1) =(-u1) P(uu1)=2(-u1) P(uu1)=1-2(-u1) P(u1uu2)(u2)-(u1)注:用曲线图和面积来理解记忆。(4)关于标准正态分布要熟记下列几种常用概率:P(-1u1)=0.6826P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95P (-2.58u2.58)=0.99(5)例:已知uN(0,1),试求: (1) P(u-1.64)? (2) P (u2.58)=? (3) P (u2.56)=? (4) P(0.34u1.53) =? 利用(4-12)式,查附表1得: (1) P(u-1.64)=0.05050 (2) P (u2.58)=(-2.58)=0.024940 (3) P (u2.56)=2(-2.56)=20.005234=0.010468 (4) P (0.34u1.53)=(1.53)-(0.34)=0.93669-0.6331=0.30389 已知uN(0,1)试求: (1) P(u-)+P(u)=0.10的 (2) P(-u=0.86的因为附表2中的值是:所以 (1) P(u-)+ P(u)=1- P(-u=0.10=由附表2查得: =1.644854(2) P (-u)=0.86 ,=1- P (-u)=1-0.86=0.14由附表2查得:=1.475791对于xN(,2),只要将其转换为uN(0,1),即可求得相应的双侧分位数。已知猪血红蛋白含量x服从正态分布N(14.52,), 若P(x1.1) =0.025, P(x)=0.025,P(x) =0.005,P(x)=0.005,求,,。由题意可知,2=0.025,=0.05 又因为P(x)=故 P(x+ P(x)= P(u-+ P(u) =1- P(-P)=0.05=由附表2查得:=1.959964,所以 (-14.52)/1.68=-1.959964, (-14.52)/1.68=1.959964即 11.23, 17.81。 同理=2.575829,所以 (-14.52)/1.68=-2.575829, (-14.52)/1.68=2.575829即 10.19, 18.85。已知猪血红蛋白含量x服从正态分布N(12.86,), 若P(x) =0.03, P(x)=0.03,求,。由题意可知,2=0.03,=0.06 又因为 P(x)=故 P(x+ P(x)= P(u-+ P(u) =1- P(-P)=0.06=由附表2查得:=1.880794,所以 (-12.86)/1.33=-1.880794, (-12.86)/1.33=1.880794即 10.36, 15.36。3. 双侧概率(重):把随机变量X落在平均数左右标准差一定倍数区间之外的概率记作;单侧概率:指所求得随机变量X小于平均数左侧标准差一定倍数或大于平均数右侧标准差一定倍数的概率记作2。第五章假设检验1.显著性检验:就是指在对资料进行统计分析时,先提某一问题对样本所在总体的参数提出一个统计假设,然后根据从样本获得的统计量所服从的概率分布,对这一假设进行检验;其目的是主要是看样本是否来自于均数相同的总体即通过对样本的研究来对总体作出统计推断;检验的对象是在统计学中,是以样本平均数差异x1- x2的大小时样本所在的总样本平均数1、2是否相同作出推断。2.为什么以样本均数作为检验对象呢?是因为样本平均数具有下述特性:(1)离均差的平方和(xi-)2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。 (2)样本平均数是总体平均数的无偏估计值,即()。(3)根据统计学中心极限定理,样本平均数服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本平均数x1和x2的差异去推断样本所属总体平均数是否相同时有依据的。.(了) 标准误(平均数抽样总体的标准差) 的大小反映样本平均数的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数间差异程度大,样本平均数的精确性低。反之,小,说明间的差异程度小,样本平均数的精确性高。的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为是一常数,所以只有增大样本含量才能降低样本平均数的抽样误差。在实际工作中,总体标准差往往是未知的,因而无法求得。此时,可用样本标准差S估计。于是,以 估计。记 为,称作样本标准误或均数标准误。区别:样本标准差与样本标准误是既有联系又有区别的两个统计量,=已表明了二者的联系。二者的区别在于:样本标准差S是反映样本中各观测值, 变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。. 小概率事件通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。一统计资料进行统计推断判断的原则如下:、当0.05 时,差异不显著,用“NS”表示,不能否H0 ;、当,0.01 P 0.05时,差异显著,用“*”表示,接受HA,否定H0 ;、当,P0.01时,差异极显著,用“*”表示,接受HA,否定H0 。5.计算题:了解样本均数与总体均数的差异性显著检验及两样本均数的差异性显著检验;重点知道正态总体平均数的置信区间。例:计算下列资料总体平均数的95%,99%置信区间,119、22、104、32、53、31、118、57、30、101、58、48、68、70。解:资料总体平均数的95%,99%置信区间df=n1=141=13,故=2.160,=3.012=65.0714 ,33.3293,9.2431 所以95%置信半径为=19.9668 95%置信下限为=45.1046 95%置信上限为=85.0382 即该资料总体平均数u 的95%置信区间为45.1046u85.0382 99%置信半径为=27.8426 99%置信下限为=37.2288 99%置信上限为=92.9140即该资料总体平均数u 的99%置信区间为37.2288u92.9140 。随机抽测了10只兔的直肠温度,其数据为:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4。已知该品种兔直肠温度的总体平均数为,检验该样本平均数温度与是否有显著性差异?解:提出无效假设与备择假设 H0 :=39.5,HA:39.5 计算t值 经计算得=39.09,=0.4909 t=(-)/=-2.6411 统计推断 由df=n-1=10-1=9,查附表得临界t值 =2.262 =3.250, t,0.01 P 3.故利用公式计算理论次数 依据9331的遗传比例,即AB:Abb:aaB:aabb =9:3:3:1计算理论次数。AB=5569/16=312.75Abb=5563/16=104.25aaB=5563/16=104.25aabb=5561/16=34.75列表计算 计算表类 型实际观察次数A理论次数TA-T(A-T)2/TAB315(A1)312.75(T1)2.250.0162Abb108(A2)104.25(T2)3.750.1349aaB101(A3)104.25(T3)3.750.1349aabb32(A4)34.75(T4)-2.750.2176总 计55655600.5036=0.0162+0.1349+0.1349+0.2176=0.5036查临界值,作出统计推断 当df=3时,c20.05(3)=7.815,因0.05,不能否定H0 ,表明实际观察次数与理论次数差异不显著,可以认为两对性状杂交二代的分离现象符合孟德尔遗传规律中9331的遗传比例。(作为了解)22列联表的一般形式12行总合1()()=+2()()=+列总合T.j=+=+T.=A11+A12+A21+A22其中Aij为实际观察次数,Tij为理论次数。例 某生物药品厂研制出一批新的鸡瘟疫苗,为检验其免疫力,用200只鸡进行试验,以原疫苗作对照,在新疫苗注射的100只中患病的10只,不患病的90只;对照组的100只中患病的15只,不患病的85只。问新旧疫苗的免疫力是否有差异。 先将资料整理成列联表 22列联表患病不患病行总和T i.新疫苗10(12.5)90(87.5)T1.:100旧疫苗15(12.5)85(87.5)T 2.:100列总和T.jT.1:25T.2:175T.:200 提出无效假设与备择假设H0:新旧疫苗的免疫力无差异。HA:新旧疫苗的免疫力有差异。计算理论次数 根据二因子相互独立的假设,由样本数据计算出各个理论次数。依此计算出各个理论次数如下:新疫苗的理论患病数:T11=10025/200=12.5新疫苗的理论不患病数:T12=100175/200=87.5, 或:T12=100-12.5=87.5;未注射组的理论发病数:T21=10025/200=12.5,或T21=25-12.5=12.5;未注射组的理论未发病数:T22=100175/200=87.5,或T22=200-87.5=87.5。计算值 将表中的实际次数、理论次数代入公式=得:+由自由度df=1查临界c2值,作出统计推断 因为c20.05(1)=3.84,而=0.73140.05,接受H0,表明新旧疫苗的免疫力无差异。注:在进行22列联表独立性检验时,还可利用下述简化公式计算: 第八章直线回归与相关1.名解(重)相关分析:用数学表达生物现象中非确定性的关系(相关变量)之间联系的性质和程度,在相关分析中,变量无自变量和依变量之分,只能研究两变量之间相关的程度和性质或一个变量与多个变量之间的相关的程度。回归分析:用回归方程揭示生物间中相关变量之间的联系方式,寻求这两个变量间的联系形式,即建立它们之间的回归方程。回归截距: , 式中的分子是自变量x的离均差与依变量y的离均差的乘积和,简称乘积和,记作,分母是自变量x的离均差平方和,记作。图8-2 直线回归方程的图象a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时,=a;b叫做样本回归系数,表示x改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度。2.把比值叫做x对y的决定系数,记为 r2,即,取值范围为0r21;若求r2的平方根,且取平方根的符号与乘积和SPxy的符号一致,即与bxy 、byx的符号一致,这样求出的平方根既可表示y与x的直线相关的程度,也可表示直线相关的性质。统计学上把这样计算所得的统计量称为x与y的相关系数,记为r,即 取值范围为1r1.3.相关系数与回归系数的数学关系式:相关变量x与y的相关系数r是y对x的回归系数与x对y的相关系数的几何平均数:4.掌握回归方程建立的六个步骤以及相关系数的计算:例:在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。 四川白鹅重与70日龄重测定结果 (单位:g)编号123456789101112雏鹅重(x)80869890120102958311310511010070日龄重(y)235024002720250031502680263024003080292029602860 四川白鹅的雏鹅重与70日龄重散点图和回归直线图作散点图 以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图,见图8-3。由图形可见四川白鹅的70日龄重与雏鹅重间存在直线关系,70日龄重随雏鹅重的增大而增大。计算回归截距a,回归系数b,建立直线回归方程首先根据实际观测值计算出下列数据:进而计算出b、a:写出直线回归方程 得到四川白鹅的70日龄重y对雏鹅重x的直线回归方程为:直线回归的偏离度估计 所以(g)即当利用直线回归,由四川白鹅的雏鹅重估计70日龄重时,离回归标准误为60.9525g。 直线回归关系假设检验回归关系显著性检验F检验 ,df1=1,df2=n-2 而。于是可以列出方差分析表进行回归关系显著性检验。四川白鹅70日龄重与雏鹅重回归关系方差分析变异来源dfSSMSF值F0.05F0.01回归1794339.60794339.60213.81*4.9610.04离回归1037152.073715.21总变异11831491.67因为,表明四川白鹅70日龄重与雏鹅重间存在显著的直线关系。、回归系数的显著性检验t检验采用回归系数的显著性检验t检验也可检验x与y间是否存在直线关系。回归系数显著性检验的无效假设和备择假设分别为:0,:0。t检验的计算公式为: 其中,为回归系数标准误。 当,查t值表,得,。因 ,否定:0,接受:0,即四川白鹅70日龄重(y)与雏鹅重(x)的直线回归系数b=21.7122是极显著的,表明四川白鹅70日龄重与雏鹅重间存在极显著的直线关系,可用所建立的直线回归方程来进行预测和控制。F检验的结果与t检验的结果一致。二种检验方法是等价的,可任选一种进行检验。绘制回归直线图。(找出最大值和最小值,不显著就绘制)如上图。第十二章试验设计1.试验设计:广义是指试验研究课题设计,也就是整个试验计划的拟定。主要包括课题的名称、试验目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益估计,已具备的条件,需要购置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论