生物统计复习 (小知识)_第1页
生物统计复习 (小知识)_第2页
生物统计复习 (小知识)_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计:生物统计是数理统计的原理和方法在生物科学中的应用,是一门应用数学。意义:提供试验设计方法、提供调查设计的方法、提供整理、分析资料的方法。特点:通过样本推断总体;有一定的错误率。基本任务:如何科学整理、分析所得资料,得出正确结论。准确性:度量值与真值接近的程度。 精确性:同一样品重复不同观察值间接近的程度。总体:研究对象的全体。总体中抽取一部分有代表性的个体进行研究,称为抽样,这些个体称为样本。随机误差:无法控制的内在和外在因素引起的;系统误差:试验条件引起。参数:根据总体计算 描述整体随机变量的特性;一般用希腊字母表示;在群体内不变。统计数:由样本估计出,拉丁字母表示描述样本随机变量

2、的特性的数字,不同样本的结果不同1. 数量性状资料:量测或计数方式测定数量性状而获得的数据。(1)计量资料:用量测方式获得的数量性状资料(2)计数资料:用计数方式获得的数量性状资料2. 质量性状资料:描述质量性状的数据,是通过对质量性状进行数量化处理而获得。统计次数法;评分法3. 半定量(等级)资料:观察单位按所考察的性状或指标的等级顺序分组,清点各组观察单位所得的资料。三种类型资料的关系:三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。1. 数据集中程度(中心)。(1)平均数:统计学中最常用的统计数,用来表明资料中各观测值的集中

3、程度。算术平均数:是指资料中各观测值的总和除以观测值个数所得的商。(2)中(位)数:样本观察值排序后,中间的那个数值。 (3)众数:数据集中出现频率最多的数值。(4)几何平均数:n个观测值相乘之积开 n 次方所得的方根,记为G。(5)调和平均数:资料中各观测值倒数的算术平均数的倒数,记为H。2. 数据离散程度(变异大小)(1)全距(极差):数据集中最大值和最小值的差。(2)离均差:样本中某个数据与平均数的差。(3)平均绝对离差(统计学中未被使用) (4)样本方差(均方):(5)总体方差:(6)样本标准差:由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时

4、,常需要与平均数配合使用。标准差特性:标准差的大小,受资料中每个观测值影响,如观测值间变异大,求得的标准差也大,反之则小。在计算标准差时,在各观测值加上或减去一个常数,其数值不变。当每个观测值乘以或除以一个常数a,则所得标准差是原来标准差的a倍或1/a倍。资料服从正态分布条件下,资料全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。(7)变异系数:标准差与平均数的比值,记为CV,衡量资料中各观测值变异程度。常用概率分布1. 小概率事件实际不可能性原理:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理;小概率事件实际不可能性原理是统计学上进行

5、假设检验的基本依据。2. 中心极限定理 概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。3. 二项分布(离散型对只具有两种互斥结果的离散型随机事件规律性进行描述一种概率分布。具有概率分布一切性质。应用条件:贝努力试验及变量:对于n次独立试验,每次只有两种结果、且互相对立(A与A), 结果事件发生的概率在整个系列试验中保持不变。如对病人治疗结果的有效与无效,化验结果阳性与阴性,接触某传染源感染与未感染等 若试验只具有两种互斥结果,则描述该实验结果的随机变量称为贝努利变量。p+q=1。平均数计算:服从二项分布B(n,p)随机变量之平均数、标准差与参数n、p有如下关系=np s2=np

6、q4. 正态分布(连续型) (PDF)若连续型随机变量x的概率分布密度函数为(CDF)其中为平均数,s2为方差,则称随机变量x服从正态分布, 记为xN(m, s2)。相应的概率分布函数为两个正态分布的和或差仍然是正态分布。正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=m。标准正态分布:对于任何一个服从正态分布N(m, s 2)的随机变量x,都可以通过标准化变换 u = (x - m)/s 将其变换为服从标准正态分布的随机变量u,u 称为标准正态变量或标准正态离差。m=0,s2=1的正态分布为标准正态分布。随机变量x落在平均数加减不同倍数标准差s区间之外的概率称为双侧概率,记作a。对应双

7、侧概率可求得随机变量x小于m-ks或大于+k的概率,称单侧概率,记作a/2。概率计算的等价转换P(0uu1)F(u1)-0.5 P(uu1) = F(-u1)P(|u|)u1)=2 F(-u1) P(|u|u1)1-2 F(-u1) P(u1uu2) F(u2)- F(u1)5.卡方分布:如果随机变量zi(i = 1, ., n)为相互独立,都服从标准正态分布N(0,1),则定义: , i = 1, ., n 变量c2服从自由度等于n卡方分布。6. t分布 如果zN(0,1), c2服从自由度等于n的卡方分布, 则为自由度为n的t分布。7. F分布8. 样本平均数的抽样分布:从N个总体中随机抽

8、取样本含量为n的样本,共抽m次,求样本平均数的分布。试验指标:试验测定的项目或者性状。试验因素:影响试验指标的因素。(单因素)因素水平:试验因素所处的特定状态或者数量等级。试验处理:实施在试验单位上的具体项目。 试验单位:接受不同试验处理的独立试验载体。重复:一个处理实施在两个或者两个以上的试验单位上,称处理有重复。试验单位数称为处理的重复数统计推断:根据样本和假定模型对总体做出概率形式结论的过程;包括假设检验和参数估计假设检验的基本步骤:(1)根据题义定义H0和HA(2)在原假设正确的前提下,确定检验统计数,并计算统计数的估计值 (3)计算P值,或确定临界值,并比较临界值与统计数值的大小(4

9、)根据“小概率不可能原理”得出结论变量间的相互关系:存在完全确定性的关系;不存在确定性关系。相关变量间的关系:因果关系;平行关系.回归分析:研究呈因果关系相关变量之间的关系,以了解依变量随自变量变化而变化的规律。回归分析的任务:揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量(结果)相关分析:研究呈平行关系相关变量之间的关系。 相关分析的任务:揭示出两个相关变量间线性相关程度和性质。回归与相关的区别:不区分自变量与因变量,不能利用自变量来预测、控制因变量相关分析与回归分析的关系:(1)它们的研究对象都是呈直线关系的相关变量;(2)直线回归方程(3)计算出相关系数;(4)相关系数显著,回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论