下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、野外实习资料的数理统计分析? 一元线性回归分析一元回归处理的是两个变量之间的关系,即两个变量X 和 Y 之间如果存在一定的关系,则通过观测所得数据,找出两者之间的关系式。如果两个变量的关系大致是线性的,那就是一元线性回归问题。对两个现象 X 和 Y 进行观察或实验, 得到两组数值: X1,X2,, Xn 和 Y1,Y2, Yn, 假如要找出一个函数 Y=f(X), 使它在 X=X1,X2, ,Xn 时的数值 f(X1),f(X2),f(Xn)与观察值Y1, Y2, Yn 趋于接近。在一个平面直角坐标 XOY中找出( X1,Y1),( X2,Y2),( Xn,Yn)各点,将其各点分布状况进行察看
2、,即可以清楚地看出其各点分布状况接近一条直线。对于这种线性关系,可以用数学公式表示:Y = a + bX这条直线所表示的关系,叫做变量Y 对 X 的回归直线,也叫Y 对 X 的回归方程。其中a 为常数, b 为 Y 对于 X 的回归系数。对于任何具有线性关系的两组变量Y 与 X,只要求解出a 与 b 的值,即可以写出回归方程。计算a 与 b 值的公式为:式中:为变量 X 的均值, Xi 为第 i 个自变量的样本值,为因变量的均值, Yi 为第 i 个因变量 Y 的样本值。 n 为样本数。第 1页当前一般计算机的Microsoft Excel中都有现成的回归程序,只要将所获得的数据录入就可自动得
3、到回归方程。得到的回归方程是否有意义,其相关的程度有多大,可以根据相关系数的大小来决定。通常用r 来表示两个变量X 和 Y 之间的直线相关程度,r 为X 和 Y 的相关系数。 r 值的绝对值越大,两个变量之间的相关程度就越高。当 r 为正值时,叫做正相关, r 为负值时叫做负相关。 r 的计算公式如下:式中各符号的意义同上。在求得了回归方程与两个变量之间的相关系数后,可以利用F 检验法、 t检验法或 r 检验法来检验两个变量是否显著相关。具体的检验方法在后面介绍。2多元线性回归分析一元回归研究的是一个自变量和一个因变量的各种关系。但是客观事物的变化往往受到多种因素的影响,即使其中有一个因素起着
4、主导作用,但其它因素的作用也是不可忽视的。因此,我们还需要研究多种变量的关系,这种多个变量之间的关系就叫做多元回归问题。例如,水稻的产量不仅与生长期内的雨量有关,而且与温度也有关系。所以寻求水稻的产量不仅与生长期内的雨量之间的相互关系,就是多元回归问题。第 2页如果假设自变量为X1, X2, Xm,因变量为 Y,而且因变量与自变量之间是线性的关系,则因变量Y 与自变量为 X1,X2, Xm的多元线性回归方程为:Y = a+b1X1+b2X2+bmXm式中: a, b1, b2,bm为常数。因此,只要能够求出 a, b1,b2, bm这些常数,就可以得到因变量 Y 与自变量为 X1, X2, X
5、m之间的多元回归方程。具体的算法比较简单,但很烦琐。这里不再叙述。求解多元回归的计算机程序很多,只要将自变量的数据以及与其相对应的因变量的数据输入计算机程序中,立刻就可以求出 a, b1,b2, bm各常数的值,从而可以获得因变量Y 与自变量为X1,X2, Xm的多元线性回归方程。例如,设已知因变量Y 的自变量 X1,X2,X3,共得 18 组数据,并已知Y对 Xi 存在着线性关系,求其回归方程。样品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.76512377第 3页79.4444681810.131117939
6、11.629173931012.658112511110.937111761223.146114961323.150134771421.64473931523936143541726.8582021681829.95112499通过求解,得到a=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回归方程为Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3通常可采用单相关系数、偏相关系数和复相关系数来说明这三个自变量与因变量之间是否有明显的线性关系以及它们之间相关的程度如何。单相关系数是指在不考虑其他因素影响的条件
7、下,所求两个变量之间的相关系数。用 rX1X2、 rYX1 和 rYX2 分别表示 X1 和 X2、Y 和 X1 以及 Y 与 X2 之间的单相关系数。偏相关系数是指在这三个变量中,将其中一个变量保持常第 4页数时,其他两个变量之间的相关系数。用rYX1X2 和 rYX2X1分别表示 X2为常数时, Y 与 X1 的偏相关系数和 X1 为常数时, Y 与 X2 的偏相关系数。偏相关系数可以用单相关系数求得。当这三个变量中,同时考虑两个变量对另一个变量相关系数时, 叫做复相关系数。 用 r( X1X2)Y 表示 X1 和 X2、两个自变量对于 Y 的复相关系数。3. 方差分析方差分析法是分析多组
8、平均数之间差异显著性时常用的一种统计方法。方差(或均方)是一个表示变异程度的量,它是离均差的平方和与自由度之商。在一项实验或调查中往往存在着许多造成生物形状变异的因素,这些因素有比较重要的,也有较次要的。分析时主要是把平方和与自由度按不同的变异起因分解为若干部分,从而构成来自不同起因的方差。利用它来检验各组平均数之间差异的显著性。在正态总体及方差相同的基本假定下,我们将利用方差比给出F 分布的检验统计量。因此这种方法称为方差分析法。方差分析是分析和处理试验或观测数据的主要方法之一。它首先被应用于农业试验,目前它在农业、工业、生物、医学等各部门有着广泛的应用。方差分析的方法往往与试验设计的方式紧
9、密地联系在一起。对于从不同试验设计中得出观测资料, 进行方差分析时将有不同的计算方法, 类型繁多,但其基本原理却大同小异。在这里将结合一个较简单的例子介绍方差分析的数学模型和基本方法,以便于读者对方差分析的方法有一个大致的了解。第 5页在实验设计的基础上,分组试验,如分为 a 组,每组作 b 个水平的试验,共得到 a×b个数据。然后,算出组平均值和总平均值,组内和组间的离差平方和,组内和组间方差,作 F 检验。F 组间方差 / 组内方差假设 HO: 1 2···b ,表示各水平的均值相等。当FF 时, HO: 真;当F > F 时, HO:假。试验
10、中必不可少地会产生误差。误差有两种:条件误差和试验误差。前者是由试验条件不同而引起的系统性误差,后者是在相同试验条件下引起的随机误差。例如,把四种不同的饲料分别喂给4 组小鸡,每组5 只,它们的增重情况如下:组别增重( Xij )1554942215226111230896334297819592416913716885153试问四组小鸡在平均增重量方面有没有明显的差别?通过计算,得到组内和组间方差分别为719.2 和 8706.3 ,因此,F=8706.3/719.2=12.1第 6页对于给定的显著性水平,将有临界值F 一,当 =0.01 时,F0.01(3,16)=5.3,其中 3 与 1
11、6 是自由度。所以 F=12.1>5.3= F0.01(3,16)故,否定各种饲料效果一致的假设,可以认为四种饲料的效果有极明显的差别。目前现成的计算机方差分析计算程序很多,如 SPASS、 SAS软件等,将数据输入后,都可以直接计算,并按要求输出结果。上述例子是单因素的方差分析,比较简单。对于多因素的方差分析,由于比较复杂,这里就不再叙述了。4. T 检验生物学中所遇到的绝大多数问题,总体标准差 都是未知的。在 未知时,平均数的显著性检验有两种解决方法。其一是根据以往的经验或从类似的工作中估计出一个 值,用这个 做 检验。使用估计的 做检验并不是很可靠的。因此在实际工作中,一般不用这种
12、方法而广泛使用t检验。对于一个正态分布总体,若 未知则服从 n-1 自由度的 t 分布,因此,在 未知时可以用t 检验做平均数的显著性检验。t 检验的零假设 H0为: =0第 7页备择假设有以下三种情况:( 1) HA: >0,若已知 不可能小于0;( 2) HA: <0,若已知 不可能大于 0;( 3) HA: 0,包括>0和 <0 。三种备择假设的拒绝域为:( 1)t>t ;(2)t< - t ;( 3)t > t /2 ,或表示为 t > t (双侧) 。其中 为给定的显著性水平。t 检验的统计量为:t =(- 0) / (s/n1/2 )
13、例如,已知玉米单交种群单105 的平均穗重0=300 克,喷药后,随机抽取 9 个果穗,其穗重为分别: 308、305、 311、298、315、300、321、294、320 克。问喷药后与喷药前的果穗重差异是否显著?根据上面介绍的基本程序:? 已知玉米穗重是服从正态分布的随机变量, 未知。( 2)假设: H0 : =0=300HA: 0=300由于问题要求检验的是“果穗重差异是否显著”,并没有明确穗重一定增加或一定减少,所以备择假设为HA:0( 3)显著性水平:根据实验的要求(差异是否“显著”)规定=0.05 。第 8页( 4)统计量的值:由于 未知需使用t 检验。t =(- 0) / (
14、 s/n1/2 )t = ( 308-3000 ) / ( 9.62/91/2) =2.49(5) 建立的拒绝域 H0: 因 HA: 0, 所以是双侧检验。 当 t > t0.05 (双侧)时拒绝 H0, =0.05 时,经查表 t8 ,0.05 (双侧) =2.306 。( 6)结论:因 t =2.49> t8 ,0.05 (双侧) =2.306 ,所以结论是拒绝 H0,接受 HA。即喷药前后果穗重的差异是显著的。5. F 检验t 检验属于单个样本的显著性检验,即在样本统计量与零假设所提出的总体参量之间做比较。这种检验需要我们事先能够提出合理的参量假设值和对参量有某种意义的备择值
15、。然而,在实际工作中,很难提出这样的假设值及备择值。因此,限制了这种方法在实际工作中的应用。为了避免上述问题的出现,在实际应用时,常常选择两个样本,一个作为处理,一个作为对照。在这两个样本之间做比较。判断它们之间是否存在足够显著的差异。当它们之间的差异不能用偶然性解释时,则认为它们之间存在足够显著的差异,这两个样本来自两个不同的总体。而F 检验是关于两个方差的检验,所以常用F 检验来解决上述问题。F 检验的程序概述如下:第 9页( 1)假定从两个正态总体中,独立地抽取含量分别为n1 和 n2 的两个随机样本,计算出s12 和 s22。总体平均数1和 2可以相等也可以不相等。( 2)零假设 H0 为: 1=2备择假设有以下三种情况: ( 1)HA:1>2,若已知 1不可能小于2;( 2) HA: 1<2,若已知 1不可能大于 2;( 3) HA: 1 2 ,包括 1>2和 1<2 。( 3)显著性水平:经常用=0.05 和 =0.01 两个水平。( 4)检验的统计量: F(n1-1 ),( n2-1 )经 = s12 /s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 短信邀约面试话术
- 艺术党课赏析
- 溶剂发酵工创新方法竞赛考核试卷含答案
- 非线性动态系统的仿真运行规范
- 中药丸剂工岗前技能认知考核试卷含答案
- 铁氧体材料制备工创新方法竞赛考核试卷含答案
- 筑路及道路养护机械装配调试工岗位应急处置技术规程
- 云母电容器制造工岗位标准化技术规程
- 2025年一一二单元测试题及答案
- 清理占道应急预案(3篇)
- 大学生体能训练(华中农业大学)知到智慧树网课答案
- 人工智能+行动范式重塑下的智慧园区研究报告
- 护理管理知识培训内容课件
- 安全监督个人工作总结
- 消除医疗歧视培训
- 2025年贵州建考试试题库及答案
- 超市培训员工知识课件
- 2025团校考试入团考试题库(含答案)
- 【2025秋季新修订教材】统编语文三上第八单元《习作那次经历真难忘》公开课一等奖创新教学设计
- 《ABB工业机器人编程与操作》课件-项目五 工业机器人涂胶装配编程与操作
- 2025年党员干部党的理论知识应知应会题库及答案
评论
0/150
提交评论