多元统计分析在农业科学中的应用.doc_第1页
多元统计分析在农业科学中的应用.doc_第2页
多元统计分析在农业科学中的应用.doc_第3页
多元统计分析在农业科学中的应用.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析在农业科学中的应用目前,农业科学的发展已进入了定量地研究生命现象的阶段。但在世纪以前,农牧学还不过是家传口授的诀窍或零星记载的技艺总结,直到世纪,由于生物学和化学的发展,农牧学才成为一门经验学科。本世纪以来,随着各门学科的相互渗透和结合,尤其是遗传学、生理学、生态学、生化学、生物数学等现代学科向农牧学的渗透,使农业科学成为既有广阔的科学基础,又有较浓厚经验色彩的技术科学门类。在农业科学的这一发展过程中,数学方法和技术的引入是十分重要的,其中特别是多元统计对农业由经验型向精确型的转化起着不可忽视的作用。在农业生物科学方面,由于生物有机体本身具有复杂的生命活动,同时由于有机体与环境条件的不可分割的关系,在生长发育过程中又受着经常变化的气候及土壤肥力等自然条件的复杂影响,因而试验结果包含试验因素的主效,因素间交互作用及误差等多项变异,故单从试验结果数据很难判断试验处理因素是否有效及效果的大小与可靠程度。农业多元分析影响农业生物产品产量与质量的性状很多,这些性状在生物的生长发育与产品形成过程中相互联系或制约,因此研究多个农业生物性状的综合生物学效应及多元相关分析十分重要。由于计算机技术的迅猛发展,目前已利用主成分分析、典范相关分析、因子分析、聚类分析和判别分析等方法研究和分析农业科学试验中的多变量数据,得出一些有意义的结果,从而指导生产实践。一、正交试验设置重复的必要性正交设计广泛应用于各研究领域的多因素多水平试验。该试验一般不设重复,统计分析时,利用研究因素的水平重复作为“隐重复”,将空列或均方差较小的列作为“误差列”进行方差分析。当“空列”的均方差较大或无空列时,就难以通过方差分析对试验结果作出科学结论。目前,对这一问题的解决尚缺乏系统的研究。(一)、重复必要性例证1、不设重复,试验效应被误差掩盖,而有重复试验则达到了5%概率显著性水准。这是因为在不设重复时,试验随机误差分散或隐含在正交表各列之中,由于随机误差与模型误差相混杂,而且较大,至使检验的误差均方差相对增大。而在有重复试验时,对空列的模型误差可以统计检验并从总变异中剔除,从而提高了试验的精度。2、 重复,效应规律被误差干扰, 3、 3、重复正交试验的统计结论是可疑的在无重复情况下,空列或均方差最小列的随机误差和模型误差混杂在一起。这些列可以作为方差分析误差的假定条件时,模型误差非常小,与随机误差相比可以忽略不计。但这一假设是否成立,只有通过有重复试验,经统计检验后才能知道。综上所述,正交试验效应的科学统计结论取决于它能否通过有重复试验,估计出试验随机误差。(二)、有重复的正交试验结果表明,对正交设计设置适当重复可以估计出随机误差和失拟误差,从而对试验效应做出正确评价。其统计方法是将试验数据总变异分解为各研究因素效应、模型误差及试验随机误差(若为随机区组设计还包括区组效应),进行方差分析和多重比较。这一方法符合方差分析的线性效应可加数学模型和生物效应试验特点,因而是合理的和可行的。二、主成分分析的应用主成分分析是利用变量族的少数几个线性组合来解释多维变量的协方差结构,挑选最佳变量子集,简化数据,揭示变量间关系的一种多元统计分析方法,其在耕地质量评价中的应用是通过建立原始数据矩阵实施,经过标准化和相关矩阵的计算,分别求出相关矩阵的特征向量、特征根及及主成分的方差贡献率,累积贡献率,根据累积贡献率选择主成分的个数,建立主成分方程,然后计算各主成分得分和综合得分,根据综合得分区间划分土地质量等级。刘了凡在麦蚜发生量预报中,应用主成分分析建立的菏泽地区麦蚜发生量预报模型可提前一个月作出高峰期蚜量预报,经两年应用预报正确。并提出主成分分析具有以下特点1、主成分分析可用较少的主成分概括较多因子的信息,并且可对因子重新组合、取舍。因此在主成分分析的基础上建立回归方程,效果一般可优于逐步回归。2、主成分不仅可用于建立回归方程,也可作为预报因子用于判别分析、聚类分析等其他统计预报方法。3、主成分分析较一般统计学方法计算量大,并且使用主成分建立的模式也较繁琐。但通过微机可使各项工作均方便地进行。三、聚类分析的应用聚类分析是数理统计中研究“物以类聚”的方法。它是根据多种指标(变量)的测定数据,定量地确定研究对象成员间的相似性或亲疏关系,以此将对象(样品、指标)归成大小类群,研究其间关系。所以,聚类分析既可见类间关系,也可见类内亲疏,是划分资源材料类群较为科学的方法。聚类的依据是遗传距离,遗传距离较大的品种分在不同的类,遗传距离较小的品种分在同一类,类内距离(类内所有品种两两之间遗传距离的平均值)全部小于类间距离(分别在两个类的品种两两之间遗传距离的平均值),但聚类分析的准确性、可靠性还很大程度上依赖于聚类性状的选择。莫惠栋认为:从育种家利用品种资源而言,可能两三个重要性状的聚类最有用,但这种聚类的稳定性差;从品种资源的分类而言,则应尽可能反映品种的综合性状,因而有较多主要性状参与聚类。许蕊仙等认为在进行大量的品种资源分类中,应尽量可能减少调查性状的数量,这样可以减少工作量,提高分析的准确性。作者认为,不管选用性状多少,所选择的性状必须具有代表性,遗传上稳定性或生态上有特殊意义,另外性状的选用还与试验的目的有关。康波,王振民等按刘来福介绍的方法,统计大豆10个农艺性状间的基因型相关系数矩阵R,并计算遗传距离,用类平均法进行聚类分析。利用多元分析来评价亲本,使研究对象数量化、直观化,这本身就是一个进步。它帮助我们提高育种的准确性,减少盲目性。特别是对分析鉴定大量的品种资源,将更科学有效。聚类分析结果基本上符合实际情况。遗传距离反映了品种间的亲缘关系。马廷臣通过对2001年种植的21个不同基因型春小麦进行研究,证明模糊聚类是进行春小麦优良品种分类的较好的方法,使用此方法对品质性状和农艺性状进行聚类,其结果与已知的品种分类相符,而且通过此方法可以进行优良品种选择。以已知的品质优良的品种为参照,评价未知品种(系)的品质是否优良,即未知品种与已知品质优良的品种同时种植,收获后同时对品质指标进行检测,其结果作模糊聚类,与已知品质优良的品种聚于一类的既为品质优良的品种。四 回归分析、通径分析的应用回归分析中逐步回归分析的基本思想是在所考虑的全部因素中,根据指定的入选F值,逐个对自变量进行检验,将该自变量的偏回归平方和与入选F值相比较,如果超过入选F值,表示该自变量对因变量有显著影响,因而入选回归方程,否则剔除该自变量。最后建立因变量对入选的自变量的回归方程。 通径分析是一种衡量自变量“性状”相对重要性的方法,已在众多领域得到广泛应用。它表明,自变量对依变量的贡献不仅反映了性状间的直接关系,同时也反映了性状间的间接关系。但由于其样本量之大,计算过程复杂,使得一些分析难以进行,计算结果不够准确。参考文献:1刘洪斌,武伟 产量决定因子的多元统计分析 水土保持研究1995年3月第2卷第l期2王兴仁,张录达 王华方 正交试验设置重复的必要性和统计分析方法 土壤通报2000年6月 第31卷 第3期3冶军,吕新 主成分分析在棉田质量评价中的应用 石河子大学学报(自然科学版) 2004年8月 第22卷第4期4刘了凡,冯殿英,张厚臣 主成分分析在麦蚜发生量预报5沈前华 大麦品种数量性状的聚类分析研究 南昌大学学报(理科版) 1997年12月第21卷第4期6康波,王振民,邓劭华等 多元分析在大豆杂交亲本选配方面的应用 吉林农业大学学报1997,19(1):32367李绥艳 聚类分析在大麦资源分类上的应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论