




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人的差异在于业余时间第八参数估计方法第八参数估计方法人的差异在于业余时间第八参数估计方法第八章参数估计方法第一节农业科学中的主要参数及其估计量的评选标准第二节矩法第三节最小二乘法第四节极大似然法第一节农业科学中的主要参数及其估计量的评选标准一、农业科学中的主要参数(1)总体数量特征值参数,例如,用平均数来估计品种的产量,用平均数差数来估计施肥等处理的效应;(2)在揭示变数间的相互关系方面,用相关系数来描述2个变数间的线性关系;用回归系数、偏回归系数等来描述原因变数变化所引起的结果变数的平均变化的数量,用通径系数来描述成分性状对目标性状的贡献程度等。农业科学研究中需要估计的参数是多种多样的,主要包括:用D(y)表示方差,有
D(y)=E[y-E(y)]2
(8·3)这就是随机变量函数的数学期望。同理,离散型随机变量方差的数学期望为:(8·4)连续型随机变量方差的数学期望为:(8·5)数学期望有这样一些常用的性质:(1)常数的数学期望为常数本身;(2)随机变量与常数的乘积的数学期望是常数与随机变量的数学期望的乘积;(3)多个随机变量分别与常数的乘积的求和函数的数学期望是常数与多个随机变量的数学期望的乘积的和;(4)多个相互独立的随机变量的乘积的数学期望是多个随机变量的数学期望的乘积。(二)参数估计量的评选标准评价估计量优劣的标准主要有无偏性、有效性、相合性等(1)无偏性参数估计量的期望值与参数真值是相等的,这种性质称为无偏性,具有无偏性的估计量称为无偏估计量。例如,在抽样分布中已经介绍了离均差平方和除以自由度得到的均方的平均数等于总体方差,即该均方的数学期望等于相应总体参数方差,这就是说该均方估计量是无偏的。估计量的数学期望值在样本容量趋近于无穷大时与参数的真值相等的性质称为渐进无偏性,具有渐进无偏性的估计量称为渐进无偏估计量。(2)有效性无偏性表示估计值是在真值周围波动的一个数值,即无偏性表示估计值与真值间平均差异为0,近似可以用估计值作为真值的一个代表。同一个参数可以有许多无偏估计量,但不同估计量的期望方差不同,也就是估计量在真值周围的波动大小不同。估计量的期望方差越大说明用其估计值代表相应真值的有效性越差;否则越好,越有效。不同的估计量具有不同的方差,方差最小说明最有效。如果一个无偏估计量相对与其它所有可能无偏估计量,其期望方差最小,那么称这种估计量为一致最小方差无偏估计量。(3)相合性用估计量估计参数涉及一个样本容量大小问题,如果样本容量越大估计值越接近真值,那么这种估计量是相合估计量。除以上三方面标准外,还有充分性与完备性也是常考虑的。
充分性指估计量应充分利用样本中每一变量的信息;
完备性指该估计量是充分的唯一的无偏估计量。第二节矩法一、矩的概念
矩(moment)分为原点矩和中心矩两种。对于样本y1,y2,…yn,各观测值的k次方的平均值,称为样本的k阶原点矩,记为,有,用观测值减去平均数得到的离均差的k次方的平均数称为样本的k阶中心矩,记为或,有。
对于总体y1,y2,…yN,各观测值的k次方的平均值,称为总体的k阶原点矩,记为,有;用观测值减去平均数得到的离均差的k次方的平均数称为总体的k阶中心矩,记为或,有二、矩法及矩估计量所谓矩法就是利用样本各阶原点矩来估计总体相应各阶原点矩的方法,即(8·6)也可以用样本各阶原点矩的函数来估计总体各阶原点矩同一函数,即若Q=f(E(y),E(y2),…,E(yk)),则由此得到的估计量称为矩估计量。[例8.1]现获得正态分布的随机样本y1,y2,…yn,要求正态分布参数和的矩估计量。首先,求正态分布总体的1阶原点矩和2阶中心矩:然后求样本的1阶原点矩和2阶中心矩,为最后,利用矩法,获得总体平均数和方差的矩估计故总体平均数和方差的矩估计值分别为样本平均数和样本方差,方差的分母为n。单峰分布曲线还有二个特征数,即偏度(skewness)与峰度(kurtosis),可分别用偏度系数和峰度系数作测度。
偏度系数(coefficientofskewness)是指3阶中心矩与标准差的3次方之比;峰度系数(coefficientofkurtosis)是指4阶中心矩与标准差的4次方之比。当偏度为正值时,分布向大于平均数方向偏斜;偏度为负值时则向小于平均数方向偏斜;当偏度的绝对值大于2时,分布的偏斜程度严重。当峰度大于3时,分布比较陡峭,峰态明显,即总体变数的分布比较集中。由样本计算的偏度系数(8·7)峰度系数(8·8)[例8.2]计算表3.4数据资料(140行水稻产量)所属分布曲线的偏度和峰度。表3.4140行水稻产量(单位:克)17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159165136108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159首先,计算样本的2、3、4阶中心矩,以及标准差估计值:然后,根据矩法原理,该分布的偏度与峰度估计值分别为:因此,说明资料比较集中在平均数左右,分布曲线并不是特别陡峭。[例8.3]例6.9为研究籼粳稻杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。按单向分组方差分析进行分析,结果见表6.9。此处用来说明由矩法估计误差、遗传方差和干草的遗传力h2。因为76个系是随机抽取的,因而为随机模型。方差结果说明系间差异显著,因而系间效应存在。根据矩法,首先应求出系间和误差变异来源的样本均方和总体期望均方(表6.9)。然后,利用矩估计原理,令样本的均方与总体相应变异的期望均方相等,从而求出和的矩估计值。此处E(MS系统间)=E[Tt-E(Tt)]2,(Tt
为各个系统的总和数)=
E(MS误差)=E(e2)=,(e为误差)因而第三节最小二乘法从总体中抽出的样本观察值与总体平均数是有差异的,这种差异属于抽样误差。因而,在总体平均数估计时要尽可能地降低这种误差,使总体平均数估计值尽可能好。参数估计的最小二乘法就是基于这种考虑提出的。
基本思想是使误差平方和最小,达到在误差之间建立一种平衡,以防止某一极端误差对决定参数的估计值起支配地位。这有助于揭示更接近真实的状况。
具体方法是为使误差平方和Q为最小,可通过求Q对待估参数的偏导数,并令其等于0,以求得参数估计量。[例8.4]用最小二乘法求总体平均数的估计量。若从平均数为的总体中抽得样本为y1、y2、y3、…、yn,则观察值可剖分为总体平均数与误差ei之和,总体平均数的最小二乘估计量就是使yi与间的误差平方和为最小,即为最小。为获得其最小值,求Q对的导数,并令导数等于0,可得:即总体平均数的估计量为:因此,算术平均数为总体平均数的最小二乘估计。这与矩法估计是一致的。估计离均差平方和的数学期望:因而,估计为:与矩法所得不同,而与常规以自由度为除数法一致。[例8.5]求例6.13的两向分组方差分析资料缺1个小区(表8.1)的最小二乘估计量和估计值。表8.1生长素处理豌豆的试验结果处理(A)组(B)总和Ti平均ⅠⅡⅢⅣ对照(CK)6062616024360.8赤霉素656568ye198+ye动力精6361616024561.3吲哚乙酸6467636125563.8硫酸腺嘌吟6265626425363.3马来酸6162626525062.5总和Tj375382377310+yeT=1444+ye从第6章可知,这种资料模式的线性模型为:按照最小二乘法的估计原理,使
该模型的约束条件为:,和误差项服从正态分布。为最小时可以求出效应和缺失小区ye的估计量,即从而,最小二乘估计量分别为:因而表8.1中,缺失小区的估计值可由下式求出:解上述方程,最小二乘估计值为:ye=65.6。缺区估计是根据线性模型,以及最小二乘法的原理得到的。不过,试验中尽可能不要缺区,因为缺区估计尽管可以估计缺区的值,但是误差的自由度将减少,本试验的误差自由度将减少1。一般地,若m个自变数x1、x2、x3、…、xm与依变数y存在统计模型关系(8·9)其中,为待估参数。
通过n次观测(n>k)得到n组含有x1i,x2i,…xmi,yi(i=1,2,…,n)的数据以估计。其最小二乘估计值为使(8·10)为最小的。这种估计方法称为参数估计的最小二乘法(leastsquares),或最小平方法。第四节极大似然法所谓极大似然法(maximumlikelihoodmethod)是值选择使事件发生概率最大的可能情况的参数估计方法。极大似然法包括二个步骤:(1)建立包括有该参数估计量的似然函数(likelihoodfunction)(2)根据实验数据求出似然函数达极值时的参数估计量或估计值。一、似然函数对于离散型随机变量,似然函数是多个独立事件的概率函数的乘积,该乘积是概率函数值,它是关于总体参数的函数。例如,一只大口袋里有红、白、黑3种球,采用复置抽样50次,得到红、白、黑3种球的个数分别为12,24,14,那么根据多项式的理论,可以建立似然函数为:其中p1,p2,p3分别为口袋中红、白、黑3种球的概率(p3=1-p1-p2),它们是需要估计的。对于连续型随机变量,似然函数是每个独立随机观测值的概率密度函数的乘积,则似然函数为:(8·11)若yi服从正态分布,则,上式可变为:(8·12)二、极大似然估计所谓极大似然估计就是指使似然函数为最大以获得总体参数估计的方法。其中,所获得的估计总体参数的表达式称为极大似然估计量,由该估计量获得的总体参数的估计值称为总体参数的极大似然估计值。为了计算上的方便,一般将似然函数取对数,称为对数似然函数,因为取对数后似然函数由乘积变为加式,其表达式为:(8·13)求极大似然估计量可以通过令对数似然函数对总体参数的偏导数等于0来获得,即当,有(k=1,2,…,l)(8·14)由此获得总体参数的极大似然估计量。[例8.6]设y1,y2,…,yn是正态总体的随机样本,求正态分布参数的极大似然估计量。似然函数为:取对数,得:那么似然方程组为:解得:因此,正态分布总体平均数的极大似然估计量为:当总体平均值为未知时,方差估计量为:当总体平均值为已知时,方差估计量为:[例8.7]求红、白、黑球事例中p1,p2,p3的极大似然估计值。由可获得对数似然函数
其中,C为常数。分别求对p1,p2的偏导数,并令为0,得似然方程组:联立求解,得:显然,极大似然估计值等于其观测频率。[例8.8]两个亲本的基因型分别为AABB和aabb,这两个亲本杂交后F2出现了4种基因型,分别为A_B_、A_bb、aaB_和aabb,得到四种基因型的个数分别为c、d、e、f,已知AA和BB两对基因间存在连锁关系,现欲估计重组率?设重组率为r,根据遗传学推导,可以得到4种基因型的概率见表8.2。表8.2F2群体基因型的分离情况基因型A_B_A_bbaaB_aabb总数观察得到基因型个数c(289)d(26)e(29)f(76)n(420)概率1首先,通过表8.3介绍由两对连锁主基因控制的F2群体16种基因型的概率计算出4种表现型的概率(表8.2)。配子及概率AB(1-r)/2Abr/2aBr/2ab(1-r)/2AB(1-r)/2AABB(1-r)2/4AABbr(1-r)/4AaBBr(1-r)/4AaBa(1-r)2/4Abr/2AABbr(1-r)/4AAbbr2/4AaBbr2/4Aabbr(1-r)/4aBr/2AaBBr(1-r)/4AaBbr2/4aaBBr2/4aaBbr(1-r)/4ab(1-r)/2AaBa(1-r)2/4Aabbr(1-r)/4aaBbr(1-r)/4Aabb(1-r)2/4表8.3
F2群体的基因型及其概率按多项式分布,可以根据概率函数得到似然函数为:(8·15)若以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司保安人员雇佣合同3篇
- 美式探戈室内设计
- 体验式包装设计
- 微循环测试系统项目绩效评估报告
- 《记承天寺夜游》板书设计
- 建筑设计电脑出图排版标准
- 2025西交利物浦大学辅导员考试试题及答案
- 2025辽宁兵器工业职工大学辅导员考试试题及答案
- 2025潍坊科技学院辅导员考试试题及答案
- 新生儿贫血护理要点解析
- 2023-2024学年四川省南充市嘉陵区五年级数学第二学期期末统考模拟试题含解析
- 大众汽车整车开发标准流程
- 教科版五年级下册科学期末测试卷含答案
- DL-T5169-2013水工混凝土钢筋施工规范
- 水暖、电气施工方案
- 单元三 防火防爆技术 项目三 点火源控制 一、化学点火源
- 原神游戏介绍PPT
- JTT663-2006 公路桥梁板式橡胶支座规格系列
- 学生退学家长委托书
- 高速公路投诉培训课件
- 交通劝导员上岗培训课件
评论
0/150
提交评论