生物统计学 第七章 直线相关与回归分析_第1页
已阅读1页,还剩137页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、直线相关和回归分析,第7章,平均,标准差,方差分析,多重比较,集中点,离散度,差异重要性,变量(产量),肥料,播种密度,品种,实际研究中事物之间的相互关系,确定的函数关系孩子的身高受父母身高的影响,人的身高和体重的关系,兄弟身高的关系, 坐标显示1078对数字。横轴x的数字代表父亲的高度,纵轴y的数字代表儿子的高度,1078个点的图形是散点图。它的形状像橄榄形的云,中间的点密集,边缘的点稀疏,其主要部分是椭圆。散点图、两个变量之间关系的特征(正或负联合更改)和程度(关系是否紧密)、两个变量之间关系的类型(线性或曲线)、异常观察是否干涉、正线关系、负线关系和负线关系它们之间的规则、回归、相关、定

2、量研究、生物学中研究两个变量之间的关系主要是探索两个变量的内在关系,或者从一个变量x(随机变量或一般变量)到x,y,肥料(可以严格人工控制)、自变量、变量、一个变量的变化研究另一个变量或多个变量的约束、因果关系和“一个因果关系”。也就是说,参数和1。直线回归分析、曲线回归分析、多重线性回归分析、多重非线性回归分析、大量测量不同身高人口的体重时,可以看出在同一高度体重并不完全相同。但是在所有的体重级别上,一定的体重分布与之相对应。在大量测量不同体重层的身高时,可以看出在相同的体重下身高并不完全相同。(莎士比亚,哈姆雷特,身高)但是在所有体重中,恒定的身高分布是相应的。(莎士比亚,体重名言),身高

3、和体重之间存在相关性。x高度,y体重,x体重,y高度,相关性,两个变量x,y都是随机变量,每个变量的可能值对应于另一个变量的晶体分布,这两个变量都有相关关系。两个变量之间直线关系的相关分析称为简单相关分析(也称为直线相关分析)。在对多个变量执行相关性分析时,研究变量和多个变量之间的线性相关性称为复合相关性分析。如果其馀变量保持不变,则两个变量之间的线性相关性称为部分相关分析。,第2节:直线回归线性回归,1,建立直线回归方程,2,直线回归的数学模型和基本假设,3,直线回归的假设检验,4,直线回归的区间估计,简单回归,y,最小值,最小二乘法,根据微积分中求极值的方法,q对a,b的一阶偏导数等于0。

4、即,最小、基本特性、回归方程的中心化。y,误差,2,数学模型和基本假设,yi,y的总平均值,x引起的y的变化,y的随机误差,总回归系数,随机误差,直线回归的数学模型,x的所有值都对应于y整体,随机误差徐璐独立,呈正态分布。y,x和y变量之间没有直线关系,但如果n对观测(xi,yi)可以根据上述方法求出回归方程,则这些回归方程反应的两个变量之间的直线关系是不现实的。如何判断直线回归方程反应的两个变量之间直线关系的真实性?取决于变量x和y之间是否存在直线关系。第三,直线回归的假设测试,有意义,指导实践,(x,y),第一,直线回归的变异原,实际值和估计值之间的差异,剩馀或残差。与回归系数大小相关的估

5、计值和平均值的差值。变量y的平方和,总平方和,ssy,ss的和,回归平方和u,回归平方和q,y的均值差值反映了y的总变化程度。y的总平方和。说明y的变形,当x和y的回归关系未考虑在内。反映y和x之间的直线关系导致的y的变化量。由于x的变化,y变化的平方和称为回归平方和。y的总变化反映了由于x和y的直线关系而减少y变化的部分可以从总平方和解为x的部分。u值越大,回归效果越好。“回归平方和”(regression sum of squares) u,误差因素引起的平方和反映了y因其他因素而变化的大小,x和y的直线回归关系除外。除了x对y的线性影响以外,所有因素都反映了y变化的影响,即总平方和不能解

6、释为x的部分。回归平方和误差平方和,其馀平方和(residual sum of squares) q,在散点图中,每个测量点离回归线越近,q值越小,直线回归的估计误差越小。变量y的平方和、总平方和、ssy、ss总和、回归平方和u、回归平方和q、直线回归分析中的回归自由度等于参数数。仅包含一个参数、df回归1、df总计n-1和df偏离n,df1=1 df2=n-2,(2) f检查,h 03360点虫化性日历期间平均温度x和日历期间天数y之间没有线性关系。ha:变量之间没有线性关系。检查线性回归系数的重要性,并使用t检验法继续。例如,h0:=0 ha:0假定通过检查样本回归系数b是否来自等于0的整

7、个2变量来估计线性回归的重要性。(c) t测试,样例统计信息的分布是根据最小二乘法计算的样例统计量,其自身分布的分布具有以下特性分布形式:正态分布数学期望:标准差:未知,因此必须使用估计的sy代替估计的标准差。df=n-2,回归系数标准,概率值相同,f(尾部)值(df1=1,df2=n-2),t值(尾部)(df=n-2),df,(2) y/x置信区间和单y预测区间,(3) y/x和单y观测置信区间图标,在比例、反比、回归分析中必须具有实际意义。直线回归主义问题,两个完全不相关的现象不能强行进行回归分析。有回归关系不一定就是因果关系。还要了解两种现象的内在联系。也就是说,在专业理论上必须有合理的

8、解释或根据。在执行直线回归分析之前绘制散点图。仅当观测点的分布有直线趋势时适用于直线回归分析。散点图还可以指示数据是否具有异常值,即残差的绝对值是否对应于特别大的观测数据。理想点的存在往往对回归方程中a和b的估计有很大影响。因此,您必须检阅此例外点的值。直线回归主义问题,直线回归的适应范围通常限制为自变量的值。在参数范围内计算的估计值,通常称为插值。超出参数范围计算的估计值称为外推(extrapolation)。如果没有充分的理由证明超过收购范围,就要避免外部推演。说明了直线回归主义问题,两个变量之间的依赖性。应用直线回归,使用回归关系进行预测。使用自变量作为预测因子,并赋予公式以估计预测量,

9、其变化范围可以根据个人y值的允许区间方法计算。回归方程统计控制。no2浓度,直线回归的应用,第3节:直线相关线性手性,1,相关系数和确定系数,2,相关系数的假设检验相关系数,相关类型,正相关,负相关,0相关,正相关,负相关,0相关,在样本,总体,相关系数计算中,两个变量的地位是相等的,按参数和变量划分,差,联系,确定系数coefficient of determination,变量x占导致y变化的回归平方和和y总变化平方和的比率,ssy是固定的,回归平方和u,说明介绍相关效果良好,x和y完全相关。完全正相关,完全负相关,散点图上的所有点都必须在一行上。回归完全不起作用。也就是说,使用x的线性函

10、数完全无法预测y值的变化。x和y之间没有线性相关性。散点图分布无序,没有直线的趋势,但可能存在非线性关系。x的线性函数有助于预测y值的变化,但无法准确预测y受其他因素(包括随机误差)的影响。相关系数(r)和确定系数(r2)的差值,(2)r表示正值或负值,r2表示正值,r2通常仅用于表示相关程度,而不是相关特性。温度、天数、点虫孵化历期平均温度与历期天数呈负相关。x和y的变异有93.74,可以解释为两者之间的线性关系。=0,x,y,(x1,y1),(x2,y2),(x3,y3),(xn,yn),p?第二,相关系数的假设检验,r是线性关系强弱的指标,h h0:=0 ha:0检查样本回归系数b是否来

11、自=0的整个2变量,从而估计线性回归的重要性。相关系数r的重要性测试的无效假设为=0。也就是说,衡量r来自=0的概率。也就是说,判断r代表的整个整体是否与直线相关。整体相关系数=0,相关系数r的标准误差,()假设,(2)水平,(3)检查,(4)估计,h 03360=0;ha:0,选择明显的水平,在明显的水平否定h0,接受ha。推断r是显著的。在重要级别接受h0并否定ha。推断r不重要。当r的显着检查结果不明显时,估计两个变量之间没有相关性,此时不能使用r表示相关的贴近度。()假设,(2)水平,(3)检查,(4)估计,h 0:=0;据推测,ha: 0 0,明显的水平0.01选择,h0傅晶,ha接受r非常明显,点虫孵化历期温度和历期天数之间有非常明显的直线关系。不可避免的结果,r和t符号相同。相关系数的假设检验可以在不计算t值的情况下直接在附加表12中找到df=n-2点r的阈值。椰子树的产量x(狗),椰子树的高度y(英尺),x(狗)120 121 123 126 128 y(英尺)21 23 22 25 24,椰子树的山果数和树高之间没有直线关系。即使在采样过小时r值达到0.7996,采样也可能来自整个相关系数=0的情况。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论