《相关于回归分析》PPT课件.ppt_第1页
《相关于回归分析》PPT课件.ppt_第2页
《相关于回归分析》PPT课件.ppt_第3页
《相关于回归分析》PPT课件.ppt_第4页
《相关于回归分析》PPT课件.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章相关和回归分析第一节简单线性相关分析1,相关关系的概念和种类(1)概念:指现象之间实际存在但关系数字不固定的相互依赖性。现象之间的数量关系一般可以分为两种茄子类型:1,函数关系:现象之间有严格的依赖性。2.相关关系相关关系有两个茄子特征。(1)现象之间实际存在的数量上的相互依存关系。(2)现象之间的数量关系不确定,不严格。(b)范畴:1,单相关和复合相关(1)单相关:两个元素之间的相关关系称为单相关。又是你简单的相关。(2)复相关:复相关、多元相关两个茄子以上要素之间的相关关系。2、线性相关和非线性相关(1)线性相关(线性相关):如果一个变量发生更改,则其他变量也会相应地发生更改。(2)

2、非线性相关(曲线相关):如果一个变量发生更改,则其他变量也相应地发生更改,但这些更改不相同。3、完全相关、不完全相关和无相关(1)完全相关:一个变量的值完全由另一个变量或一组变量的值决定,即函数关系。因此,函数关系是相关关系的特殊情况。(2)无相关:如果一个变量的值完全不受另一个变量或另一组变量的影响,则在变量之间保持不相关。(3)不完全相关:无相关相关之间的相关。大多数相关关系属于不完全的相关关系。这是没有相关的完全相关相关关系的特例。4、正相关和负相关(1)正相关:朝同一方向变化的相关正相关。(2)负相关:逆波动的相关负相关。(c)相关分析的内容是分析和研究客观现象的相关关系,称为相关分析

3、。用于分析的方法称为相关分析。相关分析的主要内容:1,确定现象之间是否存在关系。2、确定相关关系的表达方式。3、确定相关关系的密切程度。绘制相关图并计算相关系数。以上几点是狭义相关分析的内容。广义相关分析除了狭义分析的内容外,还包括4,2个变量之间的一般关系值的测量。建立它们之间的数学模型(通常称为经验公式)是判断、估算和预测的依据。5、测量变量估计值与实际值之间的差异,反映变量估计值的可靠性。第二节相关地图和相关表1,判断现象之间存在相关关系1,定性分析。2.相关表创建和相关图表绘制相关表是通过将具有相关关系的数据并行排列在一个表中来观察相互关系的统计表。相关图是根据相关表中的数据绘制的散点

4、图,即相关点图。其次,简单线性相关图表1,固定简单线性相关图表两个变量,y是随机变量,x是非固定变量。例:某些机床使用年数和保管费用之间存在相关关系。根据资料列出相关表。2,随机简单线性相关图表x,y全部按随机变量,观察(x,y)分组,然后按顺序排列,x从小到大,y从大到小形成棋盘式,例如第3节相关系数1,相关系数:测量两个变量之间线性相关关系的贴近度和方向的统计分析指标。公式:相关系数的范围是相关系数的绝对值越接近0,x和y之间的线性相关程度越小;反之,相关系数的绝对值越接近1,x和y之间的线性相关程度越大。相关系数的绝对值为1表明这两种现象完全是线性相关。相关系数为0表示这两种现象都没有线

5、性相关关系。一般来说,相关系数可以确定为:r绝对值在0.3以下的没有直线的相关0.3以上是直线相关,0.3-0.5低相关0.5-0.8是重要的相关;0.8或更高的相关。从上面判断,远视数据较多,数据少的话,起点值要高。对相关系数的解释:乘法相关系数在计算过程中使用两列的平均值,计算繁琐并影响精度。范例:在实际问题中使用下列公式:牙齿公式是从“乘法”相关系数计算公式中导出的。示例:使用前面的示例说明计算过程。如果x,y都是随机变量,就必须以分组频率加权。计算相关系数的公式如下:第4节简单的线性回归分析1,概念:回归的概念是英国生物学家高尔顿提出的,在研究父母身高和女身高时发现了有趣的现象。回归用

6、于指向变量之间的常规数量关系。为了测量现象之间数量变化的一般关系,数学模型的使用方法是回归分析。2,类:最基本的分类:(1)一元回归和多元回归1,一元回归:两个变量之间的回归分析。2,多元回归:三个或更多变量的回归分析。(2)线性回归和非线性回归3、简单线性回归分析(1)回归线1、拟合线的前提条件1、现象之间存在数量间的相互依赖性。其次,现象之间存在线性相关关系。第三,收购和收购变量的相应资料必须有一定量。2,任意直线最合理的最小平法3,直线回归方程的建立:A等于x=0牙齿时Y的估计值。b也称为回归系数,因为每次参数变化1个单位时变量的平均波动值。以上述数据为例,建立了线性回归方程。如果两种现

7、象在基于徐璐的条件下是线性波动趋势,则拟合两条回归线,创建两个回归线方程。“Y YX”回归方程:YC=A BX“X YY”回归方程:xc=c dy请参见:回归线只能估计一个茄子,反之则不能估计另一个。只能用给定的参数推断因果因子,不能反相。线性相关分析的特征:1,两个变量是等效的。2、只能计算一个相关系数;3,相关系数有表示正相关和负相关的符号。4、计算数据要求的相关系数是相关两个变量都是随机的。简单直线回归分析特征:1,两个变量之间不等价。2.回归方程是利用自变量的给定值来估计和估计自变量的值,反映了变量值之间的具体波动关系,不是抽象系数。从,3,x,y的两个变量中的方程来看,有两个回归方程

8、。4、直线回归方程的回归系数有符号,正回归系数表示两个变量之间方向相同的变化,负回归系数表示两个变量之间方向相反的变化。5.根据回归方程,对数据的要求是变量随机的,应该给出参数。5子句估计标准误差1,概念:描述回归方程估计结果准确性程度的统计分析指标。所有观测值与估计值的平均偏差。二、作用:一、回归线代表性大小测量的重要尺度。第二,估计标准误差可以反映变量之间相关关系的贴近度,在其他测量方面。估计标准误差较小,表明每条相关点回归线接近并集中。也就是说,方差较小,现象之间的相关关系密切,估计标准误差为零,那么所有相关点都落在回归线上。估计标准误差很大,这意味着每个相关点都分布在远离回归线的地方。

9、也就是说,方差大,反映了现象之间的相关关系不密切。第三,对于抽样调查,是计算回归抽样误差的基础。就像总体方差是计算取样误差的基础一样。在计算回归采样误差时,应使用整体估计标准误差,但通常没有牙齿材料,因此应用样品的估计标准误差代替。第三,估计标准误差计算(1)偏差平方和分解估计YC与其观测Y之间存在一定偏差,称为估计误差。要说明估计误差,必须从变异分析开始。观察值Y值的大小波动上下波动,Y值的这种波动现象称为变异。这种变化的原因是两个茄子方面的。(1)收购变化的影响,即X值的差异。(2)其他因素的影响,包括观察和实验中发生的错误。要分析牙齿两方面的影响,必须分解总变异。对于每个观测值,变异的大

10、小可以用观测值Y和平均值的偏差y-来表示,牙齿偏差可以分解。所有N次观测的总变动,方差的平方和表示,简称Y的总变动。从常识上可以看出,总变分一般可以分为T,R,Q两部分:总变分(总偏差平方和)、回归变分(回归偏差平方和)和剩余变分(剩余偏差平方和)。根据直线方程yc=a bx,可以认为是X波动引起的,因此回归波动反映了Y在Y总波动中因X和Y的直线回归关系引起的Y波动。剩馀偏差的平方和是回归线中每个观测点的平方和。根据最小平法原理,牙齿量是所有直线上与观察点的距离平方和中最小的,反映了除X对Y的线性影响以外的所有因素(包括X-Y的非线性关系和观测误差)对Y的影响。也就是说,总变异减去回归的部分,因此也称为误差平方之和或随机因素。因此,T中R的比重越大,Q的比重越小,线性回归拟合越好,反之,拟合越差。因此,有以下公式:R2是相关程度的结晶系数,R是相关系数。通常,使用以下公式计算R,Q:B是回归系数。通过对偏差平方和的分解,准确地解释了总变分中的各因素及其影响程度,进一步验证了回归方程的重要性,对相关系数计算等具有重要意义。(David assell,Northern Exposure(美国电视电视剧),variance(偏差)(2)根据标准误差的计算公式1,2,A,B,估计标准误差,4,相关系数与估计标准误差的关系,从估计标准误差的作用分析以及估计标准误差的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论