




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
优选概率论与数理统计课件一元回归分析当前第1页\共有34页\编于星期三\6点在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:相关关系问题(1)确定性关系——函数关系;(2)非确定性关系——相关关系;相关关系表现为这些变量之间有一定的依赖关系,但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。当前第2页\共有34页\编于星期三\6点相关关系举例例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量Y与施肥量X之间有一定的关系,但施肥量相同,亩产量却不一定相同。亩产量是一个随机变量。又如:人的血压Y与年龄X之间有一定的依赖关系,一般来说,年龄越大,血压越高,但年龄相同的两个人的血压不一定相等。血压是一个随机变量。农作物的亩产量与施肥量、血压与年龄之间的这种关系称为相关关系,在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,可控变量称为自变量,不可控变量称为因变量。当前第3页\共有34页\编于星期三\6点函数关系与相关关系的区别相关关系——影响的值,函数关系——决定的值,因此,统计学上讨论两变量的相关关系时,是设法确定:在给定自变量的条件下,因变量的条件数学期望不能确定。当前第4页\共有34页\编于星期三\6点回归分析的概念研究一个随机变量与一个(或几个)可控变量之间的相关关系的统计方法称为回归分析。只有一个自变量的回归分析称为一元回归分析;多于一个自变量的回归分析称为多元回归分析。引进回归函数称为回归方程回归方程反映了因变量随自变量的变化而变化的平均变化情况.当前第5页\共有34页\编于星期三\6点回归分析主要包括三方面的内容(1)提供建立有相关关系的变量之间的数学关系式(称为经验公式)的一般方法;(2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;回归分析的内容(3)利用所得到的经验公式进行预测和控制。当前第6页\共有34页\编于星期三\6点一元线性回归模型如果试验的散点图中各点呈直线状,则假设这批数据的数学模型为设随机变量Y依赖于自变量x,作n次独立试验,得n对观测值:称这n对观测值为容量为n的一个子样,若把这n对观测值在平面直角坐标系中描点,得到试验的散点图.其中,且相互独立,则当前第7页\共有34页\编于星期三\6点图9-1其中同服从于正态分布相互独立,因此当前第8页\共有34页\编于星期三\6点其中是与无关的未知常数。(9.1)一元线性回归模型一般地,称如下数学模型为一元线性模型而称为回归函数或回归方程。称为回归系数。当前第9页\共有34页\编于星期三\6点回归函数(方程)的建立由观测值确定的回归函数,应使得较小。考虑函数问题:确定,使得取得极小值。这是一个二元函数的无条件极值问题。当前第10页\共有34页\编于星期三\6点回归方程的建立令当前第11页\共有34页\编于星期三\6点回归方程的建立记表示对的估计值则变量对的回归方程为简写为最小二乘法当前第12页\共有34页\编于星期三\6点回归方程有效性的检验对于任何一组数据,都可按最小二乘法确定一个线性函数,但变量与之间是否真有近似于线性函数的相关关系呢?尚需进行假设检验。假设如果成立,则不能认为与有线性相关关系。三种检验方法:F检验法、t-检验法、r检验法。当前第13页\共有34页\编于星期三\6点回归方程有效性的F检验法记——总离差平方和,反映观测值与平均值的偏差程度。经恒等变形,将分解当前第14页\共有34页\编于星期三\6点回归方程有效性的F检验法——回归平方和,反映回归值与平均值的偏差,揭示变量与的线性关系所引起的数据波动。——剩余平方和,反映观测值与回归值的偏差,揭示试验误差和非线性关系对试验结果所引起的数据波动。当前第15页\共有34页\编于星期三\6点回归方程有效性的F检验法如果为真,则于是,统计量对给定的检验水平,(1)当时,拒绝,即可认为变量与有线性相关关系;(2)当时,接受,即可认为变量与没有线性相关关系;当前第16页\共有34页\编于星期三\6点回归方程有效性的F检验法(2)当时,接受,即可认为变量与没有线性相关关系;此时,可能有以下几种情况:(2)对有显著影响,但这种影响不能用线性关系表示,应作非线性回归;(3)除之外,还有其它变量对也有显著影响,从而削弱了对的影响,应考虑多元回归。(1)对没有显著影响,应丢弃自变量;当前第17页\共有34页\编于星期三\6点回归方程有效性的r检验法记——样本的相关系数可反映变量与之间的线性相关程度。因为当前第18页\共有34页\编于星期三\6点回归方程有效性的r检验法记——样本的相关系数越大,变量与之间的线性相关程度越强。因为(1)(2)时,(3)时,与有线性相关关系;与无线性相关关系;当前第19页\共有34页\编于星期三\6点回归方程有效性的r检验法计算对给定的检验水平,查相关系数的临界值表如果,则拒绝,即线性回归方程有效;否则,接受,即线性回归方程无效。F检验与r检验是一致的:当前第20页\共有34页\编于星期三\6点回归方程有效性的t检验法统计量H0成立时,对给定的检验水平,H0的拒绝域为即当时,变量与有线性相关关系。F检验与t检验是一致的:当前第21页\共有34页\编于星期三\6点编号123456789脂肪含量%15.417.518.920.021.022.815.817.819.1蛋白质含量%44.039.241.838.937.438.144.640.739.8试求出与的关系,并判断是否有效。例1为了研究大豆脂肪含量和蛋白质含量的关系,测定了九种大豆品种籽粒内的脂肪含量和蛋白质含量,得到如下数据当前第22页\共有34页\编于星期三\6点解(1)描散点图当前第23页\共有34页\编于星期三\6点(2)建立模型由散点图,设变量与为线性相关关系:确定回归系数和:编号123456789x15.417.518.920.021.022.815.817.819.1168.3y44.039.241.838.937.438.144.640.739.8364.5x2237.16306.25357.21400441519.84249.64316.84364.813192.75y219361536.641747.241513.211398.761451.611989.161656.491584.0414813.2xy677.6686790.02778785.4868.68704.68724.46760.186775.02当前第24页\共有34页\编于星期三\6点所以,所求的回归方程为当前第25页\共有34页\编于星期三\6点(3)检验回归方程的有效性查相关系数临界值表因为所以回归方程在的检验水平下有统计意义。即可以认为大豆的蛋白质含量与脂肪含量有线性相关性。当前第26页\共有34页\编于星期三\6点利用回归方程进行预测1、点预测时,即为的点预测值。2、区间预测统计量对给定的置信水平,的预测区间为当前第27页\共有34页\编于星期三\6点续例1求大豆脂肪含量为18.6%的条件下蛋白质95%的预测区间。解由已求得的回归方程得蛋白质的点预测值为所以脂肪含量为18.6%时,蛋白质的95%的预测区间为利用回归方程进行预测当前第28页\共有34页\编于星期三\6点控制则为预测的反问题:已知因变量的取值区间为,确定自变量的取值区间使得利用回归方程进行控制一般地,要解出和很复杂,可作简化求解:当样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心理护理个案护理
- 妇产科护理安全管理体系
- 影视替身演员签约协议
- 新能源车用电机测试平台租赁与智能诊断服务协议
- 智能农业无人机无人机作业与农业无人机政策支持服务合同
- 热带植物研究温室租赁与植物病虫害防治合作协议
- 电视台主持人全职聘用及节目推广合作协议
- 信息技术行业劳务派遣员工绩效考核协议
- 商业综合体线上线下融合委托经营管理合同
- 脑科学人才培养:企业与高校合作培养协议
- 事业单位工作人员调动申报表
- 《审计实务》第6讲 函证程序(下)
- 物流运输企业安全隐患排查记录表
- 神经病学题库及神经病学试题题库
- 糖尿病酮症完整版本
- 五年级下册数学约分练习100题附答案
- 跨文化交流中的语言适应性研究
- 地摊市集活动策划方案
- 劳务外包与劳务派遣课件
- 中医护理-生活起居的护理内容
- 《商标权授权与侵权》课件
评论
0/150
提交评论