版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章直线回归与相关LinearRegressionandcorrelation第一节直线回归一、概述1、函数关系与回归关系函数关系:自变量取某一数值时,应变量有一个完全确定的数值与之对应。(多见于物理、化学等学科,生物医学界不少变量间有一定的关系,但不是十分明确)回归关系:应变量随自变量的变化而变化,且呈直线趋势,但并非所有的点子都在一直线上。直线回归分析的任务:找出一条最能代表这些数据关系的一条直线。方法:一般采用最小二乘法leastsquaremethod找出一条各实测点与它的纵向距离的平方和为最小的直线回归方程。又称作最小二乘回归变量y随变量x而变化,称x为自变量independentvariable,y为应变量dependentvariable.2、直线回归方程直线方程:y=a+bx直线回归方程:a:为回归直线在Y轴上的截距intercept,a>0表示直线与纵轴的交点在原点的上方,a<0交点在原点的下方。a=0则回归直线通过原点b:回归系数regressioncoefficient,为直线的斜率slope,b>o直线从左下走向右上,b<0从左上走向右下,b=0直线与横轴平行。意义:x每增(减)一单位,Y平均改变b个单位3、最小二乘法样本含量为n的的样本资料标在(x,y)平面上,可得n个点,故可确定很多直线,直线回归的主要目标之一是用实测的x估计y,所以希望估计的y与实测的y间的误差愈小愈好。即从所有直线中找到一条直线使估计误差平方和达最小。即最小二、求直线回归方程的基本方法P110例9-1:1)由原始数据绘散点图,各点分布呈直线趋势,故作下列计算2)求x,y,x2,y2,xy3)计算x,y的均数,lxx、lyy和lxy4)求回归系数b和截距a5)列出回归方程6)直线回归方程图示:在自变量x的实测全距范围内任取相距较远且易读的两x值,代入回归方程求y的估计值,在图绘出两点连成直线。注意:所绘直线必然通过,若纵坐标、横坐标无折断号时,将此直线左端延长与纵轴相交,交点的纵坐标必然等于截距a,这两点可用来核对回归线绘制是否正确。第二节直线回归分析中误差及可信区间一、标准估计误差估计误差errorofestimate:在直线回归中,各实际值y与由回归方程计算出的估计值之间有一定的误差,称~。这种离差可以用类似标准差的式子进行计算,称为标准估计误差standarderrorofestimate。由于决定于均数和回归系数,所以自由度为n-2lyy的分析:p点的纵坐标被回归线、均数y截成三段SS总=SS回+SS剩YXPy-y^y-y^-y-yy各实测点离回归直线越近,剩余平方和愈小,说明直线回归的估计误差愈小
总=回+剩
总=n-1,回=1,剩=n-2二、实测值围绕回归线的离散度回归分析时假设:X取某一值时,Y围绕回归线+x呈正态分布,Sy.x是其标准差的估计值。故可估计出约有95%观测值y在总体回归线y=+x上下1.96个标准估计误差范围内,见P112图9-3三、回归系数的标准误表示:样本回归系数b对总体回归系数
进行估计时误差的大小求的95%可信区间bt0.05()Sb,自由度=n-2四、的标准误y的标准误本应由Sy/n求得,但因在直线回归当中x的影响被扣除后,y方面的变异减小,故y的标准误,即x=x时y^的标准误为五、的可信区间是总体均数的估计值95%可信区间:六、的标准误当xix时,的变异不仅决定于y的误差,也与回归系数b的误差有关七、(个体y值)的可信区间理论上,每个xi对应的y估计值都有一个区间估计,把这些可信区间的上限和下限连起来,为两条曲线。把这两条曲线间的空间称为回归直线的可信区间。八、截距的误差及总体参数的可信区间由于截距是x=0时y的估计值,九、单一个体yi值的范围预测第三节回归系数和截距的统计意义检验一、回归系数的t检验二、回归系数的方差分析所得结论与t检验相同三、两个回归系数差别的统计意义检验P119,例9-3四、截距的统计意义检验检验a是否是从总体截距为0的总体中抽样得到t=a/Sa
自由度为n-2五、两条回归线高度差别的统计意义检验当两条回归线的回归系数的差别无统计意义时,可以用一公共的斜率来拟合此两条回归线。(见P121,一般了解)第四节直线回归方程的应用一、描述两变量的依存关系二、利用回归方程进行预测三、利用回归方程进行统计控制统计控制:是利用回归方程进行逆估计,如要求应变量在一定范围波动,可以通过自变量的取值来实现。四、应用直线回归方程应注意的问题1、作回归分析要有实际意义,不能把毫无关联的两种现象勉强作回归分析,即便有回归关系,也不一定有因果关系,还必须对两种现象间的内在联系有所认识,即能从专业理论上作出合理解释或有所依据2、在进行直线回归分析时,应绘散点图,当观察点的分布有直线趋势,才适宜作直线回归分析。散点图还能提示资料有无异常点,异常点对方程估计影响较大3、直线回归方程的适用范围一般以自变量的取值范围为限,在此范围求出y的估计值,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年福建省永安市高二生物下册期末考试试卷及答案(基础+提升)
- 2026年辽宁省盖州市高二生物下册期末考试模拟卷及完整答案(名校卷)
- 2026年浙江省慈溪市高二生物下册期末考试模拟卷及参考答案【预热题】
- 2026年江苏省兴化市高二生物下册期末考试模拟卷含答案【培优A卷】
- 2026年贵州省仁怀市高二生物下册期末考试测试卷【综合卷】附答案
- 2026年云南省大理市高二生物下册期末考试考试卷【考点梳理】附答案
- 2026年浙江省诸暨市高二生物下册期末考试考试卷及参考答案【突破训练】
- 2026年浙江省乐清市高二生物下册期末考试检测卷带答案(巩固)
- 2025年黑龙江省穆棱市高二生物下册期末考试考试卷及完整答案【各地真题】
- 2025年河南省义马市高二生物下册期末考试考试卷附完整答案【夺冠系列】
- 国企尽职调查管理办法
- 期末必刷选填题 (十七大题型)(原卷版)-2024-2025学年沪教版七年级数学下册
- 村级项目资产管理办法
- 陕西省西安市高新一中2025年高一下化学期末检测试题含解析
- NB/T 11316-2023变电站电能质量现场测试技术规范
- 链家续租房合同协议书
- 2025年长江生态环保集团有限公司-企业报告(业主版)
- 星际航行概论钱学森著2008
- 污水处理厂施工方案与技术措施
- 急诊脑卒中预见性护理
- 无人机消防救援应用指南
评论
0/150
提交评论