版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十章 多元回归和相关n第一节 多元回归n第二节 多元相关和偏相关本章主要内容有:n 确定各个自变数对依变数的各自效应和综合效应,即建立由各个自变数描述和预测依变数反应量的多元回归方程;n对上述综合效应和各自效应的显著性进行测验,并在大量自变数中选择仅对依变数有显著效应的自变数,建立最优多元回归方程;n评定各个自变数对依变数的相对重要性,以便研究者抓住关键,能动地调控依变数的响应量。 第一节 多元回归n一、多元回归方程n二、多元回归的假设测验n三、最优多元线性回归方程的统计选择n四、自变数的相对重要性一、多元回归方程n多元回归或复回归(multiple regression):依变数依两个或两
2、个以上自变数的回归。n (一) 多元回归的线性模型和多元回归方程式n若依变数y 同时受到m 个自变数x1、x2、xm 的影响,且这m 个自变数皆与y 成线性关系,则这m+1个变数的关系就形成m 元线性回归。 n一个m元线性回归总体的线性模型为: 其中, n( 0, )。n一个m元线性回归的样本观察值组成为: jmjmjjjxxxxy210021j2jmjmjjjexbxbxbby21021(101)(102)n一个m元线性回归方程可给定为: b0是x1、x2、xm 都为0时y 的点估计值;b1是by123m 的简写,它是在x2,x3,xm 皆保持一定时,x1 每增加一个单位对y的效应,称为x2
3、,x3,xm 不变(取常量)时x1 对y 的偏回归系数(partial regression coefficient) 。 mmxbxbxbby22110(103)(二) 多元回归统计数的计算n(102) 用矩阵表示为: n即 y=xb+e (104)nmmnmmnneeebbbxxxxxxyyy2110211121121 11 1n其中(三) 多元回归方程的估计标准误n qy/12m 称为多元离回归平方和或多元回归剩余平方和,它反映了回归估计值和实测值y之间的差异。 最小 n自由度: = n-(m+1) yxxxb 1)(2) (yyq(105) sy/12m1)(/12mnqmy(106)
4、二、多元回归的假设测验n(一) 多元回归关系的假设测验n测验 m 个自变数的综合对 y 的效应是否显著。若令回归方程中b1、b2、bm 的总体回归系数为 、 、 、 ,则这一测验所对应的假设为h0: 0 对ha: 不全为0。 12mm21in由于多元回归下 ssy 可分解为 uy/12m 和 qy/12m 两部分,uy/12m由 x1、x2、xm的不同所引起,具有 = m;qy/12m与 x1、x2、xm的不同无关,具有 =n-(m+1),由之构成的f 值: )( /1/1212 mnqmufmymy(108) (二) 偏回归关系的假设测验 n偏回归系数的假设测验,就是测验各个偏回归系数bi(
5、i=1,2,,m)来自 =0的总体的概率,所作的假设为h0: =0对ha: 0,测验方法有两种。n1t 测验 iii 服从 的 t 分布,可测验 bi 的显著性。 23332312322211312112222 212022110120100/123/1)()(yxybbbbbbbbbbbbbbbscccccccccsxxbvibs1)1)(iic ibiisbt) 1( mn(109)=sy/12m(1010)(1011)n 2. f 测验 (1012)n 就是y对xi的偏回归平方和, 。 (1013) 1)1)(2iiipcbui1)(/12 mnqufmypiipu1三、最优多元线性回归
6、方程的统计选择n剔除不显著自变数的过程称为自变数的统计选择,所得的仅包含显著自变数的多元回归方程,叫做最优的多元线性回归方程。n逐步回归(stepwise regression):为了获得最优方程,回归计算就要一步一步做下去,直至所有不显著的自变数皆被剔除为止。n自变数统计选择的具体步骤为:n第一步:m个自变数的回归分析,一直进行到偏回归的假设测验。 n第二步:m-1个自变数的回归分析,也是一直进行到 偏回归的假设测验。n第三步:m-2个自变数的回归分析,又一直进行到偏回归的假设测验。 n如此重复进行,直至留下的所有自变数的偏回归都显著,即得最优多元线性回归方程。四、自变数的相对重要性n偏回归
7、系数bi本身并不能反映自变数的相对重要性,其原因有二:nbi是带有具体单位的,单位不同则无从比较;n即使单位相同,若xi的变异度不同,也不能比较。n通径系数(path coefficient,记作pi):即对bi进行标准化,在分子和分母分别除以y 和xi的标准差,从而消除单位和变异度不同的影响,获得一个表示xi 对y 相对重要性的统计数。n通径系数 pi 统计意义是:若 xi 增加一个标准差单位,y 将增加(pi0)或减少(pi0)pi 个标准差单位。yxixyiissssbnssnssbpii1)/(1/1)/(1/(1014)第二节 多元相关和偏相关n一、多元相关n二、偏相关n三、偏相关和
8、简单相关的关系一、 多元相关n多元相关或复相关(multiple correlation):在m=m+1个变数中,m个变数的综合和1个变数的相关。n偏相关(partial correlation):在其余m-2个变数皆固定时,指定的两个变数间的相关。 n(一) 多元相关系数n在m个自变数和1个依变数的多元相关中,多元相关系数记作 ry12m ,读作依变数y和m个自变数的多元相关系数。 n ry12m= (1015) ymyymyssqssu/12/121n多元相关系数为多元回归平方和与总变异平方和之比的平方根。nry12m的存在区间为0,1。n (二) 多元相关系数的假设测验n令总体的多元相关
9、系数为 ,则对多元相关系数的假设测验为h0: 对ha: , 00n f 测验 : n其中的 =m, =n-(m+1),r2为 的简写。 )(12122rrf122 myr12(1016)二、偏相关n(一) 偏相关系数n偏相关系数:表示在其它m-2个变数都保持一定时,指定的两个变数间相关的密切程度。n偏相关系数以r 带右下标表示。如有x1、x2、x3 3个变数,则r123表示x3变数保持一定时,x1和x2变数的偏相关系数; n若有m 个变数,则偏相关系数共有m(m-1)/2个。n偏相关系数的取值范围是-1,1。n偏相关系数解法是:由简单相关系数rij(i,j=1,2,m )组成的相关矩阵: mmmmmmmmijrrrrrrrrrr212222111211)(rn求得其逆矩阵:n令xi 和xj 的偏相关系数为rij ,解得 后即有 rij (1018)mmmmmmmmijcccccccccc2122221112111)(rijcjjiiijcccn矩阵以主对角线为轴而对称,即rij =rji。逆阵 r-1中 的元素也是以主对角线为轴而对称的 。n(二) 偏相关系数 的假设测验n可测验h0: =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脑栓塞患者的生命体征监测
- 江苏省徐州市树人初级中学2025-2026学年初三下学期考前模拟试卷物理试题含解析
- 安徽省阜阳市太和县重点达标名校2026年高中毕业班综合测试(一)物理试题含解析
- 江苏省盐城市东台实验2025-2026学年中考5月模拟物理试题含解析
- 重庆三峡职业学院《有限元理论及应用》2024-2025学年第二学期期末试卷
- 黑龙江佳木斯市建三江农垦管理局15校2026届初三下学期期末模拟卷(一)数学试题含解析
- 广东省阳江地区重点名校2026年初三下学期网络教学训练题(二)数学试题含解析
- 2026年山东省荣成市第三十五中学初三下第一次诊断考试数学试题含解析
- 安徽省阜阳市颍上县2026届初三数学试题下学期4月考试题含解析
- 肝病护理中的护理评估工具
- 休克诊疗规范课件
- 2025年新生儿窒息复苏试题及答案
- 2026年陕西航空职业技术学院单招职业倾向性考试题库及一套答案详解
- 20万吨-年采矿废石综合回收利用项目环境影响报告书
- (一诊)2026年兰州市高三模拟考试历史试卷(含答案)
- 2025-2026学年教科版(新教材)初中信息科技八年级第二学期教学计划及进度表
- 2026贵州安顺关岭恒升村镇银行春季招聘4人考试参考题库及答案解析
- 企业内部福利待遇制度
- 钢丝pe施工方案(3篇)
- 2026年医疗AI辅助手术报告
- 2026年六安职业技术学院单招职业适应性考试题库含答案详解(考试直接用)
评论
0/150
提交评论