版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学多元回归分析方法 多元线性回归分析 在数量分析中,经常会看到变量与变量之间存在着一定的联系。要了解变量之间如何发生相互影响的,就需要利用相关分析和回归分析。回归分析的主要类型:一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析以及逻辑回归分析等。 1.1 回归分析基本概念 相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用面不同。 在回归分析中,变量y称为因变量,处于被解释的特殊地位;而在相关分析中,变量y与变量x处于平等的地位,研究变量y与变量x的密切程度和研究变量x
2、与变量y的密切程度是一样的。 在回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;而在相关分析中,变量x和变量y都是随机变量。 相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度。 具体地说,回归分析主要解决以下几方面的问题。 (1)通过分析大量的样本数据,确定变量之间的数学关系式。 (2)对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。 (3)
3、利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。 作为处理变量之间关系的一种统计方法和技术,回归分析的基本思想和方法以及“回归(regression)”名称的由来都要归功于英国统计学fgalton(18221911)。 在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。 1.2 多元线性回归 1.2.1 多元线性回归的定义 一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的
4、条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。 一元线性回归分析讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;影响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。 因此,在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。这就产生了测定多因素之间相关关系的问题。
5、研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关 1 系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。 多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成。 1.2.2 多元线性回归模型 1.2.2.1元线性回归模型及其矩阵表示 设y是一个可观测的随机变量,它受到p个非随机因索x1,x2,xp和随机因素?的影响,若y与x1,x2,xp有如下线性关系: y?0?1x1?pxp? (1.1) 其中?0,?1,?p是p?1个未知参数,?是不可测的随机误差,且通常假定 ?n(0,?2).
6、我们称式(1.1)为多元线性回归模型.称y为被解释变量(因变量),xi(i?1,2,?,p)为解释变量(自变量). 称 e(y)?0?1x1?pxp (1.2) 为理论回归方程. 对于一个实际问题,要建立多元回归方程,首先要估计出未知参数?0,?1, ,?p,为此我们要进行n 次独立观测,得到n组样本数据(xi1,xi2,?,xip;yi), i?1,2,?,n,他们满足式(1.1),即有 ?y1?0?1x11?2x12?px1p?1?y?x?x?x?20121222p2p2 (1.3) ?yn?0?1xn1?2xn2?pxnp?n其中?1,?2,?,?n相互独立且都服从n(0,?2). 式(
7、1.3)又可表示成矩阵形式: y?x? (1.4) 这里,y?(y1,y2,?,yn)t,?(?0,?1,?,?p)t,?(?1,?2,?,?n)t, ?nn(0,?2in),in为n阶单位矩阵. 2 ?1x11?1x21x?1xn1x12x22?xn2?x1p?x2p? ?xnp?n?(p?1)阶矩阵x称为资料矩阵或设计矩阵,并假设它是列满秩的,即rank(x)?p?1. 由模型(1.3)以及多元正态分布的性质可知,y仍服从n维正态分布,它的期望向量为x?,方差和协方差阵为?2in,即ynn(x?,?2in). 1.2.2.2参数的最小二乘估计及其表示 1. 参数的最小二乘估计 与一元线性回
8、归时的一样,多元线性回归方程中的未知参数?0,?1,?,?p仍然 可用最小二乘法来估计,即我们选择?(?0,?1,?,?p)使误差平方和 t?2q(?)?i?t?(y?x?)t(y?x?)i?1n?(yi?0?1xi1?2xi2?pxip)2i?1n 达到最小. 由于q(?)是关于?0,?1,?,?p的非负二次函数,因而必定存在最小值,利用微 n?)?q(?x?x?x)?0?2?(yi?01i12i2pip?i?10?n?)?q(?x?x?x)x?0?2?(yi?01i12i2pipi1?i?11? ?n?)?q(?x?x?x)x?0?2?(yi?01i12i2pipik?ki?1?q(?n?
9、)?x?x?x)x?0?2?(yi?01i12i2pipip?i?1p?积分的极值求法,得 ?(i?0,1,?,p)是?(i?0,1,?,p)的最小二乘估计.上述对q(?)求偏导,这里?求得ii正规方程组的过程可用矩阵代数运算进行,得到正规方程组的矩阵表示: ?)?0 xt(y?x? 3 移项得 ?xty (.) xtx?称此方程组为正规方程组 依据假定r(x)?p?1,所以r(xtx)?r(x)?p?1故(xtx)?1存在解正规方 程组(.)得 ?(xtx)?1xty (.) ?x?x?x为经验回归方程 ?称y01122pp 误差方差?的估计 2 将自变量的各组观测值代入回归方程,可得因变量
10、的估计量(拟合值)为 ? ?(y?1,y?2,?,y?p)2?x?y ?i?x(xtx)?1xty?(i?h)y称为残差向量,其中?y?x?向量e?y?ynn?h?x(xtx)?1xt为n阶对称幂等矩阵,in为n阶单位阵 ?txty为残差平方和称数ete?yt(in?h)y?yty?(rror sum of squares,简写为 由于e(y)?x?且(in?h)x?0,则 ?sse) ?e(ete)?etr?t(in?h)?tr(in?h)e(?t) 2 ?2trin?x(xtx)?1xt ?2n?tr(xtx)?1xtx ?2(n?p?1) ?从而? ?1ete为?2的一个无偏估计 n?p
11、?1估计量的性质 性质 ?为?的线性无偏估计,且d(?)?var(?)?2(xtx)?1 ?(xtx)?1xty是y的线性函数,故其为线性估计,且有 证 由于?)?(xtx)?1xte(y)?(xtx)?1xtx? e(?)?(xtx)?1xtd(y)xt(xtx)?1?2(xtx)?1 d(? 4 ?为?的线性无偏估计,又由于(xtx)?1一般为非对角阵,故?的各个这一性质说明?分量间一般是相关的 性质 e(e)?o,d(e)?2(i?h) 证 由于e?(i?h)y,故e(e)?(i?h)e(y)?(i?h)x?o ?d(e)?(i?h)d(y)(i?h)t?2(i?h) 这一性质表明残差向
12、量的各个分量间一般也是相关的 ?)?o 性质 cov(e,?)?cov(i?h)y,(xtx)?1xty) 证 cov(e,? ?(i?h)d(y)x(xtx)?1?o ?是不相关的,又由于残差平方和sse是e的函这一性质表明残差e与?的最小二乘估计?也不相关在正态假定下不相关与独立等价,因而sse与?独立 数,故它与? 性质 e(sse)?(n?p?1)?2 证明略 性质 (auss-markov定理)在假定e(y)?x?,d(y)?2in时,?的任一 ?,其中?是任一p?1 线性函数?t?的最小方差线性无偏估计(blue)为?t?是?的最小二乘估计 维向量,? 性质6 当ynn(x?,?2i),有以下几点结论: ?(1)?n(?,?2(xtx)?1); ?独立; (2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河北事业单位联考雄安新区招聘369人考试参考题库及答案解析
- 2026年阜阳太和县乡村医生定向委托培养工作考试参考试题及答案解析
- 2026年渭南韩城事业单位招聘(48人)考试备考试题及答案解析
- 【社招】宜春市数字产业集团有限公司面向社会公开招聘工作人员的考试参考题库及答案解析
- 2026江西中电新材料科技有限公司诚聘英才考试参考试题及答案解析
- 2026河北建工雄安建设发展有限公司社会招聘笔试参考题库及答案解析
- 2026中石化云南怒江石油分公司招聘考试备考题库及答案解析
- 2026广东广州花都区狮岭镇新扬小学临聘教师招聘3人笔试备考试题及答案解析
- 2026新疆八团连队特聘农技员招募12人考试参考试题及答案解析
- 2026陕西西安市经开第二中学教师招聘3人考试备考题库及答案解析
- 奥拉丁项目讲解
- 实施指南(2025)《JBT 7127-2022YD 系列(IP54)变极多速三相异步电动机技术规范(机座号 63~315)》
- 15.《青春之光》课件
- 工贸企业安全标准化
- 金螳螂2080体系解读
- 制造企业员工岗位责任制细则
- 口腔科获奖品管圈案例-提高口腔医护人员消毒隔离措施执行依从率PDCA成果汇报课件
- 小学思想品德试题含答案
- 徕卡相机LEICA V-Lux 4 中文使用说明书
- 2025年苏州市中考物理试卷真题(含答案解析)
- 20G361预制混凝土方桩
评论
0/150
提交评论