版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学相关与回归分析相关分析相关析与归分析用 指标来表明现象间相 互依存关系 的密切程度。归分析根据相关关系的具体形态,选择合 适的数学模型,来近似地表达变量间 关系。相关分析所研究的变量是对等关系;回归分析所 研究的两个变量不是对等关系。因果年份year199519961997199819992000 2001 2002 2003人均国内生产总值人均消费金额x485455766054630865517086765182149101223626412834297231383397360938184089、:本章内容二、三、一元线性归分析归分析归分析多元线性一、相关关系的概念和分类 函数关糸和相
2、关关糸相关关糸的分类相关程度、相关方向、变量多少、相关性质二、线性相 关关系的识别(1)散点图(例子)最简单、最直观的识别方法,但难以给出相关的程度.(二)直线相关糸数直线相关系数的设计思想 总体相关紊数与Pearson相关紊数一元线性归分析一元线性回归模型的概念变量y对乂的_元线性回归总体模型一元线性回归方程回归分析的主要任务就是通过n样本观樂值(心小)曰2n对你煜进行估计。=“+於一元线性经验回归方程估计方法:普通最小二乘估计标准逞差一O的估计 模型评价:可决系数.显著性检验2 预测方法:点预测,区间预测将代入回归方程得=181.5830+0.4414 X 100004595.5628 (
3、元)多元线性回归分析多元建性回归(Muling liigugi邨Eion)眾形式=y = + Axi + Axa + 九 + 基本概念:回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、随机误差项。多元线性回归模型的样本形式:X =00 +01兀11 +02兀12 +0p%lp +切PpX2p+S2丁2 = 00 + 0121 + 02兀22 +FaP.n-p-V),则拒绝日0,说明总体回归系数Q不全为零,即回归方程是显著的;反之,则认为回归方程不显著。方差来源平方和自由度均方F值回归SSRPMSR - SSRP口 msr误差SSEn-p-1MSE= SSE n- p-F =MS
4、E总计SSTn-1表 10.4多元线性回归模型的方差分析表单个回归系数的检验(1)要检验的假设:Ho:A=O; H:0严0(i=l,2,,p)(2) t检验的计算公式为:其中S*是回归系数标准误,t值应该有p个(3)给定显著性水平a,确定临界值切2価_P_D (4)若tPi tal2,则拒绝即总体回归系数龙工0有多少个回归系数,就要做多少次t检验。十个地区某种商品的需求壘与其价格以及消费者收入的资料,见下表,推算若价格在40百元、消费者收入为17叩万元时,该商品的需求宣。十个地区某商品的需求量与相关瓷料地区编号需求里y(吨)价格蛊1 (百元)收入X2 (万元)1591923.567622654
5、524.449123623632.0710674647032.4611165674031,1511906644034.14129276SOO35.314348724038.715969757139.63180010706846.681930EXCEL演示和解释五、非线性归分析线性回归模型的结构特点:(1) 被解释变量是解释变量的线性函数一变量线性(2) 被解释变量也是参数的线性函数一参数线性 根据实际分析建立的模型往往不符合上述线性特点,称为 非线性模型。如:柯布一格拉斯生产函数 乎壬论 处理非线性回归模型的方法有两种:把非线性关系转化为线性关系,然后再运用线性回归的分析方法进行估计。(2)利
6、用非线性最小二乘法直接估计非线性模型转换成线性模型的常用方法:直接和间接代换法_、亘援代換法1-多项式3!尹二耳,十Qm十為;十十灼不令込二F,即可化汁线性模型:y = Qo十QiG +戸2比+邑乙?L+令U二丄,2 =丄,即可化为线性模型: y x3.J7 = lri=lnx目卩可化为线性模型,7=0 +再卩先求其倒数:-y +険然后令27 =上尹 y即可化为线性模型:U = a+二间接代换法间接代换法是先通过方程两边取对数后在进行变壘代换,转化为线性形式口y =0! & 戸对(10.46)式两辺取自然对黏得lny二lnQ + 0x,令才二lny,则得:则yf = In &+ 0兀y =曲对
7、(10.48)式两辺取对航得log 7 = log & + jfiiog x ,令 yf = log y,x! = log则得yf = log & + 少函数关系噫輸密2由数关糸:对一个或ZL个变量任意一个取 值,另一个变量都有堆一确走值与之相对应, 这种关糸确走性的关糸称为曲救关糸。如禁种商為的簡傷额Y与该商的舖隹童X 以及价格P之间的关糸可以表示Y=PX,这就 是一种函数关糸。般把作为影响因素的麦童隸为令麦量; 把发生对应变化的变量称为因变量。丫是因变童, P与X是自变量。相关弓色系相矣关糸:当一个或几个相互朕糸的变童取一走数值对,与之相对应的另一变量的值虽然不确走,但它仍按禁种规律卷一走
8、的范阖内变化,这种不确走的相互关糸,称为柏关关糸如:势动生产率与工资水平的关糸,家麗支出 和收入的关糸,人的体重和身壽的关糸。相关关糸不能用曲数精确表达,但经常用一走的函形丸去近做地描述O按相关程度划分完全相关:当一种现象的数量变化克全由另一个现象的教量变化所确定时,这两种现象间的关糸为完全相关。即函数关糸。不相关:当两个现象筱此互不影响,其数量变化各自独立时,称为不相关。不宪全相关:两个现象之间的关糸介于 屯全相关和不相关之间,隸为不屯全相关。住 要表现形式,主要研更对象,常简称为相关,即狭义的相关)按相关形式划分正相关:当一个现象的数童由小变丸P另一个现象的数董也相应由小变丸,这种相 关称
9、为正相关。如家庭支出随家庭收入的提高而增加。负相关:当一个现象的数量由小变丸,而另一个现象的数量相反地由大变小P这种才 关称为负相关。如商芫流转的规模越丸,流 通费用水平则越低。线性相关:旨两种相关现象之间的关糸 大敷呈现为直线关糸时,称之为线性相 关。如人均消费与人均收入通常呈线性关系 非线性相关:如果两种相关现象之间,并 不表现为直线的关糸,而是近似于禁种曲 线关糸则这种关糸称为非线性相关。按相关性质划分按变量多少划分单相关:一个麦量对另一个变量的相关关糸, 称为单相关。复相关:当所研屯的旻一个变量对两个或两 个以上其他变量的相关关糸对,称为复相关。 如某种商品的需求与其价格水平及人们收入
10、水平之间的相关 关系就是一种复相关。偏相关:症荼一It童与多种变童相关的场合, 当假定其他变童不麦时,其中两个麦量的相 关关糸称为偏相关。真卖相关:旨两种现象之间的相关 确卖具有内衣的联糸时,称之为“真卖 相关O虚假相关:当两种现象之间的相关 只是表面存衣,卖质上并没有内症的朕 糸时,称之为“虚假相关”。散点图散点:又称相关它是以直开坐标系V的横轴代表变量X, 纵柚代表变量Y, 将两个变量相 对应的数值用 坐标点的形式描述出来,用 来反映两变量之间相关关系的形。相关图完全负线性相关完全正线性相关正线性相关负线性相关不相关散点图我国人均国內生产总值与人均消费金额数据 单位:元年份人均国內生产总值
11、人均消费金额199548542236199655762641199760542834199863082972199965513138200070863397200176513609200282143818200391014089V散点人均GDP与人均消费的散点图人均消蜜说务总*总体相关系数1二维随机变量总体(X,Y),随机变量:X和Y的总体相关系数:(数)协方差14质:(1) IqI51 (2)|q|= 1的充分必要条件是存在常数& 和Q使得匕心。以概率1成立。(1) P的取值范围是从-1到1; 0的大小揭示了变量X和丫间线性相关关系的强弱,变量间的线性相关关系程度随着0的减小而减弱,厂1叭变
12、量X和丫之间具有完全线性关系;円说明变量沖y之间没有线性相关关系,称为不難相关或线性无关的符号说明变量间的线性相关关系的方向,p, x和丫正线性相关,po,x和丫负线性相关(3)相关系数是说明线性联系程度的,相关系数很小的变量间可能存在非线性联系(4)注意:变量x和丫不线性相关与x和丫独立是两个不同的概念。如果x和y独立,则必有x和丫不线性相关;但是若x和丫不线性相关,却不一定有x和丫独立, 它们之间可能存在着非线性相关关系。但是,若(x,y)服从二元正态分布,x和y不 线性相关和独立是等价的。样本相关系数如果二维随机变量(X, Y)的概率分布完全知道,则变量X和丫的相关系数。可以由(9.1)
13、式计算出来;往往不知道要研究变量(X,Y)的概率分布,这时将无法利用(9.1)式计算出相关系数。估计方法:可以从总体(X,Y)中随机地抽取容量为n的样本(X川),A ,(X“,匕),变量X和Y间的相关系数,可以由样本通过习 X,衣)E7)R= -“士(X,乂F 士&7)2V i=i=Z=1Z=4Z=O碩整2=必相关系数检验1.要检验的假设: 為或2检验方法一 一t检验检验统计量(原假设成立时)对HpE若I吃也(-2),就拒绝原假设,接受备择假设,认为总体相关系数p显著不为零,总体变量间确实存在线性相关关系;反之,则不能拒绝原假设。或者计算p值加幼 如果p值小于显著性水平”,则拒绝原假设。例23
14、对Hp0,则当C-2)时,拒绝原假设,接受备择假设,否则不能拒绝原假设;对Hp/;(/2),则拒绝原假设,接受备择假设,否则不能拒绝原假设;对备择假设H,p若匕脚-2),则拒绝原假设,接受备择假设,否则不能拒绝原假设。例9.3冻:t统计量t=显著性水平0.05,查表得到临界值:乙 由于所以否定原假设,接受备择假设, 表明总体相关系数显書不为零,即人均国内生产总值与人均 销售金额之间确实存在着线性相关关系。方法二:a 0.05 ;因为是双边检验,查得以2)二025(7) = 0.6664 ,由于lrl=0.99380.6664,所以拒绝原假设,接受备择假设,即人均国内生产总值与人均销售金额之间确
15、实存在着线性相关关系0正规方程组:-fcy0-n.n.ABcDEF1年份人均国内生产总值人均消费金额X2b心2Xy319954854223623561316499969610853544419965576264131091776697488114726216519976054283436650916803155617157036619986308297239790864883278418747376719996551313842915601984704420557038820007086339750211396115396092407114292001765136095853780113024
16、88127612459102002821438186746979614577124313610521120039101408982828201167199213721398912台计613952873443305766794547496202299852例子 Excel: Slope(); intercept(); steyx()归方程:0*可决系数丫 Cy2-卩丁 称为总离差平方和 SST (Total Deviation Sum of Squares)7Zn_ 2二疗i y 1 称为回归平方和 SSR (Regression Sutn of Squares )5ZjM2-克 | 称处残差平
17、方和 SSE (Residual Sum of Sqiiares)WL又称判定系数A可抉:系(coefficient of d巳termination.ssr 工惋一 y f 蕊厂乙TfAsi吃W-G-吗 52 10*例子W黑呵6 Ex迥函数:RSQO估计标饌差片= 74967.9073 -70.48337Excel函数:Steyx()|nev二_ 爲 y - 炕二研 (94547496 -11.5830 x 2S734 - 0.4414 x 2022998529-2於-2 = 70.44黜假设:血:如0;尽雷不全削(2)这里細检頗实就是方差分析的内容,m 10.3若F汕沁一 2),则拒绝禺,
18、说明总体回归系数何芒0,即回归方程是显著趾显著性检验2回归系数的显著性检验的歩骤:(1)捉出假设:7/0: = 0;尽:爲工0(2) t检验的计算公式为:烂,其料,是回归系辭误(3)给定显著性水平确定临界值5山-&(4)若*|沁讥,则拒绝血,即总体回归系数届工0;否则不能拒绝凤噪螯? 严*例子t检验s70.4833714241442=0 01870.44140.0187=23.63 a =CLD5,上氓2 弊2) = 2 365*|=23心沁“,拒绝凤,,即总体回归系数仇羊0; 或者做F检验=M_ 2MSR=SSR=V 1 一孑 I =2774636.65 ;131匸1 V- ysi2沁=半=
19、才I = 4967.9071丹乂芒9- 2 MSR2774636.65=F =558.5122MSE4967 9071I a=0.05?A (1?-2)=O5(1,7)=5.59=55.5122(1-2), /.拒绝址说明总悴回归系数 V相关分析e函数关系与相关关系相关关系的分类完全、不完全、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关、偏相关t线性相关的识别散点图 (如何用EXCEL画?)相关系数及其检验总体相关系数(数)样本相关系数(Pearson) Z以相关分析(续)土(X,乂)EP)R=,(随机变量)X(-)2X(-n2/=! /=1立(兀无)(Hy)广 (数)艺(兀-
20、无)2艺3 刃27=1/=1要检验的假设为 H:p 二 0; H:pO (或 H*0,H*Y的均值泾丫1兀)的区间估计免总心令匚并的个别值y=Yx的区间估计(预测区间)nri注:条件是5独立同正态分布,与2序P230-231三点结论.多元线性回归分析V总体模型4样本模型X =0() + 0丿 11+02兀12+, % =00+01 兀21 +0222 + 卩pMp+ 6 + PpX2p + S2独立同分布,均值为0)方差为八 儿二 00 + Pxn + 02占2 + + Ppxnp + n写成矩阵形式为:丫 =砂+匕V普通最小二乘估计(OLS)无偏估计4杆的无偏佶计:吕灵存多元线性回归模型评价*多元线性回归模型的拟合优度2 可绝系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 草食家畜饲养工岗前创新意识考核试卷含答案
- 出生缺陷防控咨询师班组协作水平考核试卷含答案
- 2025年市场预测报告范文
- 2025年接口测试工具教程
- 2025年辽宁省公需课学习-长三角一体化发展生态环境共同保护规划
- 2026年大学大四(农林经济管理)农林经济管理综合实训阶段测试题及答案
- 2026及未来5年中国铜带材行业市场供需态势及发展趋向研判报告
- 2026及未来5年中国上海市大健康行业市场研究分析及发展前景研判报告
- 2026年嘉兴南洋职业技术学院单招职业适应性测试题库含答案详解(轻巧夺冠)
- 质量负责人挂职免责协议
- 建筑工地春节后复工复产方案(通用5篇)
- 郴州职业技术学院单招《英语》考试复习题库(含答案)
- JCT640-2010 顶进施工法用钢筋混凝土排水管
- 数学地质系列-4聚类分析课件
- 公路工程、乙级试验室、作业指导书
- 康力电梯PM-DCU门机控制器说明书
- 体格检查肺部检查
- 牟乃夏ArcEngine教程ArcGISEngine编程基
- 统编人教版六年级道德与法治下册第5课《应对自然灾害》教学课件(第1课时)
- 工艺联锁图识读
- 妊高症病人麻醉精品课件
评论
0/150
提交评论