应用统计学第8章相关与回归_第1页
应用统计学第8章相关与回归_第2页
应用统计学第8章相关与回归_第3页
应用统计学第8章相关与回归_第4页
应用统计学第8章相关与回归_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章相关分析第八章相关分析 与回归分析与回归分析 1裙边理论n裙边理论是美国宾夕法尼亚大学经济学家乔治裙边理论是美国宾夕法尼亚大学经济学家乔治泰勒于泰勒于1920年提出的一种形象描述市场走势年提出的一种形象描述市场走势的理论。的理论。n当妇女普遍选择短裙,裙边向上收时,股市也当妇女普遍选择短裙,裙边向上收时,股市也随之上扬,如随之上扬,如20世纪的世纪的20年代和年代和60年代;相反年代;相反,当妇女穿着长裙,裙边向下降时,市场也逐,当妇女穿着长裙,裙边向下降时,市场也逐渐走低,如渐走低,如20世纪的世纪的30年代和年代和40年代。年代。2子女平均身高n英国统计学家高尔顿英国统计学家高尔顿(

2、Francis Galton,18221911)和他的学生皮尔逊和他的学生皮尔逊(Karl Pearson,18561936)n 研究表明:父亲平均身高每增减研究表明:父亲平均身高每增减1个单位时,个单位时,其成年儿子的身高仅平均增减其成年儿子的身高仅平均增减0.516个单位。个单位。这种遗传身高趋于一般的现象,高尔顿首次提这种遗传身高趋于一般的现象,高尔顿首次提出出“回归回归”一词加以概括。一词加以概括。3本章学习目标1.1.掌握掌握相关关系相关关系的概念与计算。的概念与计算。2.2.理解理解回归分析回归分析的特点,熟练掌握的特点,熟练掌握一元线性回归一元线性回归方程方程的建立的建立及检验及

3、检验方法。方法。4相关分析n相关分析相关分析是分析是分析变量之间关系的方向和程变量之间关系的方向和程度大小的统计方法度大小的统计方法56相关关系的种类的关系图相关关系的种类的关系图涉及的变量或涉及的变量或因素的个数因素的个数两变量间的关系7图图1变量间的线性关系变量间的线性关系 图图2 变量间的非线性关系变量间的非线性关系两变量间的关系8 图图3正向线性关系正向线性关系 图图4 负向线性关系负向线性关系 图图5 无关系无关系广告支出与销售收入n假设大发汽车公司营业部的经理相信汽车销售假设大发汽车公司营业部的经理相信汽车销售额的多寡与广告支出数额有关。但此两者间的额的多寡与广告支出数额有关。但此

4、两者间的具体关系为何并不清楚。具体关系为何并不清楚。n现蒐集现蒐集8各分公司去年的广告支出与销售额的各分公司去年的广告支出与销售额的资料如下页表。资料如下页表。9广告支出与销售收入10单位:万元相关表相关表是将具有相关关系的原始数据是将具有相关关系的原始数据, ,按某一顺序按某一顺序平行排列在一张表上平行排列在一张表上, ,以观察它们之间的相互关系。以观察它们之间的相互关系。 分公司名称 广告支出X 年销售额Y 大通 300 9,500 大德 400 10,300 大信 500 11,000 大道 500 12,000 大方 800 12,400 大立 1,000 13,400 大兴 1,00

5、0 14,500 大展 1,300 15,300 广告支出与销售收入的散点图11相关图相关图也称为分布图或散点图也称为分布图或散点图简单线性相关分析简单线性相关分析12相关系数相关系数n相关系数是指在相关系数是指在直线相关直线相关条件下,说明两条件下,说明两个现象之间相关关系个现象之间相关关系密切程度密切程度的统计分析的统计分析指标。指标。n总体相关系数总体相关系数13yxxyyxyxyyxxxyyxEyxE)(样本相关系数的计算141 , 122yyxxyyxxSSSryxxyxyyyxxnSxy11211xxnSx211yynSy其中,其中,广告支出与销售收入大发汽車大发汽車的汽车销售额与

6、广告支出间有的汽车销售额与广告支出间有很高的线性关系很高的线性关系15966. 0000,680,28000,875000,840, 4)()()(22YYXXYYXXrXY合计相关系数16若若 ,表示变量,表示变量x x与变量与变量y y为为线性正相关线性正相关关系;关系;若若 ,表示变量,表示变量x x与变量与变量y y为为线性负相关线性负相关关系。关系。01r10r 若若 ,表示两变量,表示两变量完全线性相关完全线性相关,即变量,即变量x x与变量与变量y y之之间存在确定的函数关系。间存在确定的函数关系。| 1r 相关系数17当当 时,表示两变量存在不同程度的线性相关。时,表示两变量存

7、在不同程度的线性相关。 的数值越接近于的数值越接近于1 1,表示两变量之间线性相关程度越高,表示两变量之间线性相关程度越高0 | 1r|r相关系数180 | 0.3r0.3 | | 0.5r0.5 | 0.8r0.8 | 1r 微弱相关;微弱相关; 低度相关;低度相关; 显著相关;显著相关; 高度相关高度相关通常认为:通常认为:相关系数19若若 ,表示两变量不存在线性相关。,表示两变量不存在线性相关。0r 相关系数的显著性检验n检定两变量有无线性关关系检定两变量有无线性关关系n利用利用 t 檢定檢定200:0H0:1H2122ntrnrt如果如果 ,就否定原假设,认为,就否定原假设,认为 r

8、r 在统计上是显在统计上是显著的,即总体相关系数不为零,总体变量间存在线性相著的,即总体相关系数不为零,总体变量间存在线性相关关系。关关系。2|tt 广告支出与销售收入n检定广告支出与销售额间的相关系数是否为检定广告支出与销售额间的相关系数是否为0:nt 检定統計量检定統計量n设显著性水平设显著性水平 , 臨界值臨界值 拒絕拒絕 , 亦即亦即广告支出与销售额广告支出与销售额有关系有关系210:0H0:1H15. 9966. 016966. 01222rnr 447. 26025. 0t05. 00H广告支出与销售收入22单位:万元 分公司名称 广告支出X 年销售额Y 大通 300 9,500

9、大德 400 10,300 大信 500 11,000 大道 500 12,000 大方 800 12,400 大立 1,000 13,400 大兴 1,000 14,500 大展 1,300 15,300 n假设大发汽车公司营业部的经理相信汽车销售假设大发汽车公司营业部的经理相信汽车销售额的多寡与广告支出数额有关。但此两者间的额的多寡与广告支出数额有关。但此两者间的具体关系为何并不清楚。具体关系为何并不清楚。广告支出与销售额23 1. 散散点点图图966. 0XYr2. 样本相关系数样本相关系数大发汽車大发汽車的汽车销售额与广的汽车销售额与广告支出间有告支出间有很高的线性关系很高的线性关系3

10、. 检定广告支出与销售检定广告支出与销售额间的相关系数额间的相关系数 =0?t 检定检定: 广告支出与销售额广告支出与销售额有关系有关系简单线性回归分析简单线性回归分析24广告支出与销售额25 广告支出广告支出与销售收入的散布图与销售收入的散布图 广告支出广告支出与销售收入的关系与销售收入的关系汽车汽车销售收入的多寡会受到广销售收入的多寡会受到广告支出影响告支出影响回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型26iiXY10随机误差项随机误差项i广告支出与销售收入的直线关系27回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数

11、据来估计回归模型28iiXY10估计回归模型n观察值与估计值之差的平方和观察值与估计值之差的平方和使使 最小最小29210121)()(iiniiiniXYYYQ01)(2100iiXYQ0)(2101iiiXXYQQ最小二乘估计最小二乘估计(OLS)(OLS)估计回归模型n整理得整理得n估计式估计式302221)()(XXYYXXXXnYXYXniiiiiiiiiXY10iiXnY10210iiiiXXYX广告支出与销售收入31合计53. 5000,875000,840, 4)()(21XXYYXXiii75.290, 810XY广告支出与销售收入32回归分析方法的步骤n建立简单线性回归模型

12、建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型n评判回归模型评判回归模型33评判回归模型n拟合优度检验拟合优度检验n模型的显著性检验模型的显著性检验n变量的显著性检验变量的显著性检验34模型的拟合优度检验 n拟合优度检验拟合优度检验:对样本回归直线与样本观测值:对样本回归直线与样本观测值之间拟合程度的检验。之间拟合程度的检验。n度量拟合优度的指标:度量拟合优度的指标:判定系数(可决系数)判定系数(可决系数)R23536 如果如果 即实际观测值落在样本回归即实际观测值落在样本回归“线线”上,则上,则拟合最好拟合最好。可认为可认为, ,“离差离差”全部来自回归线,而

13、与全部来自回归线,而与“残差残差”无关。无关。 )(YYyii:可认为是由回归直线解释的部分)(iiiYYe:是回归直线不能解释的部分iiYY判定系数n誤差誤差37niiiniiniYYYYYY121221)()()(SST,总体平方和SSR,回归平方和SSE,残差平方和38TSS=SSR+SSE Y的观测值围绕其均值的总离差总离差(total variation)可分解为两部分:一部分来自回归一部分来自回归线线(SSR),另一部分则来自随机势力,另一部分则来自随机势力(SSE)。在给定样本中,在给定样本中,SST不变,不变,如果实际观测点离样本回归线越近,则如果实际观测点离样本回归线越近,则

14、SSR在在SST中占的比重越大,因此中占的比重越大,因此 拟合优度拟合优度:回归平方和:回归平方和SSR/YSSR/Y的总离差的总离差SSTSST模型的拟合优度 判定系数n誤差誤差n判定系数判定系数39222)()(SSTSSRYYYYRiiniiiniiniYYYYYY121221)()()(SST,总体平方和SSR,回归平方和SSE,残差平方和判定系数4012R8.02R02R样本回归方程式完全无拟合度广告支出与销售收入41SSTSSE9334. 02SSTSSESSTSSTSSRR模型已解释总离差的93%评判回归模型n拟合优度检验拟合优度检验n模型的显著性检验模型的显著性检验n变量的显著

15、性检验变量的显著性检验42线性关系是否显著n检验此回归方程有无解释能力检验此回归方程有无解释能力nF检定检定q F检定统计量检定统计量q 决策法則决策法則n 時,則拒絕 n 時,則不拒絕43:0H:1H无解释能力有解释能力2, 12/)(1/)(2nFnYYYYFiii2, 1nFF0H0H2, 1nFF广告支出与销售收入n檢定統計量檢定統計量n显著性水平显著性水平 = = 0.05 0.05 下,檢定量大於臨界值下,檢定量大於臨界值 , 因此拒絕因此拒絕4454.83286,320287,758,262/)(1/)(2nYYYYF99.56 , 105.0F0H评判回归模型n拟合优度检验拟合

16、优度检验n模型的显著性检验模型的显著性检验n变量的显著性检验变量的显著性检验45解释变量的显著性检验n对对 的检定的检定nt 检定检定q t 检定统计量检定统计量q 决策法則决策法則n 時,則拒絕 n 時,則不拒絕46 211ntSt0:10H0:11H(X对Y无直线性影响)(X对Y有直线性影响)22/ntt0H0H 221XXSi22/ntt2)(12102nXYniii广告支出与销售收入n请检验广告支出对销售额是否有正的影响请检验广告支出对销售额是否有正的影响?n两个假设两个假设n計算計算n显著性水平显著性水平 = 0.05 下,檢定量大於臨界值下,檢定量大於臨界值 , 因此拒絕因此拒絕4

17、707.937.053.5 t 943.1605.0t0H 608. 037. 0 286,3202)(112102SnXYniii0: ; 0:1110HH48注意注意:n在一元线性回归分析中,回归系数的显著性在一元线性回归分析中,回归系数的显著性检验与回归模型的显著性检验是等价的,因检验与回归模型的显著性检验是等价的,因此此 t t 检验和检验和F F 检验的结论是一致检验的结论是一致的。的。以貌取人?n现从某公司人事资料现从某公司人事资料中抽取中抽取33位员工的身高与薪位员工的身高与薪资资:n得出回归模型得出回归模型: 身高身高(X),薪资薪资(Y)判定係數判定係數 , ,49XY96.

18、11083.919,180124. 02R6244. 0t39. 0F以貌取人?n评判回归模型、解释回归模型评判回归模型、解释回归模型q判定系数判定系数 很低,故很低,故拟合优度拟合优度不佳不佳q检定统计量检定统计量 ,不具解释不具解释能力能力。q ,该模型无解释能力,该模型无解释能力n下结论下结论这个企业没有这个企业没有“以貌取人以貌取人”的现象。的现象。5016. 431, 139. 005. 0FF 04. 2316244. 0025. 0tt0124. 02R回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型n评判回归

19、模型评判回归模型n解释回归模型解释回归模型51广告支出与销售收入52 的解释n回归方程回归方程n没有广告支出时,大发公司的预期销售额为没有广告支出时,大发公司的预期销售额为8,790.75万元。万元。53iiiXXY53. 575.290, 8100 的解释n每变动每变动1万元的广告支出,销售额会变动万元的广告支出,销售额会变动5.53万元。万元。541回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型n评判回归模型评判回归模型n解释回归模型解释回归模型n做预测做预测55预测ny y的的期望值期望值的置信区间估计的置信区间估计

20、ny y的的个别值个别值的预测区间估计的预测区间估计56从广告支出来预测销售额n回归方程回归方程n若广告支出为若广告支出为1,400万元时,汽车的平均销售万元时,汽车的平均销售额为额为多少多少?n汽車的平均銷售額汽車的平均銷售額57iiXY53. 575.290, 875.032,16400, 153. 575.290, 8可靠度?从广告支出来预测销售额n回归方程回归方程n若广告支出为若广告支出为1,400万元时,汽车的平均销售万元时,汽车的平均销售额为额为多少,多少,其其95%的置信区间为何的置信区间为何?58iiXY53. 575.290, 8給給定定 , 在在1-1- 的置信水平下的置信

21、的置信水平下的置信区间可表示为区间可表示为2222/)(12xxXXnntYifffX fYE从广告支出来预测销售额595 .147,17918,146457. 0286,32045. 275.032,16 )(12 2222/xxXXnntYiff预测ny y的期望值的置信区间估计的期望值的置信区间估计ny y的的个别值个别值的预测区间估计的预测区间估计60从广告支出来预测销售额n回归方程回归方程n若若明年明年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额为销售额为多少多少?61iiXY53. 575.290, 8从广告支出来预测销售额n回归方程回归方程n若若明年明

22、年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额为销售额为多少多少?62iiXY53. 575.290, 8給給定定 , 在在1-1- 的置信水平下的置信区间的置信水平下的置信区间2222/)(112xxXXnntYifffXfY从广告支出来预测销售额n回归方程回归方程n若若明年明年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额销售额的的95%的置信区间为何的置信区间为何?63iiXY53. 575.290, 845.811,1705.254,146457. 1286,32045. 275.032,16 )(112 2222/xxXXnntY

23、iff从广告支出来预测销售额64回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型n评判回归模型评判回归模型n解释回归模型解释回归模型n做预测做预测65多元线性回归分析多元线性回归分析66教育年数、工作年数与个人年所得67样本 教育年数 工作年数 年所得16738295403121453416850518655总计6140236平均数12.2847.2依据经济理论: 个人一年的所得受教育程度及工作经验的影响X1X2Y回归分析方法的步骤n建立多元线性回归模型建立多元线性回归模型68iiiXXY22110随机误差项随机误差项i回归

24、分析方法的步骤n建立多元线性回归模型建立多元线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型69iiiXXY22110估计回归模型n观察值与估计值之差的平方和观察值与估计值之差的平方和使使 最小,解得估计式最小,解得估计式;70222110121)()(iiiniiiniXXYYYQQ最小二乘估计最小二乘估计(OLS)(OLS)2192. 036. 125.23XXY回归分析方法的步骤n建立简单线性回归模型建立简单线性回归模型n利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型n评判回归模型评判回归模型71教育年数、工作年数与个人年所得n评判回归模型评判回归模型q判定系数判定系数 ,調整後,調整後 ,故,故

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论