统计学-8分析模型与回归方程_第1页
统计学-8分析模型与回归方程_第2页
统计学-8分析模型与回归方程_第3页
统计学-8分析模型与回归方程_第4页
统计学-8分析模型与回归方程_第5页
免费预览已结束,剩余82页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析 相关关性回性回曲曲线回变量间的相关关变量间的相关关回归模型回归模型与回归方回归方程显著性检验:判定系回归预残差分变量间的相关关相相关关系的概相相关系相关关系的概和活动偏偏女偏女合工05工055505505饮料颜色和销售量相饮料颜色和销售量超黄无粉绿12345均相关关系的概食物中热量与脂肪两个变量的样本数食 热 脂 食 热 脂 相关关系的概数据热量脂相关关系的概相关关系的概品质 变量量 数值变

分变分

自变量

回归分回归分分分分分相关关系的概有关系

四个问

强度相关关系的非线线非线弱的1r

i yi r 1r0负相

Lixi关

yi

0r1正相关r0无线性

i i

r1完全正相

i

xi

yi关r1完全负关

1010饭 学生人 6

销售收10家饭店的相关系序xy124263848789 nxiyixi nnx2innx2inx2nny2iny2 1300 1300yx xⅠ和Ⅲ象限的点为正相关点Ⅰ象限中xx yyⅢ象限中xx yyⅠ和Ⅲ象限中xxyyxxyyⅡ和Ⅳ象限的点为负相关点Ⅱ象限中xx yy0Ⅳ象限中xx yy0Ⅱ和Ⅳ象限中xy0xxyyxx0或yy0为零相关零相关点xxyy零相关点xxyy

y iy i

xixi2yi2故inxinni2nni2ni简单线性回归(linear变变量间的相关关回归模型回归模型与回归方回归方程显著性检验:F回归方程显著性检验:判定回归预残差分YiYi01XiiEYi0 iXYi,β和β εi误差项随机变量i假设εN0,σ2则有i 1即:Y—ββX,σ 1i以 2i

Y1Y因为~N02,Y0xxx x

Y2Y3的分Y4的分YY5EYβ X简单线性回归模型(简单线性回归模型(linearregressioni01β0i01iβ0β1EYβi01iβ0正线性相关

负线性相关

无相 估计回归方ˆib0

回归模型回归方程 1 1未知参数01i计算统计

样本数 样本统计 回归方程

估计步

估计的简单线性回归yQyi

i

2

bx

ˆib0为最小值时可得最小二乘法估计的回归方程

xy

yiˆ 估计的简单线性回归QQˆ2ybx2iii0ib0且对b1的偏导数为零时达到极值yi即bbxyi即bbx20 Qbbx2 0

2ybbxx

xiyixiyin

x2x

b0y

家饭店附近家饭店附近学生人数与季销售收饭学生人销售收123456789268810家饭店的回归方程的最小二乘估序xy124263848∑估计的简单线性回归方 2x2nx

y

b0yb1x130514

ˆi60ˆ60估计的简单线性回归方yˆ 605xi(16x回归方程的显著性检验(significanceFF判判定F样归方ˆ 60样归方

总方方H0: H1: F

ˆiyiˆ ˆi

yi y

y F均方误 s残残度n均方误

估计均方回均方回

s

2的另一估计F回1n,残1226384856812263848568F方差来总

平方

自由1

均-

F统计

方差来

平方

自由9

F统计14200

F=74.25>11.26 假设,即两判定系数(coefficient

ˆi yˆ

y ˆi

yi y

判定系数就是回归平方和与总平方和之 判定系判定系iy2iˆL

LLr22判定系数与相关系数的应用应用回归方程进行预个个别值的区间估平均值的区间估10家饭店附近学生人数与季销售收12263848568要求(1-平均值的区间估ˆiˆi60xp为自变量的一个给定pˆ则对应EY的点估计为xp平均销售收入的点估计为ˆYˆpp60510110

x由于i服从正态分布,所以yi也服从正态分布。所以,做为yi线性组合的b1和b 也服

平均值的区间估 正态分布。所以做 线性组合的ˆ

也服从正态分布。因此,关键的问题是要

ˆpEp

的估计时,其数学期望和ˆ

做为EY的估计时,其数学期p

ˆ

做为EY的估计时,其ppb0bx x22x22 pxx2is2s2 x2 px2t EYppsp 21nxp2x2 的估计量,可将s 代入上式,得于是可得出一个自由度为n-2的t分布的统计于是可得EYp

在显著性水平

ˆpˆp2sp平均值的区间估 yˆs2

残 残残差自由度n n平均值的区间估10家饭店附近学生人数与季销1226312263848568

xp查表得2

计算得ˆ

x14

s13.829

x2所以E 的95%置信区间为pˆp

t1n1nx2px2要求(1-的校园附近的饭店的平均销售的置信区

1102.03613.82910101010142568即:平均销售收的95%置信区间为:(98.585千元,121.415千元平均值的区间估 上ˆpxpx时置信区间xp10时的置xp置信区间的宽度依 变化xpx14pE 的95%置信区 p个别值的区间估y

xp为自变

的一个给定

ˆi60

则对应Yp的点估计pˆˆˆp605xppxpˆ

个别销售收入Yp的点估计为Yp ˆYp

60510110x对于同一 个别x点估计与平均值的点估计是相 对个别做出估计xpxp

ˆ

做出区间估计,关键是搞清ˆp关于

个别值的区间估的方差。ˆp关于Y 的方 E( Y)2

EY

p pp p

。它由两部分构成:(一)p关 即 。因此有p

的方 ;(二

pEY x2 x2 2 22 2

xx2 总体的方 也是 的估计量,可将s 代入上式,得

1s2 s2 1

pp

xi 于是可得出一个自由度为n-2的t分布的统计量

t ˆ

Ysind i于是可Yp在显著性水下的置信i

s ˆp 2

个别值的区间估10家饭店附近学生人数与季销1226312263848568

xp查表得2

计算得ˆ

x14

s13.829

x2 的95%置信区间为ˆp

t n1x2px2要求(1-生的校园附近的饭店的销售收置信区间

1102.03613.829 101421 101421 10 568即:该饭店销售收的95%置信区间为:(76.124千元,143.875千元)ˆpˆp

个别值的区间估xpx时置信区间xp10时的置信区间 下xp置信区间的宽度依 变化xpx14Yp的95%置信区 残差分证实证实模型假正态概标准化残概率有影响的观测有影响的观测异常证实模型y

ˆ第i次观测的残

i次观测的x 10家饭店附近学生人数与季销售 估计的销售收入ˆ 残差y ˆ 688

简单线性回归模

证实模型Y01X3误差项的值是相互独4误差项服从正态概率分布残差提供了有关误差项证实模型形的仔细观察的基础上完成残差正态概率证实模型假 如果总体上ε的方差是相的,且假定的回归模残yˆ合理的,所有残在一条水0y

如果总体上ε的方差是不 证实模型y

个水平带上波动,没有足够的表x10家饭店关于x的残差证实模型假 如果总体上ε的方差是相的,且假定的回归模型残类型与关于x残,所以用处更泛散点图在一个弯曲的带内

y0

合理的,所有的散点应在一条水yy

动,表明直线方程不能合地描述变量间的关系地描述变量间的关系。这

00 y

证实模型,的 示初模的定不的y10家饭店关于y的残证实模型一个随量减去它的均值,再化的随量。由最小二乘法的 态分

sy 1

约95%化残差介于-2+2

hi

xx

第i个观测值 yiˆ第i个观测值 yiˆsyiii证实模型ε所有的标准化残差都落在-2与+2之间ε 因此没有理由怀疑服从正态分布的准 10家饭店关于x的标准化残差 标准化残.5

证实模型

家饭店关于x的标准

检测异常值和有影响

检测异数据由错误数据数据11231123334456 检测异于其它数据的检测异由于输入错误,将第4个观测(3,75)修正为

常值的数据 修正修正h6时,第ih6时,第i点in被识别为高杠率点 xxh i xi自变量的值有影响的观测有一个有影响的观测值的数据 检测有影响 xih 有高杠杆率点的数i

x

17024.28620.9460.867高杠杆率有高杠杆率点习题一、单选SSE

SSTSST

SSR

SSR(y y y ˆy605x意味着:自变量每增加1个单位,因变量()①增加60个单60个单位③增加5个单5个单位习题出的 差关,明两变()①高度(强)中度相低度(弱)不y77.5+0.1x()①投资额越大收益率越高②投资额越大③投资额与收益率高度相关④投资额与收益率无习题二、多选关于判定系数r2的下列说法是错误的(①r2的算术平方根 积差相关系②r2的取值范围是正负1③r2的取值为负数时,说明随着自变量的增加④r2的取值为正数时⑤r2等于0时,说明因变量的变化完全可以由自变量来解关 积差相关系数r的下列说法是正确的(①r的绝对值在0到1②r没有计量③r为负数时,说明随着一个变量的减少,另一个变量也相应减④r等于0⑤r的平方是判习题三、判断方程ŷ=28.5-0.24x表明,x与y方程ŷ=6.25+0.33x表明,x和y相关系数r等于0.1r2

y判定系数的计算公式r2 r2 四、简答 观察并说明下列散点图中的两个变量分别是怎样的相关关系 B: C: 五、综合计1.7个地区2006年人均GDP和人均消费水平如下表所示地人均GDP(万元人均消费水(万元G34

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论