




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十讲,简单线性回归模型,建立两个变量X和Y间的关系模型,推断变量Y如何依赖于变量X,从而可以用X预测Y.例:广告费用和销售量公司的市值与CEO的年薪原始股的销售数量和期望价格证券市场收益率与某只股票的收益率商品价格和销售量装配线的速度和次品数量年收入与信用卡消费金额年龄与手机话费连锁店附近的人流与店的利润气温与滑雪场门票销量,3,阿姆德比萨饼连锁店的问题,阿姆得(Armand)比萨饼连锁店坐落在美国的5个州内,它们通常的位置是在大学旁边,而且管理人员相信附近大学的人数与这些连锁店的季度销售额是有关系的。下面是10家连锁店附近大学的学生人数和季度销售收入的数据:根据以上数据,你能否判断学生人数(x)如何影响到销售收入(y)?根据一家连锁店附近大学的人数,你能够预测该家连锁店的季度销售收入吗?,4,描述学生人数和销售收入之间的关系,协方差(315.56)和相关系数(0.95),散点图;根据这些你可以得到什么结论?,5,TypesofRegressionModels,PositiveLinearRelationship,NegativeLinearRelationship,RelationshipNOTLinear,NoRelationship,6,模型的引入,对于给定的学生人数,销售收入是唯一确定的一个数,还是一个随机变量?学生人数的变化如何影响到销售收入?使用的模型,7,简单线性回归模型,Y的截距,斜率,随机误差,因变量(响应变量,被预测变量),自变量(解释变量,预测变量),8,i,=随机误差,Y,X,观测值,观测值,Y,X,0,1,Y,X,i,i,i,0,1,9,模型的假定,1)E()=0;(E(y)=x)2)对于所有的x,Var()=.3)是服从正态分布N(0,)的.4)对于不同的x,是相互独立的.这些假定意味着什么?,10,X1,X2,X,Y,f,y服从在回归直线附近的正态分布对每个x值,y分布的方差相同.,回归直线,11,估计的回归方程,如何估计参数和?最小二乘准则,12,阿姆德连锁店的回归直线,估计参数b1=5b0=60回归直线你对系数的含义怎么理解?,13,回归方程的判定系数,y的总变差的分解定义判定系数R2=SSR/SST.判定系数的含义是什么?阿姆德比萨饼连锁店的例子:R2=0.9027.判定系数和相关系数的关系。,14,CoefficientsofDetermination(r2)andCorrelation(r),r2=1,r2=1,r2=.8,r2=0,Y,X,Y,X,Y,Y,X,r=+1,r=-1,r=+0.9,r=0,X,15,的估计,理解误差平方和的一个无偏估计s2=MSE=SSE/(n-2),16,关于回归系数的假设检验,检验统计量给定显著水平时,选择拒绝域,17,关于回归方程整体的检验,变量x的确对y有解释作用吗?(H0:=0)检验统计量F=MSR/MSE其中MSR=SSR/自变量的个数拒绝域FF(1,n-2),18,回归方程的方差分析表,19,阿姆德连锁店的情形,使用EXCEL对阿姆德连锁店的数据建立模型,并进行分析,基于EXCEL的输出结果,你对该模型有些什么认识?,20,使用你建立的模型(一),问题一:对于那些附近学校人数是1万的连锁店,他们的季度销售收入一定是一样吗?这种连锁店平均的季度销售收入是多少?你能够给出一个估计吗?问题二:某家连锁店附近学生总数约1万人,你能够给出它的季度销售收入的一个估计值吗?点估计:110,21,使用你建立的模型(二),对于问题一,如何得到这种连锁店平均销售收入的一个95%的置信区间?,(98.58,121.42),22,使用你建立的模型(三),对于问题二,如何给出一个预测区间,使得这家连锁店的季度销售收入落在该区间里面的概率是1-?,(76.13,143.87),23,两种区间的关系,xp,预测区间边界,均值的置信区间,24,对模型作进一步的探讨,回忆我们使用的模型;对模型作了什么假定?逻辑问题:如何判断我们的问题符合这些假定?分析的方案:残差分析,25,通过残差你能够了解什么?,对误差项作的假定适合吗?1)等方差;2)相互独立;3)正态分布;哪些数据属于异常值?哪些观测属于对回归模型有很大影响的?,26,残差图,关于自变量的残差图;关于因变量的预测值的残差图;学生化的标准残差图:,27,如何分析残差图,如果模型是符合的,那么残差图上的散点应该落在一条水平带中间,除此之外,残差图上的点不应呈现出什么规律性。使用EXCEL对阿姆德连锁店的数据产生残差图。你能得到什么结论?,28,非线性,线性,X,X,29,方差不等,方差相等,X,X,30,不独立,独立,X,X,31,一个残差不独立的例子,32,异常值的检测,异常值是与其它点显示的趋势不合的点。检查它是否可能是被错误输入的数据。检测异常值的方法:散点图;利用学生化标准残差基本服从标准正态分布来检测(落在2个标准差之外时)。,33,带有异常值的散点图示例,34,检测有影响的观测值,什么是有影响的观测?观测的杠杆率:高杠杆率的点意味着它的自变量距离别的自变量的值距离较大的点。识别影响的观测:杠杆率6/n的观测.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东清远市英德市建筑工程检测站有限公司招聘员工1人模拟试卷及答案详解(名师系列)
- 2025内蒙古工业大学事业编制工作人员招聘10人考前自测高频考点模拟试题及答案详解(全优)
- 2025年洮南市面向社会公开招聘化工园区特勤站政府专职消防员聘用人员考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年吉林松辽水利水电咨询有限责任公司公开招聘模拟试卷及1套完整答案详解
- 2025春季四川叙永县委组织部叙永县人力资源和社会保障局叙永县事业单位人才岗位需求70人模拟试卷及答案详解(必刷)
- 2025贵州黔东南州第十三届贵州人才博览会黔东南州事业单位人才引进19人模拟试卷及完整答案详解一套
- 2025年安徽白帝集团有限公司及所属子公司春季招聘8人模拟试卷带答案详解
- 2025贵州黔西市招募青年就业见习人员81人考前自测高频考点模拟试题参考答案详解
- 2025届春季中国广核集团校园招聘考前自测高频考点模拟试题及1套参考答案详解
- 2025年哈尔滨延寿县公安局公开招聘第二批警务辅助人员32人考前自测高频考点模拟试题及答案详解(夺冠)
- 2025海康威视视频安全门禁系统使用手册
- 安检流程课件
- 2025-2026学年沪教牛津版(深圳用)小学英语五年级上册教学计划及进度表
- 带状疱疹后神经痛护理查房
- 保密文印管理办法
- 肝癌的中医护理
- 高血糖健康宣教
- 【城市道路监理大纲】市政一级主干道路工程监理大纲
- 二年级上册道德与法治期末测试卷含完整答案(有一套)
- 《房产测绘数据库存储管理规范》
- 南通市第一初中2023~2024初一上学期第一次月考数学试卷及答案
评论
0/150
提交评论