统计学第十一章ppt课件_第1页
统计学第十一章ppt课件_第2页
统计学第十一章ppt课件_第3页
统计学第十一章ppt课件_第4页
统计学第十一章ppt课件_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,例1:生育率,生育率是指不同时期、不同地区妇女或育龄妇女的实际生育水平或生育子女的数量。,例1:生育率,你觉得生育率和什么有关?,例2:全球吃死的人比饿死的人多?,据世界卫生组织统计,全球肥胖症患者达3亿人,其中儿童占两千万人,11亿人体重过重。肥胖症和体重超常早已不是发达国家的专利,已遍及五大洲。目前,全球因”吃”致病乃至死亡的人数已高于因饥饿死亡的人数。-引自光明日报问题:肥胖症和体重超常与死亡人数真有显著的数量关系吗?,例3:其他,上市公司的地理特征会影响投资者的持股决策吗?地方官员的更换与经济的增长;实证研究的基础。,相关分析,客观现象之间是普遍联系相互依存的。客观现象之间的数量联系可分为两类:确定性关系(函数关系)和非确定性关系(相关关系)。函数关系:某一变量的数值大小完全决定于另外一个或数个变量数值的大小。自变量值确定,因变量值也随之完全确定。商品的销售额=价格销售量;圆面积=半径2。,相关分析,相关关系因果关系:说明某一现象或事物的存在和发展,是另一现象或事物存在与发展的原因。劳动生产率与产量单向因果关系销售量与价格双向因果关系关联关系:它是现象之间存在着的某种密切关系,而不是函数函数关系或因果关系。因果关系和关联关系都属于相关关系的具体内容。,变量间的相互关系,确定性的函数关系:y=f(x)不确定性的统计关系相关关系:y=f(x)+(为随机变量)没有关系并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识别和判断。相关分析,就是借助于图形和若干分析指标(如相关关系、相关指数等)对变量之间的依存关系的密切度进行测定的过程。,相关关系的分类,按相关的程度可分为完全相关、不完全相关和不相关。当一个变量的变化完全由另一个变量所决定时,称变量间的这种关系为完全相关;当变量之间存在不严格的依存关系时,称为不完全相关;当两个变量的变化相互独立、互不影响时,称两个变量不相关(或零相关);,相关关系的分类,按相关的方向可分为正相关和负相关当一个变量随着另一个变量的增加(减少)而增加(减少),即两者同向变化时,称为正相关;当一个变量随着另一个变量的增加(减少)而减少(增加),即两者反向变化,称为负相关。,相关关系的分类,按相关的形式可分为线性相关和非线性相关当变量间的依存关系大致呈现线性形式,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称之为线性相关;当变量间的关系不按固定比例变化时,就称之为非线性相关。,线性相关散布图接近一条直线非线性相关散布图接近一条曲线,相关关系的分类,按研究变量的多少可分为单相关、偏向关和复相关两个变量之间的相关,称为单相关;一个变量与两个或两个以上其他变量之间的相关,称为复相关;在多个变量的相关研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时就称其为偏相关。,相关关系的识别,相关表散点图也称相关图:强正相关、弱正相关、强负相关、弱负相关、非线性相关,相关系数,相关表和相关图大体上说明了变量之间有无关系,但它们的相关关系的紧密程度却无法表达出来。相关系数:是测定变量之间线性相关密切程度和相关方向的代表性指标。相关分析:研究现象(变量)间相互依存关系的密切程度的方法论。,相关系数的计算,积差法,总体相关系数,样本相关系数,相关系数的计算,例:某市2005年-2012年的工资性现金支出与城镇储蓄存款余额的资料如下:,相关系数的计算,相关系数的计算,相关系数的计算,简捷法,相关系数的计算,相关系数的计算,经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。,相关关系密切程度的划分,r的绝对值,在0与1之间:|r|=1:x,y完全相关;00正相关r0负相关,相关关系密切程度的划分,r的绝对值大小,可说明现象之间相关关系的紧密程度。一般标准如下:|r|0.3:没有关系;0.3|r|F,就拒绝原假设,表明回归模型是显著的;反之,就不能拒绝原假设。,一元线性回归模型的检验,在一元线性回归分析中,回归系数的显著性检验与回归模型的显著性检验是等价的,因此t检验和F检验的结论是一致的。但在多元回归分析中,它们是不等价的,t检验只检验方程中各个系数的显著性,而F检验则检验的是整个方程的显著性。,一元线性回归模型的检验,P值检验:通过比较P值与给定的显著性水平的大小,来决定是否否定原假设。P值检验的判断准则是:若P值小于给定的,则否定原假设;若P值大于给定的,则接受原假设。,一元线性回归模型的检验,德宾沃森统计量(D-W)检验:德宾沃森统计量(D-W)是检验模型是否存在自相关的一种有效方法。其公式为:将上式计算的D-W值与德宾沃森给出的不同显著水平D-W值的上限dU和下限dL进行比较判别。,利用回归模型进行估计预测,回归方程通过检验就可以根据自变量x的取值估计或预测因变量y的取值。估计或预测的类型:点估计y的平均值的点估计y的个别值的点估计区间估计y的平均值的置信区间估计y的个别值的预测区间估计,点估计,点估计是对于自变量x的一个给定值x0,根据回归方程得到因变量y的一个估计值点估计值有:y的平均值的点估计y的个别值的点估计点估计条件下,平均值的点估计和个别值的点估计是一样的。,点估计,如果想知道该市工资性现金支出为1200万元时,储蓄存款余额是多少,根据估计的回归方程可得:,区间估计,点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计。区间估计是对于自变量x的一个给定值x0,根据回归方程得到因变量y的一个估计区间。区间估计有两种类型置信区间估计(confidenceintervalestimate)预测区间估计(predictionintervalestimate),置信区间估计,利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的平均值E(y0)的估计区间(confidenceinterval)E(y0)在1-置信水平下的置信区间为大样本:小样本:,预测区间估计,利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的一个个别值的估计区间(predictioninterval)y0在1-置信水平下的预测区间为大样本:小样本:,影响区间宽度的因素,置信水平(1-):区间宽度随置信水平的增大而增大数据的离散程度(s):区间宽度随离散程度的增大而增大样本容量:区间宽度随样本容量的增大而减小用于预测的x0与x的平均值的差异程度:区间宽度随x0与x的平均值的差异程度的增大而增大,因此用于预测的x0与x的平均值的差异程度越大预测精度越差。,置信区间、预测区间、回归方程,相关与回归分析,例:已知某地居民人均收入与商品销售额的资料如下:,相关与回归分析,要求根据上述资料:计算简单相关系数;求出估计的一元线性回归方程,并解释回归系数的意义;计算判定系数,并解释其意义;计算估计标准误差。,相关与回归分析,相关与回归分析,b1的含义是人均收入每增加1元,商品销售额平均增加约0.6万元。,相关与回归分析,R2(0.9507)20.9038说明在商品销售额的总变差中有90.38可以由人均收入与商品销售额之间的线性关系来解释,或者说,在商品销售额取值的变动中,有90.38%是由人均收入所决定的。说明二者之间有较强的线性关系。,相关与回归分析,说明根据人均收入预测商品销售额时,平均预测误差为1.387百万元。,相关与回归分析,练习:以下为10家商店销售额和利润率的资料:,要求根据上述资料:1、计算两变量的相关系数;2、求出估计的一元线性回归方程,并解释回归系数的意义;3、计算判定系数,并解释其意义;4、计算估计标准误差。,相关与回归分析,相关与回归分析,相关与回归分析,练习:以下为10家商店销售额和利润率的资料:要求根据上述资料:1、计算两变量的相关系数:r=0.9838;2、求出估计的一元线性回归方程,并解释回归系数的意义:y=-0.535+2.325x;3、计算判定系数,并解释其意义:R2=0.968;4、计算估计标准误差:0.99。,多元线性回归分析,在线性相关的基础上,研究两个或两个以上自变量的回归分析称为多元线性回归。描述因变量y如何依赖于自变量x1,x2,xn和误差项ui的方程称为多元线性回归模型涉及n个自变量的多元线性回归模型可表示为:Yi=0+1x1i+2x2i+nxni+ui,自变量,随机干扰项,偏回归系数,参数的估计,对于n组实际观察数据(yi;x1i,x2i,xni),(i=1,2,n),多元线性回归模型可表示为Y1=0+1x11+2x21+nxn1+u1Y2=0+1x12+2x22+nxn2+u2Yn=0+1x1n+2x2n+nxnn+un,参数的估计,使因变量的观察值与估计值之间的离差平方和达到最小来求得0,1,2,n,(最小二乘法)根据最小二乘法的要求,可得求解各回归参数的标准方程:,多元线性回归的拟合优度检验,可决系数R2多元回归分析中常常实用修正的可决系数R2a估计标准误差(SE),多元线性回归的显著性检验,回归系数的显著性检验提出假设H0:bi=0(自变量xi与因变量y没有线性关系)H1:bi0(自变量xi与因变量y有线性关系)计算检验的统计量t:确定显著性水平,并进行决策tt,拒绝H0;tt,接受H0,多元线性回归的显著性检验,回归方程的显著性检验提出假设H0:12n=0(线性关系不显著)H1:1,2,n至少有一个不等于0计算检验统计量F:确定显著性水平和分子、分母自由度p、n-p-1找出临界值F作出决策:若FF,拒绝H0;若FF,接受H0,多元线性回归的显著性检验,如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量xi对因变量y的影响是否显著;对每一个自变量都要单独进行检验;应用t检验;在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验。,非线性相关与回归分析,非线性函数形式的确定在对实际的客观现象进行定量分析时,选择回归方程的具体形式应遵循以下原则:首先,方程形式应与有关实质性科学的基本理论相一致。例如,采用幂函数的形式,能够较好地表现生产函数;采用多项式方程能够较好地反映总成本与总产量之间的关系等等。,非线性相关与回归分析,非线性函数形式的确定在对实际的客观现象进行定量分析时,选择回归方程的具体形式应遵循以下原则:其次,方程有较高的拟合程度。因为只有这样,才能说明回归方程可以较好地反映现实经济的运行情况。,非线性相关与回归分析,非线性函数形式的确定在对实际的客

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论