《管理统计学》第八章.ppt_第1页
《管理统计学》第八章.ppt_第2页
《管理统计学》第八章.ppt_第3页
《管理统计学》第八章.ppt_第4页
《管理统计学》第八章.ppt_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第八章 相关分析与回归分析,第一节 相关分析 第二节 简单回归分析 第三节 多重线性回归分析 第四节 时间序列分析,相关分析,总体相关与样本相关 偏相关 距离相关 品质相关交叉列联表分析,相关分析,变量之间的相关关系,确定型的关系函数关系,不确定型的关系相关关系,相关分析是研究变量之间不确定关系的统计方法。 其中最为常见的是两个或多个随机变量之间的线性相关关系。,相关关系的内容有,(一)按相关程度划分,完全相关,不完全相关,不相关,(二)按相关方向划分,正相关:同方向变动,负相关:反方向变动,(三)按相关形式划分,线性相关,非线性相关,(四)按变量多少划分,单相关:两变量间的相关,复相关,偏相关,(五)按相关性质划分,真实相关,虚假相关,Kendalls tua-b 相关系数,二、普通相关系数的种类及计算,总体相关系数,(一)积矩相关系数,样本相关系数,(参数相关),(二)等级相关系数,等级相关系数适用于顺序级和刻度级的配对样本。,(非参数相关),Spearman相关系数,(三)偏相关系数,(四)复相关系数,1.总体相关系数,2.样本相关系数,积矩相关系数,适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。,图中,普通相关系数的几何解释,与,即,表示向量,一组,角的余弦就是配对样本,的相关系数。,的模。,样本,可以视为一个向量。,相关系数为0的两个随机变量,不相关,但不,一定相互独立。,相关系数为0的两个服从正态分布的随机变量, 一定相互独立。,相互独立的随机变量间的相关系数,必然为0。,普通相关系数的取值范围,样本相关系数也是区间-1,1之间的一个量。,普通相关系数的直观散点图,设有配对样本观察值,与,则其直观散点图中,标是(,)。,每个点的平面坐,散点图,散点图(Graphs Scatter),积矩相关系数的检验,检验的种类,偏相关系数的检验,相关系数异于零的显著性检验,积矩相关系数的检验,式中,,是样本容量,,是简单相关系数(Pearson),检验统计量,等级相关系数的检验,这是一个双尾检验问题,设定假设:,练习,某企业产品广告费和销售收入资料如下,判断广告费和销售收入之间关系密切程度如何?,3 10 28 40 66 117 140 404,序号,广告费(万元),销售收入(百万元),1 2 3 4 5 6 7,3 5 7 8 11 13 14 61,1 2 4 5 6 9 10 37,9 25 49 64 121 169 196 633,1 4 16 25 36 81 100 263,合计,普通相关分析的SPSS的实现过程:Analyze菜单Correlate项中选择Bivariate命令。,Flag Significant Correlation:是否用星号标明输出结果的显著性。,Means and Standard Deviations:输出所选变量的均值、标准差和样本个数。,Cross Product Deviations and Covariances:输出平方和及协方差。,回归分析,一元回归 多元回归 全部强行进入回归 逐步回归,回归:揭示出不确定数量关系的内在数量变化规律,并通过一定的表达式描述数量之间的这种内在关系的方法。,不确定性的函数关系,回归的涵义,数据之间的关系 函数,确定性的函数关系,回归方程,回归分析的任务,(1)通过分析大量的样本数据,确定变量之间的统计关系,并以数学表达式形式给出; (2)对确定的数学关系式的可信度进行统计检验,找出对某一特定变量影响较为显著的变量和不显著的变量; (3)利用确定的数学关系式,根据自变量预测或控制因变量的取值,并找出这种预测或控制的精确度。,回归分析时变量的设定,回归分析的被解释变量必须是刻度级的,如果是顺序级的,要用Numeric型的来表示。如果被解释变量是名义级的,将用Logistic回归等方法处理。 解释变量可以是刻度级、顺序级、名义级的变量,不论是什么级别的数据,都必须用Numeric型的来表示。,一元线性回归分析,一元线性回归模型的求解,一元线性回归模型的SPSS实现,一元线性回归模型的设定,一元线性回归模型的检验,样本回归模型:,样本回归直线:,一元线性回归模型的求解,最小平方法,回归方程的显著性检验,线性回归方程的检验,回归系数的显著性检验,回归效果的检验,回归方程的显著性检验F检验,:回归方程不显著,:回归方程显著,:总离差平方和,:剩余平方和/残差平方和,:回归离差平方和,若全部观测值都落在回归直线上,则,判定相关系数越接近1,表明回归平方和占总离差平方和的比例越大,用x的变动解释y 值变动的部分就越多,回归的效果就越好。,回归效果的检验判定相关系数检验,若x完全无助于解释y的变动,则,F检验,校正的判定系数,统计量 中不含有自由度。所谓校正的判定系数是指“考虑了自由度的判定系数 ”。其定义如下:,剔除了自由度的影响。,校正的判定系数Adjusted,式中:,回归效果的检验F检验,:样本容量,:自变量的个数(含常数项),:判定系数,回归系数的显著性检验T检验,成立,即,当,时,显著异于0。,针对回归系数的,统计量的显著性检验决定了相,应的变量能否作为解释变量进入回归方程。,回归系数的显著性检验T检验,成立,即,当,时,显著异于0。,针对回归系数的,统计量的显著性检验决定了相,应的变量能否作为解释变量进入回归方程。,SPSS的实现:Analyze菜单Regression项中选择Linear命令。,Enter:强行进入法,即所选自变量全部进入模型。 Remove:强制剔除法,即建立回归方程时,根据设定的条件从回归方程中剔除部分自变量。 Backward:向后剔除法,根据Option对话框中设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的F值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。 Forward:向前选择法。 Stepwise:逐步进入法,根据Option对话框中设定的判据及方差分析结果,选择符合判据的自变量与因变量相关程度最高的进入回归方程。依据Forward选入自变量,依据Backward将模型中F值最小且符合剔除判据的变量剔除,重复。,Method处下拉菜单,共有5个选项:,WLS选项是存在异方差时,利用加权最小二乘法替代普通最小二乘法估计回归模型参数。通过WLS可以选定一个变量作为加权变量。 在实际问题中,如果无法自行确定权重变量,可以用SPSS的权重估计来实现。,Descriptives:输出自变量和因变量的均值、标准差相关系数矩阵及单侧检验概率。,Estimates:输出与回归系数相关统计量。有:回归系数、回归系数的标准误差、标准回归系数、T统计量和相应的相伴概率、各自变量的容忍度。,Confidence intervals:输出每一个非标准化回归系数95%的可信区间。,Covariance matix:输出方程中各自变量间的相关系数矩阵及各变量的协方差矩阵。,Model fit:输出判定系数、调整的判定系数、回归方程的标准误差,F检验的ANOVA方差分析表。,R squared change:当回归方程中引入或剔除一个自变量后,判定系数、F值产生的变化。,Casewise diagnostics:输出标准化残差绝对值3的样本数据点的相关信息,包括:标准化残差、观测值预测值、最小(最大)预测值、残差、最小(最大)残差以及它们的均值和标准差。 Outliers outside standard devistion:设置奇异值的判据,默认3倍的标准差。 All case:输出所有样本数据有关残差值。,Part and partial correlation:输出方程中各自变量与因变量之间的简单相关系数、偏相关系数与部分相关系数。,Collinearity diagnostics:多重共线性分析,输出各自变量的容限度、方差膨胀因子、最小容忍度、特征值、条件指标及方差比例等。,Durbin-Watson:输出Durbin-watson检验值。,Plots对话框用来检验残差序列的正态性、随机性和是否存在异方差现象。,Produce all partial plots:输出每一个自变量残差相对于因变量残差的散布图。,* ZPRED选项:标准化预测值。,* ZRESID选项:标准化残差。,* DRESID选项:剔除残差。,* ADJPRED选项:修正后预测值。,* SRESID选项:t分析残差。,* SDRESID选项:t分析剔除残差。,Mahalanobis:保存Mahalanobis距离,Cooks:保存Cook距离,Leverage values:保存中心点杠杆值,Individual:保存一个观测量上限与下限的预测区间。,Studentized:标准化残差,Deleted:剔除残差,Studentized deleted:标准化剔除残差,DfBeta(s):因排除一个特定的观察值所引起的回归系数的变化。若该值2,则被排除的观测值有可能是影响点。,DfFit:因排除一个特定的观测值所引起的观测值的变化。,Use probalitlity of F:以回归系数显著性检验中各自变量的F统计量的相伴概率作为自变量是否引入模型或者从模型中剔除的标准。实际应用中,应使Entry值小于Remove值,否则,自变量一进入方程就会被立即剔除。,Use F value:以回归系数显著性检验中的各自变量的F统计量作为自变量进入模型或者从模型中剔除的标准。,Include constant in equationF:表示回归方程中将包含常数项。,练习,某企业产品广告费和销售收入资料如下,判断广告费和销售收入之间关系密切程度如何?,3 10 28 40 66 117 140 404,序号,广告费(万元),销售收入(百万元),1 2 3 4 5 6 7,3 5 7 8 11 13 14 61,1 2 4 5 6 9 10 37,9 25 49 64 121 169 196 633,1 4 16 25 36 81 100 263,合计,多元线性回归分析,一个被解释变量(因变量),,的线性模型,,多个解释变量(自变量),多元回归方程为,回归方程的显著性检验,多元线性回归的检验与估计,二、多元线性回归,三、回归系数的显著性检验,四、回归分析的置信区间,五、标准回归系数,回归效果的检验,回归系数,总体均值,方程的检验,多元回归的SPSS处理,按数列中所排列指标的表现形式不同分为:,(平均指标数列),(相对指标数列),时间数列分析,(总量指标列),时间序列的基本构成要素,要素一:时间t,要素二:指标数值a,影响时间数列变动的因素可分解为:,不可解释的变动,时间序列的分解分析,(一)时间数列的组合模型,1 加法模型:Y=T+S+C+I,2 乘法模型:Y=TSCI,(二)移动平均法,1、定义:对时间数列的各项数值,按照一定的时距进行逐期移动,计算出一系列序时平均数,形成一个派生的平均数时间数列,以此削弱不规则变动的影响,显示出原数列的长期趋势。,2、移动平均法的步骤,(1)确定移动时距,一般应选择奇数项进行移动平均; 若原数列呈周期变动,应选择现象的变动周期作为移动的时距长度。,(2)计算各移动平均值,并将其编制成时间数列,奇数项移动平均:,原数列,移动平均,新数列,偶数项移动平均:,移动平均,新数列,原数列,(三)最小平方法,1、含义:最小平方法是通过时间序列的变动分析,建立定量分析数学模型,配合一条较为理想的趋势线来测定数列变化的趋势。,直线趋势方程:,(1) 原数列的实际值与趋势值的离差平方和为最小,即,(2) 原数列的实际值与趋势值的离差之和等于零,即,2、最小平方法配合趋势线时必须满足的两点要求:,3、判断趋势类型的方法,(1)绘制散点图,4、直线趋势,利用最小平方法配合趋势直线,要求原数列的实际数值与趋势直线上的趋势值的离差平方和为最小,即:,将上述两式分别展开并进行整理后,可得到如下标准方程式:,解上述标准方程即可得到的a、b数值,【例】已知我国19962008年GDP资料(单位:亿元)如下, 拟合直线趋势方程。,解:,求解a、b的简捷方法,当t = 0时,有,5. 曲线趋势,(1)抛物线,抛物线趋势方程为:,采用最小平方法分别对a、b、c求偏导,并进行整理后得如下标准方程组:,例:某企业2003-2008年工业总产值及有关计算资料如下表所示,解:,代入简化后的方程组得:,2004年趋势值,将 的各项取值代入上述趋势方程,便可计算出各期趋势值:,2003年趋势值:,其他年份依次类推。,指数曲线趋势方程为:,(2)指数曲线,求解指数曲线方程中 的数值,通常先将指数曲线化为直线,然后再利用最小平方法,将指数曲线趋势方程两边分别求对数得:,设 。则上述方程变化为如下方程:,采用最小平方法确定的标准方程组如下:,解方程组求得 数值后,再查反对数表即可得到 的数值,例:某厂2003-2008年棉布产量及计算资料如下表所示:,将上述资料代入简化后的标准方程组得:,8.436 8=6A 3.306 2=70B 解得:A=1.406 1,B=0.004 72 查反对数表得:,则由此而确定的指数曲线趋势方程为:,将 的各项取值代入所确定的指数曲线趋势方程,便可得到各期的趋势值:,2003年趋势值:,2004年趋势值,其他年份依次类推。,季节变动的概念和测定,(一)季节变动的概念,季节变动是指社会经济现象在一定时间长度内由于受自然与社会因素的影响而发生的具有周期性、规律性的重复变动。,(二)季节变动的测定方法,1. 按月(季)平均法,1)定义:按月(季)平均法是对原时间序列资料不作处理,直接根据历年的周期数据加以平均(给出的资料是月度资料就按月平均,是季度资料就按季平均),并与总平均数对比,求出有关的季节比率,借以反映现象在各期的变动程度 。,(3) 若干年内每月(季)的数字总计,求总的月(季)平均数,即:,(4) 将若干内同月(季)平均数与总月(季)平均数对比,求各月(季)的季节比率,即:,(5) 调整季节比率。计算季节比率时,若是月度资料,各月季节比率之和应等于1200%;若是季度资料,各季季节比率之和应等于400%。若根据时间序列资料计算的结果不等,就应进行调整。,2)按月(季)平均法求季节比率的步骤:,(1) 分别就每年各月(季)的数字加总,求各该年的月(季)平均数,即:,(2) 各年同月(季)数字加总,求若干年内同月(季)的平均数,即:,首先,计算调整系数,公式为:,其次,计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论