第五章数据分析 ppt课件_第1页
第五章数据分析 ppt课件_第2页
第五章数据分析 ppt课件_第3页
第五章数据分析 ppt课件_第4页
第五章数据分析 ppt课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、L/O/G/O第五章第五章 数据分析数据分析第一节第一节 描画统计描画统计多变量描画统计多变量描画统计管理研讨方法论主讲人:何珍珍主讲人:何珍珍 Add your text in here多变量描画统计多变量描画统计 多变量分析开展多变量分析开展内容内容总结总结知识回想知识回想描画统计描画统计知识回想知识回想数据分析: 从实践观测数据中发现变量的特征、变化规那么以及变量之间的关联的过程。数数据据分分析析描画统计描画统计推断统计推断统计单变量描画统计单变量描画统计双变量描画统计双变量描画统计多变量描画统计多变量描画统计多变量分析开展多变量分析开展 多变量分析为统计方法的一种,包含了许多的方法,最

2、根本的为单变量,再延伸出来的多变量分析 统计资料中有多个变量或称要素、目的同时存在时的统计分析,是统计学的重要分支,是单变量统计的开展 来源于医学和心思学 1930年代它在实际上开展很快,但由于计算复杂,实践运用很少。 1970年代以来由于计算机的蓬勃开展和普及,多变量统计分析已渗入到几乎一切的学科。 到80年代后期,计算机软件包已很普遍,运用也方便,因此多变量分析方法也更为普及。 为何研讨为何研讨 充分地解释某种景象 探求景象的成因 Add your text in here多变量描画统计多变量描画统计 偏相关分析和多元回归偏相关分析和多元回归因子分析因子分析缘由事件的辨识缘由事件的辨识 多

3、变量关联表多变量关联表描画统计描画统计多变量关联表多变量关联表多变量关联表分析细化分析: 引入第三个变量,按此变量的属性来分别调查自变量 和因变量之间的关系。细化分析的过程细化分析的过程细化的过程细化的过程四种结果四种结果无效应无效应干涉效应干涉效应掩盖效应掩盖效应一级细分表和零级细分表的一级细分表和零级细分表的结果一样或类似。结果一样或类似。零级表显示的并非自变量和因变量两零级表显示的并非自变量和因变量两者直接存在的关联强度,而是控制变者直接存在的关联强度,而是控制变量对两者作用的结果。量对两者作用的结果。零级表和一级表所反映的自、因零级表和一级表所反映的自、因变量间的关联强度坚持一致。变量

4、间的关联强度坚持一致。 抑制效应抑制效应控制变量对自变量和因变量产生控制变量对自变量和因变量产生影响,同时,自变量和因变量之影响,同时,自变量和因变量之间也直接相关。间也直接相关。多变量关联分析法多变量关联分析法 利利VS弊弊VS利利弊弊u 适用于控制变量属性值为离散型的情况u 对于定序、定类尺度,是独一适用的方法u 变量数添加,细分表级数增多,模型复杂u 每个控制组的样本数据减少,影响准确性偏相关分析和多元回归偏相关分析和多元回归 偏相关分析: 表示在消除第三个变量的影响后,自变量和因变量的关联程度。 多元回归分析: 研讨一个被解释变量因变量,多个解释变量自变量的线性模型,即 y =1 +

5、2X2 + + kXk + 偏相关分析偏相关分析 例1: 欲分析个人受教育程度和任务绩效之间的关联,两者的关联又受年龄影响。如以下图年龄年龄教育程度教育程度任务绩效任务绩效 用一元回归分析年用一元回归分析年龄自变量和教龄自变量和教育程度因变量育程度因变量之间的关系,得出之间的关系,得出方程和残差方程和残差 用一元回归分析年用一元回归分析年龄自变量和任龄自变量和任务绩效因变量务绩效因变量之间的关系,得出之间的关系,得出方程和残差方程和残差 用第三个回归方程用第三个回归方程来分析第一个回归来分析第一个回归方程和第二个回归方程和第二个回归方程残差之间的关方程残差之间的关联,得出相关系数联,得出相关系

6、数即即 偏相关系数偏相关系数第一步第一步第二步第二步第三步第三步 注:残差项阐明因变量不能由自变量来解释的那部分偏向注:残差项阐明因变量不能由自变量来解释的那部分偏向 建立回归方程建立回归方程偏相关系数偏相关系数表示控制变量的影响消除后因变量可解释偏向部分,此系数平方后便是可解释偏向在因变量总偏向中所占的比例。Z为控制变量,x,y为自变量和因变量偏相关分析偏相关分析l 设例1中,年龄和教育程度的相关系数为0.38,年龄和任务绩效的相关系数为0.2,教育程度和任务绩效的相关系数为0.5,那么教育程度和任务绩效的偏相关系数为:l l r = 0.5-0.38*0.2/ 1-0.3821/2 1-0

7、.3821/2 = 0.47偏相关分析偏相关分析l例2l某年26个旅游景区的商店投资数据、游客增长和风景区的经济增长率,想从变量之间的相关关系,寻求与风景区经济增长亲密相关的要素。l运用SPSS软件得出风景区商业投资额与风景区经济增长之间相关系数为0.664,t检验的p=0.0000.05。 阐明剔除变量游客增长率的影响后,风景区商业投资额与风景区经济增长没有显著性关系,更不能说,风景区的商业投资额导致了风景区的经济增长。l偏相关分析可以显示:在消除了一个或多个偏相关分析可以显示:在消除了一个或多个控制变量的影响之后,自变量和因变量的相关控制变量的影响之后,自变量和因变量的相关关系发生了什么变

8、化。关系发生了什么变化。l偏相关系数可以表示两变量间的关联强度,偏相关系数可以表示两变量间的关联强度,但不能反映两者之间变化的定量关系。但不能反映两者之间变化的定量关系。偏相关分析偏相关分析多元回归分析多元回归分析 多元回归分析的内容和功能与一元回归分析完全一样,只是回归方程中包含两个或多个自变量,回归系数表示方程中其他自变量受控的情况下一个自变量与因变量的关联。 注:受控,并非将样本数据按受控的自变量属性值归类,而是“调理每个样本的变量属性值。多元回归分析多元回归分析 多变量回归方程: y =1 + 2X2 + + kXk + 表示y的截距为零的情况,i 表示自变量Xi 变化一单位时在其他自

9、变量坚持不变的情况下因变量y的变化量,表示随机误差。 注:多元回归方程并不能反映出各个自变量的相对重要性,由于i与自变量的度量尺度有关, i n并不代表Xi 和y的关联较Xn和y的关联更强,能够是由于Xi采用较小的尺度单位多元回归分析多元回归分析 为了评判各自变量的相对重要性,回归方程的系数i 可以规范化,这样就可以反映出在解释因变量y的变化中多个自变量的相对重要性。 多元回归方程可以检验自变量和因变量关联的统计显著性。P0.05,那么无显著性关系。多元回归分析多元回归分析 例:以课题总数为被解释变量,解释变量为投入人年数X2、受投入高级职称的人年数X3、投入科研事业费X4、专著数X6、论文数

10、X7、获奖数X8。 解释变量采用强迫进入战略,并做多重共线性检测。 假设课题总数与投入人年数X2、受投入高级职称的人年数X3、投入科研事业费X4、专著数X6、论文数X7、获奖数X8是线性相关,那么设此时的回归方程为: 课题总数=1+2投入年数+3投入科研事业费+4专著数+5论文数+6获奖数+ =1+2 X2+3 X3+4 X4+5 X5+6 X6+多元回归分析多元回归分析 得到结果如下:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95.0% Confidence Interval for

11、BBStd. ErrorBetaLower BoundUpper Bound1(Constant)-35.31376.580-.461.649-193.367122.740论文数-.064.053-.252-1.198.243-.173.046投入人年数.698.2081.3613.352.003.2681.128投入高级职称的人年数-.467.626-.464-.747.463-1.759.824投入科研事业费(百元).003.002.2371.601.122-.001.007专著数.022.377.014.059.953-.755.800获奖数.712.503.1191.416.170-.

12、3261.751a. Dependent Variable: 课题总数多元回归分析多元回归分析 分析:常数项分析:常数项1的显著性概率为的显著性概率为0.6490.05,表示常数,表示常数项与项与0没有显著性差别,因此没有显著性差别,因此1=0 论文数论文数2的显著性概率为的显著性概率为0.2430.05,表示论文数与,表示论文数与0没没有显著性差别,因此有显著性差别,因此2=0 投入年数投入年数3的显著性概率为的显著性概率为0.030.05,表示投入年,表示投入年数与数与0有显著性差别,因此有显著性差别,因此3=1.361 投入高级职称的人数投入高级职称的人数4的显著性概率为的显著性概率为0

13、.4630.05,表示投入高级职称的人数与表示投入高级职称的人数与0没有显著性差别,因此没有显著性差别,因此4=0 投入科研事业费投入科研事业费5的显著性概率为的显著性概率为0.1220.05,表,表示常数项与示常数项与0没有显著性差别,因此没有显著性差别,因此5=0 专著数专著数6的显著性概率为的显著性概率为0.9530.05,表示专著数,表示专著数与与0没有显著性差别,因此没有显著性差别,因此6=0 获奖数获奖数7的显著性概率为的显著性概率为0.1700.05,表示获奖数与,表示获奖数与0没有显著性差别,因此没有显著性差别,因此7 =0 课题总数课题总数=0.698+1.361X2+0.2

14、08多元回归分析多元回归分析基于多元回归分析基于多元回归分析的顾客称心度研讨的顾客称心度研讨以挪动通讯行以挪动通讯行业为例业为例 论文中的运用论文中的运用基于多元回归分基于多元回归分析对我国沿海各析对我国沿海各省乡村个人支出省乡村个人支出构造的研讨构造的研讨问题:问题: 自变量越多越好? “要领在哪? 如何诊断关键“病因,开出“药方? 多元回归分析可以采用恣意个数的自变量来解释因变量的变化,实际上说,自变量越多,对管理景象的解释才干越强。然而,随着自变量的数目增多,人们越来越难抓住问题的“要领。 因此,多变量分析中,在保证一定的对因变量变化解释才干的条件下,自变量的个数越少越好。 通常希望找到

15、降维的多元分析方法。答:答:因子分析因子分析 因子分析是一类降维的相关分析技术,用来调查一组变量之间的协方差或相关系数构造,并用以解释这些变量与为数较少的因子即不可观测的潜变量之间的关联。 分析的结果表达在将原来的一组变量聚类并浓缩成较少的称为因子的新变量,而这些因子能涵盖原来变量的主要特征。因子分析法首创因子分析法首创 1904年,斯皮尔曼以为:智商测试中所采用的各种变量都和“总体智力因子有显著关联,同时,每项智商测试又涉及到某种技艺如数学,所以智商测试又和“专门因子相关,按此两因子的论点,智商IQ应等于受测者的总体因子g加上专门因子s,g是先天的,遗传的,s因子那么是学习的结果。v 分析步

16、骤分析步骤1确认待分析的原变量能否适宜作因子分析确认待分析的原变量能否适宜作因子分析 2构造因子变量构造因子变量 利用旋转方法使因子变量更具有可解释性利用旋转方法使因子变量更具有可解释性 对因子分析结果做出解释对因子分析结果做出解释 因子分析因子分析43v 计算过程计算过程1将原始数据规范化,以消除变量间在数量级和量纲上的不同将原始数据规范化,以消除变量间在数量级和量纲上的不同 2求规范化数据的相关矩阵求规范化数据的相关矩阵 求相关矩阵的特征值和特征向量求相关矩阵的特征值和特征向量 计算方差奉献率与累积方差奉献率计算方差奉献率与累积方差奉献率 因子分析因子分析43v 计算过程计算过程5确定因子

17、:确定因子: 6因子旋转:因子旋转: 用原目的的线性组合来求各因子得分用原目的的线性组合来求各因子得分 综合得分综合得分 因子分析因子分析87设F1,F2, Fp为p个因子,其中前m个因子包含的数据信息总量即其累积奉献率不低于80%时,可取前m个因子来反映原评价目的; 假设所得的m个因子无法确定或其实践意义不是很明显,这时需将因子进展旋转以获得较为明显的实践含义。 以各因子的方差奉献率为权,由各因子的线性组合得到综合评价目的函数F = (w1F1+w2F2+wmFm)(w1+w2+wm ) 此处wi为旋转前或旋转后因子的方差奉献率 9得分排序:利用综合得分可以得到得分名次得分排序:利用综合得分

18、可以得到得分名次 因子分析因子分析主成分分析法主成分分析法 公共因子分析法公共因子分析法 抽取因子的方法抽取因子的方法主成分分析法主成分分析法 主成分分析法是一种数学变换的方法, 它把给定的一组相关变量经过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序陈列。 在数学变换中坚持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,n个变量就有n个主成分。 主成分分析法主成分分析法特征根大于1法 碎石坡法 判别因子取舍的判别因子取舍的方法方法假设一个因子的特征根大于1就保管,否那么丢弃。 假设我们以因子的

19、次序为X轴、以特征根大小为Y轴,我们可以把特征根随因子的变化画在一个坐标上,因子特征根呈下降趋势。这个趋势线的头部快速下降,而尾部那么变得平坦。从尾部开场逆向对尾部画一条回归线,远高于回归线的点代表主要的因子,回归线两旁的点代表次要因子。 公共因子分析法 公共因子分析法只思索变量中的共性部分。 在变量X1, X2, Xp中,每个变量Xi分为两部分,即 Xi= Xi +Si Xi为变量Xi与其他变量一样的共性部分, Si为变量Xi与其他变量不同的独立部分。主成分分析法主成分分析法VS公共因子分析法公共因子分析法VS主成分分析法主成分分析法公共因子分析法公共因子分析法u 因子反映变量间最优线性组合,有能够事先提出假设,设定一组变量与某个因子或因子与因子之间存在强关联,然后去检验它们之间的负荷系数。u 用于确认型因子分析u 用来发掘潜在的影响一切原来变量的新变量,研讨者事先并无任何关于变量和因子间关联的假设重点放在发现关联。u 属于探求型因子分析江苏省中成药工业江苏省中成药工业经济效益综合评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论