管理相关分析_第1页
管理相关分析_第2页
管理相关分析_第3页
管理相关分析_第4页
管理相关分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于管理相关分析第一张,PPT共四十九页,创作于2022年6月一变量间的关系:函数关系是一一对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上 xy第二张,PPT共四十九页,创作于2022年6月函数关系(几个例子) 函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = px (p 为单价)圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量

2、(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 第三张,PPT共四十九页,创作于2022年6月变量间的关系:相关关系(correlation)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围 xy第四张,PPT共四十九页,创作于2022年6月相关关系(几个例子) 相关关系的例子父亲身高(y)与子女身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系不确定 有统计规律第五张,PPT共四十九页,创作于2022年6月绘制数据散布图计算相关系数第六张

3、,PPT共四十九页,创作于2022年6月散布图散布图的定义:是一种研究成对出现的、两组相关数据之间关系的图示技术。 在散布图种,成对的数据形成点子云,研究点子云的分布状态,便可推断成对数据之间的相关程度。当x值增加,y值也相应增加,就称x 与y之间是正相关;当x值增加,y值也相应减少,就称x 与y之间是负相关;第七张,PPT共四十九页,创作于2022年6月散布图分析:散布图的分析一来般来说有六种形态.1、在图中当X增加,Y也增加,也就是表示原因与结果有相对的正相关,如下图所示:XY0第八张,PPT共四十九页,创作于2022年6月2、散布图点的分布较广但是有向上的倾向,这种形态叫做似有正相关称为

4、弱正相关XY0第九张,PPT共四十九页,创作于2022年6月3、当X增加,Y反而减少,而且形态呈现一直线发展的现象,这叫做完全负相关.如下图所示:Y0X第十张,PPT共四十九页,创作于2022年6月4、当X增加,Y减少的幅度不是很明显,这时的X 除了受Y的影响外,尚有其他因素影响X,这种形态叫作非显着性负相关,如下图所示:Y0X第十一张,PPT共四十九页,创作于2022年6月5、如果散布点的分布呈现杂乱,没有任何倾向时,称为无相关,也就是说X与Y之间没有任何的关系,这时应再一次先将资料层别化之后再分析,如下图所示:Y0X第十二张,PPT共四十九页,创作于2022年6月6、假设X增大,Y也随之增

5、大,但是X增大到某一值之后,Y反而开始减少,因此产生散布图点的分布有曲线倾向的形态,称为曲线相关,如下图所示:Y0X第十三张,PPT共四十九页,创作于2022年6月五、散布图做法:1、收集成对数据(x,y): 收集成对数据一般在30组以上;2、确定坐标并标明刻度: 横坐标x轴为自变量(原因或因素),纵坐标y轴为因变量(结果或特性),且两轴的长度大体相等。3、描点,形成散布图: 当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表 示,或在离第一个点最近出画上第二个点表示;4、图形分析: 根据点子云的形状,确定相关关系的性质和程度。 对散布图的分析判断方法有: 对照典型图形分析法: 将绘制的

6、散布图与6种典型图相对比,从而确定其相关关系和程度。第十四张,PPT共四十九页,创作于2022年6月 简单象限法: 在图上画一条与y轴平行的P线,使P线左、右两侧的点数相等或大致相等; 在图上再画一条与x轴平行的Q线,使Q线上、下两侧的点数相等或大致相等;PQ两线把图形分成四个象限,计算各象限区域内的点数,线上的不计计算对角象限内的点数,即 n+n, n+n当n+nn+n时,为正相关;当n+nn+n时,为负相关;当n+nn+n时,为不相关;YPQXnnnn第十五张,PPT共四十九页,创作于2022年6月六、注意事项:数据的性质要相同,否则会导致不真实的判断结果;散布图的相关规律的运用范围一般局

7、限于观测值数据的范围内,不能任意扩大相关推断范围;散布图中出现的个别偏离分布趋势的异常点,应当查明原因予以剔除;第十六张,PPT共四十九页,创作于2022年6月实例解析: 某酒厂要判定中间产品酒中的酸度喝酒度2个变量之间有无关系,存在什么关系?(搜集到的数据如下表)序号酸度 x酒度 y序号酸度 x酒度 y10.56.3160.76.020.95.8170.96.131.24.8181.25.341.04.6190.85.950.95.4201.24.760.75.8211.63.871.43.8221.53.480.95.7231.43.891.34.3240.95.01010.5.3250.

8、66.3111.54.4260.76.4120.76.6270.66.8131.34.6280.56.4141.04.8290.56.7151.24.1301.24.8第十七张,PPT共四十九页,创作于2022年6月解析:1、确定坐标:横坐标x轴为酸度,纵坐标y轴为酒度2、描点,形成散布图:Y0X酒度酸度nnnn3、图形分析:可以认为酸度和酒度之间存在着弱负相关关系第十八张,PPT共四十九页,创作于2022年6月相关系数通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度

9、与变化方向的量数,即相关系数。总体相关系数用(读“柔”)表示,样本相关系数用r表示。第十九张,PPT共四十九页,创作于2022年6月附加说明:(1)两变量间存在相关,仅意味着变量间有关联,并不一定是因果关系。(2)相关系数不是等距的测量单位。r是一个比值,不是由相等单位度量而来,不能进行加、减、乘、除运算。如r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。(3)相关系数受变量取值区间大小及观测值个数的影响较大。第二十张,PPT共四十九页,创作于2022年6月变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不

10、相关的两列变量,计算的结果可能相关,如学生的身高与学习成绩。本书所举例题,数据较少,仅为说明计算方法时较方便。(4)相关系数在特定情况下使用才具有意义。如高中生身高与体重的相关系数用在儿童身上就没有意义。第二十一张,PPT共四十九页,创作于2022年6月(5)通过实际观测值计算的相关系数,须经过显著性检验确定其是否有意义。|r|的取值范围|r|的意义0.00-0.19极低相关0.20-0.39低度相关0.40-0.69中度相关0.70-0.89高度相关0.90-1.00极高相关表5-0 |r|的取值与相关程度第二十二张,PPT共四十九页,创作于2022年6月*如何判断两个变量的相关性(1)找出

11、两个变量的正确相应数据。(2)画出它们的散布图(散点图)。(3)通过散布图判断它们的相关性。(4)给出相关(r)的解答。(5)对结果进行评价和检验。第二十三张,PPT共四十九页,创作于2022年6月二、 积差相关系数一、概念及适用条件(一)概念积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为(5.1)第二十四张,PPT共四十九页,创作于2022年6月(二)适用条件1、两变量均应由测量得到的连续变量。2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。3、变量必须是成对的数据。4、两变量间为线性关系。第二十五张,PPT共四十九页,创作于2022年6月二、计算方法(一)基本公式计

12、算法步骤:第二十六张,PPT共四十九页,创作于2022年6月学生序号X(政治)Y(语文)xyxy17482-1.6-1.72.7227175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.82576820.4-1.7-0.68677891.45.37.42777881.44.36.0286884-7.60.3-2.2897480-1.6-3.75.92107487-1.63.3-5.2875.683.74.4542114.3370591.8 例1 某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程

13、度。第二十七张,PPT共四十九页,创作于2022年6月解:依表5-1的资料,计算结果为 即 10名学生的政治与语文成绩的相关程度为0.475。第二十八张,PPT共四十九页,创作于2022年6月Excel 演示 例10-1第二十九张,PPT共四十九页,创作于2022年6月三、等级相关定义:等级相关是根据等级资料来研究变量间相互关系的方法。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。第三十张,PPT共四十九页,创作于2022年6月(一)斯皮尔曼等级相关1、概念及适用条件(1)概念:斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计

14、算的,所以又称为“等级差数法”。 两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关)第三十一张,PPT共四十九页,创作于2022年6月(2)适用条件 两变量的资料为等级测量数据,且具有线性关系。 连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。 不要求总体呈正态分布。2、计算方法式中:D为两变量每对数据的等级之差;N表示样本容量。(5.4)第三十二张,PPT共四十九页,创作于2022年6月计算步骤:(1)计算两变量等级之差D;(2)计算D2;(3)计算 D2;(4)代入公式(5.4),求得rR 第三十三张,PPT共四

15、十九页,创作于2022年6月序号X(语文等级)Y(阅读等级)DD218800267-11354114321152111645-11776118910-11913-24101091112表5-3 10名学生的语文成绩与阅读能力成绩相关计算表第三十四张,PPT共四十九页,创作于2022年6月解:将有关数据代入公式(5.4)得 如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。第三十五张,PPT共四十九页,创作于2022年6月 例4 某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学

16、生的自学能力和学科成绩,见表5-4,求其相关系数。序号X(能力)等级Y(成绩)等级DD21903.5884-0.50.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-0.50.2525.5表5-4 10名学生的自学能力和学科成绩相关计算表第三十六张,PPT共四十九页,创作于2022年6月解:即学生的自学能力与学习成绩的相关程度为0.85。第三十七张,PPT共四十九页,创作于2022年6月教材例10-3excel 演示第三十八张,PPT共四十九页,创作

17、于2022年6月肯德尔相关系数: 度量两个顺序变量X与Y之间的关系,第三十九张,PPT共四十九页,创作于2022年6月NS:同序对的数目 ND:异序对的数目TX:X中同分对的数目 TY:Y中同分对的数目n:样本容量 m:X与Y 等级数较小者Tau-a:没有同分对时采用,表示同序对的数目与异序对的额数目差在全部可能对数中所占的比例。Tau-b:有同分队,X与Y 的等级数相同,Tau-c:有同分队,X与Y 的等级数不同第四十张,PPT共四十九页,创作于2022年6月同序对、异序对、同分对1、同序对(same ordered pair) 设个案A在变量x和y具有等级(xi,yi),个案B在变量x和y

18、具有等级(xj,yj),如果xixj,yiyj,则称A和B为同序对,记作Ns2、异序对(different ordered pair) 设A (xi,yi)和B (xj,yj),如果xixj,yiyj,则称A和B为异序对,记作Nd第四十一张,PPT共四十九页,创作于2022年6月3.同分对(tied pair)X同分对:设A (xi,yi)和B (xj,yj),如果xi=xj, yiyj,则称A和B为x同分对,记作TxY同分对:设A (xi,yi)和B (xj,yj),如果xi xj, yi = yj,则称A和B为y同分对,记作TyX、Y同分对:设A (xi,yi)和B (xj,yj),如果x

19、i =xj,yi = yj,则称A和B为xy同分对,记作Txy第四十二张,PPT共四十九页,创作于2022年6月试就以下数据,列举其中的同序对、异序对和同分对casex yABCDE 23 13 11 12 3第四十三张,PPT共四十九页,创作于2022年6月44肯德尔和谐系数常以W表示,适用于多列等级变量的资料。可以反映多个等级变量变化的一致性。(1)同一评价者无相同等级评定时,W的计算公式:N被评的对象数; K评分者人数或评分所依据的标准数; S每个被评对象所评等级之和Ri与所有这些和的平均数的离差平方和,即 肯德尔和谐系数第四十四张,PPT共四十九页,创作于2022年6月45(2)同一评价者有相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论