下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.相关分析一、两个变量的相关分析:Bivariate1相关系数的含义相关分析是研究变量间密切程度的一种常用统计法。相关系数是描述相关关系强弱程度和向的统计量,通常用r 表示。相关系数的取值围在 -1 和 +1 之间,即: 1r 1。计算结果,若 r 为正,则表明两变量为正相关;若r 为负,则表明两变量为负相关。相关系数 r 的数值越接近于1( 1 或+1),表示相关系数越强; 越接近于 0 ,表示相关系数越弱。如果r=1 或 1,则表示两个现象完全直线性相关。如果=0 ,则表示两个现象完全不相关(不是直线相关)。 r0.3 ,称为微弱相关、 0.3r0.5 ,称为低度相关、0.5r0.8 ,称
2、为显著(中度)相关、0.8r1 ,称为高度相关 r 值很小,说明 X 与 Y 之间没有线性相关关系, 但并不意味着 X 与 Y 之间没有其它关系,如很强的非线性关系。直线相关系数一般只适用与测定变量间的线性相关关系, 若要衡量非线性相关时,一般应采用相关指数 R。2常用的简单相关系数(1)皮尔逊( Pearson)相关系数皮尔逊相关系数亦称积矩相关系数, 1890 年由英国统计学家卡尔 ?皮尔逊提出。定距变量之间的相关关系测量常用Pearson 系数法。计算公式如下:Word 资料.n( xix)( yiy)ri 1(1)nnx) 2y) 2(xi( yii 1i1(1)式是样本的相关系数。计
3、算皮尔逊相关系数的数据要求:变量都是服从正态分布, 相互独立的连续数据; 两个变量在散点图上有线性相关趋势;样本容量 n30 。(2)斯皮尔曼( Spearman)等级相关系数Spearman 相关系数又称秩相关系数,是用来测度两个定序数据之间的线性相关程度的指标。当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间的关系密切程度。 它是根据数据的秩而不是原始数据来计算相关系数的,其计算过程包括:对连续数据的排秩、 对离散数据的排序, 利用每对数据等级的差额及差额平,通过公式计算得到相关系数。其计算公式为:6d 2rR 12(2)n n1(2)式中, r R 为等级相关系数; d
4、 为每对数据等级之差;n 为样本容量。斯皮尔曼等级相关对数据条件的要求没有积差相关系数格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如, 都可以用斯皮尔曼等级相关来进行研究。(3)肯德尔( Kendall )等级相关系数肯德尔( Kendall )等级相关系数是在考虑了结点(秩次相同)的条件下,测度两组定序数据或等级数据线性相关程度的指标。它利用排序数据的秩, 通过计Word 资料.算不一致数据对在总数据对中的比例,来反映变量间的线性关系的。 其计算公式如下:rK4i1( 3)n n1(3)式中, rK 是肯
5、德尔等级相关系数; i 是不一致数据对数; n 为样本容量。计算肯德尔等级相关系数的数据要求与计算斯皮尔曼等级相关系数的数据要求相同。3相关系数的显著性检验通常,我们用样本相关系数r 作为总体相关系数的估计值,而r 仅说明样本数据的 X 与 Y 的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数r 值很大,而总体的X 与 Y 并不存在真正的线性关系。因而有必要通过样本资料来对X 与 Y 之间是否存在真正的线性相关进行检验,即检验总体相关系数是否为零(即原假设是:总体中两个变量间的相关系数为0 )。SPSS的相关分析过程给出了该假设成立的概率(输出结果中的Sig.)。样本简单相
6、关系数的检验法为:当原假设 H 0:0 , n50 时,检验统计量为:Zrn1( 4)1 r 2当原假设 H 0:0 , n50 时,检验统计量为:trn2dfn 2(5)1r 2式中, r 为简单相关系数; n 为观测值个数(或样本容量)。4背景材料设有 10 个厂家,序号为1,2, , 10,各厂的投入成本记为x ,所得产出Word 资料.记为 y 。各厂家的投入和产出如表7-18-1 所示,根据这些数据,可以认为投入和产出之间存在相关性吗?表 110 个厂家的投入产出单位:万元厂家12345678910投入20402030101020202030产出3060406030404050307
7、05操作步骤5-1 绘制散点图的步骤(1)选择菜单命令“ Graphs”“ Legacy Dialogs”“ Scatter/Dot ”,打开Scatter/Dot 对话框,如图 1 所示。图 1 选择散点图窗口(2)选择散点图类型。 SPSS提供了五种类型的散点图。(3 )根据所选择的散点图类型,单击“Define ”按钮设置散点图。不同类型的散点图的设置略有差别。简单散点图( Simple Scatter)简单散点图的设置窗口如图2 所示。Word 资料.图 2 简单散点图的设置窗口从对话框左侧的变量列表中指定某个变量为散点图的纵坐标和横坐标,分别选入 Y-Axis 和 X-Axis 框中
8、。这两项是必选项。可以把作为分组的变量指定到Set Markers by 框中,根据该变量取值的不同对同一个散点图中的各点标以不同的颜色(或形状)。该项可以省略。把标记变量指定到Label Cases by 框中,表示将标记变量的各变量值标记在散点图的旁边。该项可以省略。从左侧变量列表框中选择变量到Panel by 框中作为分类变量, 可以使该变量作为行( Rows )或列( Columns )将数据分成不同的组,便于比较。该项可以省略。选择 Use Chart Specifications From 选项,可以选择散点图的文件模板, 单击Word 资料.“ File”可以选择指定的文件。单击
9、“ Title ”按钮可以对散点图的标题进行设置,单击“Options ”按钮可以对缺失值以及是否显示数据的标注进行设置。重叠散点图( Overlay Scatter )重叠散点图能同时生成多对相关变量间统计关系的散点图,首先根据分类变量的不同取值对原始数据进行分类,然后对各分类数据做简单散点图。重叠散点图的设置窗口如图7-18-3 所示。图 3 重叠散点图的设置窗口从左侧框中选择一对变量进入Pairs 框中,其中前一个为图的纵坐标变量( Y-Variable),后一个作为图的横轴变量(X-Variable ),可以通过点击按钮进行横纵轴变量的调换。其他设置与同简单散点图都相同。矩阵散点图(
10、Matrix Scatter )Word 资料.矩阵散点图以形矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。矩阵散点图的关键是弄清各矩阵单元中的横纵变量。矩阵散点图的设置窗口如图 4 所示。图 4 矩阵散点图的设置窗口把参与绘图的若干变量指定到MatrixVariables 框中。选择变量的先后顺序决定了矩阵对角线上变量的排列顺序。其他设置也与简单散点图相同。三维散点图( 3-D Scatter)三维散点图生成三个相关变量的三维散点图,由三个坐标轴对应变量的数据决定,它以立体图的形式展现三对变量间的统计关系。设置窗口如图5 所示。Word 资料.图 5 三维散点图设置窗口从左侧的变量列
11、表中指定三个变量分别选入Y-Axis、X-Axis、 Z-Axis 框中。其他设置均与简单散点图相同。单点散点图( Sample Dot )单点散点图生成单个变量的散点图,显示数值型变量的每一个观测值,这些值都堆积在 X 轴附近,由于没有指定Y 轴,所以数据点的Y 坐标没有特殊的含义。设置窗口如图6 所示。Word 资料.图 6 单点散点图设置窗口从左侧变量列表中选择一个变量选入X-Axis Variable 框中。其他设置与简单散点图相同。5-2 计算简单相关系数的操作步骤通过散点图可以初步判断变量是否具有线性趋势。对具有线性趋势的变量计算相应的简单相关系数的步骤如下:(1)选择菜单命令“
12、Analyze ” “Correlate ”“Bivariate ”,打开两变量相关分析的对话框,如图7 所示。Word 资料.图 7 两变量相关分析窗口(2)选入需要进行相关分析的变量进入Variables 框,至少需要选入两个,如选入“投入”、“产出”变量。(3)在 Correlation Coefficients复选框中选择需要计算的相关系数。 主要有:Pearson 复选框:选择进行积距相关分析,即最常用的参数相关分析;Kendall'stau-b 复选框:计算 Kendall's 等级相关系数; Spearman 复选框:计算 Spearman相关系数,即最常用的非参
13、数相关分析(秩相关)。( 4 ) Test of Significance 单 选 框用 于确 定是 进 行 相 关系 数 的 单 侧( One-tailed )或双侧( Two-tailed )检验,系统默认双侧检验。(5)Flag significant correlations 用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时 P<0.05 的系数值旁会标记一个星号, P<0.01的则标记两个星号。(6)单击 Options 按钮,弹出 Options 对话框,选择需要计算的描述统计Word 资料.量和统计分析,如图8 所示。图 8 两变量相关分析的Opt
14、ions 子对话框在 Statistics 复选框中定义各变量输出的描述统计量。Means and standarddeviations选项表示每个变量的样本均值和标准差;Cross-productdeviationsand covariances 选项表示各对变量的离差平和、样本差、两变量的叉积离差以及协差阵。叉积离差为Pearson 相关系数公式中的分子部分;协差为叉积离差/( n-1)。在 Missing Values 单选框中定义分析中对缺失值的处理法,可以是具体分析用到的两个变量有缺失值才去除该记录 ( Exclude cases pairwise),或只要该记录中进行相关分析的变量
15、有缺失值(无论具体分析的两个变量是否缺失) ,则在所有分析中均将该记录去除( Excludes cases listwise)。(7)单击“ OK ”按钮完成设置,提交运行。6结果解析根据背景资料,利用表1 中的数据,建立SPSS数据文件,分别将变量投入、产出选入Variables 框中,并在Options子对话框选中Means and standarddeviations 选项和 Cross-product deviationsand covariances 选项,其他选择默Word 资料.认。结果如表 2、表 3 所示。6-1 表 2 为描述统计量, 表 3 为相关分析结果。 从表 3 中
16、可以看出皮尔逊相关系数为 0.759 ,即投入与产出的相关系数为0.759 ,双侧检验的 P 值为 0.011,明显小于0.05 ,拒绝二者不相关的原假设。因此,我们可以得出结论:可以认为投入与产出之间存在正相关,当投入增加时,产出也会相应增加。表2 描述统计量Descriptive StatisticsMeanStd. DeviationN投入22.009.10产出45.0014.33710表3 简单相关系数分析结果Correlations投入产出投入Pearson Correlation1.759 *Sig. (2-tailed).011Sum of Squares and760.0009
17、00.000Cross-productsCovariance84.444100.000N1010产出Pearson Correlation.759 *1Sig. (2-tailed).011Sum of Squares and900.0001850.000Cross-productsCovariance100.000205.556N1010*. Correlation is significant at the 0.05 level (2-tailed).Word 资料.6-2 调用 Bivariate 过程命令时允同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。二、偏
18、相关分析: Partial1偏相关分析的含义在实际问题中,两变量的相关关系往往还要受到其他因素的影响,这些影响有时候会使相关分析的结果变得不那么可靠。因此,引入了偏相关分析的法。 偏相关分析,也称净相关分析, 是指在研究两个变量之间的线性相关关系时,将与这两个变量有联系的其他变量控制不变的统计法。根据控制变量的个数, 偏相关分析分为零阶偏相关分析、一阶偏相关分析、二阶偏相关分析等等。其中,零阶偏相关分析是指没有控制变量的相关分析,即一般的相关分析。 一阶偏相关分析是指有一个控制变量的相关分析, 二阶偏相关分析是指有两个控制变量的偏相关分析,其他高阶偏相关分析以此类推。2偏相关系数进行偏相关分析
19、时要用到偏相关系数。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度的指标。偏相关系数的取值围亦在 -1+1 之间,其计算公式分别为:当有一个控制变量为x2 时,变量 x1 和 y 之间的一阶偏相关系数为:ryx1ryx2rx1 x2(6)ryx1? x2)(1rx2x(1 r yx2)2123对偏相关系数的检验法在偏相关分析中,由于两个变量之间的相关系数是在固定(控制)了一个或几个变量后进行的,考虑到这种因素及抽样误差的影响,其检验统计量为:Word 资料.r nk2)tr(712式中,r 是特定的偏相关系数; n 为观测值个数; k 为控制变量个
20、数; nk2为自由度。4背景材料某汽车制造商从某月中随机抽出10 天的电力消耗量、温度、日产量等有关资料,数据如表 4 所示。结合多年管理经验,对电力消耗量、温度、日产量的关系做出相关分析。表 4 某汽车制造商的电力消耗量、温度、日产量等数据表电力消耗(千瓦)温度(华氏)日产量1283120117911013851289751011487105108110812841101177107148511211841195操作步骤5-1 选择菜单命令“ Analyze ”“Correlate ”“Partial ”,打开偏相关分析的对话框,如图9 所示。Word 资料.图 9 偏相关分析窗口5-2 选
21、入需要进行偏相关分析的变量进入Variables 框中,至少需要选入两个。5-3 选择需要在偏相关分析时进行控制的协变量进入Controlling for框中,如果不选入,则进行的就是普通的相关分析。5-4在Test ofSignificance 单 选 框 中 确 定 是 进 行 相 关 系 数 的 单 侧( One-tailed )或双侧( Two-tailed )检验,一般选双侧检验。5-5Display actual significance level 复选框用于表示在结果中给出确切的P值,一般选中。5-6 单击 Options 按钮,弹出 Options 对话框,选择需要计算的描述
22、统计量和统计分析。如图10 所示。Word 资料.图 10偏相关分析的 Options 子对话框(1)Statistics复选框用于定义可选的描述统计量。其中,Means and standarddeviations 表示每个变量的样本均值和标准差;Zero-order correlations表示输出包括控制变量在所有变量的相关矩阵。(2)Missing Values 单选框用于定义分析中对缺失值的处理法,可以是具体分析用到的两个变量有缺失值才去除该记录(Exclude cases pairwise),或只要该记录中进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分析中
23、均将该记录去除(Excludes cases listwise)。系统默认为前者, 以充分利用数据。6结果解析这里我们选择电力消耗、温度作为待分析变量,把日产量作为控制变量,在Options 子对话框中选中Means and standard deviations选项,其他选择系统默认。具体分析结果见表4、表 5 所示。6-1 表 5 偏相关系数表中的结果表明,在控制了日产量变量后,电力消耗与温度之间的偏相关系数为0.815,概率 P 值为 0.007<0.05,从而表明两者之间有高度的相关关系。Word 资料.表4 偏相关分析描述统计量DescriptiveStatisticsMeanStd. DeviationN电力消耗11.701.63610温度82.003.88710日产量112.008.10表 5 偏相关系数表 Correla
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年湖南民族职业学院单招职业倾向性考试题库参考答案详解
- 2026年广东茂名幼儿师范专科学校单招职业适应性考试题库及答案详解一套
- 2026年朔州师范高等专科学校单招职业技能考试题库含答案详解
- 2026年锦州师范高等专科学校单招职业适应性考试题库及参考答案详解1套
- 2026年湖北职业技术学院单招职业倾向性考试题库及参考答案详解
- 2026年枣庄职业学院单招职业适应性测试题库附答案详解
- 2026年山西省财政税务专科学校单招职业适应性测试题库及参考答案详解
- 2026年福州科技职业技术学院单招职业适应性考试题库及答案详解一套
- 2026年临汾职业技术学院单招职业倾向性考试题库参考答案详解
- 2026年哈尔滨铁道职业技术学院单招职业适应性测试题库参考答案详解
- 2025年下半年贵州遵义市市直事业单位选调56人备考笔试题库及答案解析
- 出纳劳务合同范本
- 海外项目质量管理体系的实施要求与案例分析
- 中国马克思主义与当代思考题(附答案)
- 《电力拖动控制线路与技能训练》试卷 A(附答案)
- 关于新能源汽车的研究报告高中生怎么写
- 严歌苓作品:霜降
- 西尔斯怀孕百科(升级版)
- 楼梯工程量计算表(模板、砼计算)
- 百富系列灌装培训手册
- GB/T 13871.1-2022密封元件为弹性体材料的旋转轴唇形密封圈第1部分:尺寸和公差
评论
0/150
提交评论