旅游统计学第八章相关分析_第1页
旅游统计学第八章相关分析_第2页
旅游统计学第八章相关分析_第3页
旅游统计学第八章相关分析_第4页
旅游统计学第八章相关分析_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 相关分析主讲:宇LOGOPDF 文件使用 "pdfFactory Pro" 试用版本创建 本章要点两个随量的母体相关与样本相关?8.1?8.2?8.3非线性相关Spearman等级相关偏相关?8.4?8.5相关系数异于0的显著性检验SPSS对普通相关分析的处理?8.6至少有一个变量是二值名义级的相关系数?8.7LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.1 两个随量的母体相关与样本相关v 8.1.1 两个随v 定义:X,Y是随母体相关系数量的母体(简单)相关系数量,已知二维(X,Y)分布,E é&#

2、235;( X - E ( X )(Y - E (Y )ùû=Cov ( X ,Y )=rD ( X ) ·D (Y )XYE ( X - E ( X )2 ·E (Y - E (Y )2v 可以证明,相关系数是区间【- 1, 1】之间的一个量。v 若上述相关系数为0,则称X与Y不相关。但未必相互。v 若则称X与Y相互相关系数为0。,则必然不相关,即,上述LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.1 两个随量的母体相关与样本相关v 所谓相互PAB=PA,对而言,是指:·PB ,对随量而

3、言,是指:PX<x,Y<y=PX<x· PY<yv 8.1.2 样本相关v 定义:(X1,Y1),(Xn,Yn)是(X,Y)的一组样本,(显然,x1,x2,xn与y1, y2,yn,是配对样本)则样本相关系数为:LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.1 两个随量的母体相关与样本相关å( Xi- X )(Yi - Y )å xi yi ig= iåiåiXYx gå( Xi- X )2 g()åi222yY - Yiiiiv 注:式中小写x

4、,y是相应大写字母的中心化数据,并不是表示观察值。v 这种相关关系在SPSS中,又称Pearson积矩相关。v 样本相关系数也是区间【- 1, 1】之间的一个量。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.1 两个随量的母体相关与样本相关v 8.1.3 样本(线性)相关系数的几何解释g = < x, y > = cosqx gy量y = ( y , y)T 的模长=+ y2,表示y2注:y1n1nv 这里,x与y是中心化数据,即:, y = Y - Yv 一组样本,可以视为一个。LOGO mPDF 文件使用 "pd

5、fFactory Pro" 试用版本创建 8.1 两个随量的母体相关与样本相关v 8.1.4 直观散点图(每个点的平面坐标是(xi ,yi )v 这个散点图,反映出的是x、y之间的正相关关系v 当散点图从左上向右下分布时,反映出的是x、y之间的负相关关系。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.2 非线性相关v 8.2.1 随量之间的非线性关系v 例8.2.1样本数据(这里x,y是表示随这是配对样本)量X,Y的样本观察值。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 x0

6、.30.61.01.31.82.52.9y7.565.304.102.331.010.290.02x3.43.64.14.75.25.8y0.180.211.233.104.608.608.2 非线性相关v 8.2.1 随量之间的非线性关系v 例8.2.1样本数据的示意图LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.2 非线性相关v 8.2.2 非线性相关的测量v 对于例题8.2.1而言,如果令z=x2,就很容易计算出z与y之间的线性相关系数为rxy=0.994,是高度线性相关的(按照下面的第8.5节的知识,容易量Z与Y高随度线性相关的)

7、,从而,可以推断X与Y是高度非线性相关的。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.3 Spearman等级相关v 8.3.1 两组配对的顺序数据的Spearman等级相关系数(又称秩相关,或名次相关)v 对两组顺序样本而言,无法求出上述等级相关系数(Pearson积矩相关系数)。而应当采用Spearman等级相关系数。v 等级相关系数的公式如下:nå26diq = 1-i=1n (n2 -1)LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.3 Spearman等级相关v

8、 式中,di =Rxi - Ryiv Rxi 表示xi 的名次,Ryi 表示yi 的名次v (从大到小排,或从小到大排,都可以)。注意,两个相同的名次,要加起来除以2。多相同 类似处理。v 一个等价的公式是:å(Rxi- Rx )(Ryi- Ry )q = iå(R- R)2 gå(Ri)2- RxixyiyiLOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.3 Spearman等级相关v 8.3.2 刻度级(Scale)配对样本的等级相关系数v 刻度级的两组样本,也可以排名次(秩),也可以求出Spearman等

9、级相关系数。v (在求出名次后,按照上页公式计算,即可)v 等级相关,又称非参数相关。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.4 偏相关v 8.4.1 剔除了一个变量Z的影响后,两个变量X、Y之间的偏相关系数v 8.4.2 剔除了两个变量Z1、Z2的影响后,两个变量X、Y之间的偏相关系数LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.4 偏相关v 所谓偏相关,是指在诸多相关的变量中,剔除了(了)其中的一个或若干个变量的影响后,两个变量之间的相关关系。v 例如,可以剔除和工龄的影响

10、,看工资收入与受教育程度之间的关系。剔除其他变量(如销售能力)的影响,研究销售量与用之间的关系。费v 关于剔除的含义,在回归分析之后介绍v 以下偏相关的公式,只要求看一看,不要求记忆。概念清楚了,就可以了。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.4 偏相关v 8.4.1 剔除了一个变量Z的影响后,两个变量X、Y之间的偏相关系数rxy - rxz ryz=r()()xy , z1- r1-22rxzyzv 式中,r··是普通样本相关系数LOGO mPDF 文件使用 "pdfFactory Pro"

11、; 试用版本创建 8.4 偏相关v 8.4.2 剔除了两个变量Z1、Z2的影响后,两个变量X、Y之间的偏相关系数- rxzrxy,z,z ryz ,z=r12121()g()xy,z1z21- r1-22rxz2 ,z1yz2 ,z1v 注意下标。但不要记忆公式v 式中,r··,·是偏相关系数。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.5 相关系数异于0的显著性检验v 当我们求出各类样本相关系数不为0时,并不能真正表明变量之间是相关的。还需要通过显著性检验,来判别是否显著异于0。v 8.5.1 Pears

12、on相关系数显著异于0的t检验v 检验简单相关系数(Pearson)显著异于0的t统计量如下:n - 2t = r1- r 2v 服从t(n-2)分布,n是样本容量,r是简单相关系数(Pearson)。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.5 相关系数异于0的显著性检验v 8.5.2 等级相关系数(Spearman)显著异于0的t检验v 检验等级相关系数(Spearman)显著异于0的t统计量同上:n - 2t = r1- r 2v 服从t(n-2)分布,n是样本容量,r是等级相关系数(Spearman)。LOGO mPDF 文件

13、使用 "pdfFactory Pro" 试用版本创建 8.5 相关系数异于0的显著性检验v 8.5.3 偏相关系数显著异于0的t检验v 检验偏相关系数显著异于0的t统计量如下:n - k - 2t = r1- r 2v 服从t(n-k-2)分布,n是样本容量,k是剔除了的变量数,r是偏相关系数。只需要注意一个问题:如果要作正负相关的双向检验,就要作双尾的t检验。如果只作正相关或负相关的检的t检验。验,就只作LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.5 相关系数异于0的显著性检验v 8.5.4 两随量相关性强度的表达

14、v 从一个例子看相关系数显著性检验的意义v 例如,对某尖子班学生采用随机抽样的方法,抽出10名学生,查出其语文与数学的成绩如下表所示。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 学生样本号12345678910语文成绩90888888858580808080数学成绩939290899191837890908.5 相关系数异于0的显著性检验v 依据表中数据,计算出来的语文成绩与数学成绩的相关系数是0.623,等级相关系数是0.626,但是t检验的结果却是在5%的置信水平上,都与0没有显著性差异,也就是说,尽管相关系数在0.6以上,这个尖子班的

15、语文成绩与数学成绩还是不能说是母体相关的。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.5 相关系数异于0的显著性检验v 错误的作法:用如下准则代替显著性检验,来判别随量间的相关性的强弱:v 相关系数的绝对值为0.8以上是强相关,0.8至0.5是显著性相关,0.5至0.3是弱相关,0.3 以下是不相关。v 与上页的例子对照,下节在例8.6.1中,变量“受教育程度”和“投入市场总资金”的样本相关系数仅为0.116,却在5%的显著性水平上,与0有显著性差异。v 正确的作法:依据t统计量的显著性概率,来判断。LOGO mPDF 文件使用 &qu

16、ot;pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 8.6.1 简单相关分析(Pearson)v 例9.5.1某城市某区散户股民的场外收入与场内投资的相关问题。数据“CH8投资额与数据”v 1)点击AnalyzeCorrelateBivariate(分析相关分析两个变量相关分析),系统弹出一个框。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普

17、通相关分析的处理v 2)在左框中选择所要作相关分析的变量(场外年收 入、场内投资总额),用箭头送入右框(Variable)中。v 3)在框口的第一下框(Correlationcoefficients,即相关系数)中,列出了三种相关系数,供选择。v Pearson 相关系数(简单相关系数)是系统默认值。v Kendalls tau-b相关系数v Spearman等级相关系数v 本题只作简单相关分析,接受系统的默认值。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 4)在窗口的第二个下框(Test ofSig

18、nificance,即显著性检验)中,要求你选择还是双尾检验。系统的默认值是双尾。本题可以接受系统的默认值。v 如果你确认关系,则应选择收入与城乡居民存款时正相关。v 5)窗口的第三个下框(FlagSignificant Correlations,即标识显著相关),问你要不要用星号标明输出结果的显著性。系统的默认值是“要”,一般接受它。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 6)点击OK,输出结果v 7)结果说明:p=0.000<0.05,说明:相关系数是显著异于0的。LOGO mPDF 文

19、件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 8.6.2 简单相关分析(Pearson):修改运行语句的例子v 仍然是“CH8投资额与依据”为分析对象v 目的:要分析股民的“市场以外年收入”和“投入市场总资金”与其他一些变量(如“受教育程度”“入市年份”等)的相关关系。v 1)点击AnalyzeCorrelateBivariate(分析相关分析两个变量相关分析),系统弹出一个框。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 2)在左框

20、中选择所要作相关分析的变量(“证券市场以外年收入”“投入市场总资金”“受教育程度”“入市年份”),用箭头送入右框(Variable,变量)中。v 3)在窗口的第一个下框(Correlationcoefficients,即相关系数)中,接受系统的默认值(简单相关系数)。v 4)在窗口的第二个下框(Test ofSignificance,即显著性检验)中,接受系统的默认值(双尾)。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试

21、用版本创建 8.6 SPSS对普通相关分析的处理v 5)窗口的第三个下框(Flag SignificantCorrelations,即标识显著相关),接受。系统的默认值是“要”。v 6)点击Paste(粘贴),系统弹出语句窗口(Syntax),由于仅仅分析“市场以外年收入”和“投入市场总资金”与其他一些变量(如“受教育程度”、“入市年份”)的相关关系,所以要对语句做一个修改:v 对”/”后的语句,改为模式“VARIABLES=A B WITH C D E”意思是分别计算A与C、D、E的简单相关系数,以及计算B与C、D、E的简单相关系数。LOGO mPDF 文件使用 "pdfFacto

22、ry Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 否则系统计算你选择的所有变量之间的两两的相关系数(输出一个矩阵)。LOGO gPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 点击RUN(运行)all(全部),系统输出计算结果。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 8.6.3 非线性相关分析v 按照如下顺序完成非线性相关分析:v 1)做两变量的散点图v 2)估计两变量的非线性相关的函数形式

23、,并做相应的非线性变换v 3)计算变换前配对变量的相关系数,及非线性变换后相关系数v 作业:用SPSS做例8.2.1的非线性相关分析LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 8.6.4 等级相关分析(Spearman相关系数)v 仍然是“CH8投资额与依据”为分析对象v 分析股民的“依据公司业绩买入”和“依据公司的业绩卖出”的行为的相关性如何。v 1)点击AnalyzeCorrelateBivariate(分析相关分析两个变量相关分析),系统弹出一个框。v 2)在左框中选择所要作相关分析的变量(“依

24、据公司业绩买入”与“依据公司的业绩卖出”),用箭头送入右框(Variable,变量)中。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 3)在窗口的第一个下框(Correlationcoefficients,即相关系数)中,选择Spearman等级相关系数。v 4)在窗口的第二个下框(Test ofSignificance,即显著性检验)中,选择因为可以确认两项得分是正相关关系。,v 5)窗口的第三个下框(Flag SignificantCorrelations,即标识显著相关),接受。系统的默认值是“要

25、”。v 6)点击OK,系统输出结果。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 显著性概率p小于0.05,显示,相关系数显著异于零,即两个变量有显著相关关系。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 例8.6.2某小组10个学生的数学与语文成绩是否等级相关?见“CH8数学语文

26、成绩”v 1)点击AnalyzeCorrelateBivariate(分析相关分析两个变量相关分析),系统弹出一个框。v 2)在左框中选择所要作相关分析的变量(数学成绩、语文成绩),用箭头送入右框(Variable,变量)中。v 3)在窗口的第一个下框(Correlationcoefficients,即相关系数)中,选择Spearman等级相关系数。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 4)在窗口的第二个下框(Test ofSignificance,即显著性检验)中,因为无法确定两门成绩是否相关

27、,所以接受系统的默认值,采尾检验。v 5)窗口的第三个下框(FlagSignificant Correlations,即标识显著相关),接受。系统的默认值是“要”。v 6)点击OK,系统输出结果。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 7)结果说明:v 这里的结果很有趣:数学成绩与语文成绩的相关系数高达0.061,却在0.05的显著性水平上与0没有显著性差异,也就是说,在0.05的显著性水平上,不能认为这个小组的数学与语文的成绩是相关的。v 由此可见,相关系数的显著性检验是非常必要的,切不可一见到

28、相关系数大于0.5,就妄言两个变量时相关的。有些,在不作显著性检验的情况下,基于0.3左右的相关系数,就断定所研究的两个变量是相关的,就是缺乏对这一问题的了解。 mLOGOPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 8.6.5 偏相关法分析(Part

29、ial)v 例9.5.3数据:某年26个旅游风景区的商店投资数据、游客增长率和风景区的见“CH9偏相关商客旅”。增长率。v 想从变量之间的相关关系,寻求与风景区增长密切相关的因素。v 为了对比,先研究风景区商业投资与风景区经济增长之间普通相关关系。v 按照上面的步骤,得出:风景区商业投资额与增长之间相关系数为0.664,t检验风景区的p=0.000<0.01,拒绝零假设,表明两个变量之间显著相关。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactor

30、y Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 再来看偏相关的计算结果。v 1)点击AnalyzeCorrelatePartial(分析相关分析偏相关),系统弹出一个框v 2)在左框中选择所要作相关分析的变量(“风景区商业投资额”与“风景区头送入右边的Variable框中。增长率”)用箭v 3)选择游客增长率作为变量(剔除变量“有增长率”的影响),用箭头送入右边的Control for框中。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 4)在窗口的第一个下框(Test of

31、Significance)中,选择双尾(不能确定是否是正相关)。v 5)窗口的第二个下框(FlagSignificant Correlations),接受系统的默认值“要”。v 6)点击OK,系统输出结果。LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理LOGO mPDF 文件使用 "pdfFactory Pro" 试用版本创建 8.6 SPSS对普通相关分析的处理v 7)结果说明:v 偏相关系数为0. 0825 ,显著性概率p=0. 695>0. 05, 说明剔除变量游客增长率的影响后,风景区商业投资额与风景区增长没有显著性关系,更不能说,风景区的商业投资导致了风景区的增长。v 在点击OK前,可先点击Opt ion按钮。在弹出的窗零口的第一框中,选择Zero- orderCorrelations(阶相关),也就是输出两两简单相关(Pearson)系数。此时,可用于偏相关比较。这与直接做简单分析:Analyze- Correlate- Bivariate,所得结果与ZeroOrder Partials

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论