spss第五章 偏相关与详析模型_第1页
spss第五章 偏相关与详析模型_第2页
spss第五章 偏相关与详析模型_第3页
spss第五章 偏相关与详析模型_第4页
spss第五章 偏相关与详析模型_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-12-13偏相关与详析模型1 相关分析的概念和相关分析过程相关分析的概念和相关分析过程2 两个变量间的相关分析两个变量间的相关分析3 偏相关分析偏相关分析4 距离分析距离分析5 详析模型(以交互分类为例)详析模型(以交互分类为例)1.1相关分析的概念研究变量间密切程度的一种常用统计方法研究变量间密切程度的一种常用统计方法n1、线性相关分析:、线性相关分析:研究两个变量间线性关系的研究两个变量间线性关系的程度。用相关系数程度。用相关系数r r来描述。来描述。( (详见下面)详见下面)n2、偏相关分析:、偏相关分析:它描述的是当控制了一个或几它描述的是当控制了一个或几个另外的变量的影响条

2、件下两个变量间的相关性,个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系教育水平之间的相关关系n3、相似性测度:、相似性测度:两个或若干个变量、两个或两两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远似性用距离或不相似性来描述,大值表示相差甚远线性相关分析研究两个变量间线性关系的程度。相关系数是

3、描述这种研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用线性关系程度和方向的统计量,用r r表示。表示。如果变量如果变量Y Y与与X X间是函数关系,则间是函数关系,则r=1r=1或或r=-1;r=-1;如果变量如果变量Y Y与与X X间是统计关系,则间是统计关系,则-1r1, -1r0r0,如果,如果x,yx,y变变化的方向相反,如吸烟与肺功能的关系,则称为负相关,化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0r0.95 存在显著性相关;存在显著性相关;n|r| 0.8 高度高度相关;相关;n0.5 |r|0.8 中度中度相关;相关;n0.3 |r|0.

4、5 低度低度相关;相关;n|r|.5,认为,认为中度相关)中度相关)nP213 Data10-02 某次全国武术女子前某次全国武术女子前10名运动名运动员长拳和长兵器两项得分数据,要求分析这两项得员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(分是否存在线性相关(比较有用的结果:比较有用的结果: 秩相关系数秩相关系数r和和其相应的显著性概率其相应的显著性概率Sig(秩相关系数均秩相关系数均.5,认为中度相关),认为中度相关)2021-12-133 偏相关分析的概念 线性相关分析计算两个变量间的相关关系线性相关分析计算两个变量间的相关关系,分析两个变量间线性关分析两个变量间线性关

5、系的程度。往往因为第三个变量的作用系的程度。往往因为第三个变量的作用,使相关系数不能真正反映使相关系数不能真正反映两个变量间的线性程度。如身高、体重与肺活量之间的关系。如两个变量间的线性程度。如身高、体重与肺活量之间的关系。如果使用果使用Pearson相关计算其相关系数相关计算其相关系数,可以得出肺活量与身高和体可以得出肺活量与身高和体重均存在较强的线性关系。但实际上重均存在较强的线性关系。但实际上,如果对体重相同的人如果对体重相同的人,分析分析身高和肺活量身高和肺活量,是否身高越高是否身高越高,肺活量就越大呢?不是的。原因是肺活量就越大呢?不是的。原因是身高与体重有线性关系身高与体重有线性关

6、系,体重与肺活量存在线性关系体重与肺活量存在线性关系,因此得出身因此得出身高和肺活量之间存在着较强的线性关系的错误结论。高和肺活量之间存在着较强的线性关系的错误结论。偏相关分析的任务就是在研究两个变量之间的线性相关关系时控偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。制可能对其产生影响的变量。分析身高与肺活量之间的相关性,就要控制体重在相关分析中的分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。实际生活中有许多这样的关系,如可以控制年龄和工作经影响。实际生活中有许多这样的关系,如可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间

7、的相关关系。验两个变量的影响,估计工资收入与受教育程度之间的相关关系。可以在控制了销售能力与各种其他经济指标的情况下,研究销售可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等。量与广告费用之间的关系等。2021-12-133 偏相关分析的SPSS过程和实例菜单:菜单:Analyze+Correlate+PartialnVariables:分析变量:分析变量nControlling for:控制变量:控制变量实例实例P220Data10-03 使用四川绵阳地区使用四川绵阳地区3年生中山柏的数据,年生中山柏的数据,分析月生长量分析月生长量hgrow与月平均气温与月平

8、均气温temp、月降雨量、月降雨量rain、月平、月平均日照时数均日照时数hsun、月平均湿度、月平均湿度humi这四个气候因素的哪个因素这四个气候因素的哪个因素有关。有关。n将月生长量将月生长量hgrow作为分析变量,作为分析变量,n然后分四次,分别将其中的一个因素作为分析变量,而其他三个作然后分四次,分别将其中的一个因素作为分析变量,而其他三个作为控制变量为控制变量n用用Pearson相关系数相关系数n结果结果P223:中山柏生长量与气温中山柏生长量与气温temp关系最为密切,相关系数关系最为密切,相关系数0.9774,显著性概率,显著性概率p=0.000;其次是湿度;其次是湿度humi,

9、相关系数,相关系数0.7310,显著性概率,显著性概率p=0.025;日照时数;日照时数hsun,相关系数,相关系数0.6318,显著性概率显著性概率p=0.068;与降雨量没有线性关系,降雨量过大,还会;与降雨量没有线性关系,降雨量过大,还会影响其生长。影响其生长。2021-12-134 距离分析是对观测量之间或变量之间相似或不相似程度的一种是对观测量之间或变量之间相似或不相似程度的一种测度,是一种广义的距离。测度,是一种广义的距离。有关的统计量。有关的统计量。n不相似性测度:不相似性测度:a、对等间隔、对等间隔(定距定距)数据的不相似数据的不相似性(距离)测度可以使用的统计量有性(距离)测

10、度可以使用的统计量有Euclid欧氏距欧氏距离、欧氏距离平方等。离、欧氏距离平方等。 b、 对计数数据使用卡方。对计数数据使用卡方。 c、对二值(只有两种取值)数据,使用欧氏距离、对二值(只有两种取值)数据,使用欧氏距离、欧氏距离平方、尺寸差异、模式差异、方差等欧氏距离平方、尺寸差异、模式差异、方差等n相似性测度:相似性测度:a、等间隔数据使用统计量、等间隔数据使用统计量Pearson相关或余弦。相关或余弦。 b、测度二元数据的相似性使用的统、测度二元数据的相似性使用的统计量有计量有20余种。余种。距离分析分为观测量之间距离分析和变量之间距离分距离分析分为观测量之间距离分析和变量之间距离分析。

11、析。2021-12-13距离分析实例实例实例P227Data10-03 仍使用四川绵阳地区仍使用四川绵阳地区3年生中山柏的数据。年生中山柏的数据。菜单:菜单:Analyze+Correlate+Distance观测量间的距离分析(不相似性测度,使用欧氏距离),分析月生长量观测量间的距离分析(不相似性测度,使用欧氏距离),分析月生长量hgrownVariables分析变量:月生长量分析变量:月生长量hgrownLabel Case by:月份:月份MonthnCompute Distances:Between CasenMeasure:不相似性测度:不相似性测度n结果结果P228:观测量间的欧氏

12、距离(观测量间的欧氏距离(1月与月与8月的生长量最不相似,其欧氏距离值为月的生长量最不相似,其欧氏距离值为19.290,而,而1月与月与2月生长量不相似性最小,值为月生长量不相似性最小,值为0.490)变量间的不相似性变量间的不相似性nVariables分析变量:分析变量:temp、rain、hsun、huminCompute Distances:Between VariablesnMeasure:不相似性测度,欧氏距离,:不相似性测度,欧氏距离,n分析变量测度的单位不同,所以要进行标准化,分析变量测度的单位不同,所以要进行标准化,Transform Values:By Variable,Z

13、Scoren结果结果P229:变量间的欧氏距离矩阵(不相似矩阵)变量间的欧氏距离矩阵(不相似矩阵)n还可以重新进行相似性分析,得还可以重新进行相似性分析,得Pearson相关系数矩阵,然后跟欧氏距离矩阵相比较。相关系数矩阵,然后跟欧氏距离矩阵相比较。5 引进其他变量后的交互分析引进其他变量,详细分析两个变量之间引进其他变量,详细分析两个变量之间的关系,因为两个变量之间的关系可能的关系,因为两个变量之间的关系可能受到其他变量的影响,对于其他变量与受到其他变量的影响,对于其他变量与这两个变量之间的关系到底怎么样,依这两个变量之间的关系到底怎么样,依据作用的形式,可以分为三种情况:据作用的形式,可以

14、分为三种情况:5.1因果分析因果分析因果分析explanation model主要关心的是主要关心的是X与与Y是否真的有因果关系是否真的有因果关系前置变量或控制变量前置变量或控制变量例例一一:结婚年龄与身体状况之间存在高:结婚年龄与身体状况之间存在高相关,二者之间是否真的有因果关系?相关,二者之间是否真的有因果关系? 年龄(年龄(A) 婚龄(婚龄(X) 犯病率(犯病率(Y)控制的方法:分类采用统计控制的方法采用统计控制的方法也就是用也就是用SUB-TABLES的方法来说明,所谓分表就的方法来说明,所谓分表就是根据前置变量是根据前置变量A的值,把样本的个案分组,然后分析每个组与的值,把样本的个案

15、分组,然后分析每个组与X与与Y之间的之间的关系。假定年龄分为两个组(关系。假定年龄分为两个组(1:5065岁以下;岁以下;2:65岁以上),那么,岁以上),那么,根据年龄可以分为两个表:根据年龄可以分为两个表:65岁以下的人的结婚年数与身体状况;岁以下的人的结婚年数与身体状况;65岁以岁以上的人的结婚年数与身体状况。通过上的人的结婚年数与身体状况。通过SPSS中得到的中得到的CROSSTABS命令,把命令,把年龄作为控制变量,就可以对结婚年数与身体状况之间是否真的存在因果关年龄作为控制变量,就可以对结婚年数与身体状况之间是否真的存在因果关系进行分析。系进行分析。操作步骤:操作步骤:1看要研究的

16、两个现象看要研究的两个现象X与与Y 之间的交互表之间的交互表2加控制变量(可以是一个或加控制变量(可以是一个或2个)个)看分表的相关系数,了解控制变量看分表的相关系数,了解控制变量对现象的影响。对现象的影响。总表分表相关系数结论模式RR1=R2=0虚假相关 AX YRR1=R2=R真实相关AX YRR1小于RR2小于R部分真实相关AX Y例二:例二:住房拥挤对夫妻冲突的影响住房拥挤对夫妻冲突的影响夫妻冲突住房拥挤高低高63.841.6低36.258.4总数599401G=0.423住户拥挤是否是夫妻冲突的主要原因? 答案是不一定,冲突的真实原因也许是经济因素.分析夫妻冲突富户拥挤3中等户拥挤2

17、贫困户拥挤1高2低1高2低1高2低1高21356023892919低18530562276178总数2209029411485197ConflictEconomicHouseclfre23213513285231601313022223812256221921212221291127621119111178在控制家庭经济水平以后在控制家庭经济水平以后,住房拥挤与夫妻住房拥挤与夫妻冲突的关系消失冲突的关系消失,结论结论:住户拥挤与夫妻冲住户拥挤与夫妻冲突的因果关系是虚假的突的因果关系是虚假的,这两个变量之间的这两个变量之间的相关可能是家庭经济水平引起的相关可能是家庭经济水平引起的.S Sy ym

18、 mm me et tr ri ic c M Me ea as su ur re es s.052.213.239.811282.008.140.058.954408-.115.130-.889.374310GammaOrdinal by OrdinalN of Valid CasesGammaOrdinal by OrdinalN of Valid CasesGammaOrdinal by OrdinalN of Valid CasesECONOMIC1.002.003.00ValueAsymp. Std.ErroraApprox. TbApprox. Sig.Not assuming th

19、e null hypothesis.a. Using the asymptotic standard error assuming the null hypothesis.b. 5.2阐明分析(又称因果环节)阐明分析(又称因果环节)阐明分析(又称因果环节)Interpretation analysis关心的是为什么关心的是为什么X会影响会影响Y阐明分析要做的工作就是以事实来验证:阐明分析要做的工作就是以事实来验证:X是通过某是通过某些因素(些因素(T)而对)而对Y产生影响的。产生影响的。T被称为中介变量。被称为中介变量。 如何分辨某一个变量是控制变量还是中介变量?如何分辨某一个变量是控制变量还

20、是中介变量?控制变量控制变量发生在发生在X与与Y之前之前中介变量中介变量在在X与与Y发生时间的中间发生时间的中间总表分表相关系数结论模式RR1=R2=0第三个变量是中介变量 XTY完全阐明RR1=R2=R第三个变量不是中介变量AX Y不能阐明RR1小于RR2小于R部分通过第三个变量AX Y 部分阐明举例:为什么比较贫困的家庭少年犯罪的比较高?是否由于为什么比较贫困的家庭少年犯罪的比较高?是否由于比较贫困的家庭中父母的争吵多,导致了儿女社会化比较贫困的家庭中父母的争吵多,导致了儿女社会化过程中的问题?阐明分析的作用就是要用事实来证明过程中的问题?阐明分析的作用就是要用事实来证明X是否通过某些因素

21、对是否通过某些因素对Y产生影响。也就是产生影响。也就是X变动引起变动引起T变动变动T变动引起变动引起Y变动。如果控制变动。如果控制T以后发现以后发现X变化变化,但是,但是Y没有变化,那么说明没有变化,那么说明T是是X与与Y发生作用的关键发生作用的关键性因素,证明性因素,证明X是通过这个中介变量来影响是通过这个中介变量来影响Y的。如果的。如果控制控制T以后,以后,X变动以后变动以后Y也是变动的,说明也是变动的,说明T是无关紧是无关紧要的。要的。在在SPSS中对中对T进行控制的方法与上面的比较,在操作进行控制的方法与上面的比较,在操作上并没有什么不同,控制上并没有什么不同,控制T以后,通过以后,通

22、过CROSSTABS把把原来的表分成几个分表,然后对相关系数进行比较。原来的表分成几个分表,然后对相关系数进行比较。例子:调查发现例子:调查发现300个年纪相近的妇女(个年纪相近的妇女(35-40岁)教育水平越高,岁)教育水平越高,子女数目越少,为什么?(子女数目越少,为什么?(G=-0.7)研究猜想:结婚年龄在其中起作用。也就是由于教育水平高的妇女,研究猜想:结婚年龄在其中起作用。也就是由于教育水平高的妇女,结婚晚,生育的子女少。结婚晚,生育的子女少。做做CROSSRABS:晚婚妇女:教育水平与子女数目的相关系数:晚婚妇女:教育水平与子女数目的相关系数G=-0.71;早婚妇女:教育水平与子女

23、数目的相关系数早婚妇女:教育水平与子女数目的相关系数G=-068。研究结论:由于两个分表的相关系数与原来的相关系数十分接近研究结论:由于两个分表的相关系数与原来的相关系数十分接近,说说明晚婚的说法不能阐明教育水平与子女数目是反比关系的情况。明晚婚的说法不能阐明教育水平与子女数目是反比关系的情况。操作步骤:操作步骤:1做做XT,TX的交互表的交互表2控制控制T,看,看X与与Y之间的关系之间的关系3进一步的分析,比较相关系数。可以再引入其他的变量,看这个分进一步的分析,比较相关系数。可以再引入其他的变量,看这个分表的相关系数。如果发现分表的相关系数与原来的差别很大,可以表的相关系数。如果发现分表的

24、相关系数与原来的差别很大,可以认为这个变量是中介变量。认为这个变量是中介变量。例子二例子二: 已婚女工的已婚女工的旷旷工率高于单身女工工率高于单身女工加入控制变量:家务劳动多少5.3条件分析 conditional analysis条件分析关心的是在不同的情况下,条件分析关心的是在不同的情况下,X与与Y会有不同的会有不同的关系吗?它是以第三类变量作为基础来了解关系吗?它是以第三类变量作为基础来了解X与与Y在不在不同的情况下的关系。同的情况下的关系。 在社会学的研究中,值得关注的是第二种情况,在社会学的研究中,值得关注的是第二种情况,X与与Y之间本来没有关系或关系很弱,但在表明了若干条件以之间本

25、来没有关系或关系很弱,但在表明了若干条件以后,后,X与与Y的关系强大起来,这种研究在社会学中有很重的关系强大起来,这种研究在社会学中有很重要的意义。要的意义。 条件分析的作用:就是以第三个变量作为基础来了解条件分析的作用:就是以第三个变量作为基础来了解X与与Y在不同情况下的关系,条件分析以第三类变量的各个在不同情况下的关系,条件分析以第三类变量的各个值来代表不同的情况,所以第三类变量称为条件变量。值来代表不同的情况,所以第三类变量称为条件变量。进行条件分析也可以使用分表法,依据条件变量的值把进行条件分析也可以使用分表法,依据条件变量的值把样本分为几个组,然后在每组(每种条件下)分析样本分为几个

26、组,然后在每组(每种条件下)分析X与与Y之间的关系。如果在各个组中之间的关系。如果在各个组中X与与Y在不同的组中有不在不同的组中有不同的关系说明同的关系说明X与与Y之间的关系具有条件性。之间的关系具有条件性。总表分表及相关系数结论R不等于0分表相关系数不等于原来的表引入的这个变量是条件变量R等于0分表的相关系数不等于0引入的变量是压抑变量R大于0分表的相关系数小于0引入的变量是曲解变量举例:某个城市研究住户拥挤(举例:某个城市研究住户拥挤(X)与家庭冲突()与家庭冲突(Y)之)之间的关系,发现间的关系,发现G=0.55。研究猜想:两个变量之间的关系是否取决于家庭规模?研究猜想:两个变量之间的关系是否取决于家庭规模?把家庭规模引入,分组,把家庭规模引入,分组,看:大家庭中的拥挤与冲突之间的关系看:大家庭中的拥挤与冲突之间的关系小家庭中的拥挤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论