




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第8章:相关分析Correlations,8.1相关分析,8.1.1统计关系与函数关系客观事物之间的关系大致可分为两大类关系:(1)函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。(2)统计关系:两事物之间的一种非一一对应的关系,即当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。,8.1.2线性相关和非线性相关统计关系可再进一步分为:(1)线性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐标系中,如现象观察值的分布大致在一条直线上,则现象之间的相关关系为线性相关或直线相关(Linearcorrelation)。(2)非线性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上,则变量之间的相关关系为非线性相关或曲线相关(Curvilinearcorrelation),8.1.3正线性相关与负线性相关线性相关可以分为:(1)正线性相关:两个变量线性的相随变动方向相同。(2)负线性相关:两个变量线性的相随变动方向相反。,8.1.4相关分析如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是相关分析。如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。绘制散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果。,8.2绘制散点图,8.2.1散点图的特点散点图:是将数据以点的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。在实际分析中,散点图经常表现出某些特定的形式。如绝大多数的数据类似于“橄榄球”的形状,或集中形成一根“棒状”,而剩余的少数数据点则零散地分布在四周。通常“橄榄球”和“棒状”代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描绘出来,是数据的主要特征更突出。,r=1,r=0.70.8,r=0,r=0,r=-0.7-0.8,r=-1,完全正相关,正相关,无相关,完全负相关,负相关,无相关,8.2.2散点图应用举例,案例:利用住房状况问卷调查数据,分析家庭收入与打算购买的住房面积之间存在怎样的统计关系。(数据:住房状况调查.sav)操作:【图形(Graps)】【散点图(Scatter)】,简单散点图表示一对变量间统计关系的散点图将纵轴变量选入【Y轴】,将横轴变量选入【X轴】,将分组变量选入【设置标记】:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入【标注个案】:将标记变量的各变量值标记在散点图相应点的旁边。,8.3计算相关系数,8.3.1相关系数的特点利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:1.计算样本相关系数r;相关系数r的取值在-1+1之间r0表示两变量存在正的线性相关关系;r0.8表示两变量有较强的线性关系;|r|0.3表示两变量之间的线性关系较弱,2.对样本来自的两总体是否存在显著的线性关系进行推断。由于存在随机抽样和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的总体是否具有显著的线性相关性,而需要通过假设检验的方式对样本来自的总体是否存在显著的线性相关关系进行统计推断。基本步骤是:(1)提出原假设,即两总体无显著的线性关系。(2)选择检验统计量,即不同的相关系数。(3)计算检验统计量的观测值和对应的概率值。(4)决策:p与a的关系。,8.3.2相关系数的种类,对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有Pearson简单相关系数、Spearman等级相关系数和Kendall相关系数等。1.Pearson简单相关系数(适用于两个变量都是数值型的数据)Pearson简单相关系数的检验统计量为:,2Spearman等级相关系数,Spearman等级相关系数用来度量定序变量间的线性相关关系,设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据,而是利用数据的秩,用两变量的秩代替代入Pearson简单相关系数计算公式于是其中的和的取值范围被限制在1和n之间,且可被简化为:,如果两变量的正相关性较强,它们秩的变化具有同步性,于是的值较小,r趋向于1;如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是的值较大,r趋向于0;小样本下,在零假设成立时,Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为Z统计量,定义为Z统计量近似服从标准正态分布。,3.Kendall相关系数,(1)用非参数检验方法度量定序变量间的线性相关关系(2)利用变量秩数据计算一致对数目和非一致对数目。当两个变量具有较强的正相关关系,则一致对数目较大,非一致对数目较小,当两个变量具有较强的负相关关系,则一致对数目较小,非一致对数目较大,当两个变量相关性较弱,则一致对数目和非一致对数目大致相等,,Kendall相关系数在小样本下,Kendall相关系数服从Kendall分布;在大样本下,Kendall相关系数的检验统计量为Z统计量,定义为:Z统计量近似服从标准正态分布。,8.3.3计算相关系数的应用举例,对于案例8-1,通过绘制散点图得知家庭收入与计划购买的住房面积之间存在一定的正的弱相关关系,为更确定地反映两者之间线性关系的强弱,采用计算相关系数的方法。由于这两个变量为定距变量,故采用Pearson相关系数。【分析(Analyze)】【相关(correlate)】【两变量(bivariate)】,因p=0.000a(0.01)故拒绝原假设,即拒绝零相关因相关系数为0.323,意味着两者存在弱相关。,8.4偏相关分析,8.4.1偏相关分析和偏相关系数(1)简单相关系数研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。例如,研究商品的需求量、价格和消费者收入之间的线性关系时,需求量和价格的相关关系实际还包含了消费者收入对价格和商品需求量的影响。此时,单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关因素影响的条件下计算变量间的相关。偏相关的意义就在于此。,(3)偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。(4)控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。,偏相关系数的分析步骤,(1)计算样本的偏相关系数假设有三个变量y、x1和x2,在分析x1和y之间的净相关时,需控制x2的线性作用,则x1和y之间的一阶偏相关定义为:偏相关系数的取值范围及大小含义与相关系数相同。,(2)对样本来自的两总体是否存在显著的净相关进行推断,检验统计量为:其中,r为偏相关系数,n为样本数,q为阶数。t统计量服从n-q-2个自由度的t分布。,8.4.2偏相关分析的应用举例,对于案例8-1,已经分析了家庭收入与计划购房面积之间的相关性。直观感觉这种相关性会受到家庭常住人口数影响。为此可将家庭常住人口数作为控制变量,对家庭收入与计划购房面积作偏相关分析。【分析(analyze)】【相关(correlate)】【偏相关(partial)】,相关分析因p=0.000a(0.01)故拒绝原假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025全国统考教师资格考试《教育教学知识与能力(小学)》通关题库有答案详解
- 2025年公务员考试时事政治测试卷附有答案详解附答案详解【黄金题型】内部题库
- 年度院感汇报课件
- 2025年中州实验室招聘25名高层次人才笔试高频难、易错点备考题库含答案详解
- 子宫腺肌症影像课件
- 年度安全培训计划审批表课件
- 年度安全培训
- 年底车间安全培训感受与收获
- 杭州市余杭区事业单位统一招聘笔试真题2024
- 工业容器维修培训课件
- T/CCOA 51-2023生湿面条生产加工技术规程
- 2025年中国燃气用埋地聚乙烯(PE)管材数据监测报告
- 返还房产协议书范本
- 幼儿园小班科学公开课《美丽的菊花》课件
- DBJ50-T-200-2024 建筑桩基础技术标准
- 线下股份协议书范本
- 1.团体标准《腹部减脂塑形手法操作技术规程》(征求意见稿)
- 手术室医院感染管理制度
- 食品安全月调度会议
- 七年级上册道德与法治情境题集合
- 《材料电学性能》课件
评论
0/150
提交评论