版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十四相关分析第1页,共44页,2023年,2月20日,星期二第一节相关、相关系数与散点图一、什么是相关第2页,共44页,2023年,2月20日,星期二变量间的关系可以分成两类一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示,它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。另一类是变量间关系不存在完全的确定性关系,不能用精确的数学公式来表示,如人的身高与体重的关系;统计学中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。常常用相关系数或回归方程来描述。第3页,共44页,2023年,2月20日,星期二事物间的关系解释为:因果关系共变关系相关关系这是从变量的事物本性角度出发,而前面是从变量的数理特征的角度出发。第4页,共44页,2023年,2月20日,星期二二、相关系数样本间相关系数用r表示总体间相关系数用ρ来表示-1≤r≤1第5页,共44页,2023年,2月20日,星期二三、散点图
第6页,共44页,2023年,2月20日,星期二相关告诉我们变量X和Y之间关系的3个特征1)关系的方向正相关(正数)意味着两个变量向相同的方向变化.亦即,一个变量增加,另一个变量也增加.负相关(负数)意味着两个变量向相反的方向变化.亦即,一个变量增加,另一个变量反而减少.第7页,共44页,2023年,2月20日,星期二2)关系的形式
本课集中讨论线性(直线)相关,但两变量的关系也有其他形式第8页,共44页,2023年,2月20日,星期二图8-1(x,y)的散点图第9页,共44页,2023年,2月20日,星期二3)关系的强度相关也度量了X和Y间关系的强度.相关系数的值在-1和+1之间.0相关意味着没有关系.+1意味着"完全的正相关"之间两个,-1意味着完全的负相关.r=0.7高度相关,r=0.5中度相关,r=0.3明显相关,r=0.1~0.29小效应r=0.3~0.49中等效应r=0.5以上大的效应第10页,共44页,2023年,2月20日,星期二3)为什么(以及何时)要用到相关?⑴预测-如果两个变量间有强相关,我们就可以根据一个变量的值,预测另一个变量的值。如,如果知道胎儿头部的超声波尺寸与婴儿出生时体重有正相关,则可预测婴儿出生时体重第11页,共44页,2023年,2月20日,星期二(3)信度–
如果对同一组被试两次用相同的测验,将两组分数做相关.如果测验是可信的,两次测验应当得到相似的结果,产生高相关(2)效度–
如果发明新的心理测验(测验A),想知道它是否测量了X,就需要知道测验A是否与X相关.如,如果发明新的量表来预测管理潜能量表来预测晋升所需时间,这个量表分数应当与晋升所需时间相关。(4)理论验证–
许多理论预测不同的变量之间存在某种关系.然后我们收集数据,来考察这样的关系是否存在
第12页,共44页,2023年,2月20日,星期二第二节积差相关一、概念及其适用的范围1、积差相关又叫皮尔逊相关,是英国统计学家皮尔逊(高尔顿之学生)提出的一种计算相关的方法。是用来揭示两个变量相关方向和程度最常用的和基本的方法。2、积差相关的使用条件使用条件:①数据要成对,一般大于30对(文中例子是不够的,只是说明关系和计算方法)。②两个变量的总体都是正态分布,至少是单峰对称的,样本的分布并不一定要求正态。
③两个变量都是连续变量,也即两列变量是测量数据④两个变量的关系是直线性的。
第13页,共44页,2023年,2月20日,星期二二、计算积差相关系数的基本公式(一)定义公式r=X和Y共同变化的程度
X和Y各自变化的程度
=X和Y的协方差
X和Y各自的标准差
在概念上是什么意思?第14页,共44页,2023年,2月20日,星期二协方差协方差是两个变量的离均差乘积和的平均数,公式为它能反映两个变量的一致性,但是不能直接用来表示两个变量的一致性,因为它是带有具体单位的绝对数量,不能与单位不同的资料比较,比如它的绝对值大不见得相关关系就强,为了克服这个缺点就用各自的标准差去除其离差,使其成为没有单位的标准分数,然后将两标准分数的乘积和除以N.第15页,共44页,2023年,2月20日,星期二定义公式
第16页,共44页,2023年,2月20日,星期二(二)计算积差相关的差法计算公式1、减差法1、加差法第17页,共44页,2023年,2月20日,星期二第三节等级相关等级相关是指以等级次序排列或以等级次序表示的变量之间的相关主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。第18页,共44页,2023年,2月20日,星期二一、斯皮尔曼等级相关(一)适用范围1、是两列等级变量性质数据2、两者具有线性关系3、总体分布可以不是正态,4、样本容量可以是小于30个。它可以算是皮尔逊相关的特殊形式,如果符合积差相关条件的数据使用斯皮尔曼等级相关的话,会降低精确度。第19页,共44页,2023年,2月20日,星期二(二)计算公式
1、一般计算公式第20页,共44页,2023年,2月20日,星期二2有相同等级时候计算方法第21页,共44页,2023年,2月20日,星期二二、肯德尔等级相关(一)适用范围,当多个变量值以等级次序表示,求这几个变量间的相关系数,我们常用肯德尔和谐系数来表示,或者称肯德尔W系数第22页,共44页,2023年,2月20日,星期二(二)公式计算1、无相同等级的情况当同一位评定者对所有被评事物的评定没有相同等级的时候,计算公式为Ri表示K个评定者对同一事物给出的等级之和,SSR为R的离差平方和,K代表等级评定者的数目,N表示被评事物的个数。评分者越是高度一致,被评价者的等级和(Ri)的
离散程度(SSR)就越大,而公式的分母部分就是它的极大值第23页,共44页,2023年,2月20日,星期二rw值的分布范围与意义rw的值界于0到1之间Rw不是标准的相关系数。但可以看成是所以可能评定者对评定等级的Spearman相关系数的函数。第24页,共44页,2023年,2月20日,星期二2、有相同等级的情况∑T=∑(n3-n)/12,n为相同等级的数目。第25页,共44页,2023年,2月20日,星期二第四节质与量的相关需计算相关的变量一列为等比或者等距的测量数据,另一列是按性质划分的类别,求这样的两列变量的直线相关,称之为质量相关,包括二列相关,点二列相关以及多系列相关。简单地说就是一个变量为质,另外一个变量为量的时候来计算它们的线性相关称为质量相关。第26页,共44页,2023年,2月20日,星期二一、点二列变量(一)、概念及其适用范围当两个变量中一个是正态连续性变量,另外一个是真正的二分称名变量(例如,男与女,已婚与未婚等)这时表示这两个变量间的相关,称为点二列相关,有时候一个变量并非真正的二分变量,而是双峰对称分布的变量,也可以用点二列相关来表示。第27页,共44页,2023年,2月20日,星期二(二)基本计算公式第28页,共44页,2023年,2月20日,星期二二、二列相关(课外自主学习)(一)概念及其适用范围当两个变量都是正态连续变量(等比或等距),其中一个变量被人为地划分成二分变量(如把某项能力测验划分及格或不及格,健康状况划分成好与差等等),表示这样的两个变量的间的相关称为二列相关。第29页,共44页,2023年,2月20日,星期二二列相关的使用条件
(1)两个变量都是连续变量,而且总体呈正态分布,或总体接近正态分布,至少是单峰对称的。(2)两个变量之间是线性关系(3)二分变量是人为划分,而且划分界点应该尽量靠近中数值(4)样本容量应该大于80第30页,共44页,2023年,2月20日,星期二(二)二列相关的计算公式第31页,共44页,2023年,2月20日,星期二三、多列相关(课外自主学习)(一)概念及其适用范围
当两个变量都是正态连续变量(等比或等距),其中一个变量被人为地划分成多种类别(如把某项能力测验划分优良中差,健康状况划分成好,一般与差等等),表示这样的两个变量的间的相关称为多列相关。第32页,共44页,2023年,2月20日,星期二(二)公式及解释多列相关的计算公式由积差相关系数公式推导出来的。第33页,共44页,2023年,2月20日,星期二第五节品质相关两个变量都划分成几种品质,计算他们的相关的方法因而称为品质相关。品质相关处理的数据一般都是计数数据,而非测量数据。品质相关根据变量的性质及其分类项目不同,有不同的名称和计算方法。主要有四分相关,Φ
相关,列联表相关等。第34页,共44页,2023年,2月20日,星期二一、四分相关(一)概念及其适用范围当两个变量都是正态连续变量,且两者呈直线关系,但二者被人为划分成二分变量,通常计算四分相关的资料会整理成四格表,表示这两个变量的相关,称为四分相关。第35页,共44页,2023年,2月20日,星期二(二)计算公式计算四格表的最常用的方法是皮尔逊的余弦法(近似计算法)第36页,共44页,2023年,2月20日,星期二二、Φ
相关当两个相互关联的变量分布都是真正的二分变量(在教育统计中有时也可以用在人为二分的变量),在两个变量中间都有真正的缺口的时候,用phi系数来描述此类点分布的问题,故叫phi相关。第37页,共44页,2023年,2月20日,星期二计算公式
第38页,共44页,2023年,2月20日,星期二公式中分子是四格表各条边的计数之和的乘积开平方根。当Φ小于0.3时候表示相关弱,当Φ大于0.6的时候相关较强。第39页,共44页,2023年,2月20日,星期二三、列联表相关(一)概念及其适用范围当两个变量都被分成两个以上的类别,或其中一个变量被分成两个以上的类别,表示这两个变量间的相关,称为列联相关。第40页,共44页,2023年,2月20日,星期二(二)公式计算第41页,共44页,2023年,2月20日,星期二列联表的值C最大达不到1,四格表最大值0.707,3*3表最大0.816,因此两个变量最好不要小于5*5。符合积差相关的条件的数据计算列联相关要样本容量较大,R大于5,C大于5的时候,与积差相关系数的结果相近。第42页,共44页,2023年,2月20日,星期二第六节相关系数的选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川成都高新区招聘事业单位人员20人备考题库含答案详解(突破训练)
- 2026江西赣州市全南县公用市政建设集团有限公司招聘1人备考题库附参考答案详解【培优】
- 2026中国人民财产保险股份有限公司那曲分公司嘉黎县营销服务部招聘1人备考题库及答案详解【考点梳理】
- 2026陕西延安北方医院招聘备考题库及参考答案详解(满分必刷)
- 2026浙江嘉兴市桐乡市凤鸣高中招聘寝室生活管理人员若干名备考题库附参考答案详解(满分必刷)
- 2026北京大旺食品有限公司丰台分公司招聘8人备考题库及完整答案详解【网校专用】
- 2026黑龙江哈尔滨工业大学建筑与设计学院建筑数字化设计与技术研究所招聘人工智能工程师备考题库及完整答案详解(历年真题)
- 2026湖北武汉市第三医院骨干人才及成熟型人才招聘备考题库带答案详解(研优卷)
- 2026甘肃天水秦安县云山中心卫生院招聘1人备考题库附完整答案详解【历年真题】
- 2026广西百色市右江区城东社区卫生服务中心招聘公益性岗位2人备考题库及答案详解【真题汇编】
- 充装站安全绩效考核制度
- 2025年高考贵州卷物理真题(试卷+解析)
- 2026年高速公路安全驾驶培训
- 特殊作业奖惩制度范本
- EPC项目投标人承包人工程经济的合理性分析、评价
- 高警示药品管理制度考核试题及答案
- (完整版)合规管理办法
- 回族做礼拜的念词集合6篇
- 场地清表施工方案设计
- 光纤熔接机培训
- 电梯工程有限公司程序文件
评论
0/150
提交评论