版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第四章,相关测量法与测量层次,相关测量的六种情况,两个定类变量 两个定序变量 两个定距变量 一个定类变量与定序变量 一个定类变量与定距变量 一个定序变量与定距变量,第一节 两个定类变量,Lambda 相关测量法 基本逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。消减的误差在全部误差中所占的比例愈大,就表示这两个变量的相关越强。 Lambda 相关测量法有两种形式。一种是对称形式,简写是系数,即不分自变量与因变量。另一种是不对称形式,简写是y系数,即要求一个是自变量,一个是因变量。,系数,E1的定义: 未知y与x有关之前,如果预测y值,唯
2、一可资依据的就是y本身的分布。由于y与x无关,所以只能根据y的行边缘和(与x无关)去预测y,也即由y的行边缘和中最大者众值,去预测y,可能性最大。 E1 = n max(n*j) (即总频次n减去y的行边缘和中最大者) 分析: (1)E1 = 0 (E1最小)当 max(n*j) = n 时,E1 = 0。也即众值极大,异众比率为0,此时众值代表性最高,故E1为0。 (2)E 1 = n (E1最大)当 max(n*j) = 0 时,E1 = n。也即众值为0,异众比率最大,此时众值代表性最低,故E1为n。,E2的定义: 当已知y与x有关之后,如果再去预测y值,则可借助x预测y。即用各类x条件
3、下,y的条件分布中的众值去预测y,可能性最大。 E2 = n max(nij) 分析: 1)E2 = 0 (即max(nij) = n,即各类x条件下的众值皆为最大值) 2)E2 = n (即max(nij) = 0,即各类x条件下的众值皆为最小值),系数计算公式,其中,My=Y变量的众值次数, Mx=X变量的众值次数 my=X变量的每个值(类别)之下Y变量的众值次数 mx=Y变量的每个值(类别)之下X变量的众值次数,例:对称与不对称系数,表 青年人与其知心朋友的志愿,系数与尤拉Q系数,系数的缺点,Lambda相关测量法的特点是以众值作为预测的准则,不理会众值以外的次数分布。因此,如果全部众值
4、集中在条件次数表的同一列或同一行中,则Lambda系数便会等于0.,tau-y相关测量法,tau-y是不对称相关测量法,这个方法是在计算系数值时会包括所有的边缘次数和条件次数。,其中: n=全部个案书目, f=某条件次数 Fy=Y变量的某个边缘次数 Fx=X变量的某个边缘次数,再以饮食习惯表为例:,练习题1,题:以下是某高校对高、低年级学生求职意愿的抽样调查。问:(1)计算不对称Lambda系数;(2)计算tau-y系数;(3)建立条件百分表。,第二节 两个定序变量,Gamma系数 级序相关法的基本逻辑是要求出;根据任何两个个案在某变量上的等级来预测他们在另一个变量上的等级时,可以减少的误差是
5、多少。 同序对与异序对:假设样本的全部个案数目是n,就会组成1/2n(n-1)对个案。某对个案在两个变量上的相对等级时相同,则成为同序对;如果是不相同,则成为异序对。,同序对与异序对,同分对,两个个案在某变量上次序相对,无法分高低,即同分对。通常以Tx代表只在X变量上同分的对数,以Ty代表只在Y变量上同分的对数,而以Txy代表在两个变量上都是同分的对数。,Gamma系数,Gamma系数的计算公式如下: 其中:Ns 是同序对数,Nd异序对数。 G的绝对值越大,就表示所犯的错误可能性越小,G是负值,则如果知道一对个案在某个变量的相对等级,就应该估计他们在另一个变量上的相对等级是相反的。反之亦然。,
6、求下表G系数,G系数是属于对称相关测量法。如果是非对称,即一个是自变量,一个是因变量,则适宜于简化不对称关系的萨默斯dy系数。,萨默斯dy系数,dy的计算公式如下: 其中:Ns 是同序对数,Nd异序对数,Ty是只在因变量上同分的对数。 假设积极性等级是x,产量是Y,求dy,计算列联表的同序对与异序对,同序对:n1(n5+n6+n8+n9)+n2(n6+n8)+n4(n8+n9)+n5(n9),异序对:n7(n2+n5+n3+n6)+n4(n2+n3)+n8(n3+n6)+n5(n3),计算列联表的同分对,同分对:Tx=n1(n2+n3)+n2(n3)+n4(n5+n6)+n5(n6)+n7(n
7、8+n9)+n8(n9),同分对:,例:计算G系数与dy系数,婚姻美满,文化程度,同序对:9(30+18+4+7)+8(4+7)+16(18+7)+30(7)=1229 异序对:5(8+30+3+4)+18(3+4)+16(8+3)+30(3)=617 同分对:9(16+5)+16(5)+8(30+18)+30(18)+3(4+7)+4(7)=1254 G系数=0.33 dy系数=0.22,肯德尔的tau系数,tau系数的基本逻辑是计算同序对数与异序对数之差在全部的可能对数中所占的比例。公式如下:,其中m是列联表中行数与列数中的较小者。,斯皮尔曼rho系数,斯皮尔曼rho系数的特点是计算每个个
8、案在两个变量上的等级时,不仅要区别两者的高低差异,而且还要计算二者差异的确切数值。 其中D表示每个个案在两列级序上的差异值,n表示全部个案数目。D平方可以避免正负值抵消 rho系数是对称相关测量法,要求同分情况不多,统计值在-1至1之间。其平方值可以有消减误差比例的意义。,求斯皮尔曼rho系数,第三节 两个定距变量,简单线性回归分析法 简单线性回归时根据一个直线方程式,以一个自变量X的数值来预测一个因变量Y的数值。目的是要找出一个错误最小的方法来预测因变量的数值。 其中X是自变量数值;b成为回归系数,表示回归线的斜率;a是截距,是回归线与Y轴的交点;是根据回归方程所预测的Y变量值。,最小二乘法
9、,回归法在绘制回归线时所根据的准则是最小二乘法。假定我们根据一条直线来以自变量X估计因变量的某个值,所估计的值是Y1,而实际上该值是Y2,则误差便是:e=Y2-Y1 各个e相加起来就是误差总数,为防止正负值相抵消的问题,改为e的平方值相加起来,即直线应使 最小。,计算公式,斜率 截距 其中X是自变量值, 是自变量的均值,Y是因变量值, 是因变量的均值,n是全部个案数目。,例1:计算回归方程,回归与相关,线性回归方程不仅具有简化资料的作用,而且可以推广应用于预测或估计样本之外个案的数值。 回归系数(b)表示X对Y的影响有多少,指每增加一个单位的X值时Y值的变化有多大。 B值是表示自变量对因变量的
10、影响的大小与方向,它是不对称关系的统计法。 回归方程不具有消减误差比例作用,一般在计算回归方程时须进行相关系数测量。如果相关系数比较小,消减误差比例太少,则不适合作线性回归方程。,积矩相关测量法,b系数没有上限,很少用来比较变量与变量之间的相关程度。而且容易受到统计单位的影响。 r系数与b系数的不同地方,是r系数假定X与Y的关系是对称的,而且r的统计值是-1至1,同时r2具有消减误差比例的意义。r2称为决定系数。,r系数,r系数计算公式如下: r系数与简单线性回归都是假定X与Y的关系具有直线的性质。如果非直线,就会犯错误。,直线与非直线,第四节 定类变量与定距变量,相关比率,又称为eta平方系数(E2),是以一个定类变量为自变量,来预测或估计以一个定距变量为因变量的值。 其中,Y是因变量的值, 是因变量的均值; 是自变量值(Xi)上各因变量的均值。,表1 20名学生的家庭职业背景对英文水平的影响,英文水平(得分),非线性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园书记培训课件
- 哈丽法塔外幕墙单元体专项施工方案
- 2024年苏州职业技术大学马克思主义基本原理概论期末考试题含答案解析(必刷)
- 人货梯基础专项施工方案
- 2025年广丰县幼儿园教师招教考试备考题库附答案解析(夺冠)
- 2024年西安邮电大学马克思主义基本原理概论期末考试题及答案解析(夺冠)
- 2024年金溪县招教考试备考题库带答案解析
- 2025年青海省联合职工大学马克思主义基本原理概论期末考试模拟题附答案解析(夺冠)
- 2025年新昌县招教考试备考题库带答案解析(夺冠)
- 2025年兰州理工大学马克思主义基本原理概论期末考试模拟题带答案解析(夺冠)
- 2026年山东药品食品职业学院单招综合素质考试备考试题含详细答案解析
- GB/T 46878-2025二氧化碳捕集、运输和地质封存地质封存
- 雷波县粮油贸易总公司 2026年面向社会公开招聘备考考试试题及答案解析
- 2026年1月浙江省高考(首考)历史试题(含答案)
- 疗养院员工劳动保护制度
- 云南省昆明市五华区2023-2024学年高一上学期1月期末考试地理
- HGT 20714-2023 管道及仪表流程图(P ID)安全审查规范 (正式版)
- 初高中生物知识衔接问题分析教学专业知识讲座
- 语文高考题小说说题比赛
- 建筑砌筑工(中级)理论考试题库及答案
- 2022-2023学年安徽省合肥重点中学七年级(下)期中数学试卷-普通用卷
评论
0/150
提交评论