社会统计学 第四章 相关测量法与变量层次ppt课件.ppt_第1页
社会统计学 第四章 相关测量法与变量层次ppt课件.ppt_第2页
社会统计学 第四章 相关测量法与变量层次ppt课件.ppt_第3页
社会统计学 第四章 相关测量法与变量层次ppt课件.ppt_第4页
社会统计学 第四章 相关测量法与变量层次ppt课件.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第四章 相关测量法与测量层次 相关测量的六种情况 两个定类变量两个定序变量两个定距变量一个定类变量与定序变量一个定类变量与定距变量一个定序变量与定距变量 第一节两个定类变量 Lambda相关测量法基本逻辑是计算以一个定类变量的值来预测另一个定类变量的值时 如果以众值作为预测的准则 可以减除多少误差 消减的误差在全部误差中所占的比例愈大 就表示这两个变量的相关越强 Lambda相关测量法有两种形式 一种是对称形式 简写是 系数 即不分自变量与因变量 另一种是不对称形式 简写是 y系数 即要求一个是自变量 一个是因变量 系数 E1的定义 未知y与x有关之前 如果预测y值 唯一可资依据的就是y本身的分布 由于y与x无关 所以只能根据y的行边缘和 与x无关 去预测y 也即由y的行边缘和中最大者 众值 去预测y 可能性最大 E1 n max n j 即总频次n减去y的行边缘和中最大者 分析 1 E1 0 E1最小 当max n j n时 E1 0 也即众值极大 异众比率为0 此时众值代表性最高 故E1为0 2 E1 n E1最大 当max n j 0时 E1 n 也即众值为0 异众比率最大 此时众值代表性最低 故E1为n E2的定义 当已知y与x有关之后 如果再去预测y值 则可借助x预测y 即用各类x条件下 y的条件分布中的众值去预测y 可能性最大 E2 n max nij 分析 1 E2 0 即 max nij n 即各类x条件下的众值皆为最大值 2 E2 n 即 max nij 0 即各类x条件下的众值皆为最小值 系数计算公式 其中 My Y变量的众值次数 Mx X变量的众值次数my X变量的每个值 类别 之下Y变量的众值次数mx Y变量的每个值 类别 之下X变量的众值次数 例 对称与不对称 系数 表青年人与其知心朋友的志愿 系数与尤拉Q系数 系数的缺点 Lambda相关测量法的特点是以众值作为预测的准则 不理会众值以外的次数分布 因此 如果全部众值集中在条件次数表的同一列或同一行中 则Lambda系数便会等于0 tau y相关测量法 tau y是不对称相关测量法 这个方法是在计算系数值时会包括所有的边缘次数和条件次数 其中 n 全部个案书目 f 某条件次数Fy Y变量的某个边缘次数Fx X变量的某个边缘次数 再以饮食习惯表为例 练习题1 题 以下是某高校对高 低年级学生求职意愿的抽样调查 问 1 计算不对称Lambda系数 2 计算tau y系数 3 建立条件百分表 第二节两个定序变量 Gamma系数级序相关法的基本逻辑是要求出 根据任何两个个案在某变量上的等级来预测他们在另一个变量上的等级时 可以减少的误差是多少 同序对与异序对 假设样本的全部个案数目是n 就会组成1 2n n 1 对个案 某对个案在两个变量上的相对等级时相同 则成为同序对 如果是不相同 则成为异序对 同序对与异序对 同分对 两个个案在某变量上次序相对 无法分高低 即同分对 通常以Tx代表只在X变量上同分的对数 以Ty代表只在Y变量上同分的对数 而以Txy代表在两个变量上都是同分的对数 Gamma系数 Gamma系数的计算公式如下 其中 Ns是同序对数 Nd异序对数 G的绝对值越大 就表示所犯的错误可能性越小 G是负值 则如果知道一对个案在某个变量的相对等级 就应该估计他们在另一个变量上的相对等级是相反的 反之亦然 求下表G系数 G系数是属于对称相关测量法 如果是非对称 即一个是自变量 一个是因变量 则适宜于简化不对称关系的萨默斯dy系数 萨默斯dy系数 dy的计算公式如下 其中 Ns是同序对数 Nd异序对数 Ty是只在因变量上同分的对数 假设积极性等级是x 产量是Y 求dy 计算列联表的同序对与异序对 同序对 n1 n5 n6 n8 n9 n2 n6 n8 n4 n8 n9 n5 n9 异序对 n7 n2 n5 n3 n6 n4 n2 n3 n8 n3 n6 n5 n3 计算列联表的同分对 同分对 Tx n1 n2 n3 n2 n3 n4 n5 n6 n5 n6 n7 n8 n9 n8 n9 同分对 例 计算G系数与dy系数 婚姻美满 文化程度 同序对 9 30 18 4 7 8 4 7 16 18 7 30 7 1229异序对 5 8 30 3 4 18 3 4 16 8 3 30 3 617同分对 9 16 5 16 5 8 30 18 30 18 3 4 7 4 7 1254G系数 0 33dy系数 0 22 肯德尔的tau系数 tau系数的基本逻辑是计算同序对数与异序对数之差在全部的可能对数中所占的比例 公式如下 其中m是列联表中行数与列数中的较小者 斯皮尔曼rho系数 斯皮尔曼rho系数的特点是计算每个个案在两个变量上的等级时 不仅要区别两者的高低差异 而且还要计算二者差异的确切数值 其中D表示每个个案在两列级序上的差异值 n表示全部个案数目 D平方可以避免正负值抵消rho系数是对称相关测量法 要求同分情况不多 统计值在 1至1之间 其平方值可以有消减误差比例的意义 求斯皮尔曼rho系数 第三节两个定距变量 简单线性回归分析法简单线性回归时根据一个直线方程式 以一个自变量X的数值来预测一个因变量Y的数值 目的是要找出一个错误最小的方法来预测因变量的数值 其中X是自变量数值 b成为回归系数 表示回归线的斜率 a是截距 是回归线与Y轴的交点 是根据回归方程所预测的Y变量值 最小二乘法 回归法在绘制回归线时所根据的准则是最小二乘法 假定我们根据一条直线来以自变量X估计因变量的某个值 所估计的值是Y1 而实际上该值是Y2 则误差便是 e Y2 Y1各个e相加起来就是误差总数 为防止正负值相抵消的问题 改为e的平方值相加起来 即直线应使最小 计算公式 斜率截距其中X是自变量值 是自变量的均值 Y是因变量值 是因变量的均值 n是全部个案数目 例1 计算回归方程 回归与相关 线性回归方程不仅具有简化资料的作用 而且可以推广应用于预测或估计样本之外个案的数值 回归系数 b 表示X对Y的影响有多少 指每增加一个单位的X值时Y值的变化有多大 B值是表示自变量对因变量的影响的大小与方向 它是不对称关系的统计法 回归方程不具有消减误差比例作用 一般在计算回归方程时须进行相关系数测量 如果相关系数比较小 消减误差比例太少 则不适合作线性回归方程 积矩相关测量法 b系数没有上限 很少用来比较变量与变量之间的相关程度 而且容易受到统计单位的影响 r系数与b系数的不同地方 是r系数假定X与Y的关系是对称的 而且r的统计值是 1至1 同时r2具有消减误差比例的意义 r2称为决定系数 r系数 r系数计算公式如下 r系数与简单线性回归都是假定X与Y的关系具有直线的性质 如果非直线 就会犯错误 直线与非直线 第四节定类变量与定距变量 相关比率 又称为eta平方系数 E2 是以一个定类变量为自变量 来预测或估计以一个定距变量为因变量的值 其中 Y是因变量的值 是因变量的均值 是自变量值 Xi 上各因变量的均值 表120名学生的家庭职业背景对英文水平的影响 英文水平 得分 非线性关系 比较E值与r值的大小 就可以大致知道是否非直线关系 两者相差愈大 显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论