双变量关联性分析_第1页
双变量关联性分析_第2页
双变量关联性分析_第3页
双变量关联性分析_第4页
双变量关联性分析_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

授课教师 殷菲 双变量关联性分析 单变量分析方法 univariateanalysis t检验 u检验 方差分析双变量分析方法 bivariableanalysis 直线回归与相关 秩相关等 直线相关 直线相关的概念 用相关系数描述两变量间直线关系的密切程度和方向相关系数又称Pearson积矩相关系数 样本相关系数用r表示 总体相关系数用表示 相关的种类 0 r 1 1 r 0 r 1 r 1 r 0 r 0 相关的种类 正相关 0 r 1完全正相关 r 1负相关 1 r 0完全负相关 r 1零相关 r 0相关系数没有单位 其值为 1 r 1 相关系数的意义 相关密切程度 用r的大小表示 r的绝对值越接近于1 说明相关越密切相关方向 用r的正负号表示 P164例13 1 某医师测量了15名正常成年人的体重 kg 与CT双肾体积 ml 大小 数据如表13 1所示 据此回答两变量是否有关联 其方向与密切程度如何 直线相关的计算步骤 绘制散点图 观察散点是否随一变量的变化而变化 所有散点是否呈直线关系 图13 115名正常成年人体重和双肾体积的散点图 体重 kg x 双肾体积 ml y 直线相关的计算步骤 计算样本相关系数 本例r 0 875 离均差积和 相关系数的假设检验 检验r是否来自总体相关系数 为零的总体 常用t检验 Ho 0 两变量间无直线相关关系H1 0两变量间有直线相关关系 0 05查附表3 t界值表 得p 0 001 拒绝Ho 可以认为体重和双肾体积之间有直线相关关系 相关分析应用中应注意的问题 1 进行相关分析前应先绘制散点图散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点 outlier 当散点有线性趋势时 才能进行相关分析 2 出现离群点时慎用相关 3 分层资料不可盲目合并 3 分层资料不可盲目合并 3 分层资料不可盲目合并 3 分层资料不可盲目合并 直线回归与直线相关的区别与联系 区别 1 资料要求不同回归 y服从正态分布 x没有特别的要求相关 x和y服从双变量正态分布 若x数值系人为选定 莫作相关例药物的剂量 反应关系 区别 2 应用情况不同回归 反映两变量间的数量关系 b 相关 反映两变量间互依的程度和方向 r 提问方式不同年龄增加 血压发生什么样的变化 年龄和血压之间有关系吗 联系 1 方向一致 对同一组数据若同时计算r和b 其正负号是一致的Question r和b的大小有关系吗 r较大 是否b也较大 联系 2 假设检验等价 r和b的假设检验是等价的 即对同一样本 两者的t值相等 检验结果完全一致 联系 3 用回归解释相关r的平方称为决定系数 决定系数r2 表示回归平方和占总平方和的比例 即应变量y的总变异中由自变量x可以解释的比例 SS回越接近于SS总 则r2越接近于1 说明引入相关变量的效果越好当相关系数较小时 若引入回归 可能由于减少的误差太少而无实际意义 example 如r 0 20 n 100时 P 0 05 r有统计学意义 但r2 0 04 表示SS回在SS总中仅占4 说明两变量相关分析的实际意义不大 应用直线回归和相关的注意点 1 作回归和相关分析之前 先绘制散点图2 据资料的性质正确选用回归和相关3 用回归方程进行预测的时候 应当谨慎 X不能偏离实测范围太远 否则偏差太大 example x 20 50妇女年龄y 血压x 0时 应用直线回归和相关的注意点 4 相关关系不一定是因果关系 也可能是伴随关系 如某生春种一植物 不久长出幼苗 恰邻院盖楼 细心观测 苗长楼增 计算发现 苗高与楼高具有相关性 两者是否真有内在联系 例 1875 1920 美国年铁制品产量与英国年出生率相关系数为 0 98因素 社会 经济 技术 应用直线回归和相关的注意点 5 不能只根据相关系数的绝对值大小来判断相关的密切程度 应首先作假设检验例 r 0 601n 8p 0 10 0 20r 0 401n 42p 0 005 0 01 应用直线回归和相关的注意点 6 和为零仅说明没有变量间没有直线关系 不能说明变量间没有关系 秩相关 秩相关适用条件 原始数据只能以等级表示总体分布未知不服从双变量正态分布 P169例13 4 某研究者对15例30 50岁成年男子的舒张压 mmHg 与夜间最低血氧含量分级进行研究 结果见表13 2 试分析两者的关联性 rs的计算 将x及y的秩次直接代入直线相关系数的计算公式可得到rs rs的假设检验 当n 50时 检验 s是否为零可用查表法 查附表15 rs界值表 当n 50时 按式 13 4 和 13 5 计算检验统计量 分类变量的关联性分析 对一组观察对象 分别观察其两种分类变量的表现 归纳成双向交叉排列的统计表 这类统计表用以描述行变量和列变量之间的关系 亦称为列联表 contingencytable 什么是关联性分析 单一样本 按两种属性分级 故称双向有序列联表分析目的 推断两种属性标志间有无关系 关联性分析 2 2列联表R C列联表 例13 6为研究青少年在校情况与对艾滋病知晓情况之间的关系 某研究者在某地共调查了384名青少年 并对每名青少年按是否在校和对艾滋病是否知晓两种属性交叉分类 如表13 3所示 试问两变量是否存在关联性 表13 3交叉分类表 两种方法有无关系 关联性分析 两法检验的结果有无关系 两变量互相独立 无关系 两变量互相关联 有关系 0 05查附表9 得P 0 05 按 0 05水准拒绝 故可以认为青少年是否在校与对艾滋病是否知晓之间有关联 上述检验说明有无关联 若需了解两个分类变量的关联程度 需进一步计算列联系数 列联系数取值范围为0 1 数值越接近1 关联性越强 关联性分析 2 2列联表R C列联表 例13 7为研究自我效能感与领导行为类型是否有关 某研究者抽样调查了来自某省各三甲医院的238名护士长 并对每个个体按自我效能感和领导行为类型两种属性交叉分类 如表13 5所示 试分析两变量的关联性 表13 5自我效能感与领导行为交叉分类表 1 建立检验假设 H0 自我效能感与领导行为类型间无关联H1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论