




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据模型与决策 案例 2 关于关于 Wentworth Wentworth 医疗中心医疗中心 的案例报告的案例报告 2010 级 5 班第 1 组 提交日期 2011 年 5 月 7 日 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 目 录 组员名单 1 讨论记录 1 案例介绍与背景分析 2 一 案例全文 2 二 案例背景分析 3 问题求解及分析 4 一 利用描述统计学方法概括说明两部分研究的数据 5 二 利用方差分析方法进一步说明两部分数据 5 一 方差分析的假定 5 二 健康老人样本的方差分析 9 1 零假设与备择假设 9 2 方差分析 ANOVA 的原理 9 3 EXCEL 的方差分析结果 10 4 分析结论 10 三 患有慢性病老人样本的方差分析 10 1 零假设与备择假设 10 2 EXCEL 的方差分析结果 10 3 分析结论 11 四 综合两个样本方差分析比较 11 三 多重比较方法分析 14 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 2 页 组员名单组员名单 讨论记录讨论记录 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 3 页 案例介绍与背景分析案例介绍与背景分析 一 一 案例全文案例全文 作为对 65 岁和 65 岁以上的老人所做长期研究的一部分 位于纽约州北部地区的 Wentworth 医疗中心的社会学家和内科医生调查了地理位置和抑郁症之间的关系 选择了 60 名相当健康的人组成了一个样本 其中 20 人居住在佛罗里达州 20 人居住在纽约州 20 人居住在北卡罗来纳州 对随机选中的每个人给出了测量抑郁症的一个标准化检验 收 集到的数据如下表所示 较高的得分表示有较高程度的抑郁症 这些数据可以提供给我们 使用 它们被存放在本教材附带的 CD 上 文件名为 Medical1 研究的第二部分考虑地理位置与患有慢性病的 65 岁和 65 岁以上的老人得抑郁症之间 的关系 这些慢性病包括关节炎 高血压和 或 心脏病等 这种身体状况的人也选出 60 人 同样 20 人居住在佛罗里达州 20 人居住在纽约州 20 人居住在北卡罗来纳州 这一 研究记录的抑郁症程度的数据如下表所示 这些数据也可以提供给我们使用 它们被存放 在本教材附带的 CD 上 文件名为 Medica2 Medical1 的资料Medical2 的资料Medical1 的资料Medical2 的资料 佛罗 里达 纽 约 北卡 罗来 纳 佛罗 里达 纽 约 北 卡 罗 来 纳 佛 罗 里 达 纽 约 北 卡 罗 来 纳 佛 罗 里 达 纽 约 北卡 罗来纳 3810131410668122018 71171291228791117 7931715156123122319 375171218689151915 8811201612968161713 8782124147812151414 88416181755613911 54314148473101412 5137131514778111313 21081717163811171111 管理报告 1 利用描述统计学方法概括说明两部分研究的数据 关于抑郁症的得分 你的初步观 测结果是什么 2 对于两个数据集使用方差分析法 陈述每种情况下被检验的假设 你的结论是什么 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 4 页 3 在适当的地方使用单个处理方法的统计推断 你的结论是什么 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 5 页 二二 案例背景分析案例背景分析 本案例主要是研究老年人抑郁症的程度 是否受气候类型差异巨大的不同地理位 置因素影响 罹患慢性病与否的因素是否也影响老年人的抑郁程度 以及两个因素的 交互影响是否也造成了老年人不同的抑郁程度 研究所涉及的佛罗里达 北卡罗来纳以及纽约州的地理位置如下图所示 调查中的三个地区的地理位置和由地理位置所决定的气候差别非常大 纽约州地 理位置偏东北 气候冬天寒冷而夏天炎热 令人不适 佛罗里达偏南 受海洋影响 气候温和 所以成为度假和疗养的胜地 北卡罗纳处于中部 地理复杂 气候也复杂 地理位置造成的气候 天气 日照 都给人带来了很大的影响 包括身体和精神 而 对精神的影响很可能造成抑郁症 故可以推断地理位置对于健康人患抑郁症的影响是 很大的 抑郁症和其它慢性疾病之间的关系也很复杂 许多中风过后的病人会产生抑郁症 状 抑郁往往又是酿成病人第二次中风的主要因素 抑郁症患者更容易有动脉疾病 主要是脑动脉疾病 这一结论同样适用于心脏病 高血压及糖尿病的影响 以下篇幅将根据实际调查的研究记录 运用描述统计学方法及方差分析方法 科 学分析以上两种因素及其交互作用对老年人抑郁程度影响的显著程度 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 6 页 问题分析问题分析及求解及求解 一 利用描述统计学方法概括说明两部分研究的数据一 利用描述统计学方法概括说明两部分研究的数据 本案例中研究者为调查地理位置和抑郁症之间的关系 在 65 岁以上老人中选取了两 个样本进行研究 分别是身体健康的老人以及患有慢性病的老人 每个样本均有 60 人组 成 居住地分别来自佛罗里达州 纽约州和北卡罗来纳州 不同地区的采集人数占样本 总人数的三分之一 该项调查中对随机选中的每个人给出了测量抑郁症的一个标准化检 验 收集到的数据如表 1 所示 较高的得分表示有较高程度的抑郁症 表 1 健康的老人样本健康的老人样本患有慢性病的老人样本患有慢性病的老人样本序序 号号佛罗里达佛罗里达纽约纽约北卡罗来纳北卡罗来纳佛罗里达佛罗里达纽约纽约北卡罗来纳北卡罗来纳2711712912 3793171515 4375171218 58811201612 6878212414 7884161817 854314148 95137131514 102108171716 11668122018 1228791117 13612312231915968161713 167812151414 175561391119778111313 203811171111 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 7 页 运用 EXCEL 软件 数据分析 功能对表 1 中的数据进行处理 得到如下的相关描述 统计指标 从中可初步观察出抑郁症与地理位置之间的关系以及两个不同样本间的差异 表 2 健康老人样本健康老人样本患有慢性病的老人样本患有慢性病的老人样本 指标指标 佛罗里达佛罗里达纽约纽约北卡罗来纳北卡罗来纳佛罗里达佛罗里达纽约纽约北卡罗来纳北卡罗来纳 平均5 5587 0514 515 2513 95 标准误差0 4783470 4920420 6344288770 7089650 9230240 658847 中位数687 514 514 514 众数788171412 标准差2 1392332 2004782 8372521923 1705894 127892 946452 方差4 5763164 8421058 0510 0526317 039478 681579 峰度 1 062190 626432 0 904925496 0 3408 0 03014 0 59205 偏度 0 273560 625687 0 0561882690 2807210 525352 0 04173 区域799121511 最小值243998 最大值91312212419 求和111160141290305279 观测数202020202020 1 健康老人样本 由上表数据可以看出 在健康人群中位于纽约的被调查者平均分数最高 与北卡罗 来纳和佛罗里达地区相比较具有更高程度的抑郁症 同时 位于纽约的被调查者分数最 大值与最小值也均高于其他两个地区 表明纽约地区被调查人群的抑郁症程度要整体高 于其他两个地区 详图 1 2 患有慢性病的老人样本 与健康人群的样本情况相同 在患有慢性病的被调查者中 位于纽约的平均分数最 高 且最大值与最小值也高于其他两个地区 表明位于纽约的患有慢性病的被调查者与 北卡罗来纳和佛罗里达地区相比较具有更高程度的抑郁症 与第一个样本不同的是 位 于佛罗里达的患有慢性病的被调查者抑郁症程度高于北卡罗来纳 详图 1 3 两个样本比较 就整体而言 同一地区患慢性病的被调查者患抑郁症的水平明显高于健康的被调查 者 不同地区所有被调查者的平均得分情况是 1 佛罗里达地区平均得分 9 575 2 纽约地区平均得分 11 625 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 8 页 3 北卡罗米纳地区平均得分 10 5 无论是健康的被调查者还是已经患有慢性病的被调查者 就其地理位置而言 都是 纽约地区患抑郁症的分数平均水平最高 详图 2 图 1 不同地区所有被调查者得分均值 0 2 4 6 8 10 12 14 平均得分 图 2 0 5 10 15 20 平均得分 各地区不同健康状况下数据均值比较 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 9 页 二 利用方差分析方法进一步说明两部分研究的数据二 利用方差分析方法进一步说明两部分研究的数据 为进一步判断样本数据能否真正推断出 处于不同地理位置的总体人群 65 岁以上 老人 对抑郁症的影响程度是有差异的 我们借助方差分析的方法对两部分调查的结果 进行深度分析 一 方差分析的假定及原理 一 方差分析的假定及原理 作为一项观测性研究 本案例中的数据通过抽样调查得到 据此为应用方差分析的 方法我们首先需要进行三个假定 1 对每个总体 响应变量服从正态分布 即 在本案例中 位于佛罗里达 纽约及 北卡罗来纳州等三个地区 65 岁以上老人 包括健康和患有慢性病的群体 测量抑郁症 的标准化检验分数服从正态分布 2 响应变量的方差 记为 对所有总体都是相同的 即 在本案例中 位于三个 2 地区 65 岁以上老人 包括健康和患有慢性病的群体 测量抑郁症的标准化检验分数方 差是相同的 3 观察值是独立的 即 在本案例中 对于每个地区 65 岁以上老人 包括健康和 患有慢性病的群体 其测量抑郁症的标准化检验分数独立于任何其他地区 65 岁以上老 人的分数 方差分析 ANOVA 的逻辑是以共同方差的两个独立的估计量为基础 基于方差分 2 析的假定 我们可以利用样本均值之间的变异 建立的一个估计 处理间均方 MSTR 2 另一个估计量则是基于每个样本内部数据的变异 误差均方 MSE 通过比较的这两个估 2 计就能够判定总体均值是否相等 如果各样本均值 都相等 可以理解成个样本均来自于 同一个总体 那么 MSTR 与 MSE 给出的两个独立的估计量应该是接近的 我们知道 对 2 于同一正态总体 的两个独立估计量之比的抽样分布服从 F 分布 所以能通过 F 检验 2 来判定样本是否来自同一总体 有同一个均值估计 在本案例中 如果佛罗里达州 纽约州以及北卡罗来纳州的抑郁症标准化检验分数 总体均值是相等的 则根据表 1 数据分析出的 MSTR MSE 抽样分布会服从一个分子自由度 为 2 k 1 k 为 3 个地区 分母自由度为 57 k 为所有的观测值个数 60 的 F 分布 而如果零假设不成立 则会由于 MSTR 高估从而使得 MSTR MSE 的值变大 不能 2 得出服从上述条件的 F 分布的话 我们将拒绝 即佛罗里达州 纽约州以及北卡罗来 0 纳州的抑郁症标准化检验分数总体均值不相等 得出结论认为不同地理位置对抑郁症产 生的影响是不同的 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 10 页 二 健康老人样本的方差分析 二 健康老人样本的方差分析 1 1 零假设与备择假设 零假设与备择假设 根据本案例进行的第一部分研究 针对 65 岁以上老人选取 60 名健康的群体作为研 究样本进行抑郁症标准化分数测量 在深入的方差分析中 我们面对的实际问题是 观 察到的三个地区分数之间样本均值差异是否足够大 以致使我们能够得出结论 对于所 调查的三个地区 抑郁症的标准化检验分数总体均值是不同的 为了用统计术语来描述 这一问题 引入下列记号 居住在佛罗里达州的 65 岁以上健康老人 抑郁症标准化检验分数的总体均值 1 居住在纽约州的 65 岁以上健康老人 抑郁症标准化检验分数的总体均值 2 居住在北卡罗来纳州州的 65 岁以上健康老人 抑郁症标准化检验分数的总体均值 3 由此 尽管我们不知道的真实值 但在方差分析中我们还是试图用样本均 1 2 3 值来检验下面的假设 0 1 2 3 总体均值不全相等 2 2 EXCELEXCEL 的方差分析结果的方差分析结果 利用 EXCEL 软件的 单因素方差分析 功能 导入表 1 内 健康的老人样本 部分 数据 得到下述 ANOVA 表 方差分析 单因素方差分析 SUMMARY 组观测数求和平均方差 Florida201115 554 576316 New York2016084 842105 North Carolina 201417 058 05 方差分析 差异源 SSdfMSF FP valueF crit 组间 61 03333230 516675 2408865 2408860 008143 158843 组内 331 9575 822807 总计 392 933359 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 11 页 3 3 分析结论 分析结论 根据 F 分布表 上侧面积上侧面积 0 100 100 050 050 0250 0250 010 01 F F 值值 1 2 2 57 2 398163 15883 938254 9981 由 ANOVA 表中计算得到的 F 5 240886 大于 4 9981 因此拒绝零假设 认为总体均 值不全相等 即得出结论认为对于健康的 65 岁以上老人群体 位于佛罗里达州 纽约 州以及北卡罗来纳州等不同地理位置对抑郁症产生的影响是显著的 三 患有慢性病老人样本的方差分析 三 患有慢性病老人样本的方差分析 1 1 零假设与备择假设 零假设与备择假设 与上述健康老人样本的方差分析步骤相同 先引入下列记号 居住在佛罗里达州的 65 岁以上患有慢性病的老人 抑郁症标准化检验分数的总 1 体均值 居住在纽约州的 65 岁以上患有慢性病的老人 抑郁症标准化检验分数的总体均 2 值 居住在北卡罗来纳州州的 65 岁以上患有慢性病老人 抑郁症标准化检验分数的 3 总体均值 同样 尽管我们不知道的真实值 但在方差分析中还是试图用样本均值 1 2 3 来检验下面的假设 0 1 2 3 总体均值不全相等 2 2 EXCELEXCEL 的方差分析结果的方差分析结果 利用 EXCEL 软件的 单因素方差分析 功能 导入表 1 内 患有慢性病的老人样 本 部分数据 得到下述 ANOVA 表 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 12 页 方差分析 单因素方差分析 SUMMARY 组观测数求和平均方差 Florida2029014 510 05263 New York2030515 2517 03947 North Carolina2027913 958 681579 方差分析 差异源 SSdfMSF FP valueF crit 组间 17 0333328 5166670 7142120 7142120 4939063 158843 组内 679 75711 92456 总计 696 733359 3 3 分析结论 分析结论 根据 F 分布表 上侧面积上侧面积 0 100 100 050 050 0250 0250 010 01 F F 值值 1 2 2 57 2 398163 15883 938254 9981 由 ANOVA 表中计算得到的 F 0 714212 小于 2 39816 因此不能拒绝零假设 无法 得出结论认为对于患有慢性病的老人群体 位于佛罗里达州 纽约州以及北卡罗来纳 州等不同地理位置对抑郁症产生的影响是有差异的 四四 综合两个样本的方差分析比较综合两个样本的方差分析比较 我们观察到案例中两个样本来自不同的人群 健康的老人和罹患慢性病的老人 通过双因素方差分析 可以直观地看出在不同人群和不同地理位置这两个因素是否都 对抑郁症程度 分数 有显著性影响 也可以确定两个因素的交互作用是否对抑郁症 程度有显著性影响 我们将案例两项调查数据汇总 详表 3 以不同人群和不同地理位置作为两个不同 的因素 将抑郁症程度的评估分数作为响应变量 运用 excel 程序进行双因素方差分 析 分析结果如表 4 所示 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 13 页 表 3 样本分类 佛罗里达佛罗里达纽约纽约北卡罗来纳北卡罗来纳 3810 7117 793 375 8811 878 884 543 5137 2108 668 287 6123 689 968 7812 556 473 778 健康的人群 样本 3811 131410 12912 171515 171218 201612 212414 161817 14148 131514 171716 122018 患有慢性病 的人群样本 91117 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 14 页 122319 151915 161713 151414 13911 101412 111313 171111 方差分析 可重复双因素分析 SUMMARYFloridaNew York North Carolina 总计 健康的 观测数 20202060 求和 111160141412 平均 5 5587 056 86666667 方差 4 57631584 8421052638 056 65988701 罹患慢性病 观测数 20202060 求和 290305279874 平均 14 515 2513 9514 5666667 方差 10 05263217 039473688 68157894711 8090395 总计 观测数 404040 求和 401465420 平均 10 02511 62510 5 方差 27 66602624 1378205120 35897436 方差 差异源 SSdfMSFP valueF crit 人群 1778 711778 7200 4466197 1057E 273 92433023 地理位置 54 016667227 008333333 043643730 0515523 07585264 交互 24 05212 0251 355130490 262036173 07585264 内部 1011 61148 873684211 总计 2868 3667119 根据上述方差分析 我们得出这样的结论 不同人群自身的健康状况会对其抑郁 症水平有显著影响 差异源 人群对应的 p 值接近 0 拒绝 1 2 3的原假设 不同地理位置对抑郁症水平的影响并不显著 差异源 地理位置对应的 p 值 0 051552 大于我们设定的显著性水平 0 05 不能得出拒绝原假设的结论 同样的 这两个因素的交互作用对抑郁症水平也没有显著影响 数据模型与决策 案例 2 Wentworth 医疗中心 2010 级 5 班第 1 组 第 15 页 三 多重比较方法分析三 多重比较方法分析 在前一部分的方差分析中 针对 65 岁以上的健康人群 我们依据统计软件给出的相关 数据拒绝了原假设 得出判断三个不同州之间抑郁症标准化检验分数总体均值不全相等 即地理位置对抑郁症程度的影响是显著的 在这种情形下 我们可以利用 Fisher 的最小显著性差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南通初一考试试卷及答案
- 2025年丹东生物中考试题及答案
- 2025年阳江公务员考试题目及答案
- 枝江生物地理考试试卷及答案
- 云南音乐中考试卷及答案
- 消防常识考试题目及答案
- 油漆安全考试题及答案
- 上海高二考试试题及答案
- 急救培训知识大全课件
- 消控室考试试题及答案
- 国际投资学(investment)讲义课件
- 施工机具进场检查验收记录
- 二年级健康成长上册教案
- 民俗学概论 第一章 概述课件
- 时代邻里4度°服务美学品质关怀体系
- 供水公司主要安全风险公告栏(总)
- 《农产品贮藏与加工》课件第三章稻谷精深加工
- 外研版五年级上册英语(全册)单元教材分析
- 【课件】音响的感知课件-高中音乐湘教版(2019)音乐鉴赏
- 华为-计划、预算和核算
- 膝关节置换术的护理
评论
0/150
提交评论