wentworth医疗中心案例报告.doc_第1页
wentworth医疗中心案例报告.doc_第2页
wentworth医疗中心案例报告.doc_第3页
wentworth医疗中心案例报告.doc_第4页
wentworth医疗中心案例报告.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据模型与决策案例2关于“Wentworth医疗中心”的案例报告2010级5班第1组提交日期:2011年5月7日数据模型与决策案例2“Wentworth医疗中心” 2010级5班第1组目 录. 组员名单1. 讨论记录1. 案例介绍与背景分析2一、案例全文2二、案例背景分析3. 问题求解及分析4一、利用描述统计学方法概括说明两部分研究的数据5二、利用方差分析方法进一步说明两部分数据5(一)方差分析的假定5(二)健康老人样本的方差分析91、零假设与备择假设92、方差分析ANOVA的原理93、EXCEL的方差分析结果104、分析结论10(三)患有慢性病老人样本的方差分析101、零假设与备择假设102、EXCEL的方差分析结果103、分析结论11(四)综合两个样本方差分析比较11三、多重比较方法分析14. 组员名单. 讨论记录. 案例介绍与背景分析一、案例全文作为对65岁和65岁以上的老人所做长期研究的一部分,位于纽约州北部地区的Wentworth医疗中心的社会学家和内科医生调查了地理位置和抑郁症之间的关系。选择了60名相当健康的人组成了一个样本,其中20人居住在佛罗里达州,20人居住在纽约州,20人居住在北卡罗来纳州。对随机选中的每个人给出了测量抑郁症的一个标准化检验,收集到的数据如下表所示。较高的得分表示有较高程度的抑郁症。这些数据可以提供给我们使用,它们被存放在本教材附带的CD上,文件名为Medical1。研究的第二部分考虑地理位置与患有慢性病的65岁和65岁以上的老人得抑郁症之间的关系,这些慢性病包括关节炎、高血压和(或)心脏病等。这种身体状况的人也选出60人,同样,20人居住在佛罗里达州,20人居住在纽约州,20人居住在北卡罗来纳州。这一研究记录的抑郁症程度的数据如下表所示。这些数据也可以提供给我们使用,它们被存放在本教材附带的CD上,文件名为Medica2。Medical1的资料Medical2的资料Medical1的资料Medical2的资料佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳3810131410668122018711712912287911177931715156123122319375171218689151915881120161296816171387821241478121514148841618175561391154314148473101412513713151477811131321081717163811171111管理报告1、利用描述统计学方法概括说明两部分研究的数据。关于抑郁症的得分,你的初步观测结果是什么?2、对于两个数据集使用方差分析法,陈述每种情况下被检验的假设,你的结论是什么?3、在适当的地方使用单个处理方法的统计推断。你的结论是什么?二、案例背景分析本案例主要是研究老年人抑郁症的程度,是否受气候类型差异巨大的不同地理位置因素影响;罹患慢性病与否的因素是否也影响老年人的抑郁程度;以及两个因素的交互影响是否也造成了老年人不同的抑郁程度。研究所涉及的佛罗里达、北卡罗来纳以及纽约州的地理位置如下图所示。调查中的三个地区的地理位置和由地理位置所决定的气候差别非常大。纽约州地理位置偏东北,气候冬天寒冷而夏天炎热,令人不适;佛罗里达偏南,受海洋影响,气候温和,所以成为度假和疗养的胜地;北卡罗纳处于中部,地理复杂,气候也复杂。地理位置造成的气候,天气,日照,都给人带来了很大的影响,包括身体和精神,而对精神的影响很可能造成抑郁症,故可以推断地理位置对于健康人患抑郁症的影响是很大的。抑郁症和其它慢性疾病之间的关系也很复杂,许多中风过后的病人会产生抑郁症状。抑郁往往又是酿成病人第二次中风的主要因素。抑郁症患者更容易有动脉疾病,主要是脑动脉疾病。这一结论同样适用于心脏病、高血压及糖尿病的影响。以下篇幅将根据实际调查的研究记录,运用描述统计学方法及方差分析方法,科学分析以上两种因素及其交互作用对老年人抑郁程度影响的显著程度。. 问题分析及求解一、利用描述统计学方法概括说明两部分研究的数据本案例中研究者为调查地理位置和抑郁症之间的关系,在65岁以上老人中选取了两个样本进行研究,分别是身体健康的老人以及患有慢性病的老人。每个样本均有60人组成,居住地分别来自佛罗里达州,纽约州和北卡罗来纳州,不同地区的采集人数占样本总人数的三分之一。该项调查中对随机选中的每个人给出了测量抑郁症的一个标准化检验,收集到的数据如表1所示,较高的得分表示有较高程度的抑郁症。表1序号健康的老人样本患有慢性病的老人样本佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳13810131410271171291237931715154375171218588112016126878212414788416181785431414895137131514102108171716116681220181228791117136123122319146891519151596816171316781215141417556139111847310141219778111313203811171111运用EXCEL软件“数据分析”功能对表1中的数据进行处理,得到如下的相关描述统计指标,从中可初步观察出抑郁症与地理位置之间的关系以及两个不同样本间的差异。 表2指标健康老人样本患有慢性病的老人样本佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳平均5.5587.0514.515.2513.95标准误差0.4783470.4920420.6344288770.7089650.9230240.658847中位数687.514.514.514众数788171412标准差2.1392332.2004782.8372521923.1705894.127892.946452方差4.5763164.8421058.0510.0526317.039478.681579峰度-1.062190.626432-0.904925496-0.3408-0.03014-0.59205偏度-0.273560.625687-0.0561882690.2807210.525352-0.04173区域799121511最小值243998最大值91312212419求和111160141290305279观测数2020202020201、健康老人样本由上表数据可以看出,在健康人群中位于纽约的被调查者平均分数最高,与北卡罗来纳和佛罗里达地区相比较具有更高程度的抑郁症。同时,位于纽约的被调查者分数最大值与最小值也均高于其他两个地区,表明纽约地区被调查人群的抑郁症程度要整体高于其他两个地区,详图1。2、患有慢性病的老人样本与健康人群的样本情况相同,在患有慢性病的被调查者中,位于纽约的平均分数最高,且最大值与最小值也高于其他两个地区,表明位于纽约的患有慢性病的被调查者与北卡罗来纳和佛罗里达地区相比较具有更高程度的抑郁症。与第一个样本不同的是,位于佛罗里达的患有慢性病的被调查者抑郁症程度高于北卡罗来纳,详图1。3、两个样本比较就整体而言,同一地区患慢性病的被调查者患抑郁症的水平明显高于健康的被调查者。不同地区所有被调查者的平均得分情况是:(1)佛罗里达地区平均得分9.575;(2)纽约地区平均得分11.625;(3)北卡罗米纳地区平均得分10.5。无论是健康的被调查者还是已经患有慢性病的被调查者,就其地理位置而言,都是纽约地区患抑郁症的分数平均水平最高,详图2。图1图2二、利用方差分析方法进一步说明两部分研究的数据为进一步判断样本数据能否真正推断出,处于不同地理位置的总体人群(65岁以上老人)对抑郁症的影响程度是有差异的,我们借助方差分析的方法对两部分调查的结果进行深度分析。(一)方差分析的假定及原理作为一项观测性研究,本案例中的数据通过抽样调查得到,据此为应用方差分析的方法我们首先需要进行三个假定:1、对每个总体,响应变量服从正态分布。即,在本案例中,位于佛罗里达、纽约及北卡罗来纳州等三个地区65岁以上老人(包括健康和患有慢性病的群体),测量抑郁症的标准化检验分数服从正态分布;2、响应变量的方差,记为2,对所有总体都是相同的。即,在本案例中,位于三个地区65岁以上老人(包括健康和患有慢性病的群体),测量抑郁症的标准化检验分数方差是相同的;3、观察值是独立的。即,在本案例中,对于每个地区65岁以上老人(包括健康和患有慢性病的群体),其测量抑郁症的标准化检验分数独立于任何其他地区65岁以上老人的分数。方差分析(ANOVA)的逻辑是以共同方差2的两个独立的估计量为基础。基于方差分析的假定,我们可以利用样本均值之间的变异,建立2的一个估计:处理间均方MSTR;另一个估计量则是基于每个样本内部数据的变异,误差均方MSE。通过比较2的这两个估计就能够判定总体均值是否相等。如果各样本均值x都相等,可以理解成个样本均来自于同一个总体,那么MSTR与MSE给出的2两个独立的估计量应该是接近的。我们知道,对于同一正态总体,2的两个独立估计量之比的抽样分布服从F分布,所以能通过F检验来判定样本是否来自同一总体,有同一个均值估计。在本案例中,如果佛罗里达州、纽约州以及北卡罗来纳州的抑郁症标准化检验分数总体均值是相等的,则根据表1数据分析出的MSTRMSE抽样分布会服从一个分子自由度为2(k-1,k为3个地区),分母自由度为57(nT-k,nT为所有的观测值个数60)的 F分布。而如果零假设不成立,则会由于MSTR高估2从而使得MSTRMSE的值变大,不能得出服从上述条件的F分布的话,我们将拒绝H0,即佛罗里达州、纽约州以及北卡罗来纳州的抑郁症标准化检验分数总体均值不相等,得出结论认为不同地理位置对抑郁症产生的影响是不同的。(二)健康老人样本的方差分析1、零假设与备择假设根据本案例进行的第一部分研究,针对65岁以上老人选取60名健康的群体作为研究样本进行抑郁症标准化分数测量。在深入的方差分析中,我们面对的实际问题是,观察到的三个地区分数之间样本均值差异是否足够大,以致使我们能够得出结论:对于所调查的三个地区,抑郁症的标准化检验分数总体均值是不同的。为了用统计术语来描述这一问题,引入下列记号:1=居住在佛罗里达州的65岁以上健康老人,抑郁症标准化检验分数的总体均值; 2=居住在纽约州的65岁以上健康老人,抑郁症标准化检验分数的总体均值; 3=居住在北卡罗来纳州州的65岁以上健康老人,抑郁症标准化检验分数的总体均值;由此,尽管我们不知道1、2、3的真实值,但在方差分析中我们还是试图用样本均值来检验下面的假设: H0: 1=2=3 Ha :总体均值不全相等2、EXCEL的方差分析结果利用EXCEL软件的“单因素方差分析”功能,导入表1内“健康的老人样本”部分数据,得到下述ANOVA表方差分析:单因素方差分析SUMMARY组观测数求和平均方差Florida201115.554.576316New York2016084.842105North Carolina201417.058.05方差分析差异源SSdfMSFP-valueF crit组间61.03333230.516675.2408860.008143.158843组内331.9575.822807总计392.9333593、分析结论根据F分布表上侧面积0.100.050.0250.01F值(df1=2,df2=57)2.398163.15883.938254.9981由ANOVA表中计算得到的F=5.240886大于4.9981,因此拒绝零假设,认为总体均值不全相等,即得出结论认为对于健康的65岁以上老人群体,位于佛罗里达州、纽约州以及北卡罗来纳州等不同地理位置对抑郁症产生的影响是显著的。(三)患有慢性病老人样本的方差分析1、零假设与备择假设与上述健康老人样本的方差分析步骤相同,先引入下列记号:1=居住在佛罗里达州的65岁以上患有慢性病的老人,抑郁症标准化检验分数的总体均值; 2=居住在纽约州的65岁以上患有慢性病的老人,抑郁症标准化检验分数的总体均值; 3=居住在北卡罗来纳州州的65岁以上患有慢性病老人,抑郁症标准化检验分数的总体均值;同样,尽管我们不知道1、2、3的真实值,但在方差分析中还是试图用样本均值来检验下面的假设: H0: 1=2=3 Ha :总体均值不全相等2、EXCEL的方差分析结果利用EXCEL软件的“单因素方差分析”功能,导入表1内“患有慢性病的老人样本“部分数据,得到下述ANOVA表:方差分析:单因素方差分析SUMMARY组观测数求和平均方差Florida2029014.510.05263New York2030515.2517.03947North Carolina2027913.958.681579方差分析差异源SSdfMSFP-valueF crit组间17.0333328.5166670.7142120.4939063.158843组内679.75711.92456总计696.7333593、分析结论根据F分布表上侧面积0.100.050.0250.01F值(df1=2,df2=57)2.398163.15883.938254.9981由ANOVA表中计算得到的F=0.714212小于2.39816,因此不能拒绝零假设,无法得出结论认为对于患有慢性病的老人群体,位于佛罗里达州、纽约州以及北卡罗来纳州等不同地理位置对抑郁症产生的影响是有差异的。(四)综合两个样本的方差分析比较我们观察到案例中两个样本来自不同的人群:健康的老人和罹患慢性病的老人。通过双因素方差分析,可以直观地看出在不同人群和不同地理位置这两个因素是否都对抑郁症程度(分数)有显著性影响,也可以确定两个因素的交互作用是否对抑郁症程度有显著性影响。我们将案例两项调查数据汇总,详表3。以不同人群和不同地理位置作为两个不同的因素,将抑郁症程度的评估分数作为响应变量,运用excel程序进行双因素方差分析,分析结果如表4所示。 表3样本分类 佛罗里达纽约北卡罗来纳健康的人群样本38107117793375881187888454351372108668287612368996878125564737783811患有慢性病的人群样本13141012912171515171218201612212414161817141481315141717161220189111712231915191516171315141413911101412111313171111方差分析:可重复双因素分析SUMMARYFloridaNew YorkNorth Carolina总计健康的观测数20202060求和111160141412平均5.5587.056.86666667方差4.57631584.8421052638.056.65988701罹患慢性病观测数20202060求和290305279874平均14.515.2513.9514.5666667方差10.05263217.039473688.68157894711.8090395总计观测数404040求和401465420平均10.02511.62510.5方差27.66602624.1378205120.35897436方差:差异源SSdfMSFP-valueF crit人群1778.711778.7200.4466197.1057E-273.92433023地理位置54.016667227.008333333.043643730.0515523.07585264交互24.05212.0251.355130490.262036173.07585264内部1011.61148.873684211总计2868.3667119根据上述方差分析,我们得出这样的结论,不同人群自身的健康状况会对其抑郁症水平有显著影响:差异源人群对应的p值接近0,拒绝1=2=3的原假设;不同地理位置对抑郁症水平的影响并不显著:差异源地理位置对应的p值=0.051552,大于我们设定的显著性水平0.05,不能得出拒绝原假设的结论。同样的,这两个因素的交互作用对抑郁症水平也没有显著影响。三、多重比较方法分析在前一部分的方差分析中,针对65岁以上的健康人群,我们依据统计软件给出的相关数据拒绝了原假设,得出判断三个不同州之间抑郁症标准化检验分数总体均值不全相等,即地理位置对抑郁症程度的影响是显著的。在这种情形下,我们可以利用Fisher的最小显著性差异(least significant difference,LSD)方法来进一步确定这三个总体均值中到底哪几个均值之间存在差异。在本案例中三个不同地理位置调查数据的样本容量均为n1=n2=n3=20,k=3,1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论