




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据、模型与决策案例分析报告数据、模型与决策案例分析二Wentworth 医疗中心案例报告2014年01月10日目录一、案例背景3二、检验分析的方法4三、样本数据基本分析5四、同地理位置样本平均值检验7五、同健康状况老人样本平均值检验8六、抑郁症程度因素分析(析因实验分析)10七、案例结论12一、案例背景 Wentworth医疗中心作为对65岁和65岁以上的老人的长期研究的一部分,位于纽约北部地区的Wentworth医疗中心的社会学家和内科医生调查了地理因素和抑郁症之间关系,抽取了60名健康状况不错的人组成一个样本。其中20人住在佛罗里达州,20人住在纽约,20人住在北卡罗来纳州。对随机选中的每个人进行了一次测量抑郁症标准化检验,收集到数据如表1。较高的检验分数表示有较高程度的抑郁症。研究的第二部分是考察地理位置与患有慢性病的65岁和65岁以上的老人得抑郁症之间的关系。这些慢性病诸如关节炎、高血压和心脏病等。具有这些身体状况的老人也抽取60人组成一个样本,同样20人住在佛罗里达州,20人住在纽约,20人住在北卡罗来纳州。这项研究所记录的抑郁症程度的数据如表2所。表1 表2佛罗里达州纽约北卡罗莱纳州佛罗里达州纽约北卡罗莱纳州3810131410711712912793171515375171218881120161287821241488416181754314148513713151421081717166681220182879111761231223196891519159681617137812151414556139114731014127781113133811171111管理报告:1、 利用描述统计学方法汇总这两部分研究的数据。关于抑郁症的得分,你的初步观察结果是什么?2、 对于两个数据集使用方差分析方法,在每种情况下成熟需要进行检验的假设,你的结论是什么?3、 在适当的地方使用单个处理方法的统计推断。你的结论是什么?二、 检验分析的方法本案例主要对不同地区和不同健康状况的65岁和65岁以上的老人(以下文本中简称老人)进行了抑郁症程度的调查。影响抑郁症程度的可能因素包括了两个因素:地理位置和是否患有慢性病。因此在以下检验报告中,将主要判断和区分这些可能因素对老人患抑郁症程度的影响,主要用到了三种检验方法:假设检验、单因素方差分析,以及析因实验分析。假设检验是抽样推断中的一项重要内容,它是根据原资料做出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设的一种检验方法。方差分析是用于两个及两个以上样本均数差别的显著性检验。它通过假定:对每个总体响应变量服从正态分布、响应变量的方差2对所有总体相同、观测量独立,来检验样本均值的差异性,进而推断总体均值的变异性。如果样本均值的变异性“小”,则支持原假设;如果样本均值变异性“大”,则支持备择假设。在支持备择假设情况下,再通过Fisher的最小显著性差异(LSD)方法来确定到底在哪些均值之间存在着差异。析因实验分析允许我们同时得到两个或者两个以上因子同时存在影响时的一些统计结论。分析采用ANOVA方法,将总平方和(SST)分为各种影响因素的的平方和,进行具体分析各因素的影响。三、样本数据基本分析1、 样本数量分析在做数据分析前,需要先确定样本数量是否足够。因为该样本随机抽取不同地理位置的居住人群,且每个样本容量为20,足够大,因此可以视该数据分布为正态分布,可以使用正态分布的分析工具进行分析。2、 样本数据假设:令1 佛罗里达州健康状况不错老人患抑郁症总体均值; 2 纽约州健康状况不错老人患抑郁症总体均值;3 北卡罗来纳州健康状况不错老人患抑郁症总体均值;4 佛罗里达州慢性病老人患抑郁症总体均值;5 纽约州慢性病老人患抑郁症总体均值;6 北卡罗来纳州慢性病老人患抑郁症总体均值;3、 异常数据检验检验依据:利用z分数检验,我们把z分数大于3或小于-3的数据视为异常值。4、 数据检验见下页表格,通过对样本的数据分析发现,z均在3倍误差范围内。试验数据均在最大误差值及最小误差值范围内。5、 检验结论:样本数据数量合格,无异常。异常数据检验表项目健康状况不错的老人患有慢性病的老人地理位置佛罗里达纽约北卡罗莱纳佛罗里达纽约北卡罗莱纳13810131410271171291237931715154375171218588112016126878212414788416181785431414895137131514102108171716116681220181228791117136123122319146891519151596816171316781215141417556139111847310141219778111313203811171111平均值5.558.007.0514.5015.2513.95标准差2.142.202.843.174.132.95允许最大值11.9714.6015.5624.0127.6322.79样本最大值91312212419允许最小值-0.871.40-1.464.992.875.11样本最小值243998结论数据合格数据合格数据合格数据合格数据合格数据合格四、 同地理位置样本平均值检验(1) 检验目的:检验同地理位置的健康状况不错的老人和患有慢性病的老人,抑郁症程度是否一致。检验将对三个不同地区进行分别检验。假设同一地理位置的健康老人与患慢性病老人的抑郁症程度一致,并对此进行检验(2) 检验依据:检验1:H0:1-4 =0;备择假设Ha:1 - 40;拒绝H0,则总体均值不相等。检验2:H0:2-5 =0;备择假设Ha:2 50;拒绝H0,则总体均值不相等。检验3:H0:3-6 =0;备择假设Ha:3 60;拒绝H0,则总体均值不相等。显著水平取0.05检验统计量 ;自由度df=若p-面积小于显著性水平0.05,则拒绝原假设;若临界值,则拒绝原假设。(3) 检验数据检验1检验2检验3地理位置佛罗里达州纽约北卡罗来纳州老人情况健康老人慢性病老人健康老人慢性病老人健康老人慢性病老人样本均值()555145080015257051395样本标准差(s)214317220413284295样本容量(n)202020202020检验统计量(t)-10.46-6.93-7.54自由度(df)332837显著水平()0.050.050.05t0。0252.0352.0482.026概率累计面积(p-)0.000.000.00假设判断拒绝原假设拒绝原假设拒绝原假设结论142536(4) 检验结论根据样本的假设检验结果,同一地理位置的不同健康状况的老人,患抑郁症程度的均值不同。五、 同健康状况老人样本平均值检验(1) 检验目的检验同健康状况老人,在不同地理位置,抑郁症程度是否一致。检验将对两种不同健康状态下的不同地区进行分别检验。采用方差分析法,假设同一健康状况下的老人,在不同地理位置患抑郁症程度一致,并对此进行检验。(2) 检验依据:检验1:H0:12=3 ;备择假设Ha:12 3 ;拒绝H0,则总体均值不全相等;检验2:H0:45=6 ;备择假设Ha:45 6 ;拒绝H0,则总体均值不全相等;显著水平取0.05,SSTR= ; MSTR= ;SSE= ; MSE=F=(3) 检验数据检验1检验2项目健康状况不错的老人患有慢性病的老人地理位置佛罗里达纽约北卡罗莱纳佛罗里达纽约北卡罗莱纳平均值5.558.007.0514.5015.2513.95标准差2.13922.20052.83733.17064.12792.9465组数k33样本容量n2020总平均值68667145667MSTR30516785167MSE58228119246F524071自由度2/572/57p-面积0.00810.4939显著性水平0.050.05假设判断拒绝原假设不能拒绝原假设结论三个州总体均值不全相等不能说明三个州总体均值相等(4) 由于检验1只能让我们得出三个州的总体均值不全相等的结论,我们利用LSD方法来确定总体均值之间的差异到底出现在哪两个均值之间。我们利用Fisher的LSD方法做了三个成对的两两比较。检验1:H0:12 ;Ha:12 ;拒绝H0 ,则两者均值不相等。检验2:H0:23 ;Ha:23 ;拒绝H0 ,则两者均值不相等。检验3:H0:13 ;Ha:13 ;拒绝H0 ,则两者均值不相等。检验统计量LSD=如果LSD,则拒绝原假设。检验数据健康状况不错的老人检验检验1检验2检验32.450.951.50样本容量202020显著性水平0.05MSE58228t值2.002LSD1.5277假设判断拒绝原假设不能拒绝原假设不能拒绝原假设结论两个州均值不相等不能说明两个州均值相等不能说明两个州均值相等(5) 检验结论由以上检验可以得出以下结论:健康状况不错的老人,抑郁症程度与地理位置有关系。三个州健康状况不错的老人抑郁症总体均值不全相等,通过多重比较方法得出总体均值之间的差异出现在佛罗里达州和纽约州之间。患有慢性疾病的老人,其得抑郁症的程度不能拒绝与地理位置无关的结论。因p-值较大,可以认为和地理位置无关。六、 抑郁症程度因素分析(析因实验分析)(1) 计算目的在影响抑郁症程度的因素上,可能有两个因素,即地理位置和健康状况。通过析因实验分析两个因素对抑郁症程度的影响是否显著(2) 计算依据ANOVA析因原理SSA=SSB=SSAB=SST=SSE=SST-SSA-SSB-SSAB方差来源平方和自由度均方F因子ASSAa-1MSA=SSA/(a-1)MSA/MSE因子BSSBb-1MSB=SSB/(b-1)MSB/MSE交互作用SSAB(a-1)(b-1)MSAB=SSAB/(a-1)(b-1)MSAB/MSE误差SSEab(r-1)MSE=SSE/(ab(r-1)综合SSTnt-1(3) 数据及结论因子B:地理位置佛罗里达纽约北卡罗莱纳均值因子A: 健康因素健康状况不错x11=5.55x12=8.00x13=7.05x1.=6.87患慢性病x21=14.50x22=15.25x23=13.95x2。=14.57均值x1=10.03x2=11.63x3=10.50=10.72ANOVA表(a=2, b=3, r=20, nt=120)平方和自由度均方F参照F(0.05)SSA1778.7011778.70200.453.92SSB54.02227.013.043.08SS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金融科技企业投资决策报告:2025年估值模型创新与市场趋势预测洞察
- 专升本考前冲刺练习试题及参考答案详解【能力提升】
- 消防设备安全管理作业指导书
- 2025年高端数控机床智能化升级对产业生态的影响报告
- 网络营销内容策划与创意生成作业指导书
- 自考专业(计算机应用)高频难、易错点题含完整答案详解(考点梳理)
- 二年级数学计算题专项练习1000题汇编
- 自考专业(护理)考试历年机考真题集附参考答案详解【基础题】
- 中级银行从业资格之中级银行业法律法规与综合能力能力测试备考题及参考答案详解【夺分金卷】
- 老年人用药研究-洞察及研究
- GB/T 28288-2012足部防护足趾保护包头和防刺穿垫
- GB/T 1508-2002锰矿石全铁含量的测定重铬酸钾滴定法和邻菲啰啉分光光度法
- GA 1800.6-2021电力系统治安反恐防范要求第6部分:核能发电企业
- 行为金融学案例
- 万科集团财务管理制度手册207
- “李可中医药学术流派论治厥阴病”-课件
- 通用技术作品设计报告
- 锚杆支护技术规范正式版本
- 下一代互联网技术
- 皮肤知识与问题性皮肤分析(入行必看)
- 单位消防安全评估报告(模板)
评论
0/150
提交评论