版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析(ANOVA)Analysis
ofVariance南京医科大学生物统计学系柏建岭因素和水平因素(factors):将试验对象随机分为若干个组,加以不同的干预,称为处理因素。在相同的因素下的不同干预,称为不同的水平(level)。问题的提出t检验实例南京医科大学的学工部门想知道2015年南京市进入南医大就读的学生中,市区的学生和郊区的学生成绩是否有差异。因素:学生所来自的区域水平:市区,郊区单因素两水平问题的提出t
检验实例阿卡波糖的降血糖效果。分别给对照组和试验组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后血糖下降值的差异。因素:不同的药物水平:阿卡波糖,拜唐平单因素两水平问题的提出t
检验的局限性单因素两水平问题的提出一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。?单因素四水平用药组1=2.72mmol/l用药组2=2.70mmol/l安慰剂组
=3.43mmol/l用药组3=1.97mmol/l多组间的两两比较为什么不能用
t检验?进行一次假设检验,犯第一类错误的概率:
进行多次(k)假设检验,至少犯一次第一类错误的概率:1-(1-
)k
组数为3,k=3,
1-(1-0.05)k=0.1426
组数为4,k=6,
1-(1-0.05)k=0.2649
组数为5,k=10,1-(1-0.05)k=0.4013
组数为6,k=15,1-(1-0.05)k=0.5400问题的提出RAFisher(1890~1962)方差分析(AnalysisofVariance,ANOVA),又称“变异数分析”由英国统计学家R.A.Fisher首先提出,为纪念Fisher,以F命名,故方差分析又称为F检验。方差分析简介方差分析简介1918年,Fisher首创“方差”和“方差分析”两个词汇。apaperonpopulationgenetics,TheCorrelationBetweenRelativesontheSuppositionofMendelianInheritance
TransactionsoftheRoyalSocietyofEdinburgh,52,399-433:"Itis...desirableinanalyzingthecausesofvariabilitytodealwiththesquareofthestandarddeviationasthemeasureofvariability.WeshalltermthisquantitytheVariance..."(p.399)方差分析简介1925年他对方差分析及协方差分析进行了完整的论述Fisher'sbookStatisticalMethodsforResearchWorkers(1925)madetheanalysisofvariancewidelyknown。看一个实例例6.6某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者,治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见表6.3,问三种治疗方案对婴幼儿贫血的疗效是否相同?分析
3类变异总变异:所有个体的血红蛋白上升值几乎都不同组间变异:3组间的血红蛋白上升值不同,原因:处理因素的效应(如果存在的话)、随机误差组内变异:同组内的血红蛋白上升值不一致,原因是个体差异、随机误差总变异——SS总SumofsquaresaboutthemeanofallNvalues.
total=N-1
组间变异——
SS组间Sumofsquaresbetweengroupsn1n2n3组间变异——
SS组间Sumofsquaresbetweengroups
Between=k
-1MSBetween=SSBetween/(k
-1)组内变异——SS组内
within=N-k
MSwithin=SSwithin/(N-k)Sumofsquareswithingroups变异分解
组间变异总变异组内变异总变异=组间变异+组内变异SS总=SS组间+SS组内
总=
组间+
组内
证明方差分析的基本思想组内变异:随机误差组间变异:组间本质差别+随机误差若组间无本质差别:组间变异=组内变异或:总变异总的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度单因素多个样本均数的比较
(onewayanalysisofvariance)单因素:处理因素属于完全随机设计
(Completelyrandomdesign)
随机的含义:机会均等不可预测因素(factor)所要检验的对象:治疗方案水平(level)因素的具体表现:方案A、方案B、方案C试验(Trial)单因素三水平的试验基本步骤建立检验假设,确定检验水准计算检验统计量(列方差分析表)计算P值结论建立假设,确定检验水准H0:
A=
B=
C,即三种治疗方案治疗婴幼儿贫血的疗效相同,H1:
A,
B,
C不全相等或全不相等,即三种治疗方案治疗婴幼儿贫血的疗效不全相同或全不相同。
=0.05计算基本数据计算SS总,SS组间,和SS组内
计算SS总,SS组间,和SS组内
C=(78.70)2/59=104.9778SS总=159.43-104.9778=54.4522SS组内=0.91332×19+1.01212×18+0.78012×19=45.8468单因素方差分析表
(基本结构)
列方差分析表
F分布方差比的分布F分布0123450.00.20.40.60.81.0
1=1,2=10
1=5,2=10F分布0123450.00.20.40.60.81.0
1=10,2=
1=10,2=1界定P值,作结论总自由度为N-1=59-1=58组间自由度=组数(k)-1=3-1=2组内自由度=总自由度-组间自由度=58-2=56。F(2,56)的F分布及界值0123450.2.4.6.813.1560.05F0.05(2,56)≈3.156查方差分析表得F0.05(2,56)=3.156,F>F0.05(2,56),则P<0.05。故按
=0.05的水准,拒绝H0,接受H1,故可认为三种治疗方案的治疗效果不一样。多个样本均数的两两比较在方差分析认为多组均数间差异有统计学意义的基础上,若需了解究竟哪些组均数之间有差别,还是各组间均有差别,可用多个样本均数的两两比较(又称多重比较multiplecomparison)。
多重比较(multiplecomparison)多组间的两两比较为什么不能用
t检验?进行一次假设检验,犯第一类类错误的概率:
进行多次(k)假设检验,至少犯一次第一类错误的概率:
1-(1-
)k
组数为3,k=3,
1-(1-0.05)k=0.1426
组数为4,k=6,
1-(1-0.05)k=0.2649
组数为5,k=10,1-(1-0.05)k=0.4013Theriskthatweactuallytakeishigherthanwhatweassumed!两两比较又叫多重比较,MultipleComparison;分类事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组间的比较或者特定组间的比较;(PlannedMultipleComparison)方差分析得到有差别的结论后多个组之间的相互比较的探索性研究;(PostHoc)Bonferroni1892-1960Scheffe1907-1977Tukey1915-2000Dunnett1921-Westerfall1957-Benjamini1949-多个样本均数间的两两比较
用q检验(又称Student-Newman-Keuls法,即SNK法),统计量为q:q与误差自由度有关,还与比较的两组之a值有关!H0:
A=
B,每次对比时两个总体均数相等;H1:
A≠
B,每次对比时两个总体均数不等。
=0.05。将三个样本均数按从大到小顺序排列并编上组次:组次123
均数1.8401.2260.930
组别(治疗方案)ABC
q0.05,(56,3)=3.408q0.05,(56,2)=2.836结论总的说来,三种治疗方案的治疗婴幼儿贫血疗效有差别。而这种差别主要来自A方案和C方案。这一结论可用下列形式表示:ABC1.8401.2260.930多个实验组与一个对照组
均数间的两两比较
常用q’检验,又称Dunnett法,其计算公式为:公式与q检验公式类似,但需查附表9q'界值表。两两比较的注意事项对于方差分析后的两两比较均应以方差分析拒绝相应的H0为前提,且结论均不应与方差分析的结论相悖;出现模糊结论,下结论应该谨慎;方差分析拒绝H0,但两两比较得不出有差异的结论,因为方差分析效率高。PostHoc分析发现的各组间差别只是一种提示,一种进一步增加含量改进试验的提示。不能用t检验代替方差分析,也不能用t检验代替两两比较。两种错误的说法X1X2
X3X2所来自的总体位于X1所来自的总体和X3所来自的总体之间;X1和X2来自同一总体,X2和X3来自同一总体。只能说明无法判断样本2来自于何总体!两因素多个样本均数的比较
(twowayanalysisofvariance)两因素:配伍因素和处理因素属于随机区组设计
(randomizedblockdesign)
又称“配伍组设计”配伍的概念是“配对”概念的扩展,不是按每两个配对,而是按每三个、每四个或更多个配起来,这就超出了“对子”的涵义,而是配伍组设计了。配伍设计的目的对研究因素以外的已知的干扰因素加以控制,从而将研究因素的作用与干扰因素的作用区分开,以达到提高检验的功效之目的。单向区组控制示意区组处理水平1水平2水平3水平4123456实例例6.10在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?两因素方差分析的原理类似于单因素方差分析,前者仅在后者的基础上,从误差中再分离出区组效应,使误差减少,达到提高检验功效之目的。区组设计的SS的分解SS总=
SS处理+SS区组+SS误差v总=v处理+v区组+v误差
kb-1=(k-1)+(b-1)+(k-1)(b-1)实验因素:H0:三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组相同,即
对照=
A=
B=
C;H1:三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不全同或全不同。
=0.05。建立检验假设干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同;H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相同。
=0.05。计算SS总,SS处理,SS区组和SS误差
SS误差=SS总-SS处理-SS区组=0.74128-0.41084-0.11233=0.21811
计算自由度
总=总例数-1=20-1=19
处理=处理组数-1=4-1=3
区组=区组数-1=5-1=4
误差=
总-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年湖北省宜城市高二生物下册期末考试试卷及答案(考点梳理)
- 2026年湖南省汨罗市高二生物下册期末考试模拟卷及参考答案【典型题】
- 2026年湖南省耒阳市高二生物下册期末考试检测卷附参考答案【满分必刷】
- 2025年黑龙江省同江市高二生物下册期末考试模拟卷及答案【典优】
- 2026年辽宁省北镇市高二生物下册期末考试检测卷完整参考答案
- 2026年广东省南雄市高二生物下册期末考试测试卷【巩固】附答案
- 2025年黑龙江省穆棱市高二生物下册期末考试测试卷及完整答案1套
- 2026年湖北省汉川市高二生物下册期末考试模拟卷及完整答案(名师系列)
- 2026年辽宁省大石桥市高二生物下册期末考试试卷(轻巧夺冠)附答案
- 2026年浙江省兰溪市高二生物下册期末考试模拟卷及参考答案【轻巧夺冠】
- 2026年中央安全生产考核巡查明查暗访清单
- 2026及未来5年中国清洁供热行业全景调研及竞争格局预测报告
- GB/T 44067.4-2025工业互联网平台技术要求及测试方法第4部分:边缘计算平台
- 分子诊断设备技师精准操作能力标准
- 2025年华南理工综评面试题库及答案
- 和君咨询管理公司
- IT运维服务与系统安全保障实战案例
- 安全管理岗面试常见问题及高分攻略
- (正式版)DGTJ 08-2200-2024 建筑隔热涂料应用技术标准
- 《物流企业温室气体排放核算方法》
- 2025年湖北省武汉市中考语文真题(含答案)
评论
0/150
提交评论