沃登编辑:医学论文中统计分析错误辨析与释疑_18.doc_第1页
沃登编辑:医学论文中统计分析错误辨析与释疑_18.doc_第2页
沃登编辑:医学论文中统计分析错误辨析与释疑_18.doc_第3页
沃登编辑:医学论文中统计分析错误辨析与释疑_18.doc_第4页
沃登编辑:医学论文中统计分析错误辨析与释疑_18.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

沃登编辑 医学论文中统计分析错误辨析与释疑(18) 实验设计类型的合理选择 型:L4 (23) 、L8 (27) 、L16 一、什么是正交实验设计正交设计是利用一系列规格化的正交表来安排 多因素试验的一种十分有效的设计方法。正交表是例1 原文题目:浙贝母提取工艺的优化选择。原作者采用正交试验法考察提取溶媒、溶媒浓度、药(215) 、;有3n 型:L9 (34) 、L27 (313) 、;有4n 型:L16 (45) 、L64 (421) 、;有5n 型:L25 (56) 、L125 (531) 。常用的混合水平的正交表有:L8(41 24) 、L18 (37 21) 、L50 (511 21) 等。Ln (Km) 中的L 代表“正交表”, n 代表“正交表的行数”; K 代表“各列的水平数”, m 代表“列数”。正交表各列水平代码出现的规律是:各列不同代码出现的次数一样多;任何两列不同代码组合形式出现的次数一样多,如(1 ,1) 、(1 ,2) 、(2 ,1) 、(2 ,2) 被称为4 种不同的代码组合形式。满足这样两个条件的数据(或代码) 阵列被成为是彼此正交的。由正交表所确定的“实验点(即正交表每一行代码所决定的实验条件) ”具有两个明显的特点:在空间具有“均匀分散性”、在统计分析时具有“整齐可比性”。正交表一般分成表头(列号) 和表身(水平的标志) 。所谓进行正交设计,实际上就是把实验因素及材处理方法、提取次数等因素对总生物碱提取效果的影响。根据有关资料及经验,拟定7 个因素,每个因素选择2 个水平(表1) ,按L8(27) 正交设计表对总生物碱提取和测定,结果见表2, 方差分析见表3 。方差分析表明,提取溶媒对贝母碱的提取效果影响极显著,溶媒浓度、药材处理次之,提取时间、提取次数、粒度、溶媒量对结果几乎无影响。表2 的结果表明,提取效果最佳的第4 号(A1B2C2D2E2F1G1) ,即以95 % 乙醇提取3 次,每次2 h, 碎粒提取,溶媒量6 倍,药材不需10 %Na2CO3 处理。A1B2C2D2E1 F1G2 , 即除溶媒9倍外,其余相同,但从表3看,溶媒量等表1 因素水平水平溶媒A 浓度B ( %) 药材处理C 提取次数D 提取时间E 粒度F 溶媒量G 1 乙醇60 10 % Na2CO3 浸30 min 2 1 碎粒6 倍2 水95 不处理3 2 整粒9 倍表2 试验方案与结果因素试验指标试验号A B C D E F G 总生物碱含量( %) 1 1 1 1 1 1 1 1 0. 163 2 1 1 1 2 2 2 2 0. 240 3 1 2 2 1 1 2 2 0. 280 4 1 2 2 2 2 1 1 0. 310 5 2 1 2 1 2 1 2 0. 148 6 2 1 2 2 1 2 1 0. 128 7 2 2 1 1 2 2 1 0. 095 8 2 2 1 2 1 1 2 0. 126 0. 993 0. 679 0. 624 0. 606 0. 697 0. 747 0. 696 0. 497 0. 811 0. 866 0. 884 0. 793 0. 743 0. 794 T = 1. 49 R 0. 496 0. 132 0. 242 0. 110 0. 096 0. 004 0. 898 1576 中华医学杂志2004 年9 月17 日第84 卷第18 期Natl Med J China , September 17 ,2004 ,Vol 84 , No. 18 表3 方差分析结果方差来源偏差平方和自由度均方F 值P A 0.0307 1 0.0307 74.70 0.01 B 4. 375 10 -3 1 4.375 10 -3 10.63 0.05 C 7. 325 10 -3 1 7.325 10 -3 17.81 0.05 E 3. 250 10 -5 1 3.250 10 -5 0.079 0.05 F 2. 000 10 -6 1 2.000 10 -6 0.0049 0.05 G 1. 200 10 -3 1 1.200 10 -3 2.91 0.05 e(误差) 1. 235 10 -3 3 1.235 10 -3 注: F0101 (1,3) =34.11 F0105 (1,3) =10113 头设计来实现的,通需要考察的因素数、 水平数及交互作用的个数(以专业知识为依据),选择合适的正交表,每个因素的效应对应于正交表的一列,各因素的交互作用所在的列通过查所对应的交互作用表来获得,它对应于正交表的一列或多列上, 此外,还需要空出若干列来,在方差分析时提供误差项用于统计分析。原作者考察了7 个因素,选用了L8(27) 正交表进行表头设计,这样7 个因素就把L8 对结果几乎无影响,可任取其一水平,从节约成本和例2 某研究者进行 “生脉颗粒剂的处方、工艺时, 所选用的因素和水平见表4, 并运用L9 (27) 正交表的7 列占满,如果因素之间存在交互作用,其效应将会与某些单个因素的效应混杂,又因没有多余的空列,也就不能进行正确的统计分析,原作者将E、F、G三因素所对应的三列作为误差项,各因素的均方与误差均方相比得到F 值(注:原作者误差的均方计算有误,应为误差的离均差平方和除以误差的自由度,此外,其他因素的离均差平方和也存在计算错误),从而判断各因素不同水平效应之间的差异是否具有显著意义,这种做法是不正确的,因为方差分析的思想是把数据变异的总的离均差平方和分解为各个因素的离均差平方和以及误差的离均差平方和,E、F、G三列的离均差平方和要么作为各个因素的离均差平方和,要么作为误差的离均差平方和,如果以此三列作为误差项,是不能分析出E、F、G 三因素的效应的。完善的正交设计要根据因素的个数、水平数及所考察的交互作用选用合适的正交表,通常在安排完各因素及交互作用所对应的列后,还要空出若干列来作为误差项。本资料可选用大一号的正交表即L16 (215) 正交表来进行表头设计,这样不仅可以考虑各因素的效应,而且还可以考虑部分因素的交互作用,留出若干列来作为误差项,可以使分析的结果更稳定。(34) 正交表安排了实验因素见表5 。表4 研究者选定的4 个实验因素及其水平A:PVP B:PVP C:乳糖微纤D:软材搅水平代码浓度( %) 用量(ml) 三硅酸镁配比拌时间(s) 1 175 1 9010 2 2100 3 12021 3 3 125 12 15053 表5 用L9 (34) 安排四因素的正交设计及实验结果试验号A B C D 细粉率得分稳定性得分1 1 1 1 1 30 20 2 1 2 2 2 62 60 3 1 3 3 3 65 65 4 2 1 2 3 34 50 5 2 2 3 1 41 70 6 2 3 1 2 98 55 7 3 1 3 2 0 80 8 3 2 1 3 64 85 9 3 3 2 1 97 90 因素对细粉率指标影响大小顺序为B C A D,最佳处方工艺为A2B3C2D1 。因素对稳定性指标影响大小顺序为A B C D,最佳处方工艺为A3B3C3D3 。综合考虑稳定性和细粉率的影响因素及各自最佳工艺,并以稳定性为主,最终选定最佳工艺处方为A3B3C3D3 ,即PVP 浓度5%、用量125 ml; 乳糖2微晶纤维素52三硅酸镁(123) ;软材搅拌时间150 s。对差错的辨析与释疑:用L9 (34) 正交表安排可能有交互作用的四个实验因素,设计欠合理;正交表中四列全部排满,不便对资料进行统计分析,结论的可靠性较低。正交试验设计是利用一套规格化的正交表来安排各实验因素及各水平。正交表很多,需要根据因素的个数、水平数、实验条件及因素间是否有交互作用来选取,本例有四个因素,选择L9 (34) 表,无法估计误差。此外,之间可能存“PVP 浓度与PVP 用量”在交互作用,需要考虑。因此,应选择较大的正交表如选择L27 (313) 表安排四个实验因素及其交互作用(表6) ,并对资料进行方差分析为宜。用L27 (313) 表安排四个实验因素和一级交互作用(即两个因素之间的交互作用) 的个数小于等于3 的表头设计见表6 。表6 用L27 (313) 表安排四因素及三对交互作用的表头设计试验号123 456 12列号: A BAB1,每一对交互作用占两列,如A B 占第3 、4 两列,在表头设计中分别用AB1 和AB2 表示。同理,可以解释AC1 和AC2 、BC1 和BC2 的含义。表身的水平编码可从专用统计工具表中查得,此处从略。做实验时,只需要将此表中与单个因素对应的那些列的水平代码抽出来,按各行水平代码所决定的实验条件去做实验,将得到的实验结果记录在各行的最后边,等全部实验都做完后, 就可进行正交设计定量资料的方差分析。正交设计的作用在于,用较少次数有代表性的试验点,获得尽可能多的信息,从而得出较为可靠的结论。由于正交设计具有“均匀分散、整齐可比”的特点,所以,某些好的实验点即使未包含在实验中, 一般也能通过方差分析(特别是通过对交互作用的分析) 将其寻找出来,这一点也是其他实验设计类型很难与其相比的优点。例3 在某项生物医学实验研究中,涉及7 个实验因素AG, 由预实验得知:C F、G F 是相当重要的交互作用,必须考虑,但实验次数不能太多, 最好不要超过35 次。观测指标是某种物质的产量, 每个因素拟考察3 个不同的水平,希望通过较少次数的实验,找到因素之间的最佳水平组合。某研究者采用析因设计安排此实验,问此人的做法妥否? 正确的做法是什么? 对差错的辨析与释疑:此研究者的做法是不妥的! 因为实验中将涉及7 个实验因素,每个因素需要考察3 个水平,若用析因设计,则因素之间的全部水平组合数为37 =2187, 这仅仅是不同的实验条件数,各实验条件下至少要做两次独立重复实验,这样一来,总共至少需要做4374 次实验。做这么多次实验需要花费大量的人力、物力和时间,通常研究者是无法承受的! 虽然要考察的实验因素比较多,但需要考察的交互作用却比较少,故完全没有必要进行析因设计,而改用正交设计,不仅可以很好地实现实验目的,还可节省时间、经费和人力。具体地说,本实验研究适于选用3 水平的正交设计。因为有7 个三水平的实验因素,还要考察两对一级交互作用,实验次数又不能超过35 次,故只有选用L27 (313 ) 正交表安排实验合适。此表有13 列,7 个三水平的实验因素要占去7 列,两对一级交科书或专用统计表中查到,这里只需给出表头设计就可以了(注:有些书上连表头设计都是现成的,只要能看懂,就可直接套用) 。表头设计见表7 。表7 用L27 (313) 正交表安排7 个3 水平实验因素的表头设计实列验号:12 3 4 5 6 7 8910111213 实验编因号素:F C CF1 CF2 GFG1 FG2 AB DE 结果注:第3 、4 列上分别是C 与F 交互作用的两部分;第6 、7 列上分别是F 与G交互作用的两部分值得一提的是,进行表头设计时,应首先安排需要考察交互作用项的实验因素及其交互作用,在剩下的空列上可随意放置不需要考察交互作用项的实验因素。例4 有一项试验研究,涉及A、B 、C、D 四个因素,由专业知识得知,B 与D 之间的交互作用是不可忽视的。全部因素拟取两水平,希望通过较少次数的试验和较易分析的方法确定最优的试验条件,有人选用正交拉丁方设计来安排此实验,妥否? 若不妥,请选择合适的设计类型, 并给出具体的设计格式。对差错的辨析与释疑:此实验不适合选用正交拉丁方设计,因为虽然有4 个因素,但这4 个因素基本上都属于实验因素,尤其是还必须考虑因素B 与因素D 之间的交互作用,正交拉丁方设计无法完成此重任! 若能承受较多的实验次数,可以考虑选用四因素析因设计,但题目要求:“通过较少次数的试验和较易分析的方法确定最优的试验条件”,故宜选用正交设计。具体地说,可选用L8 (27) 正交表来安排此试验,因为表中有7 列,4 个2 水平实验因素占去4 列,1 个一级交互作用也只需1 列就可安排,还剩2 个空列,可用于估计实验误差。先安排需要考表9 用L27 (313) 正交表安排本题试验的表头设计试验号列号:12 3 456 7 8 910 11 1213 试验因素:AC AC1AC2EAE1 AE2 CE1 B CE2 D 结果每一对三水平的交互作用项占2 列,如:A 与C 的交互作用出现在第3 、4 列上。表身的水平编码可从统计教科书中查到,具

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论