试验设计课件.ppt_第1页
试验设计课件.ppt_第2页
试验设计课件.ppt_第3页
试验设计课件.ppt_第4页
试验设计课件.ppt_第5页
免费预览已结束,剩余132页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试验设计与数据处理ExperimentDesign&DataProcessing,授课教师:程江峰,课程教学平台,推荐参考书,课堂教学,上机实习,推荐参考书,徐秉玖编著.药物统计学.北京:北京医科大学出版社,1999.,杨德编著.试验设计与分析.北京:中国农业出版社,2002.,袁志发周静芋主编.试验设计与分析.北京:高等教育出版社,2000.,李云雁胡传荣编著.试验设计与数据处理.北京:化学工业出版社,2005.,课堂教学目录,第一章概述第二章试验设计的概念及原理第三章试验统计基础及EXCEL简介第四章简单试验设计与统计分析第五章方差分析第六章回归与相关分析第七章正交试验设计与分析,第一章概述,试验设计在科研中的地位与意义,科学研究是人类对物质世界和社会现象的一种认识活动。其方法可分为三个层次,即哲学方法;一般研究方法(如科学试验、科学抽象、数学方法等);各门科学中的一些专门化的特殊研究方法。,试验设计是属于一般研究方法中的科学试验方法的范畴,它是由试验方法与数学方法,特别是统计方法相互交叉而形成的一门科学。它是研究如何计划安排试验并对结果进行分析的一门科学。,科技人员掌握应用各种先进试验设计与结果分析方法,可提高自身的素质及科学试验水平,将加快所从事科学研究的进程。,科学研究中不同阶段的试验设计,研究初期阶段的探索试验简单设计试验目的是明确某因素的作用。如对照试验、比较试验等。,筛选试验目的是在众多因素中明确关键因素或优良水平。如单因素多水平试验(格子设计等);少量水平的多因素试验(如混杂设计、不完全区组设计、均匀设计、正交设计等)。,研究中期阶段的析因试验多因素的析因试验,以深入分析主要因素的作用及其相互关系。如拉丁方设计、交替设计、裂区设计、正交设计等。,研究后期阶段的优化试验目的是深入研究少数关键因子及相互作用关系并进行优化设计。如回归设计、配方设计、稳健设计等。,第二章试验设计的概念及原理,2.1试验的基本概念,2.1.1总体与样本,总体(Population)定义:由具有共同性质的全部个体(Individual)组成。而个体是研究对象中可以单独观测和研究的一个物体或一定量的材料。例如:一个药厂的某一种产品中有效药物含量值;全国采集的某种中药材中总甙含量。,样本(Sample)定义:按一定程序从总体中抽取的,数量相对较少的一组个体,称为该总体的一个样本。例如:所选出样品分析后得到的有效药物含量值;选出一定数量的中药材测得的总甙含量。,样本容量(Samplesize)样本中所包含的个体(或抽样单元)的数目。一般样本容量在30个以上为大样本。,2.1.2试验因子、水平、处理,试验因子(Factor)试验中安排的因子,或称试验因素。其实影响科学试验结果的因子往往很多,但进行试验时,仅能挑选少数几个。,水平(Level)在安排试验中,每个因子的某种具体措施称为该因子的某种水平。处理(Treatment)多因子试验中,不同因子的不同水平的组合称为处理;而在单因子试验中,该因子的不同水平亦可称为处理。,2.1.3试验单元、重复、区组,试验单元(Unit)试验中实施试验处理的基本对象。如医药学试验中的小白鼠、医院病人等。,重复(Replication)在试验中,每一种处理往往进行一次以上试验,称为处理的重复。区组(Block)某一批处理排列时集中在某一区域(时期、空间等)称为区组。,2.1.4试验误差及来源、分类,试验误差(Error)在科学试验中,由于受到许多非处理因子的干扰和影响,所观察到的每个处理的测量结果与该处理的真值会产生一定的偏差,这个偏差就是试验误差。,试验误差的来源试验单元间的固有差异试验单元上操作方法间的差异试验单元间环境的差异,试验误差的分类随机误差(Randomerror)系统误差(Systematicerror)粗大误差(过失误差)(Grosserror),2.1.5精密度、正确度、精确度,精密度(Precision)表示试验结果中随机误差大小的程度。它是在试验规定条件下,对处理进行多次相互独立测量所得结果之间符合的程度。,精确度(Accuracy)又称准确度。它表示试验处理测量结果与被测量处理真值之间的接近程度。它反映了试验测量结果中系统误差与随机误差的综合。,正确度(Correctness)表示试验测量结果中系统误差大小的程度。它反映了试验规定条件下,试验测量中所有系统误差的综合。,2.1.6提高试验精确度的主要途径,选择试验处理注意试验材料改进试验技术统计方法控制,2.2试验设计的原理,2.2.1唯一差异原则,进行两处理平均值比较时,它们两者之间仅有此两种处理不同而引起的唯一差异,而其它各种试验条件都应保持在同等的背景上。,2.2.2试验设计的基本原理,为控制干扰因子引起的差异,降低试验误差,在试验设计中要遵循如下三条基本原理:重复随机化区域控制,第三章试验统计基础及EXCEL简介,3.1试验统计基础,3.1.1试验数据的类型,数量数据当试验结果显现数量上的变化,由计数或测量所得到的数据资料。,计数数据:由计数法得到的数据,是非连续型变量数据。取值时一般为正整数。如人体白细胞计数等。计量数据:由测量所得的数据,是连续型变量数据。不一定是整数,通常有不同的有效数字。如药片的重量等。,质量数据当试验结果显现属性变化,只能分门别类处理所得到的数据。称名数据:数据的各种类别并没有顺序大小差别,仅是属性上名称不同。可按属性类别进行分组统计次数,有时也称次数数据。如人的血型等。,顺序数据:数据的各种类别存在顺序大小的差别。如疾病治疗的疗效有痊愈、好转、无效等。可按属性类别进行分组统计其次数,有时也可数量化。,3.1.2试验数据的初步分析,试验数据可采用样本的基本统计参数进行初步分析。平均值(Mean/Average)算术平均值(Arithmeticmean),加权平均值(Weightedmean),极差(Range):一组数据中最大的与最小的值之间的差。,方差(s2、2)和标准偏差(s、)Variance&StandardDeviation样本方差:样本的标准偏差:总体的方差:总体的标准偏差:,3.2EXCEL的统计功能简介,3.2.1EXCEL界面,3.2.2数据、公式及函数,数据输入技巧复制数据序列填充公式公式输入公式编辑单元格的引用,常用函数及格式求和SUM(number1,number2,)平均值AVERAGE(number1,number2,)方差总体:VARP(number1,number2,)样本:VAR(number1,number2,),标准偏差总体:STDEVP(number1,number2,)样本:STDEV(number1,number2,)相对标准偏差(RelativeStandardDeviation)STDEV(number1,number2,)/AVERAGE(number1,number2,)极差MAX(number1,number2,)-MIN(number1,number2,),3.2.3随机数函数在抽样中的应用,随机数发生函数RAND()随机抽样(Randomsampling)例:从1000瓶中选取10瓶作为样品。采用公式:ROUND(RAND()*1000,0),临床试验中给病人随机指定治疗方法例:对20个病人随机指定服用有效药物和安慰剂。方法一:利用公式:ROUND(RAND()*10,0)方法二:随机数排序法。,3.2.4统计分析工具的使用,调用统计分析工具的操作EXCEL菜单工具数据分析(19种)找不到此选项时,菜单工具加载宏勾选分析工具库,数据分析工具使用举例描述统计,第四章简单试验设计与统计分析,正态分布与标准正态分布,正态分布(Normaldistribution)若总体符合正态分布则记为:XN(,2)。X的概率密度函数为:,标准正态分布Standardnormaldistribution均值为0,标准偏差为1的正态分布。任意正态分布可通过简单的变量变换化为标准正态分布,即令U=(X-)/,则:UN(0,1),4.1不相关样本的方差比较,4.1.1F分布(Fdistribution),两个具有共同方差的独立正态总体。样本容量为n1的一个样本来自第一个总体,来自第二个总体的另一个样本,其样本容量为n2,则:,F分布可用来检验平均值的差别(方差分析)和检验方差是否相等,即F检验。,4.1.2两个方差的假设(显著性)检验,例1:比较用两种不同的步骤制备的粉末产品,混合程度是否均匀一致。可采用的试验设计:分别随机取出7个重量一样的粉末混合物样本,分析其中的活性物质的量(mg)。,假设检验(Hypothesistesting)步骤:提出假设:H0:12=22H1:1222确定检验水平:预先规定的概率值,一般取0.05(双尾检验)选择检验方法,计算统计量:F=8.33或0.12,与临界值比较,作出统计推断结论:利用EXCEL数据分析中的双样本方差的F检验工具(注意:单尾=0.025);临界值计算也可利用FINV函数(其反函数FDIST)。格式:FINV(probability,deg_freedom1,deg_freedom2);FDIST(F,deg_freedom1,deg_freedom2)。结论:FF0.025(6,6)=5.82,Pt0.05(5)=2.57,PF0.05(1,4)=7.71,Pt0.05(8)=2.31,P0.05,在=0.05水平上,拒绝H0,认为成人的舒张压与其血清胆固醇水平间存在显著的相关性。,第七章正交试验设计与分析OrthogonalDesign/Orthoplan,多因素试验的处理会因试验因素及其水平的增加而急剧增加,从而使试验的实施变得困难,甚至无法实施。,部分实施试验:对于因素数目在三个以上的多因素试验,可以在一定条件下挑选部分处理作试验并进行严格的统计分析。正交试验设计是常用的一种部分实施试验设计方法。,7.1正交表及其特点,正交表是正交试验设计中合理安排试验,并对数据进行统计分析的主要工具。较简单的正交表如L9(34),正交表的表头可表示为:Lt(nq)L代表正交表,各种符号意义为:t,正交表行数,即处理数;n,因子的水平数;q,正交表列数,即可容纳的最大因子数。,L9(34)正交表,正交表的性质:每一列中,不同的数字出现的次数相等;任意两列中,将同一行的两个数字看成一种排列时,每种排列出现的次数相等。,正交试验设计的特点:整齐可比;均衡分散;简单易行。,正交试验设计在试验的初期、中期及后期均可应用。但要注意,因其为部分实施试验,应慎重分析结果;另外有条件时尽量设置重复,以便对试验误差进行直接估计。,7.2简单设计与结果分析,例9:自溶酵母提取物是一种多用途产品。为探讨外加中性蛋白酶的方法,需作啤酒酵母的最适自溶条件试验,为此安排3因素皆3水平的试验。试验指标为自溶液中蛋白质含量(%)。,首先列出试验因素水平表,选择正交表,实施试验:由经验知,该试验几乎不存在交互作用,故选用L9(34)正交设计。,试验结果的直观分析:求各列各水平的和Kj;求各水平的均值kj;由各列均值求出极差Ri;Ri愈大,说明该因素对指标影响愈大。故可由Ri给出各因素影响指标的主次顺序:主次ABC由均值,A以A3好,B以B1好,C以C1好,故最佳组合应为A3B1C1。但这个处理未作试验,需进一步作验证试验。,试验结果也可进一步作方差分析,分析各因素中哪个或哪几个因素对试验指标有显著的影响。,上机实习目录,上机实习1(EXCEL基本操作技巧)上机实习2(统计函数和分析工具)上机实习3(F检验)上机实习4(u检验和单样本t检验)上机实习5(独立样本t检验和配对样本t检验)上机实习6(方差分析)上机实习7(线性回归和相关分析)上机实习8(正交试验数据分析)上机实习9(复习),EXCEL上机实习内容(1),熟悉EXCEL软件界面,复习基本操作(如文件的打开和保存,工作表、行、列的插入等)。练习数据的输入技巧:复制和序列填充。练习简单公式的输入、编辑和复制。练习公式中单元格的引用,理解相对引用、绝对引用和混和引用。,EXCEL上机实习内容(2),利用随机数发生函数生成一组1020个样本数据,练习使用统计函数SUM,AVERAGE,VAR(VARP),STDEV(STDEVP),MAX,MIN等求取样本统计参数。利用随机数发生函数将30个病人随机分为两组(两种方法),还有其它方法吗?利用随机数发生函数生成一组1020个样本数据,练习统计分析工具中描述统计的使用。,EXCEL上机实习内容(3),理解假设检验的原理。由例1的数据练习双样本方差的F检验工具;理解和掌握FINV和FDIST函数的使用,利用其编写分析工具。某单位测定了蓄电池厂工人32名,得尿氨基乙酰丙酸(mg/l)的平均含量为7.06,方差为42.3072,又测定了化工厂工人6名,得平均含量为3.48,方差为0.9047,试比较两方差的差别是否有统计学意义?=0.05(单尾)。要求编写分析工具。,EXCEL上机实习内容(4),根据大量调查,已知健康成年男子脉搏均数为72次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论