药品数据统计分析与应用.doc_第1页
药品数据统计分析与应用.doc_第2页
药品数据统计分析与应用.doc_第3页
药品数据统计分析与应用.doc_第4页
药品数据统计分析与应用.doc_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

药品数据统计分析与应用一、导言1、我们面临大数据时代的挑战数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。麦肯锡大数据时代已经降临,在商业、经济及其它领域中,决策将日益基于数据和分析而作出,项并非基于经验和直觉。纽约时报2、数据是实施GMP管理的支持 数据是一各观测值,是实验、测量、观察、调查等活动中以数量的形式给出的结果。数据分析是企业有目的地收集数据、分析数据,使之成为信息的过程,这一过程是在产品的整个生命周期的支持过程;是实施GMP管理的支持,是建立并实施高质量的药品质量体系的支持过程。3、数据统计分析质量管理体系的支持过程(1)数据是信息的载体; (2)数据统计是数据转为信息的加工过程,统计技术是企业质量体系中的一个重要要素,分析数据,控制过程中的异常,坚持不懈地持续改进,提高产品质量,提升企业的核心竞争力。4、数据是企业的无形资产l 掌握现状l 工序调节l 工序管理l 检查和评价l 分析和改进二、数据分析的有关基础知识1、数据分析的类型l 描述性数据分析:是对一组数据的各种特征的分析,以便描述测量样本的各种特征及其所代表的总体的特征;l 推断性数据分析:也叫探索性数据分析,是为了形成值得假设的检验而对数据进行分析的一种方法; l 验证性数据分析:是对社会调查数据进行的一各统计分析。通过因子间的关系是否符合研究者所设计的理论; 2、定量数据的分类l 计数值数据:不能连续取值的数据; l 计量值数据:可以连续取值的数据;l 差别:当数值是百分率时,取决于给出数值的数学式分子,分子为计量值,则求得的百分率是计量值;如分子为计数值,求得的百分率虽不是整数提也属于计数植。3、值得注意的概念l 总体:指所要研究的对象的全体;l 个体:指组成总体的每一个基本单位;l 样本:从总体中随机抽出的一部分样品,样本中所包含榈数目称为样本大小,又叫样本量,常用n表示;4、数据的特征值位置特征值:子样平均值 了样中位数量 差异特征量:极差标准差 相对标准差 实例1对气相层析的实验人员进行技术考核,进样10次,每次0.5ul,得色谱峰高(mm)为:142.1 147.0 146.2 145.2 143.8 146.2 147.3 150.3 149.9 151.8 =146.98 s=3.00 RSD=2.04%结论:有经验的色谱工作人员很容易将RSD控制在1%以内,可认为该实验人员的技术还不够稳定,操作不够熟练。5、数据分析的基础制药生产现场的数据是分析的基础,生产工序的稳定是收集可靠数据的前提,抓住生产现场的六大因素是生产的关键。6、数据分析的形式算一算:特征数看一看:动力变化比一比:统计值找一找:相关因素7、数据分析的前处理(筛选)l 数值的修约(GB/T8170-2008)四舍六入五考虑,五后非零则进一,五后全零看五前,五前偶舍奇进一,不论数字多少位,都要一次修约成。l 修约的位数:试验运算中,应比规定的有效数字多保留一位数,后根据有效数字的修约进舍至规定有效位。标准差一般按二位有效即可,最多保留小数点后二位。l 数据筛选的方法(1) 按美国EJ鲍尔推荐的方法进行处理。步骤如下: 计算这群检测值的平均值; 计算极差R; 计算可疑值Xi与平均值之差的绝对值,再用极差R除,得出ti与规定附表的临界值比较,若ti比表上的t值大,则应弃去此可疑值。 附表如下:抛弃无效测量的临界伸值n345678910111213141520t1.531.050.860.760.690.640.600.580.560.540.520.510.500.46注:用分式计算t,如计算值超过表上的值时,则所调查的值是无效的,此概率约为0.95。,实例2某分析者对一样品检测,得:93.3% 93.3% 93.4% 93.4% 93.3% 94.0%,问:第六个结果有效吗?第1步:计算方法六个结果的平均值:=93.45%第2步:计算极差R=94.0=93.9=0.7第3步:计算可疑值与增均值之差的绝对值再用极差除:=(91.0-93.45)/0.7=0.79第4步:与临界值t=0.76(n=6)比较 ti=0.79 t=0.76,说明94.0%是一个离群数据,应舍弃。(2) G检验法(格鲁布斯法)步骤: 算出包括可疑值在内的平均值; 计算可疑值与平均值之差; 算出包括可疑值在内的标准偏差; 用标准偏差除可疑值与平均值之差得G值: 查G的临界值表,若计算的G值大于查到的值,就可把可疑值舍弃。,查表G(6,0.05)=1.89,所以这个值应舍去。Grubbs检验法的临界值测定次数置信界限测定次数置信界限95%99%95%99%31.151.15152.552.8141.481.50162.592.8551.711.76172.622.8961.891.97182.652.9372.022.14192.682.9782.132.27202.713.0092.212.39212.733.03102.292.48222.763.06112.362.56232.783.09122.412.64242.803.11132.462.70252.823.14142.512.768、质量特性值的正态分布绝大多数质量特性值服从或近似服从正态分布。正态分布的中心点(均数)最高,然后逐渐向两侧下降,以均数为中心,两端对称,永远不会与X轴相交的钟形曲线。范围机率0.6750.00%168.26%1.9695.00%2.095.45%2.5899.00%399.73%10、产品质量波动10.1正常波动:同随机原因引起的产品质量波动,生产过程在控制中,呈稳定状态;10.2 异常波动:同系统原因引起的产品质量波动;引起波动的原因5M1E:人、机、料、法、环、测,生产过程在失控中,呈不稳定状态。11、统计分析的两类错误和风险:第一类错误:把质量好的一批成品当作质量坏的一批成品去看待、处理的错误;:第一类错误的概率值,也叫第一类错误的风险率。第二类错误:把质量坏的一批成品当作质量好的一批成品去看待、处理的错误;:第二类错误的概率值,也叫第二类错误的风险率。12、药品抽样检验的风险:抽样检验是由样本的质量状况去推断总体的质量是要冒风险的。12.1 生产方风险(PR):对于给定的抽样方案,当批产品或过程质量水平(如不合格品率)为某一指定的可接收值(如可接受质量水平)时的拒收的概率,即把质量好的批产品判为不合格,用表示。12.2 使用方风险(CR):对于给的抽样方案,当批产品或过程质量水平为某一指定的不满意值(如极限质量水平)时的接收概率,即把质量差的批产品判为合格,使用方风险一般用表示。13、关于样本13.1 样本要有代表性:要代表总体,如果做不到这一点,将导致对总体特性作出不良估计;13.2 样本也会产生误差:即使样本代表总体,但从样本得到的信息也会产生一定程度的误差,这种误差的大小可增大样本量来减小但却不能消除。14 百分比抽样的不科学性在百分比抽样中,在相同的批不合格品率的情况下,产品批量越大,则批的接收概率越小,产品批量越小,则批的接收率越大,即“大批量严,小批量宽”,不能正确鉴别批产品的质量水平,所以,这是一种不科学的抽样检验方法,工业发达国家早已淘汰。三、GMP实施中常用的数据分析工具1、描述性统计技术用来对统计数据进行整理和描述的技术。主要有:折线图、饼分图、因果图、树图、排列图。2、推断性统计技术:在统计数据描述的基础上立新功,对所反映的问题再进行分析解释和作出推断性结论的技术。主要有:控制图(分析用图)、回归分析、假设检验。3、过程控制所用的技术:下次试验、过程能力、控制图(控制用图)4、常用质量分析图的应用序号名称作用1折线图直观地表现出数据的变化趋势2饼分图表示一个系统中各部分所占比率3散点图判断两个质量因素之间的相关性4因果图分析原因与结果的关系,找到问题的原因5树图对主题构成因素进行系统分析展开6排列图寻找影响产品质量的主要问题7控制图判断生产过程是否异常及导致导常的因素4.1、散点图:又称相关图,是研究成对出现的两组相关为数据之间相关关系的简单图示技术。用来发现、显示和确认两组相关数据之相关关系,并确定其预期关系。 370380390400410420430450460470480490500510520370380390400410420430450460470480490500510520370380390400410420430450460470480490500510520370380390400410420430450460470480490500510520370380390400410420430450460470480490500510520370380390400410420430450460470480490500510520a 图b 图c 图d图e图f图表示随x增加,y随之明显增加的关系,称为强正相关,表明x与y关系密切表示随x与y之间没有什么关系,称为不相关。表示随x增加,y随之明显减少的关系,称为强负相关,表明x与y关系密切表示随x增加,y基本上随之减少的关系,但不如d图强烈,称为弱负相关,表明除了y的影响外,还有其他因素表示随x与y之间有关系,但不是线性关系。表示随x增加,y基本上随之增加的关系,但不如a 图强烈,称为弱正相关,表明除了y的影响外,还有其他因素4.2 因果图:又名特性要因图,表示结果(特性)与原因(影响特性的要因)之影响情形或两者关系之图形。定性寻找引发结果的原因。质量特性人员机器测量方法材料4.3排列图:又叫柏拉图。它是将质量改进项目从最重要到最次要顺序排列而采用确定主导因素的一种图表。分析:通常占总频数80%以上的项目是主要问题,占总频数10%以上的项目是次要问题,余下的占总频数10%左右的项目是更次要的一般问题。柏拉图原理:关键的小数,次要的多数。100806040200 A B C D E100%80%60%40%20%0%问题原因公吨50%80%90%97%4.4控制图:是地过程质量特性值的数据进行分析和判断工序是否处于稳定状态所使用的带有控制界限的图。从而监察过程是否处于控制状态的一种用统计方法设计的图。4.4.1作用:对生产过程进行监控发现异常,及时告警;4.4.2控制图的种类: 分析用控制图 控制用控制图4.4.3其结构:中心线CL= 上控制线UCL=+3S 下控制线UCL=-3S4.4.4控制图过程控制的核心手段(1)分析用控制图主要分析:所分析的过程是否处于统计控制状态; 该过程的过程能力指数是否满足要求,达到技术稳态。须将过程调整到技术稳态。(2)控制用控制图:当过程达到了所确定的状态后,才能将分析用控制图的控制线作为控制用限,进入日常管理后关键是保持所确定的状态。(3)控制界限就是区分偶然波动与异常波动的科学界限。实例3某制药厂生产链霉素年月的含量(%)控制如下表,分析本月的生产控制情况批号12345678含量97.24 97.31 97.67 97.80 97.89 97.96 97.06 97.90 移动极差RS0.07 0.36 0.13 0.09 0.07 0.90 0.84 批号910111213141516含量98.08 98.02 98.08 97.87 98.28 97.55 97.44 97.73 移动极差RS0.18 0.06 0.060.210.410.730.110.29批号1718192021222324含量97.72 97.46 97.62 98.27 98.31 98.46 98.02 98.11 移动极差RS0.010.260.160.350.040.150.440.09控制图:minitab15结论:含量X 的单值控制图检验结果 检验 1。1 个点,距离中心线超过 3.00 个标准差。检验出下列点不合格: 7检验 5。3 点中有 2 点,距离中心线超过 2 个标准差(在中心线的同一侧)检验出下列点不合格: 2检验 6。5 点中有 4 点,距离中心线超过 1 个标准差(在中心线的同一侧)检验出下列点不合格: 24含量X 的 MR 控制图检验结果 检验 1。1 个点,距离中心线超过 3.00 个标准差。检验出下列点不合格: 74.4.5控制图的判断有判稳和判异两种判断方法稳定(正常)判稳不稳定(异常)异常(不稳定)判异不异常(正常、稳定)4.4.6控制图判断的两类错误 第类错误:弃真概率(虚发警报) 由于休哈特确定了3原则,所以弃真概率=0.0027,数值很小。 第类错误:取伪概率(漏发警报) 由于=0.0027数值很小,所以导致取伪概率的数值很大。4.4.7判断的概念l 由于=0.0027数值很小(虚发警报的概率很小)。所以在控制图中打1点超界就判异,置信度达99.73%,很可靠。l 由于数值很大(漏发警报的概率很大)。所以,在控制图中打1点在界内就判稳,置信度很低,不可靠。 但是1,所以连续打m点进行判稳,总=m数值很小,很可靠。l 判稳准则 在控制图中连续打m点,界外点数d时判稳 (1)m=25,d 0,即,25点不得出现一点在界外。 (2)m=35,d 1,即,35点允许出现一点在界外。 (3)m=100,d 2,即,100点允许出现两点在界外。4.4.8判异准则的制定 4.4.8.1判异的理论基础是“小概率事件原理” 小概率事件原理又称小概率事件不发生原理,其数学定义是:事件A发生的概率很小(如0.01),现经过一次或少数次试验,事件A居然发生了,就有理由认为A的发生是异常。 统计方法的应用是为捕捉异常先兆。因此,在应用前应确定小概率,小概率实际是允许判断错误的概率,称为风险度、风险概率、风险水平或显著水平。根据被判断事物的重要度,可取0.01、0.05、0.10等。与风险度相对应的是置信度(1- ),又称为置信概率、置信水平。由于风险度不可能为“0”,所以置信度(1- )不可能为100%。4.4.8.2判异准则的制订步骤 (1)设定小概率,休哈特早期设定的小概率 点子超界=0.0027 点子在界内排列不随机=0.01,英国以没有作到等概率为由,一律 =0.01,休哈特后期设定的小概率,一律=0.0027。(2)GB/T 4091-2001 idt ISO 8258:1991标准制订的判断准则即为休哈特后期做制订。充分设想过程中所发生的各种事件,逐一计算其发生概率P。(3)制订准则若 P 判断过程正常;若 P 判断过程异常,则该事件本身即为对过程异常的判断准则。4.4.9判异准则 GB/T 4091-2001 ISO 8258:1991常规控制图标准给出八个判异的检验模式。凡在控制图中出现八个检验模式中任何一个时,即可判断过程异常。 在八个检验模式中,除第4个模式由蒙特卡罗试验(统计模拟试验)确定以外,其他7个模式均由概率计算而确定。控制图反映过程处于异常状态时,应区分是“坏”的异常还是“好”的异常。坏异常 质量分析 找出原因 将其消除好异常 质量分析 找出原因 将其巩固控制图判异准则(过程异常的检验模式)准则1:一点落在A区以外控制图中1点越出控制界限的概率为 0.0027。 准则1是控制图判异准则中最为重要的检验模式。 准则1可以对分布参数的变化或分布参数的变化给出 信号,变化越大给出信号的速度越快(时间周期越短)。 准则1还可以对过程中的单个失控做出反应,如计算错误、测量误差大、原材料不合格、设备工装发生故障等。准则2:连续9点落在中心线同一侧控制图中1点落于中心线一侧的概率为0.50,则连续9点落于中心线同一侧的概率为0.509 =0.00195, 准则2是对准则1的补充,以改进控制图的灵敏度。准则2是为了检验分布中心线以下,则反应了参数的减小,若连续9点落于中心线以上,则反应了分布参数的增大。准则3:连续6点递增或递减控制图中连续6点递增或递减的发生概率为准则3是针对分布参数(过程平均值)的趋势变化而设计的,它判定分布参数(过程平均值)的较小的趋势变化的灵敏度比准则2要高(更为灵敏)。过程中产生趋势变化的原因可能是刀具、工具的磨损、维修水平降低、操作人员技能的逐渐变化等,这种变化往往会造成概率也随之变化。递增或递减显示了趋势的变化方向。准则4:连续14点中相邻两点上下交替准则4由于并不限定点子落入哪个区域,因而不能由概率计算来决定。准则4是通过蒙特卡罗试验(统计模拟试验)所决定的。 准则4用于检验由于数据未分层(数据来源于两个总体,如轮流使用两台设备加工或由两位操作人员轮流进行操作)而引起的系统效应,准则4也可以检验过程中存在的周期性变化的异常。准则5:连续3点中有2点落在中心线同一侧的B区以外在控制图中1点落入中心线同一侧A区的概率为2点落入中心线同一侧A 区的概率为 P=0.021452=0.000463点中的2点可以是任何2点,至于第3点可以在任何处,甚至不存在。 准则5用于检验分布参数(过程平均值)的变化,对于分布参数的变化的检验也很灵敏。准则6:连续5点中有4点落在中心线同一侧C区以外在控制图中,1点落入中心线同一侧C区以外的概率为4点落在中心线同一侧C区以外的概率 P=0.1574=0.0006 准则6与准则5的情况类似,第5点可以在任何处。 准则6是为了检验分布参数的变化,其对过程平均值偏移的检验是很灵敏的。准则7:连续15点中全部在中心线两侧C区以内连续15点落在中心线两侧 C 区以内的概率为: 0.682615=0.00325连续16点落在中心线两侧 C 区以内的概率为: 0.682616=0.0022应注意出现准则7的现象可能有两种情况:(1) 由于分布参数的减小,这是一种良好的异常,应进行质量分析,找出原因将良好的状况加以巩固;(2)不要轻易被这种良好的“外貌” 所迷惑。应注意到可能是非随机性所致。如:数据的虚假、数据分层不够以至控制图设计中的错误等。只有排除了这些可能之后才能总结分析现场减小标准差的先进经验。准则8:连续8点在中心线两侧,但无1点在C区以内连续8点在中心线两侧 C 区以外的概率为: (0.9973-0.6826)8=0.31478=0.0001 出现准则8的现象可能是分布参数的显著增大,也有可能是数据分层不够,应认真分析。四、正交试验设计1、 正交表L4(2)3读为三因素二水平四次试验试验号列号1231111221231224221L9(3)4读为四因素三水平九次试验试验号列号1234111112122231333421235223162312731138322193321试验号列号123ABC1A1B1C12A1B2C23A1B3C34A2B1C25A2B2C26A2B3C17A3B1C38A3B2C19A3B3C2三因素三水平试验的均衡分散立体图正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图10-1中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1 (2)A2B1C2 (3)A3B1C3(4)A1B2C2 (5)A2B2C3 (6)A3B2C1(7)A1B3C3 (8)A2B3C1 (9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C 3个因素来说,是在27个全面试验点中选择9个试验点,仅是全面试验的三分之一。 从图中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。 9个试验点均衡地分布于整个立方体内 ,有很强的代表性, 能够比较全面地反映选优区内的基本情况。 由 图可以看出,在立方体中 ,任一平面内都包含 3 个“()”, 任一直线上都包含1个“()” ,因此 ,这些点代表性强 ,能够较好地反映全面试验的情况列试验方案表头设计选择合适正交表因素、水平确定选因素、定水平试验指标试验目的与要求2、试验方案设计:试验结果分析3、试验结果分析:进行试验,记录试验结果试验结果极差分析计算K值计算K值计算极差R绘制因素指标趋势图优水平因素主次顺序优组合结 论试验结果方差分析列方差分析表,进行F 检验计算各列偏差平方和、自由度分析检验结果,写出结论4、实例1:为提高山楂原料的利用率,研究酶法液化工艺制造山楂原汁,拟通过正交试验来寻找酶法液化的最佳工艺条件。(1) 明确试验目的,确定试验指标对本试验而言,试验目的是为了提高山楂原料的利用率。所以可以以液化率液化率=(果肉重量-液化后残渣重量)/果肉重量100%为试验指标,来评价液化工艺条件的好坏。液化率越高,山楂原料利用率就越高。试验设计前必须明确试验目的,即本次试验要解决什么问题。试验目的确定后,对试验结果如何衡量,即需要确定出试验指标。试验指标可为定量指标,如强度、硬度、产量、出品率、成本等;也可为定性指标如颜色、口感、光泽等。一般为了便于试验结果的分析,定性指标可按相关的标准打分或模糊数学处理进行数量化,将定性指标定量化。(2) 选因素、定水平,列因素水平表 经全面考虑,最后确定果肉加水量、加酶量、酶解温度和酶解时间为本试验的试验因素,分别记作A、B、C和D,进行四因素正交试验,各因素均取三个水平,因素水平表见表所示。 水平试验因素加水量(mL/100g)A加酶量(mL/100g)B酶解温度()C酶解时间(h)D1101201.52504352.53907503.5(3) 选择合适的正交表列:正交表的列数c因素所占列数+交互作用所占列数+空列。自由度:正交表的总自由度(a-1)因素自由度+交互作用自由度+误差自由度。此例有4个3水平因素,可以选用L9(34)或L27(313) ;因本试验仅考察四个因素对液化率的影响效果,不考察因素间的交互作用,故宜选用L9(34)正交表。若要考察交互作用,则应选用L27(313)。 (4) 表头设计此例不考察交互作用,可将加水量(A)、加酶量(B)和酶解温度 (C)、酶解时间(D)依次安排在L9(34)的第1、2、3、4列上列号1234因素ABCD(5)编制试验方案,按方案进行试验,记录试验结果。把正交表中安排各因素的列(不包含欲考察的交互作用列)中的每个水平数字换成该因素的实际水平值,便形成了正交试验方案表1试验号因 素试验结果(液化率 %)ABCD11(10)1(1)1(20)1(1.5)0212(4)2(35)2(2.5)17313(7)3(50)3(3.5)2442(50)123125223147623122873(90)1321832131893321425、实例2: 鸭肉保鲜天然复合剂的筛选。试验以茶多酚作为天然复合保鲜剂的主要成分,分别添加不同增效剂、被膜剂和不同的浸泡时间,进行4因素4水平正交试验。试设计试验方案 明确目的,确定指标。本例的目的是通过试验,寻找一个最佳的鸭肉天然复合保鲜剂。 选因素、定水平。根据专业知识和以前研究结果,选择4个因素,每个因素定4个水平,因素水平表见下表表: 天然复合保鲜剂筛选试验因素水平表水平因素A茶多酚浓度/B增效剂种类C被膜剂种类D浸泡时间/min10.10.5维生素C0.5海藻酸钠120.20.1柠檬酸0.8海藻酸钠230.30.2-CD1.0海藻酸钠340.4生姜汁1.0葡萄糖4 选择正交表。此试验为4因素4水平试验,不考虑交互作用,4因素共占4列,选L16(45)最合适,并有1空列,可以作为试验误差以衡量试验的可靠性。表头设计。4因素任意放置。编制试验方案。试验方案见下表表:天然复合保鲜剂筛选试验方案试验号A茶多酚浓度/B增效剂种类C被膜剂种类D浸泡时间/minE 空列结果11233236.2022412231.5433434330.0944211329.3251314431.7762131435.0273113132.3784332132.6491142338.79102323330.90113341232.87124124234.54131421138.02142244135.62153222434.02164443432.806、试验结果分析(极差分析方差分析)n 分清各因素及其交互作用的主次顺序,分清哪个是主要因素,哪个是次要因素;n 判断因素对试验指标影响的显著程度;n 找出试验因素的优水平和试验范围内的最优组合,即试验因素各取什么水平时,试验指标最好;n 分析因素与试验指标之间的关系,即当因素变化时,试验指标是如何变化的。找出指标随因素变化的规律和趋势,为进一步试验指明方向;n 了解各因素之间的交互作用情况;n 估计试验误差的大小。6.1直观分析法极差分析法计算简便,直观,简单易懂,是正交试验结果分析最常用方法。以上例为实例来说明极差分析过程。 Kjm, jm计算Rj极差分析法R法因素主次优水平判断优组合Kjm为第j列因素m水平所对应的试验指标和,kjm为Kjm平均值。由kjm大小可以判断第j列因素优水平和优组合。6.1.1、实例1:不考察交互作用的试验结果分析(1) 确定试验因素的优水平和最优水平组合分析A因素各水平对试验指标的影响。由表1可以看出,A1的影响反映在第1、2、3号试验中,A2的影响反映在第4、5、6号试验中,A3的影响反映在第7、8、9号试验中。A因素的1水平所对应的试验指标之和为KA1=y1+y2+y3=0+17+24=41,A1= KA1/3=13.7;A因素的2水平所对应的试验指标之和为KA2=y4+y5+y6=12+47+28=87,A2=KA2/3=29;A因素的3水平所对应的试验指标之和为KA3=y7+y8+y9=1+18+42=61,A3=KA3/3=20.3。结论:根据正交设计的特性,对A1、A2、A3来说,三组试验的试验条件是完全一样的(综合可比性),可进行直接比较。如果因素A对试验指标无影响时,那么kA1、kA2、kA3应该相等,但由上面的计算可见,A1、A2、A3实际上不相等。说明,A因素的水平变动对试验结果有影响。因此,根据A1、A2、A3的大小可以判断A1、A2、A3对试验指标的影响大小。由于试验指标为液化率,而A2A3A1,所以可断定A2为A因素的优水平。 同理,可以计算并确定B3、C3、D1分别为B、C、D因素的优水平。四个因素的优水平组合A2B3C3D1为本试验的最优水平组合,即酶法液化生产山楂清汁的最优工艺条件为加水量50mL/100g,加酶量7mL/100g,酶解温度为50,酶解时间为1.5h。(2) 确定因素的主次顺序根据极差Rj的大小,可以判断各因素对试验指标的影响主次。本例极差Rj计算结果见表3,比较各R值大小,可见RBRARDRC,所以因素对试验指标影响的主次顺序是BADC。即加酶量影响最大,其次是加水量和酶解时间,而酶解温度的影响较小。表3 试验结果分析试验号因素液化率ABCD1111102122217313332442123125223147623122873132183213189332142K141134689K287827146K361947254k113.74.315.329.7k229.027.323.715.3k320.331.324.018.0极差R15.327.08.714.3主次顺序BADC优水平A2B3C3D1优组合A2B3C3D1(3) 绘制因素与指标趋势图以各因素水平为横坐标,试验指标的平均值(kjm)为纵坐标,绘制因素与指标趋势图。由因素与指标趋势图可以更直观地看出试验指标随着因素水平的变化而变化的趋势,可为进一步试验指明方向。6.1.2、实例2:试验结果极差分析(1)计算Ki值。Ki为同一水平之和。以第一列A因素为例:K1=36.20+31.77+38.79+38.02=144.78K2=31.54+35.02+30.90+35.62=133.08K3=30.09+32.37+32.87+34.02=129.35K4=29.32+32.64+34.54+32.80=129.30(2)计算各因素同一水平的平均值i。1=36.20,2=33.27,3=32.34,4=32.32(3)计算各因素的极差R,R表示该因素在其取值范围内试验指标变化的幅度。 R=max(Ki)-min(Ki)(4)根据极差大小,判断因素的主次影响顺序。R越大,表示该因素的水平变化对试验指标的影响越大,因素越重要。由以上分析可见,因素影响主次顺序为A-C-B-D,A因素影响最大,为主要因素,D因素为不重要因素。(5)做因素与指标趋势图,直观分析出指标与各因素水平波动的关系。(6)选优组合,即根据各因素各水平的平均值确定优水平,进而选出优组合。 本例A、B、C为主要因素,按照平均值大小选取优水平为A1B1C4,即茶多酚用量取0.1%水平;以0.5%维生素C作为增效剂;1.0%葡萄糖液为被膜剂为形成的鸭肉保鲜复合剂为优组合,而浸泡时间为次要因素,选取操作时间1-3min即可鸭肉保鲜天然复合剂筛选试验结果试验号A茶多酚浓度B增效剂种类C被膜剂种类D浸泡时间E 空列结果11233236.222412231.5433434330.0944211329.3251314431.7762131435.0273113132.3784332132.6491142338.79102323330.9113341232.87124124234.54131421138.02142244135.62153222434.02164443432.8K1144.78140.72125.00135.23138.65K2133.08135.16137.48136.99135.15K3129.35128.18133.95132.27129.10K4129.30132.45140.08132.02133.61k136.2035.1831.2533.8134.66k233.2733.7934.3734.2533.79k332.3432.0533.4933.0732.28k432.3333.1135.0233.0133.40极差R 3.873.143.771.242.39因素主次顺序ACBD优水平A1B1C4优组合A1B1C47、多指标正交试验及极差分析示例3:油炸方便面生产中,主要原料质量和主要工艺参数对产品质量有影响。通过试验确定最佳生产条件(1)试验方案设计确定试验指标。本试验目的是探讨方便面生产的最佳工艺条件,以提高方便面的质量。试验以脂肪含量、水分含量和复水时间指标。脂肪含量越低越好,水分含量越高越好,复水时间越短越好。挑因素,选水平,列因素水平表。根据专业知识和实践经验,确定试验因素和水平见表4表4因素水平表水平试验因素湿面筋()A改良剂用量()B油炸时间(s)C油炸温度()D1280.05701502320.075751553360.180160选正交表、设计表头、编制试验方案。本试验为四因素三水平试验,不考虑交互作用,选L9(34)安排试验。表头设计和试验方案以及试验结果记录见表。(2)试验结果分析计算各因素各水平下每种试验指标的数据和以及平均值,并计算极差R。根据极差大小列出各指标下的因素主次顺序。试验指标: 主次顺序脂肪含量(): ACDB水分含量(): CDAB复水时间(s): ADBC初选优化工艺条件。根据各指标不同水平平均值确定各因素的优化水平组合。脂肪含量():A3B3C1D2水分含量():A1B2C1D1复水时间( s ):A2B2C2D3综合平衡确定最优工艺条件。以上三指标单独分析出的优化条件不一致,必须根据因素的影响主次,综合考虑,确定最佳工艺条件。对于因素A,其对粗脂肪影响大小排第一位,此时取A3;其对复水时间影响也排第一位,取A2;而其对水分影响排次要第三位,为次要因素,因此A可取A2或A3,但取A2时,复水时间比取A3缩短了14%,而粗脂肪增加了11.3%,且由水分指标看,取A2比A3水分高,故A因素取A2。同理可分析B取B2,C取C1,D取D3。优组合为A2B2C1D38、混合型正交表试验设计与极差分析示例4:某油炸膨化食品的体积与油温、物料含水量及油炸时间有关,为确保产品质量,现通过正交试验来寻求理想的工艺参数表5 因素水平表油炸温度A物料含水量B油炸时间C12102.03022204.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论