




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、v1.0可编辑可修改最佳培养基配比方案何官勇王国敏谢正勇摘要:本文通过建立三个模型来确定最佳培养基配比方案,其主要内容如下:模型一一一单因素模型。我们直接由图表的数据得到,即在N2 (或G)为准则的情况下,通过使用 matlab对图表中有同类性质的数据进行了拟合,得到了 只有一个碳源(氮源)与IFN- 丫(丫干扰素)的产量有关的几组拟合函数。通 过对这些拟合函数的分析、并结合图形判断出在 N2 (或C)为准则下的优化配比 方案。这个模型虽然可以得到比较优化的配比方案,但是它要求是在某一因素不变的情况下才成立的,而在实际求解最优配比方案时,要考虑到各组成因素的变 化情况,同时还要考虑各组成因素的
2、交互效应,所以我们想到了逐步回归模型。模型二一一逐步回归模型。我们是运用逐步回归分析法分析图表的数据,把 IFN- 丫(丫干扰素)的产量作为要考虑的因变量 y,三种碳源和四种氮源的含量 作为要考虑的七个自变量。因为七个自变量对因变量y的影响是不同的,所以我 们通过使用逐步回归分析模型把七个可供选择的自变量中的那些对建立回归方 程比较重要的因素选择出来,从而可以得到这些确定出来的因素即为影响 y产量 的主要因素,即得到所选择的碳源和氮源的种类, 在得到碳源和氮源的种类之后 我们要解决的问题是如何确定其含量使得IFN- 丫(丫干扰素)的产量最大,即最终找出最优配比方案。由此我们想到了模型三。模型三
3、。在确定了碳源和碳源的种类之后, 我们通过借鉴模型一中运用的单 因素准则法,先确定一个 C,在N、N对IFN- 丫产量影响的图像中进行比较, 就 可以得到IFN- 丫的产量达到最大时碳源和氮源的含量。在得到模型之后,我们对所建模型进行了的可行性分析,自我评价和改进。 在整个建模过程中我们运用 matlab去进行计算,使得我们在建模过程中处理数 据方便了许多。11v1.0可编辑可修改关键字:最优配比 matlab 拟合逐步回归图像分析 单因素准则一、问题重述及分析本题是某发酵实验中培养基的碳源(C,C 2, C3)和氮源(N,N)含量及IFN- 丫(丫 -干扰素)的产量的关系问题(实验数据表见附
4、件一):如何 选择碳源和氮源的种类及含量使IFN- 丫的产量达到最大本题是以生物化学知识为背景的数学建模。在建立模型之前首先要弄清楚发 酵、IFN- 丫(丫干扰素)等生物化学上的专用词,弄清楚培养基原理,再从实验 的数据出发,去建立一个最优的配比方案。、模型假设与假设的说明模型假设:1)每个实验都是在相同的外界条件下进行的,且外界条件的变化对实验不会产 生影响。2)每个实验都是独立进行、互不影响的。3)每个实验都是在所需的条件下顺利进行的。4)每个实验培养基中都有相同的且数量不变的真菌。5)每个实验培养基中的碳源、氮源和真菌都是均匀分布,且充满整个培养基。6)每个实验中的真菌利用氮源和碳源生成
5、 IFN- 丫的能力是一样的。7)每个实验中氮源、碳源的含量同时成比例变化不影响氮源、碳源的转化率。8)每个实验中不同碳源(氮源)之间都是独立的,不互相影响。9)每个实验用到的数据都用同一的单位。10)因为IFN- 丫是单一类型的干扰素分子,在下面的讨论中考虑不同的碳源和 氮源被吸收后都只生成一种相同类型的干扰素分子。22v1.0可编辑可修改11)每个实验的培养基本身都含有一定数量的碳和氮。12)在求解最佳配比方案时,不同碳源(氮源)价格是相同的,或者说他们的价 格的差别对于冋题而言是可以忽略的。假设的说明:对于假设1)、2)、3)、4)、5)、6)、8)、9),是为了保证实验具有可行性、 可
6、比性,在现实的情况下这些假设是可以做到的,符合实际的。对于假设7),是为了便于从实验数据中了解、得到更多的信息,从而建立 模型。在实际情况下,当两个反应物在其他条件不变时,浓度成比例改变,它们 的转化率一般是不变的,在这里也假设是不变的。对于假设10),是为了在判断碳源和氮源的优劣进而选择合适的原料时,不 需要去考虑因生成的IFN- 丫有不同种类,而导致在判断碳源和氮源时,无法根 据表中的量去判断的情况,在现实中因为IFN- 丫是单一类型的干扰素分子,考虑其只会产生一种IFN- 丫,也是合理的。对于假设11),是从实际情况出发,考虑到一方面每个培养基中本身就含有 必备的营养素,也就会含有一定的
7、碳和氮;另一方面,因为实验中有五组数据是在只有碳或氮的情况下生成的,如果没有碳或氮是不会出现这些情况的。对于假设12),是为了在判断碳源和氮源的优劣进而选择合适的原料时,只 需从相同原料时生成IFN- 丫的产量的多少考虑即可,这样假设是从方便建模的 角度出发的。在现实中,会出现价格不同,甚至相差很大的情形,在这个时候就 必须要考虑经济效益了,我们将在模型改进中予以简要说明。三、模型建立及求解模型一:经过我们分析认为第14,15,16,17,23五次实验为特殊情形,在以下分析中暂不考虑,将在模型二的第二步中予以说明。下面介绍模型一:首先,根据实验数据研究 N含量不变的准则下,不同的 C1 (C2
8、, G)的含量 34v1.0可编辑可修改对产生IFN- 丫的影响,主要思想如下:找出含C(C2, C3)源的项及其对应的IFN- 丫的产量的项,禾用数学软件 matlab把表中的C (C2,C3)的含量与IFN- 丫的 产量有关的数据拟合成曲线,建立它们两者之间的函数关系。 把建立G(G, C3) 的含量与IFN- 丫的产量的三条曲线图像放在同一个坐标系中,进行观察、比较, 取图像在一定区间内最上方的曲线所对应的碳源为在该区间内所选择的碳 源,对应区间内取得函数最大值时的自变量即为碳源的含量。其次,根据实验数据研究Ci准则下,不同的N( N M 2)的量的对产生IFN- 丫的影响,主要思想和上
9、面的一样,这里就不累述了。最后,根据在N含量不变的准则下求出的一个最佳的碳源C (i为1、2或3中的一个),把N,C (i为1、2或3中的一个)的组合作为一个优化的配比方 案。同理,根据在C含量不变的准则下求出的最佳的一个氮源 N (i为1、2、3 或4中的一个),把C,N (i为1、2、3或4中的一个)的组合也作为一个优化 的配比方案。具体的做法如下:把实验设置为七组,把第1至第5个实验作为第一组,第6至第9个实验作 为第二组,把第10至13个实验为第三组,把第15至第18个实验作为第四组, 在第1至5个实验中把C按假设7)都化为2后所得的新结果分为一组作为第五 组,把第23至28个实验作为
10、第六组,把第29至32个实验作为第七组。在N含量为,Ni、M、N、Q、C3含量均为零时,利用数学软件 matlab对 1, 2, 3, 4, 5组实验中C的含量x与IFN- 丫的产量y的关系进行三次曲线拟 合。具体的拟合曲线如下:Matlab 指令:x= 1 2 3;y=;a=polyfit(x,y,3)x 仁:3;44v1.0可编辑可修改z=polyval(a,x1);plot(x,y,k*,x1,z,r)a =得到拟合曲线,如图(1)所示。拟合函数为:y = x 3 - x 2 + x +同理,对固定的N,可以按上述的方法拟合第二组,和第三组实验的数据,具体的拟合过程如下:对第二组:C2的
11、含量x与IFN- 丫的产量y的关系进行三次曲线拟合,具体的拟合曲线如图(2):拟合函数为:y = x 3 + x 2 x +对第三组:C3的含量x与IFN- 丫的产量y的关系进行三次曲线拟合,具体的拟合曲线如图(3):拟合函数为:y = x 3 x 2 + +(2)55v1.0可编辑可修改把上面建立的 C、C2、G 的含量与IFN- 丫的产量的三条 曲线图像拟合在同一个坐标下, 得到图(4):从上图可知,以N2含量不变作为准则时,取 C1作为碳源,IFN- 丫产量明显最大。因此,我们取 C1、N2作为碳源和氮源。通过计算可以得到 C1的最大 值,该值即为N2不变准则下IFN- 丫产量取最大值时
12、的含量,由此我们即得到一 个优化配比方案。该方案为:C1 : N2=:同理:以C1含量不变作为准则的情况下,可以得到另一个优化配比方案。模型二:模型一中我们只考虑了单一准则下各因素的最优时的情况,然而,实际上各个因素都在变化,要找到最优方案必须考虑周全。因此,我们要同时考虑三种碳源和四种氮源,分析它们对IFN- 丫产量的影响的大小,从中选取影响较大且合 理的组合,由此我们想到了逐步回归分析方法,建立了逐步回归模型。通过使用这种方法选取出了对IFN- 丫产量的影响较大的碳源、氮源。在运用这种方法时, 我们是借助于数学软件 matlab的,我们的具体计算过程为:第一步:分别记C1、C2、C3 N1
13、、N2 N3 N4等7列的数据为列向量x1、x2x7 x1 = 1 2 3 0 0 0 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ; x2 = 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 ; x3 = 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 ; x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 4 5 0 0 0 0 0 0 0 0 0 0 ; x5 = 0 0 0 0 0
14、0 0 2 3 4 5 0 0 0 0 ; x6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 4 5 0 0 0 0 ; x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0; y =72;i77ii,用 stepwise (x, y)令 x = x1 x2 x3 x4 x5 x6 x7得至 U个 stepwise regressi on diag no sties table(如图 i 所示)可以看出结果不太好:p=,取a =时,此回归模型可用,但取a =时,模型不
15、能用;R-square =,较小;F=,也较小。(由图ii中各直线都是虚线可证明)于是我们调整图ii中的各直线。然而,无论怎么调整都无法使哪条虚线变为实线。故可知此回归模型不大合理,需改进Column 求ParainerfrConnerntcivoh 1LowerUppei12243-12 122.J.:;T3 32ri si3-4.039-46 S13aT3A14. D1-5.1 5g551551Ifi? Ab23L39-10O11B7303 1601.7165.6iiRFP37阴D.4612 93Z0 07291 .i Ep椁 EM Lxl=RowK.LJLJ -DD -4DD -ZDDJ
16、DaCobIFcib vfHh E*rar fiarvv1.0可编辑可修改iii88第二步:我们仔细分析实验数据,发现x (14: 16,)中,每行向量相等,而y的值不等,说明此实验数据不可靠, 且在现实中如果只用单 一氮源,那么培养基将因缺乏碳源而崩溃, x (17,)和x (23,)也是如此, 故将其删除掉。用其余数据组合成新的 x、y。即: x1 = 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ; x2 = 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ; x3 = 0 0 0 00 0
17、0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 ; x4 = 0 0 0 00 0 0 0 0 0 0 0 0 2 3 4 5 0 0 0 00 0 0 00 ; x5 = 0 0 0 0 0 2 3 4 5 0 0 0 0 ; x6 = 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 45 0 0 00 ; x7 = 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 ; y =72; x = x1 x2 x3 x4 x5 x6 x7;重复做第一步中的操作,得到另一个table如图iii 所示:com Mn
18、帥 iimon/a c 1ColumnLWUplpVlT12:.oe2754阖2*朗-411952.15J20.364.1? 437 7B54.95913fi占4 -1RG4-2168r-2Z4.12397斥划医Ft aouaicFP22.30075510.547 4CD05m 一卜吋1stepwise regressi on diag no stiesv1.0可编辑可修改可知此方案比较好了, p=,很小;R-square =,比较大;F=,也比较大。可 见此方案可取。但,由图iii可知,x2、x3、x7不显著,调整图iv中的直线, 移去这三个向量后统计结果如图 v所示:Column para
19、YiFlprLokhierUp 口 EJ15 93143 je冲11.7150 12*137.4 出的FUSEFP2D d0631771 2476-000i.fflindsrcc由matlab易知: inin =14 outout =237图vi中x2、x3、x7三行用红线显示,表明它们已经移去。从新的统计结果可以看出,虽然剩余标准差s( RMSE没有太大的变化,但是统计量F的值明显增大,因此新的回归模型更好一些。再运用matlab知识: x=o nes(27,1) x1 x4 x5 x6; b,bi nt,r,ri nt,stats=regress(y,x);100v1.0可编辑可修改 b
20、statsstats =可以求出模型:y=+第 三步:由试验数据可知,C1、N3和N2共存时,IFN- 丫的产量比只有C1、N2时要低得多。可见最优方案中要去掉N3o以下我们再次用逐步回归方法验证我们的结论:去掉与N3有关的数据之后我们得到新的x,y。即:x1 = 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 ;x2 =000 0 0 0 0 0 0 0 0 0 0 00000;x3 =000 0 0 0 0 0 0 0 0 0 0 00000;x4 =000 0 0 0 0 0 0 0 0 0 0 2 345000 0 ;x5 =0 0 0 0 0 0 0
21、0 0 ;x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0;1011v1.0可编辑可修改y =72;x = x1 x2 x3 x4 x5 x7;调用 stepwise (x, y)得到另一个 stepwise regressi on diag no sties table如图vii所示:Columr #1234&RPaiamatBr2 x=o nes(22,1) x1 x4 x5;b,b in t,r,ri nt,stats=regress(y,x);bb = statsstats =求出最终的模型:y=+综上所述:碳源C1和氮源N1、N2是影响IFN- 丫产量
22、的主要因素。所以原 问题中要求得最优培养基配比方案, 可以转化为在选取碳源C1和氮源N1、N2作 为原料后,确定它们的含量使得IFN- 丫产量最大(具体求解见模型三)。模型三:通过上述讨论,我们已经选出了碳源和氮源的类型, 下面我们具体讨论它们1212v1.0可编辑可修改的含量问题:鉴于N2、N3共存时,IFN- 丫的产量低于仅有N2时的情况,我们不能断定N1、 N2共存时IFN- 丫的产量会达到最大;同时也没有 C1、N1、N2共存时的数据。因 此我们通过分析,可以先任意给出 C1的含量,在N1、N2中选择一种,使之与 C1共存时,让IFN- 丫的产量达到最大,从而求出氮的含量。具体分析如下
23、:在假设7)成立的情况下,通过数据分析,当C1含量为a时(以下计算时,以&=为例),通过作图来比较N1、N2的优劣情况: x1= 2 3 4 5; x2=10 1 1/3; y1=72; y2=*20 *5 *2 ; a仁polyfit(x1,y1,3); a2=polyfit(x2,y2,3); x=:5; z1=polyval(a1,x); z2=polyval(a2,x); plot(x,z1,r,x,z2,b)由图一分析可知:在培养基中C1的含量a (a取)已知的情况下,当氮源的量小于或大于时,选择N1, IFN- 丫的产量高;当氮源的量在到之间,选择N2, IFN- 丫的产量高。(最
24、大含量由a的具体值决定)四、模型的说明与可靠性分析本题是通过给我们一系列实验数据,要求我们分析数据来寻求最优配比方案。这本身就要求我们用那些数据去预测,而那些数据的产生具有一定的随机性、 1314v1.0可编辑可修改和误差值,这就使得我们的模型的结果具有一定的随机性、预测性。同时,我们 根据实验数据,用拟合和逐步回归的方法建立上述模型, 所得的结果与实验数据 是基本吻合的,具有合理性,预测性。五、模型的自我评价对于模型一,我们使用了在确定一个因素的量之后, 研究其它单一因素的改 变对目标的影响。运用这种方法,我们可以粗略地判断不同的因素对目标的贡献 大小,得到一个粗略的优化配比方案。这个模型的
25、优点在于我们可以直接利用实 验数据表中的数据进行比较而得到方案;缺点在于没有把实验表中的每个因素都 进行比较,得到的结果只是局部的一个最优, 不一定是整体的最优,同时在比较 时没有考虑第14,15,16,17, 23五次实验,也会对所得的结果造成一定的影 响。对于模型二,我们用逐步回归分析法找出最优的碳源、氮源种类。运用这种 方法得到一组最优组合是比较合理的,它是根据实验数据考虑了全部变量而得到 的。对于模型三,我们是对模型二进行了补充说明。它在通过计算碳源、氮源的 含量来获得最优方案时,参照了模型一的方法。这个模型的优点在于解决了我们 在得到了回归方程之后,无法由实验数据表求出三个因素都在变
26、动时的最优配比 方案的难题。该模型通过确定一个因素之后,就可以利用实验数据表求解最优配 比方案了。缺点在于没有给出全部因素都在变动时的最优解。在整个建模过程中,存在一个无法克服的困难:我们的模型是建立在实验数 据之上的,由于实验数据具有随机性, 这就决定了模型所得结果具有随机性、 预 测性。1414v1.0可编辑可修改六、模型的改进1)我们的模型是建立在实验数据上的,运用的是数理统计的方法,可以从 增加实验的测试次数来提高我们的模型的准确度。2)在实验设计时考虑运用正交实验设计。3)我们的模型假设12)如果不成立时,就要考虑到价格对我们选取碳源、 氮源种类时的影响。这种情况下,我们建议在建立模型时把价格乘上含量来代替 原模型中的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《行业会计实务》课件-项目三 3.3临时设施的核算
- 重庆市名校联盟2024-2025学年高二下学期4月第一次联合考试化学试卷(含答案)
- 小儿扩张型心肌病的临床护理
- 2025赠与合同公证样本
- 2025仓储保管合同范本3
- 浙江国企招聘2025宁波大通开发有限公司招聘6人笔试参考题库附带答案详解
- 2025年股票交易授权代理合同
- 2025年初级银行从业资格之初级个人贷款通关考试题库带答案解析
- 2025年初级经济师之初级建筑与房地产经济综合检测试卷B卷含答案
- 发力新质生产力
- 北师大版四年级下册小数乘法竖式计算练习100题及答案
- 2024年湖南省长沙市中考地理试卷真题(含答案解析)
- 《中国健康成年人身体活动能量消耗参考值》(编制说明)
- 食堂大米采购招标文件
- 医疗美容诊所规章制度上墙
- CJT 216-2013 给水排水用软密封闸阀
- CJ-T250-2018建筑排水用高密度聚乙烯(HDPE)管材及管件
- 大学遗传学期末考试题库和答案
- 2024注册信息安全专业人员CISP培训讲义全集
- 心脏介入术后穿刺部位并发症的预防及护理讲解
- DB64 1996-2024 燃煤电厂大气污染物排放标准
评论
0/150
提交评论