基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测_第1页
基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测_第2页
基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测_第3页
基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测_第4页
基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.基于基于图像识别技术和人工神经网络的食品中大肠菌群的实时预测摘要一种基于图像识别技术预测食品中大肠菌群的方法已经被提出来过。为了得到接近实时的检测结果,就是用总的细菌和杆菌的数量来预测总的大肠杆菌的数量,因为提取大肠菌群的特征参数并识别和计算是十分困难的,而总的细菌和杆菌的数量可以使用图像识别技术来计算出来。一种理想的人工神经网络模型被提出用来预测总的大肠菌群的数量。几种模型被评估之后使得理想ANN模型得到发展。理想ANN模型包含两个隐藏的层,每层含有五个神经元。结果显示用它来预测的总的大肠菌群的数量与试验中通过传统的多重发酵技术吸收的总的大肠菌群的数量是有明确相关的,(相关系数 0.971

2、6 )这种模型比其他预测模型的预测准确度更高。1简介 大肠菌群被频繁的用来作为细菌指示器。他们的出现表明外部污染。他们被定义成能发酵乳糖、产酸产气、需氧和兼性厌氧的革兰氏阴性无芽胞杆菌,当温度达到3537时孵化。温血动物的排泄物中富含大肠菌群。但它们也在水生环境,土壤和植被丰富的环境被发现。在大多数情况下,大肠菌群本身并不使人生病,但它们的存在被用来表明可能存在其他的致病微生物在粪便中。 当检测总大肠菌群时,传统的多管发酵技术被广泛使用,因为它的高准确度和低技术难度。然而,在实际工作中,我们发现这种方法需要太长时间去培养(48-72 h)而且准备的过程是如此的复杂使得在工厂中管理产品很困难。预

3、防风险的食品安全管理系统如HACCP要求卫生监管部门应该迅速的提供结果并且及时的采取补救行动来恢复对流程和产品的监管。最近,一种新的研究方法和改进型的研究方法来计算食品中大肠菌群和大肠埃希氏菌已经得到了发展。例如带染色体的琼脂和带荧光的肉汤,大肠埃希氏菌计数板这三种选择性培养基可以计算大肠菌群和大肠埃希氏菌,检测时间最少24小时。A和B基于准确性,一致性,便捷性,费用,劳动,敏感性,特异性和常规检测的时间的比较在计算冷冻黑虎虾的大肠菌群和大肠埃希氏菌上更加迅速。Reichart,Szakmr,Jozwiak,Felfoldi,Baranyai(2007)报道,氧化还原电位测量方法可以作为一种合

4、适的方法进行定量和定性测定细菌。在他们的研究文章中对用氧化还原电位测量方法测量大肠菌群进行了测试和验证,结果证明这种新方法的高效性和可靠性。另一个例子是ATP发光生物可以提供对总污染面积的实时估计,并且蛋白检测试剂盒可以显示实时的表面蛋白残留。然而,以前的研究已经表明,在土壤的情况下,ATP生物荧光的方法是不能检测当表面的细菌很少的时候,同时蛋白质的检测方法甚至在表面很多细菌时也不能检测细菌污染。接近实时的预测使制造商可以在生产中警惕总大肠菌群超过一定的限制。为了获得实时信息,以监督生产和判断食品在生产过程中的污染状况,开发展中一个新的快速检测方法迫在眉睫。然而,对于大肠菌群的定义,它不是医学

5、细菌学分类而是健康领域的细菌学,所以在没有背景的前提下很难找到一个共同的特点。因此,难以实现接近实时的检测。为了解决这个问题,在本文中,图像识别技学和人工神经网络模型被用于开发一个快速的检测系统可以估算食品中总大肠菌群数。该系统可以在30分钟内获得总大肠菌群数(MPN1/100克或毫升),而且预测的结果和实验结果是呈正相关(相关系数R2 =0.9716)的。这是一种快速,有效的尚未被报道的方法。在此之前的研究中,一些文献中也出现了关于人工神经网络用于细菌鉴定。Rebuffo, Schmitt, Wenning, von Stetten, and Scherer利用人工神经网络的傅立叶变换红外光

6、谱以确定单核细胞增生李斯特氏菌和李斯特菌,这只用了25h。Rebuffo-S, Schmitt, 和Scherer用单核细胞增生李斯特菌的人工神经网络的子网来另外定义血清型和血清型的分组。两种分类系统的整合提供了通过简单地测量一个纯的红外光谱李斯特菌这个单一的步骤就同时识别李斯特氏菌在种的水平,单核细胞增生李斯特氏菌的血清组水平,和大部分单核细胞增生李斯特氏菌菌株在血清变种水平。 Palanichamy Jayas,和lolley使用神经网络预测工厂生产线上干发酵香肠残渣中E.coiO157:H7。此外,一个大型数据库的人工神经网络(ANN)的方案已被用于分类和识别的海洋细菌属和种。大肠菌群源

7、于土壤,植物,人类和动物残渣。正如大肠菌群的定义那样,它们都是棒状生物体。因此,总的大肠菌群的数量是杆菌总数的一部分。此外,总的杆菌的数量是总细菌数量的一部分。如果食物被大肠菌群污染,杆菌总数和细菌总数必然增加,同时总杆菌数量和细菌总数的比例也将增加。因此,受污染的样品中的比例将是高于未经污染的样品中的比例,比例越高,总大肠菌群的数量就越多。我们称未受污染样本中的比例为标准比值。不同种类的食品样品,这个比值会有所不同。基于这个理论分析,食品中的细菌主要来自在食品加工过程中的原料和外部环境的污染。而且,在最后的分析中,食品中的细菌来自空气,水和土壤中的微生物。正如我们所知的,一个地区的细菌分布情

8、况是平衡的,所以总杆菌和细菌总数比值会在小范围内波动,所以总大肠菌群数的总数与杆菌和细菌之间有可能有一定的相关性。总括来说,是否可以找到总大肠菌群数量与细菌和杆菌的总数之间的关系是关键问题。在本文中,上述的想法是通过大量的实验数据证明。若干预测模型被提出来,最后提出了最佳的预测食品中大肠菌群数量的人工神经网络模型。2.材料和方法2.1材料的选择和处理2.1.1材料所有的样品都是当地食品厂的产品。面包,饼干及蛋糕被选定进行检测,以讨论总大肠菌群快速检测方法的可行性。2.1.2材料处理向50克样品加入50毫升无菌生理盐水,将他们足倒入搅拌器搅拌均匀。通过一个10微米孔径的膜滤器过滤该混合物,以去除

9、杂质颗粒。细菌是在滤液中的,因为大多数细菌的实际尺寸是0.5-5微米。振荡滤液,得到了0.1毫升滤液用来快速检测系统计算。亚甲基蓝染色方法被用于区分的活菌和死菌。亚甲基蓝被广泛用于在分析化学中作为氧化还原指示剂。在氧化环境中这种物质是蓝色的,但是,如果暴露在还原剂中会变成无色。它也可以作为一个指标,以确定一个细胞如细菌是活的或死的。蓝色指示剂在活性酶系中变为无色在,从而表明细胞是活的。亚甲基蓝上色溶液按照下面的公式来准备:亚甲基蓝色0.025克+氯化钠0.9克+氯化钾0.042克+的CaCl6H0.048克+的NaHCO0.02克+葡萄糖1克+蒸馏水100毫升苯基蓝染色溶液的制备。亚甲基蓝染色

10、溶液(0.1毫升)加入到上述滤液中(1:1)。染色时间为2分钟。为了保持细菌活着,染色之后才是涂抹玻片和固定步骤。这里使用的是与普通的固定方法(热固定方法)不同的固定方法。采用晾干固定的方法来保持细菌存活。染色后,在内部的深蓝色的圆圈中活的细菌是无色的,死菌是淡蓝色的。2.2多管发酵法三管MPN法大肠菌群发酵在FDA中被拿出来详细说明了。一个25g的样本被拿去立即与225ml的磷酸盐缓冲液或者消过毒的生理盐水按1:10的比例稀释,PH值为7.2,装在一个质的袋子里放进搅拌机中摇匀1分钟。然后这个样本被连续稀释十倍用来作为三管MPN法大肠菌群发酵法的培养液。悬浮液:从每个试管中取出1ml转移月桂

11、醇硫酸酯蛋白胨肉汤培养基中,在35下保温2448小时。培养液:从试管取一个铂环量的培养液在35的条件下与空气接触48小时,然后转移到亮绿乳糖肉汤培养基中,在35的条件下培养24-48小时。试管中与空气接触的接种体在亮绿乳糖肉汤培养基中会显示大肠菌群的存在,每1g样本中大肠菌的数量可以从MPN表中被计算出来。2.3图像识别技术应用 我们的自动模式识别程序有以下四个极端:首先是以前的图像分割阶段,其次一个对象提取阶段,第三,一个特征抽取阶段;第四步ANN识别阶段。开发程序的主要步骤,如图2所示。2.3.1图像分割在细菌图像处理中,从背景中分割图像是一个重要的步骤。正如图1所示,这幅图中细菌和背景还

12、有一些非细菌的颗粒的图像对比度是十分明显的阈值分割的R,G,B值的方法可以用来获得的二值化图像。几个几个阈值被用来进行了尝试。最适当的阈值应该准确分离细菌和背景,可以准确地分开的活菌与死细菌。在这时,死的细菌应该该都是固态务,而活的细菌应该是空心的。2.3.2目标提取为了节省处理时间,在接下来的步骤,一些大的杂质颗粒,噪音小点应首先被擦去。大多数细菌的实际大小是0.5-5微米。经过快速检测系统的放大后,图像中的细菌的大小应该是1.25-12.5毫米。一个像素的大小为0.264毫米,所以有必要除去黑色的过大或过小的连通区域的噪声。在删除这个连接区域之前,在二值图像的连通区域中必须首先标出来。这个

13、连通区域中小于pi*1.25*1.25平方毫米和大于pi*12.5*12.5平方毫米将被去掉。此外,实心连接区域将被删除,以消除死菌的影响。2.3.3特征参数的提取根据他们的形态特征,细菌可以分为三大类:球菌的细菌,杆菌的细菌,和单核的细菌。 7个特征参数要被提取,这分别是“面积,周长,圆度,最小外接矩形(MER)的长度,最小外接矩形(MER)的宽度,长度与宽度的比例,和矩形的度。为了准确地计算的圆形,活菌的中空必须首先被填充。2.3.4人工神经网络识别 反向算法被用来ANN模型的计算。以上7个特征参数被考虑用来作为输入变量来用于ANN的计算,为了加速网络的计算速度,在使用MATLAB子程序时

14、输入和输出数据在0.05-0.95范围内是正常的。作为一个正常的结果,在研究过程中所有变量都具有相同的重要性。输入和输出之间的关系可以用下面的式子表示。其中Xmin和Xmax代表这一行数据的最小和最大值。输出层包含了三个神经元,球状细菌的指示信号是一个,杆状细菌的指示信号时两个,单核细菌的指示信号时三个。这里只有一个影藏层,它包含30个神经元。Log和s型传递函数分别用于输入和输出层。直到计算的网络误差小于0.0001,传输速率为0.01,最大计算量为1000。2.4硬件系统和软件系统的设计一种计算机控制的光学显微镜系统已经被开发出来了,它能够对透明的微小对象产生连续的光学显微图像。该成像系统

15、包括光学显微镜,带有2D运转的计算机控制平台, CCD彩色数码相机,微控制单元,两个驱动单位的二进制电机。这个步进制电机被安装在显微镜的实物平台上。一台个人电脑和一套能够适用Windows的自行开发软件也是被需要的。检测系统操作软件的设计是由C +语言实现的。这种快速的自动检测系统的组织和设计示于图2。计算机发出指令来驱动对象平台。对象平台的移动是受单片机的程序控制。此外,键盘用于驱动阶段,并找到的检测区域。因为它的操作简单,我们的实验效果得到了明显的提高进入软件和填充一些检测到的信息后,系统可以自动获取和保存图片,处理和分析图像,并列计算细菌总数和总杆菌数。软件程序和硬件的开发,如示于图2。

16、3数据分析3.1人工神经网络分析神经网络是一类新的信息处理技术。神经网络的最基本组成部分是模仿人类大脑结构类似人类信息处理系统的人工神经系统或网络工程获取,存储和利用信息。它已经被广泛用来解决各种各样的问题。最常见的是利用神经网络预测什么最有可能发生。它有独特的能力去在输入和输出事件之前认识它们之间的关系。3.11构造神经网络 人们已经认识到这个网络的预测能力和执行力上应该在遵守构造数据集合的规模,隐藏层的数目,隐藏层中处理原件的数目学习规则的类型传递函数的基础上被优化,反向传播算法被用来构造ANN模型。Log函数和线性传递函数被分别用于输入和输出层。为了避免在采用反向传播算法的时候出现的过度

17、拟合或记忆的潜在问题,选择保存最好的配置选项在这个网络最好结果被保存的地方。输入层包括两个神经元,其中对应于细菌和杆菌的总数,这是通过以下方式获得的快速检测系统。这个输出层有一个神经元来代表总的大肠菌群的数量,这里的大肠菌群是通过多管发酵技术获得的(图3)。在每个隐藏层内部隐藏层和神经元的数量会根据问题和数据集的复杂性而变化。在这项研究中,隐藏层的数目会有一到两个的变化。每个层中的神经元数量会有以5为增加量的从5到30的变化。这导致总共12个神经网络。为了实现最小化的根均方误差(RMSE)的快速收敛,使用的Matlab子程序对输入和输出数据在0.05-0.95的范围内进行标准化。根据我们的数据

18、,计算反向传播误差直到网络误差0.005,获取速率为0.05,最大的计算数目为3000人。3.1.2最佳ANN配置的选择各种人工神经网络模型的预测性能通过对使用均方根误差(RMSE),平均绝对误差(MAE)进行了比较。在ANN模型预测值和输出期望值之间的线性回归线的判定系数R2也用于作为衡量预测性能的一种方式。这两个错误措施被用来比较各种人工神经网络模型的性能。参数Kp代表给定输入时对输出的预测值,kd代表输出期望值。RMSE和MAE越低,所给的模型描述的数据就更加精确。另一方面,判定系数越高,这个模型的预测能力就越好。3.2多元回归分析多元回归模型,如线性回归,二阶多项式回归和多项式趋势面分

19、析也来预测总大肠菌群细菌通过预测总的细菌和杆菌的总数。 这些数据被SPSS和DSP进行了处理。结果分析如下。4结果与讨论4.1优化阈值的图像分割此阈值是通过多次试验来确定。其中,图4a-c是对图像分割的阈值分别是110,128和140,根据数字。基于这些数字的比较,我们可以得出一个结论:当阈值是128,最好的分割结果可以得到。目前,死菌都是固体的,而活的细菌是空心的。与此同时,图像分割的噪音也非常低。它由实验结果证明了,这阈值主要依赖于亚甲蓝染色液和染色时间的浓度。该值将不会经常变更。因此,它在检测程序中可以被预设,运行程序时,它会被调用。因此,这对非本领域技术人员运行该程序是十分方便的。4.

20、2特征参数的提取结果通过图像处理程序从大量细菌中提取特征参数,提取的十个细菌的结果显示在表1中。通过人工神经网络识别过程中,鉴定结果被这7个特征参数决定。这工神经网络识别方法的识别精度优于其他单一特征参数识别方法。分析所提取的特征参数时,很容易发现,长度与宽度的比例是一个有用的标准。球菌的长度与宽度的比例低于1.2,而芽孢杆菌和螺旋菌高于1.2。所以圆形和矩形度是来区分的螺旋杆菌和球菌和芽孢杆菌的有效的特征参数,如表1中所示。4.3预测模型分析从本地食品厂的面包,饼干和蛋糕被用来作为例子分析。细菌总数,总杆菌和总大肠菌群数之间的关系如下图5所示。因为它可以被观察到,在大多数情况下,当总的细菌数

21、或杆菌的总数增加时,实际的总的大肠菌群数在相同的时间增加,但它不是简单的线性关系。人工神经网络分析,多元线性回归模型分析,多个第二阶多项式模型分析和趋势面分析被用来优化这个最优的预测模型。4.3.1人工神经网络的分析结果在我们研究的463例的总大肠菌群数据集被分为两组。在第一组中,370例被拿来用于计算,并用第二组93例进行验证,从463例中随机选择的一组。测量误差与不同的神经网络有关,不同的神经网络预测总大肠菌群数的不同的数据集的配置示于表2。这个网络模型实现了最佳预测,它的每个隐藏层含有两个隐藏层和五个神经元,在隐藏层中有s型传递函数,在输出层有线性函数。这个配置中的RMSE和MAE的值是

22、170446和10.7015MPN/100g.结果显示预测值和实验的大肠菌群的数量是很符合的。使用由93案件组成的较小的数据集对最优神经网络的性能(两个隐藏层和每个隐藏层神经元)进行了验证。该网络预计在RMSE为26.1421和MAE为12.3246 MPN/100的克时总大肠菌群数量。人工神经网络模型预测和实验的总大肠菌群数量,如下图6所示 (R 2 =0.9716)。4.3.2多元回归分析结果4.3.2.1多元线性回归模型第一组数据代被用来入线性回归方程(公式4)。由公式2计算RMSE和MAE。公式3分别确认这两组数据60.4002和25.8349。结果显示在预测值和实验值不符合。如图(7

23、)。其中,参数X1代表细菌总数,而X2是杆菌的总数,Y表示总大肠菌群总数。4.3.2.2多元回归模型。一个多元回归模型也被选来满足这个趋势。第一组数据来拟合多元回归方程(公式(5)。RMSE和MAE由式(1)和(2)计算来用于分别验证92.7075和64.0258 MPN/100克。结果表明预测总大肠菌群数量和实验数据是不相符的(R =0.6717)如图7其中,参数X1表示的细菌总数,而X2是杆菌的总数,Y表示总大肠菌群总数。4.3.2.3趋势面分析。趋势面分析是最广泛使用的全球表面拟合程序。映射数据的控制点的地理坐标由一个多项式展开近似,多项式函数的系数由最小二乘法确定,以保证从趋势面偏差的

24、平方的总和是最小的。该多项式可以扩展到任何所需的程度,虽然也有由于舍入误差的计算限制。分别进行三阶多项式,四阶多项式和5次多项式拟合分析。基于这个理论分析,指令越大实验值的拟合会更好,可以更好地反映样本数据的趋势。但它在现实中并非总是如此。指令越大,计算机数据处理占用内存就越多。它会影响的处理的效果。此外,如果实在是太大了,它不但不能揭示真正的空间趋势,因为太大的拟合精度会造成“失真”的趋势面。这个分析将失去其作用。这是常用的测试方法选择公式的指令。一般情况下,不超过5个。正如图 8所示,预测值0.7885和参考的数据0.7197的相关系数为0.0138。相关系数表明,趋势面分析模型不适合预测总大肠菌群数量。4.3.3人工神经网络模型和多元回归方法的比较综上所述,基于上述几种多元回归模型分析,结果表明预测值与实验值是不相符的。网络的精度在某些方面比一般的预测方法要高,这表明ANN具有学习和很高精度的模拟实验数据中的物理问题的能力,不需要去解决任何复杂的数值模型。一个可能的缺点是ANN是一个需要计算和验证的大的实验数据库,这些数据库是来弥补可能的情况和保证每个强大的网络的运行。因此,最终选择的预测模型是最优的人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论