haccp-在蜂产品原料控制中的应用用2种聚类法.ppt_第1页
haccp-在蜂产品原料控制中的应用用2种聚类法.ppt_第2页
haccp-在蜂产品原料控制中的应用用2种聚类法.ppt_第3页
haccp-在蜂产品原料控制中的应用用2种聚类法.ppt_第4页
haccp-在蜂产品原料控制中的应用用2种聚类法.ppt_第5页
免费预览已结束,剩余41页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HACCP在蜂产品原料控制中的应用 用2种聚类法对蜂产品原料氯霉素检测的关键限值的科学确认 四川检验检疫局食检处刘灵奕 2002年初 因氯霉素 CAP 残留超标我国蜂产品全线退出欧盟市场 并在多国发生连锁反应 2004年7月欧盟才解除对我国包括蜂产品在内的动物源性食品的禁令 目前中国蜜蜂养殖业的兽药残留监控体系仍处于逐步规范之中 加上蜜源种类多 分布广 放蜂环境复杂和养蜂员素质差异大等特点 蜂产品的质量风险时时存在 要符合欧盟 美国 日本等国的兽药残留要求 使产品顺利出口 需要将危害分析与关键控制点 HazardAnalysis CriticalControlPoint HACCP 理论与蜂产品生产的实践紧密结合 HACCP是一种确保食品安全的系统方法 是一种识别 预防 控制或减少食品安全危害的有效手段 关键控制点 CCP 是能进行有效控制危害的加工点 步骤或程序 判定关键控制点就是针对已辨明的危害 在本步骤或随后的步骤中有相应的预防措施 而且能在此步将显著危害发生的可能性消除或降低到可接受水平 CAP是蜂产品中的禁用药 此兽药残留是与原料自身有关的危害 为化学危害 控制CAP在原料的检测和验收中尤为重要 我们用下表对这一步骤进行分析 对蜂产品原料验收环节的危害分析表 关键限值是指区分食品安全可接受与不可接受之间的界限 关键限值的选择必须有科学性和可操作性 如果过严 造成即使没有发生影响到食品安全危害而就要求去采取纠正措施 如果过松 又会产生不安全的产品 一个好的关键限值应该直观 易于监测 仅基于食品安全 能使只出现少量被销毁或处理的产品就可采取纠正措施 不是GMP或SSOP措施以及不能违背法规 我们拟用两种聚类法为关键控制点建立关键限值 这对蜂产品出口的生产加工企业有相当的参考价值和实际意义 在各国氯霉素检测水平中欧盟最严 欧盟规定进口蜂产品中的CAP残留不得超过0 3ppb 其推荐方法是气质联用法 GC MS 和液相 串联质谱法 LC MS MS 它们具有灵敏度高 选择性好 可靠度高的特点 是动物源性食品中氯霉素残留检测的最佳方法 但是高昂的仪器费使该法在现阶段难以推广应用于原料蜜的收购和筛检 企业只能采用ELISA法对原料进行检测 受背景干扰的影响 有些本来不含CAP的产品在ELISA法中也会出现数值 不少实际合格的蜂产品被判为不合格 造成加工企业和蜂农的经济损失 所以本文要研究的问题就是寻找一个合适的用ELISA法检测的关键限值作为原料检测的判定标准 使在此数值下的蜂产品用LC MS MS法 检测限为0 3ppb 检测的结果都合格 从而提高蜂产品的出口合格率 在研究方法上 根据88组国内蜂产品生产商ELISA法检验结果与相应的秦皇岛蜂产品实验室LC MS MS法检验结果的数据样本 我们首先用层次聚类方法对0 3ppb的标准进行分析 然后用较先进的基于相似合成算法的聚类方法对国内蜂产品生产商检验氯霉素含量的标准做进一步分析 最后结合两种方法得出蜂产品生产商用ELISA法检验氯霉素含量的判定标准 即原料检测氯霉素这个CCP点的关键限值 1数据样本说明 本文的研究目标是88个数据样本 每个数据样本包含国内蜂产品生产商检验结果 X1 秦皇岛实验室检验结果 X2 2项指标 其中 国内蜂产品生产商检验结果是样本中氯霉素的具体含量 秦皇岛实验室检验对于低于其检验标准的样本不显示具体检验数值 对于高于其检验标准的才给出具体检验数值 表1目标样本数据一览表 为叙述方便 以下简称国内蜂产品生产商检验结果合格 秦皇岛实验室检验结果不合格的样本为目标样本 具体的 目标样本数据见表1 2层次聚类法对检验标准的分析 用层次聚类法 hierarchicalclustering 对检验标准分析的思路是 将可能的检验标准加入88组实际数据样本中 用层次聚类方法对样本聚类 当某一加入的检验标准与最多的目标样本聚在一类时 该检验标准最接近合理的检验标准 我们选定的可能的检验标准分别是0 05 0 1 0 15 0 2 0 25 0 3 0 35 0 4 0 45 0 5 0 55 0 6 0 65 0 7 为了使研究更加合理 我们分别将102组数据样本分成2 3 4 5类 对不同聚类结果进行比较 见表2 并用能实现层次聚类分析的SPSS11 0软件分析结果 表2对样本聚类 从表1可知 样本17 18 19的工厂检验值较高 明显超过0 3 而其余样本的工厂检验值较小 因此 聚类时所有的目标样本不可能聚在一类 对样本17 18 19聚类分析的参考价值不如其它样本 从表2可知 当将样本分成2 3 4类时 除去样本17 18 19外的目标样本都被分在第一类 当将样本分成5类时 它们主要在第二类 再看对可能的检验标准0 05 0 7的分类 当将样本分成2 3 4类时 0 05 0 25的数据样本都在第一类 当将样本分成5类时 它们主要集中在第二类 与可能的检验标准0 3 0 7相应的样本的聚类结果与目标样本的聚类结果差别明显 这说明 合理的检验结果应该在0 25 0 3之间 3基于相似合成算法的聚类方法对检验标准的分析 以上层次聚类在方法上存在不完善的地方 这可能会影响到分析结果 其不足包括 类别个数的确定主观性强 如上面的分析中 到底将数据样本分成几类才能最恰当地反映它们之间的相似程度未知 只能通过建模者的主观判断进行试错分析 层次聚类方法将所有数据样本作为学习集 从中寻找数据样本反映的规律 但是数据样本中包含的信息除了反映共性规律外 还有反映个性特征的信息 将所有数据样本作为学习集得到的聚类结果可能可以很精确地反映学习集的情况 但是对于新加入的 具有同一规律性的数据样本就可能不适用 即聚类结果不具有良好推广能力 出现 过拟合 如果这样 那么基于层次聚类的分析结果的可信度就值得怀疑 基于相似合成算法的聚类方法可以解决以上2个问题 3 1基于相似合成算法的聚类方法简介 由Lorence提出的相似体合成算法 AnalogComplexing 以下简称AC 1 是对模糊对象的预测 聚类和分类的一种序列模式识别方法 最先提出AC算法是为了解决对模糊经济对象的预测问题 应用AC算法进行预测时 一般需要待研究的过程满足以下假设 1 系统由多维过程所描述 2 多维过程的观察值很多 长期序列 3 多维过程是充分有代表性的 即由基本的系统变量形成数据集 4 过程的行为一般将在一段时间内相似地重复 AC包含3个步骤 2 1 待选模式的产生 2 待选模式的变换 3 相似模式的选取 3 1 1待选模式的产生 3 1 2待选模式的变换 根据工作原理 对于长度为k的某参照模式 在数据样本中可能有一个或几个长度为k的相似模式 但是由于系统是动态的 不同时期的相似模式可能具有不同的平均值和标准方差 因此 需要用一种变换来描述这些差异 将模式变换到同一基准点上从而使各模式具有可比性 即为了下面将进行的模式间相似性的度量 必须寻找待选模式到参照模式的变换 一般取线性变换为 3 1 3相似模式的选取 模式相似度这一步的主要目的是识别模式形状间的相似性 其度量我们称为模式相似度 一般地 第i个待选模式与参照模式间的距离可定义为 模式间的相似度可由距离来度量 如定义第i个模式与参照模式的相似度si为 显然距离值越大 模式相似度就越小 相似模式的选取 模式相似度计算出来以后 我们就可以根据相似度大小来选取相似模式 将AC算法与数据分组处理 GroupMethodofDataHandling 简称GMDH 方法结合 形成了基于AC算法的聚类方法 这种聚类方法的特点在于 根据模式 数据样本 之间的相似度 按照自组织数据挖掘的思想 客观 自动的产生唯一的聚类结果 为说明这种方法的工作原理 简要介绍GMDH的实现原理 GMDH是自组织数据挖掘 Self OrganizingDataMining 3 方法的核心算法 它从参考函数构成的初始模型 函数 集合出发 按一定的法则产生新的中间候选模型 遗传 变异 再经过外准则筛选 选择 重复这样一个遗传 变异 选择和进化的过程 使中间待选模型的复杂度 complexity 不断增加 直至得到最优复杂度模型 GMDH使用在建立中间模型过程中未用到的数据 测试集上的数据 新鲜信息 freshinformation 计算外准则值来评价 选择中间待选模型 GMDH要求将样本集W分为训练集A 测试集B W A B 在训练集A上的误差体现了模型模拟真实系统的能力 在测试集B 也是已知数据 但在建模时没有用到 上的偏差既是模型对真实系统模拟能力在新水平上的确认 更是对模型推广能力的评价 这样 一方面由于模型在新数据集上的拟合能力的不断确认 其推广能力将加强 这样选出的最终模型不会过拟合 体现了在一定噪声水平下模型拟合精度与推广能力之间的最优平衡 4 另一方面 由于用新信息评价筛选模型 可以客观地确定模型 最后 GMDH算法的停止法则由最优复杂度原理给出 当模型的复杂度逐渐增加时 模型的外准则值有一个先减小再增大的过程 外准则的最小值对应了最优复杂度模型 如果在一个筛选阶段不能再改善外准则值 最优复杂度模型找到了 算法过程就结束 最优复杂度原理保证了最终模型的唯一性 将AC与GMDH结合 可以实现基于AC算法的聚类方法 其工作原理如图1所示 图1 2 客观聚类分析示意图 1 数据样本 2 3 数据划分为A B2部分 4 5 分别在A B上产生的层次聚类树 计算聚类平衡准则BL k k k min 其中k表示类的个数 k表示相同类的个数 3 2用基于AC的聚类方法对检验标准的分析结果 将变量X2按照Lamdam隶属度函数模糊化为 N X2 ZO X2 P X2 其中N negative 表示低于平均水平 ZO zero 表示在平均水平附近 P positive 表示高于平均水平 然后以X1和N X2 ZO X2 P X2为变量 对102个样本聚类 将可能的检验标准加入数据样本时作如下处理 假设S代表合理的检验标准 那么氯霉素含量小于S的产品不应该是目标样本 如假设0 3是合理的检验标准 那么工厂检验值为0 05 0 1 0 15 0 2 0 25的数据样本在秦皇岛检验中应该合格 检验值为0 35 0 4 0 45 0 5 0 55 0 6 0 65 0 7的数据样本在秦皇岛检验中应该不合格 是目标样本 分别假设0 05 0 7为检验标准 按照相似度超过95 的数据样本聚为一类的办法 用能实现基于AC聚类的KnowledgeMiner软件分析 结果 见表3 显示所有目标样本都被分在第2类 C2 其余合格样本都在第一类 C1 这说明了基于AC的聚类方法的有效性 同时发现 如果可能的检验标准S小于0 2 0 05 0 7中大于S的样本被分在目标样本一类 如果可能的检验标准S大于0 2 0 05 0 7中小于S的样本可能也被分在目标样本一类 出现错误 因此 当选取聚类标准是相似度大于95 时 0 2应该是合适的检验标准 在正确聚类的前提下 相似度越低 说明选择的检验标准越合理 相似度大于95 意味着要求数据样本表现出非常明显的相似性 进一步 在假设0 2为合理检验标准的前提下 逐渐降低相似度标准进行聚类 聚类结果 表4 表明当相似度大于57 时 所有样本均被正确分类 当相似度小于57 时 所有样本被分成一类 出现错误 这说明 当数据样本之间有接近六成相似时 以0 2为检验标准是最合理的 4结论 以上分析表明 在蜂产品中用ELISA法检测氯霉素的合理的关键限值应该在02 0 25ppb之间 现行的0 3ppb的检验标准虽然接近这一范围 但可能导致成品不能满足欧盟官方要求或客户退货 实际确定工厂检验标准时 还应该考虑 1 生产商与客户检验技术水平的一致性 如果生产商检验技术水平低于客户 检验标准的值可适当调低 反之相反 2 如果标准过高 产品不合格率增加 生产成本就增加 如果过低 客户退回的产品增加 收益减少 确定合适的检验标准 要分析检验标准与生产成本 利润之间的关系 这可以通过技术经济模型实现 3 信息的不对称性 由于生产商与客户在检验标准等方面的信息的保密性和市场变化的不确定性 使得双方只能凭行业经验在一定范围内确定自己的检验标准 这又可能造成本来是不合格的产品 工厂检验合格但客户检验不合格 或本来合格的产品 如果按工厂检验标准则不合格 按客户检验标准合格 两种情况都会给双方造成不同程度的损失 生产商与客户应该在信息不对称的合作 不合作博弈行为中寻求共同或个体利益的最大化 还需说明的是这里所指的食品安全危害是指显著危害 每个显著危害都必须通过一个或多个CCP点来控制 其实 在整个食物链 FromFarmtoFork 中控制蜂产品兽残还需要在养殖环节中加以具体分析加以控制 这里不再赘述 这里引入的基于相似合成算法的聚类法与传统的层次聚类法相比 其优点是能对先验知识不足的复杂性问题进行研究和能处理传统方法感到棘手的小样本数据 该法将数据模糊化后的研究更能接近描绘问题的本质 这一特点正适于解决诸如蜂产品原料验收中氯霉素关键限值的问题 是HACCP应用的一个好的实例 也为我们用数理学方法解决在检验监管中这一类问题打开了思路 HACCP是一个基于科学分析建立的体系 需要强有力的技术支持 当然可以寻求外援 也可以利用其他科学研究的成果 但企业根据自己的实际情况所做的实验数据 分析结果等尤为重要 参考文献 1 Lorence E N Athmosphericpredictabilityisrevealedbynaturalyoccuri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论