毕业论文-食品质量安全抽检数据分析.doc_第1页
毕业论文-食品质量安全抽检数据分析.doc_第2页
毕业论文-食品质量安全抽检数据分析.doc_第3页
毕业论文-食品质量安全抽检数据分析.doc_第4页
毕业论文-食品质量安全抽检数据分析.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

食品质量安全抽检数据分析 摘 要“民以食为天”,食品安全关系到千家万户的生活与健康。随着人们对生活质量的追求和安全意识的提高,食品安全已成为社会关注的热点,也是政府民生工程的一个主题。本文通过建立数学模型来分析如何进行食品安全的抽查等问题。对于问题一,我们统计了2010-2012三年间深圳市的食品抽样数据。根据数据,将食品检验不合格的原因大致分为微生物、重金属、添加剂和其他四类。对数据进行筛选和处理可以得到2010到2012年各个季度由于微生物、重金属、添加剂和其他四个原因而不合格的概率。将主要食品领域分为六大类,运用层次分析模型,建立三个层:主食、四类造成不合格的原因、年份,定量分析了深圳三年来由于微生物、重金属、添加剂和其他原因造成个主要食品领域检验不合格的变化情况,并得出图表对于问题二,运用线性规划和线性相关,我们将深圳分为福田区、罗湖区、南山区、盐田区、宝安区、龙岗区、六个个区域,通过线性关系,建立回归模型来找出食品质量和产地、销售地、季节的规律。对于问题三,要改进原有抽检方法,找到一个新方法,使其在成本相同的情况下,测得数据结果更准确,在测得数据结果和老方法接近下,成本更低。根据第一问和第二问得到的数据,得到不同因素的影响程度是不同的。减少稳定数据的测量量,加大不稳定数据的测量量,减少测量环节,加重必要环节。由于我们获取的数据均是在原抽检方法下得到的数据,而没有真正标准真实的数据,所以无论我们用什么样的新方法,只能在原抽检下的数据(或有关预测、推测数据)进行验证。故新方法在测量不稳定数据的结果与原方法不具可比性。但稳定数据的结果两种方法下的测量数据基本一致。新方法得到后,检验新方法的科学性、合理性。拟合曲线确定其未来检测值,采用蒙特卡洛法抽检,带入回归方程进行验证新方法是否合理。关键词:统计 层次分析 回归分析 拟合 一、问题重述“民以食为天”,食品安全关系到千家万户的生活与健康。随着人们对生活质量的追求和安全意思的提高,食品安全已成为社会关注的热点,也是政府民生工程的一个主题。城市食品的来源越来越广泛,人们消费加工好的食品的比例也越来越高,因此除食材的生产收获外,食品的运输、加工、包装、贮存、销售以及餐饮等每一个环节皆可能影响食品的质量与安全。另一方面,食品质量与安全又是一个专业性很强的问题,其标准的制定和抽样检测及评价都需要科学有效的方法。深圳是食品抽检、监督最统一、最规范、最公开的城市之一。请下载2010年、2011年和2012年深圳市的食品抽检数据(注意蔬菜、鱼类、鸡鸭等抽检数据的获取),并根据这些资料来讨论:1. 如何评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势;2. 从这些数据中能否找出某些规律性的东西:如食品产地与食品质量的关系;食品销售地点(即抽检地点)与食品质量的关系;季节因素等等;3能否改进食品抽检的办法,使之更科学更有效地反映食品质量状况且不过分增加监管成本(食品抽检是需要费用的),例如对于抽检结果稳定且抽检频次过高的食品领域该作怎样的调整?二、模型假设2.1对于问题一的模型假设假设主要食品能且只能分为六种,对于不属于这六种内的食品的检验不合格造成的影响不进行考虑。2.2对于问题二的假设第一问中涉及的影响因素是食品是否安全的直接因素,但这些因素又是由其它相关因素决定。分析数据,我们将影响食品安全的这些因素归结为检测地点、食品产地、抽查季节、生产环节、流通环节、餐饮环节六个要素。这一问要求的是这些要素与食品质量的规律性关系,即线性关系。通过建立回归模型,来定量求出各因素在影响食品安全中所占影响度大小和影响规律。对于各因素对食品安全的影响程度,利用偏回归平方和衡量每个变量在回归中所起的作用大小(即影响程度),对每个变量的偏回归平方和进行了计算,最后把影响程度由深到浅的各因素进行了排序。最后进行回归方程的显著性检验,将总的平方和分解为回归平方和和剩余平方和,运用F检验法来判定线性回归方程的显著性。2.3对于问题三的假设:改进原有抽检方法,需要找到一个新方法,尽量在成本相同的情况下,测得数据结果更准确,根据第一问和第二问得到的数据,得到不同因素的影响程度是不同的。减少稳定数据的测量,加大不稳定数据的测量,减少测量环节的测量,加重必要环节的测量量。然而由于我们获取的数据均是在原抽检方法下得到的数据,而无法掌握真正标准真实的数据,所以无论我们用什么样的新方法,只能在原抽检数据分析进行验证。故新方法在测量不稳定数据的结果与原方法不具可比性。但稳定数据的测量结果两种方法下的测量数据基本一致。新方法采用后,检验新方法的科学性、合理性。拟合曲线确定其未来检测值,采用蒙特卡洛法抽检,带入回归方程进行验证新方法是否合理。 三符号说明符号表示的意义备注Ai 目标层指标i=1Bi 准则层指标i=1,2,3,4Ci方案层指标i=1,2,3 第 i层权重i=1,2,3标准化后的第 i层权重i=1,2,3入一致性指标过度数C.I一致性指标R.I.平均随机一次性指标C.R.一致性比例指标bij 每个因子的评分i=1,2,3j=1,2,3,4Ci综合评价指数i=1,2,3PI食品安全质量综合评价指数影响食品质量安全的因素。i=1,2,.6各食品安全系数a=1,2.6相互独立且服从同一正态分布的随机变量变量的偏回归平方和i=1,2,.6回归平方和剩余平方和待估计系数参数i=1,26的回归值参数的最小二乘估计i=1,26 四、模型的建立4.1问题一的分析与模型的建立4.11统计计算并得出图标来表示六大类食品在2010到2012三年中在各个季度因为微生物、重金属、添加剂和其他因素的不合格率的变化情况三年中各个季度食品由于微生物、重金属、添加剂、其他造成不合格的概率年份201020112012季度一二三四一二三四一二三四微生物0.0280.0330.0510.1410.1050.1180.1150.0350.0870.1180.0360.074重金属0.0320.0390.0300.2620.1010.2260.0880.0870.0640.0770.134添加剂0.040.0380.0300.0220.1060.0950.0620.0370.1080.0370.092其他0.0580.050.0480.1410.060.0560.0250.1190.10.0570.0230.025计算出三年中每年因微生物、重金属、添加剂和其它因素所造成不合格概率的平均值并绘制图表年平均不合格率年份201020112012微生物0.0630.0930.079重金属0.0250.1690.091添加剂0.0270.0710.068其他0.0740.0650.051 从上面图表可以看出:因为微生物、重金属、添加剂和其它因素造成不合格概率在三年中有波动,但整体上并未减少,反而对比2010年与2012年可以看出食品安全有所下降,所以在这三年中深圳市食品安全状况并未有所改善。4.12根据三年中六类食品检验数据,运用层次分析法,对数据进行定性定量分析来评价三年来由于微生物、重金属、添加剂和其它因素造成食品安全不合格的年度食品安全情况。对深圳这三年来由于微生物、重金属、添加剂和其它因素造成的食品安全不合格情况进行定量综合评价,建立相关层次分析图,其结构如下:食品微生物重金属添加剂其它2010年2011年2012年 为了能准确说明各种类食物中因为微生物、重金属、添加剂和其它因素影响而不合格的情况,无奈将食品大致分为五大类,分别为:蔬菜、鱼类、鸡鸭、米、面。考虑四个因素对食品质量安全综合评价的重要性时,考虑到下面三张图并查找资料可得三年各类食物的判断矩阵。2010四种因素年平均不合格率变化曲线00.010.020.030.040.050.060.070.08微生物重金属添加剂其他四种因素年平均不合格率2011四种因素年平均不合格率变换曲线00.020.040.060.080.10.120.140.160.18微生物重金属添加剂其他四种因素年平均不合格率2012四种因素年平均不合格率变化曲线00.020.040.060.080.1微生物重金属添加剂其他四种因素年平均不合格率各个因素的含量已统计,将微生物、重金属、添加剂和其它分别用以下符号表示:1,2,3,4;得出2010蔬菜类的判断矩阵如下:A1=2011蔬菜类的判断矩阵如下:A2=2012蔬菜类的判断矩阵如下:A3=以及四类因素的权重如下:2010蔬菜类:(0.32 0.12 0.12 0.08) 2011蔬菜类:(0.42 0.21 0.31 0.14)2012蔬菜类:(0.18 0.11 0.09 0.31)分析数据绘出相应图表:2010五大类食品因四类因素不合格次数食品蔬菜鱼肉鸡鸭米面微生物22323重金属00011添加剂12056其它202132011五大类食品因四类因素不合格次数 2012五大类食品因四类因素不合格次数食品蔬菜鱼肉鸡鸭米面微生物71760319重金属021031添加剂9171656其它32218食品蔬菜鱼肉鸡鸭米面微生物11114811重金属002228添加剂9217652其它223044.2问题二的分析与模型的建立4.11设随机变量假如变量与另外6个变量,, 的内在联系是线性的,它的第次试验数据是 =1,2,,6 (1)那么这一组数据可以假设有如下的结构式: (2)其中,是7个待估计参数,, 是8个可以精确测量的一般变量,是72个相互独立且服从同一正态分布的随机变量,这就是多元线性回归的数学模型。令, , ,那么多元线性回归的数学模型(2)可以写成矩阵形式 (3)其中是72维随机向量,它的分量是相互独立的。3、参数的最小二乘估计为了估计参数,我们采用最小二乘估计法。设 分别是参数,的最小二乘估计,则回归方程为 (4)由最小二乘法知道, 应使得全部观察值与回归值的偏差平方和达到最小,即使 (5)所以是 的非负二次式,最小值一定存在。根据微积分学中的极值原理。 应是下列正规方程组的解: (6)显然,正规方程组的系数矩阵是对称矩阵,用来表示,则,且其右端常数项矩阵亦可采用矩阵和来表示:。所以可以得到回归方程的回归系数: (7)4、由于利用偏回归平方和可以衡量每个变量在回归中所起的作用大小(即影响程度),设是p个变量所引起的回归平方和,是p-1个变量所引起的回归平方和(即除去),则偏回归平方和为:=-=-= (8)就是去掉变量后,回归平方和所减少的量2010年各地区不合格因素一览表地区抽检数微生物重金属添加剂其他龙岗区174292宝安区189144罗湖区72122南山区100082盐田区51121福田区420202011年各地区不合格因素一览表地区抽检数微生物重金属添加剂其他龙岗区2101137宝安区192485罗湖区132524南山区52210盐田区20002福田区600002012年各地区不合格因素一览表地区抽检数微生物重金属添加剂其他龙岗区164084宝安区210079罗湖区133082南山区94023盐田区61041福田区52021 五、模型的求解与结果分析5.11模型一的求解(1)构造判断矩阵通过相互比较及分析数据各个准则目标的权重及构造判断矩阵。在层次分析法中为使矩阵中各个要素的重要性能可以顶量显示,在这里我们引进1-9尺度的含义【1】,如下:尺度a意义1Ci与Cj的影响相同3Ci比Cj的影响稍强5Ci比Cj的影响强7Ci比Cj的影响明显地强9Ci比Cj的影响绝对地强2,4,6,8Ci与Cj的影响之比在上述两个相邻等级之间1,1/2,1/9Ci较Cj的影响之比与上述说明相反 得到判断矩阵,记为A。(2)利用判断矩阵计算各个因素对于目标层的权重a将A的每一列向量归一化得:b对按行求和得:c将归一化,w=()T,即为近似特征根d.计算,作为最大特征根的近似值(3)判断矩阵的一致性检验a一致性指标CI=CI=0时A一致,CI越大,A 的不一致情况越加严重b随机一致性指标RI的数值【2】n1 2 3 4 5 6 7 8 9 10 11 RI0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51分四步检验矩阵的一致性:第一步:自上而下,先求出判断矩阵A最大特征值和特征向量第二步:计算准则层相关的判断矩阵的最大特征值和权向量第三步:算出最大特征值和特征向量第四步:与检验指标比较,看看是否符合一致性5.12结果分析 经检验,判断矩阵符合一致性,则可以用我们作出的判断矩阵来计算权重。对于蔬菜这个因素来说,通过前面确定的权重就可以看出在2010年造成蔬菜检验不合格的大部分原因时微生物,2011年不合格大部分是因为添加剂和微生物,2012不合格多是因为其它和微生物,故可以得出结论蔬菜检验不合格的大多数原因时微生物,而且从这三年看来蔬菜检验不合格次数总体上升,蔬菜食用安全在下降。5.21模型一的求解(1)回归方程的求解用筛选后的数据,根据回归模型编程求解(程序如附表) 解得:回归系数为:=3257.8 = 9.7 = -18.6 =5.3 = 1.4 = -7.6 =0.8回归方程为:Y=3257.8+9.7-18.6+5.3+1.4-7.6+0.8(2)偏回归平方和的比较运用MATLAB进行编程,得到各因素的偏回方和:()0.37961.37840.34440.12070.13391.27165.22结果分析食品与产地有一定的关系,但与抽查地没有太大关系,从表中看出宝安区的不合格率较高,龙岗区次之,其余地区排后。(3)问题三的分析与模型的建立1、用数据拟合曲线来验证其 抽减次数减少后的结果,利用残差和来看。2、假如变量与另外5个变量, , 的内在联系是线性的,它的第次试验数据是 =1,2,,5 (1)那么这一组数据可以假设有如下的结构式: (2)其中,是7个待估计参数,, 是8个可以精确测量的一般变量,是72个相互独立且服从同一正态分布的随机变量,这就是多元线性回归的数学模型。令, , , 那么多元线性回归的数学模型(2)可以写成矩阵形式 (3)其中是72维随机向量,它的分量是相互独立的。3、参数的最小二乘估计为了估计参数,我们采用最小二乘估计法。设 分别是参数,的最小二乘估计,则回归方程为 (4)由最小二乘法知道, 应使得全部观察值与回归值的偏差平方和达到最小,即使 (5)所以是 的非负二次式,最小值一定存在。根据微积分学中的极值原理。 应是下列正规方程组的解: (6)显然,正规方程组的系数矩阵是对称矩阵,用来表示,则,且其右端常数项矩阵亦可采用矩阵和来表示:。所以可以得到回归方程的回归系数: (7)4、由于利用偏回归平方和可以衡量每个变量在回归中所起的作用大小(即影响程度),设是p个变量所引起的回归平方和,是p-1个变量所引起的回归平方和(即除去),则偏回归平方和为:=-=-= (8)就是去掉变量后,回归平方和所减少的量。(1)回归方程的求解用筛选后的数据,根据MATLAB求解 解得: 从72个变量中进行残差排除。2、回归方程的求解用筛选后的数据,根据回归模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论