数学与应用数学毕业论文-纯净水安全监控的聚类分析.doc_第1页
数学与应用数学毕业论文-纯净水安全监控的聚类分析.doc_第2页
数学与应用数学毕业论文-纯净水安全监控的聚类分析.doc_第3页
数学与应用数学毕业论文-纯净水安全监控的聚类分析.doc_第4页
数学与应用数学毕业论文-纯净水安全监控的聚类分析.doc_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业论文(设计)BACHELOR DISSERTATION论文题目:_ 纯净水安全监控的聚类分析_学位类别:_ 理学学士_学科专业:_ 数学与应用数学(师范)_作者姓名:_ _导师姓名:_ _完成时间:_ 2011年6月20日_ _纯净水安全监控的聚类分析中 文 摘 要随着我国国民经济的快速发展,人们生活水平不断提高,生活条件不断改善,对方便、安全、卫生的饮用水的需求不断增加,特别纯净水的增加,但是纯净水造假和有毒的情况也时常出现,在此,我们对纯净水的电导率,菌落总数等进行分析.我们根据已给数据进行了统计和分类,我们知道风险的本质是由于对未来结果予以期望所带来的无法符合期望结果的可能性,就目前情况来看,以方差度量风险的方法影响最大,应用也最为广泛.因此我们采用方差度量风险度.通过SAS软件算出方差以及相关数据,最终给出了科学的评价体系和风险分析的评价方法,确定了评价的标准和规则,对该城区所有批次的纯净水进行评判排序.我们建立了一个聚类模型,我们通过 SAS对数据进行聚类分析来掌握各变量之间的区别与联系,并以该分类为指导,确定对公司的政策.利用MATLAB自带的函数tabulate()产生频数表,并以频数表的形式来发掘数据分析的规律,避免从直方图中不能不能明显反映规律的情况.并画出六个柱形图,对此危害因素以及各个危害指标的分布规律和A、B、D公司的管理状况给出了具体的说明.针对下一年的检验批次分配问题,我们假设抽样数据服从正态分布,接着用 t检验对其进行验证,结果假设成立.再综合各公司的市场占有率和产品不合格率,利用条件概率推算出批次分布.其中,C、E、F、G不结合产品不合格率.在此基础上,评价了该城区的饮用水安全形势,并给出了监控对策.关键词:SAS 聚类分析 正态分布 MATLAB 条件概率 t检验Pure Water Safety Monitoring of Clustering AnalysisABSTRACTWith the rapid development of our national economy, improve peoples living standard, and constantly improve the living conditions of convenient, safety, hygiene drinking water rising demand, particularly pure water increases, but pure water fraud and poisonous situation also frequently appeared, so we give the conductivity of pure water analysis of total colonies. According to the given data statistics and classification, we know that is the essence of risk of future results due to expect brings the possibility of fail to meet desired result, as the current situation, the method to measure risk variance of the biggest influence, application and the most widely used. So we variance measure risk degrees. Calculate by SAS software and the related data, eventually variance given scientific evaluation system and risk analysis to determine the evaluation method of the evaluation standard, to the city and regulation, all batches of pure water judge sort. We set up a clustering model of data by us, SAS clustering analysis to grasp the difference between the variables with contact, and with this classification guidance, and sure to company policy. MATLAB self-contained function tabulate () produce frequency table, and with frequency table form to explore the rule, avoid data analysis from histogram can obviously reflect in the law. And draw the six bar charts, to this hazard factors and the various harm index distribution rule and A, B and D companys management situation gives detailed instructions. Aimed at next years inspection batch assignment problem, we assume that the sampling data is normal distribution, and then used to t test, results verified founded. Assumptions Then the companys market share comprehensive unqualifiedly, products and using of conditional probability calculate batch distribution. Among them, C, E, F, G dont combine product rejects. Then on this basis, evaluation of the urban drinking water safety situation, and gives the surveillance countermeasures. Keywords: SAS; Clustering analysis; Normal distribution; MATLAB; Conditional probability; T test 目 录第一章引 言11.1 问题提出11.2 相关理论11.3 运用方法7第二章 纯净水安全监控的聚类分析82.1 问题引入82.2 问题的假设与变量的限定92.3 模型的建立及求解92.4 模型的分析及问题的决断152.5 模型的评价17第三章总 结18参考文献19致谢20第一章 引 言1.1 问题提出日趋加剧的水污染,已对人类的生存安全构成重大威胁,成为人类健康、经济和社会可持续发展的重大障碍.据世界权威机构调查,在发展中国家,各类疾病有8%是由于饮用了不卫生的水而传播的,每年因饮用不卫生水至少造成全球2000万人死亡,因此,水污染被称作“世界头号杀手”.我国政府对纯净水安全问题十分重视,已将纯净水安全作为一项重要的公共管理目标,采取了一系列措施,强化纯净水安全的监管,并取得了初步成效.但纯净水安全问题的总体形势仍不容乐观,依然存在一系列隐忧,近年来食品安全方面的恶性、突发性事件屡屡发生.而纯净水的安全危机的爆发,往往是日常的监控机制和管理长期存在漏洞的反映.因此,本文主要从电导率、菌落群数、大肠菌群、霉菌四个方面对纯净水进行监测,以做出完整、有效的纯净水安全风险分析监测预控,为政府及有关部门实施控制措施提供决策依据和技术支持,以及时化解可能出现的安全危机.近年来,我国在从国家宏观层面探讨建立纯净水安全预警机制的研究方面,已取得了不少理论成果,但由于我国地域辽阔,经济社会发展水平很不平衡,如何构建有效的预警机制并应用到饮用水安全监控过程还处于起步阶段.为了能够做出完整、有效的纯净水安全风险分析监测预控,为政府及有关部门实施控制措施提供决策依据和技术支持,及时化解可能出现的安全危机,已经有一些相关研究,但在现实中纯净水安全问题的总体形势仍不容乐观,依然存在一系列隐忧.因此,纯净水安全监控问题仍然是一个值得研究的课题.1.2 相关理论1.2.1 数据的变换方法设有n个样品,每个样品测得m项指标(变量),得观测数据表1-1.表1-1 观察数据及特征值 均值 标准差 极差 其中,均值,标准差.对数据进行变换处理,常用的变换方法有以下几种:(1)中心化变换:变换称为中心变换.它是一种标准化处理方法,变换后数据的均值为0,而协差阵不变,即协差阵为 其中,中心化变换是一种方便地计算样本协差阵的变换.(2)标准化变换变换称为标准化变换,变换后的数据,每个变量的样本均值为0,标准差为1,而且标准化变换后的数据与变量的量纲无关.1.2.2相似系数设我们测得了个变量的组数据 ,. (1.2.2.1)这变量的个观测记为中的个向量,和以前一样并写成矩阵的形式,还称为个变量的观测样本. 常用 , (1.2.2.2)来描述变量,间的相关性,并称为,的相关系数,其中 , 此外,还常用 , (1.2.2.3)来描述变量,间的相关程度,为和前者区别,我们称为(1.2.2.3)为,的相似系数.其几何意义就是在中向量,的夹角余弦如果(1.2.2.2)式引进向量表示 , ,则式(1.2.2.2)也表示两向量的夹角余弦.两者都是从不同角度描述变量,的相近程度. 有时为了简单,也可以用两个变量,的观测向量在对应分量上的通号率(数符相同的比值)来衡量它们的相近程度,即设 和相应分量和同号的个数, 和相应分量和异号的个数,则同异号差率: , (1.2.2.4)我们称为变量,的非参数相关系数.相应地,设 和相应分量和同号的个数, 和相应分量和异号的个数,则同异号差率: , (1.2.2.5)我们称为变量,的非参数相似系数. 当变量,的观测向量各分量均大于零时,还常用以下的相似系数, (1.2.2.6)以上各相关系数(相似系数)具有以下两个共同性质:(1) ,对一切,;(2) ,对一切,.而且越接近1,越相关或相似,越接近零,越不相关或不相似.特别的,对于和还有;当时有(时有),即与(与)是有通常的线性相关;当时,为通常的正交关系(时,为通常的正交关系). 1.2.3 距离下面我们用变量的样本来描述这一概念.取,两个点(或称向量),除了可用相似(或相关)来衡量它们的相近程度外,还可以用距离来衡量4.最常用的有以下几种.(1) 欧式距离.沿用上面的记号,定义,的欧式距离为 . (1.2.3.1)(2)Minkowski距离.定义为 , (1.2.3.2)其中为一正整数.当时即为欧式距离.当时有 , (1.2.3.3)称之为绝对距离.(3)Chebyshev距离.定义为 , (1.2.3.4)(4)马式距离.定义为 , (1.2.3.5)其中,这里,而要求是可逆的.(5)兰氏(Lance Willams)距离.定义为 , (1.2.3.6)这种距离一般在都同号情况下使用.以上各种距离定义可类似用于对的列,以衡量两个变量,的相近程度.越小时意味着,越相近.特别的,如果,则表示两者在相应的距离意义下完全相同.越大,意味着两者相差越远.还有一点值得注意的是,在泛函分析中定义的距离要求满足距离公里,即满足(1),当且仅当时;(2),对一切,;(3) ,对一切,.1.2.4类平均法用表示样品和之间的距离,当样品间的疏关系采用相似系数时,令(或);用表示和间的距离.类与类之间的距离定义为两类中相距最近的样品之间的距离,即类和之间的距离定义为:(这里表示)类平均法是用两类样品两两之间平方距离的平均作为类之间的距离,即 采用这种类间距离的聚类方法,称为类平均法.当某步骤将类和合并为,且,则与其他类距离平方的递推公式为:1.3 运用方法1.3.1系统聚类方法的基本思想系统聚类法是目前用得最多的一种.其基本思想是:一开始将要归类的个变量(或个体)各自看成一类,然后按事先规定好的方法计算各类之间的归类指标(如某种相关系数或距离),根据指标大小衡量两两之间的关系即密切程度,将关系最密切的两类并成一类,其余不变,即得类;又按事先规定的方法重新计算各类之间的归类指标(仍为某种相关系数或距离),又将关系最密切的两类并成一类,其余不变,即得类;如此继续下去,每次归类都减少一类,直到最后个变量都归成一类为止.这一归类过程可以用一张聚类图(或称谱系图)形象的表示出来,由聚类图来进行分类.1.3.2系统聚类方法的基本步骤(1)数据变换:数据变换的目的是为了便于比较、计算上方便或改变数据的结构.选择给定样品间距离的定义及度量类间距离的定义.(2)计算个样品间的距离,得样品间的距离矩阵.(3)开始时个样品各自构成一类,类的个数;,此时类间距离样即品间距离,然后对步骤执行并类过程的步骤4)和5).(4)每次合并类间距离最小的两类为一新类,此时类的总个数减少到1类,即;(5)计算新类与其他类间的距离,得到新的距离矩阵.若合并之后的类的个数仍然大于1,重复4)和5)步,直到类的总个数为1.(6)画谱系聚类图(7)决定分类的个数及各类的成员.可以看到,这种系统归类过程,显然与计算类与类之间指标是有关系的,同时也与归类的方法有关系. 第二章 纯净水安全监控的聚类分析 2.1 问题引入日趋加剧的水污染,已对人类的生存安全构成重大威胁,成为人类健康、经济和社会可持续发展的重大障碍.据世界权威机构调查,在发展中国家,各类疾病有8%是由于饮用了不卫生的水而传播的,每年因饮用不卫生水至少造成全球2000万人死亡,因此,水污染被称作“世界头号杀手”.我国政府对纯净水安全问题十分重视,已将纯净水安全作为一项重要的公共管理目标,采取了一系列措施,强化纯净水安全的监管,并取得了初步成效.但纯净水安全问题的总体形势仍不容乐观,依然存在一系列隐忧,近年来食品安全方面的恶性、突发性事件屡屡发生.生物性和化学性污染对纯净水安全的影响愈来愈严重.本问题主要考虑纯净水的以下危害因素:(按照危害的严重性依次给出)“电导率”:是纯净水的特征性指标,反映的是纯净水的纯净程度,以及生产工艺控制的好坏,“电导率”根本达不到国家卫生标准要求,与自来水无异,根本不能算做纯净水.菌落总数:是指纯净水检样经过处理,在一定条件下培养后所取1ml(g)检样中所含菌落的总数.它可以作为判定纯净水被污染程度的指标之一.大肠菌群:反映纯净水加工过程中对大便污染程度的一个指标.数值越高证明污染越严重.霉菌:食物霉变后产生,直接引起中毒,或产生致癌物质,毒害人体. 纯净水的安全危机的爆发,往往是日常的监控机制和管理长期存在漏洞的反映.完整、有效的纯净水安全风险分析监测预控,为政府及有关部门实施控制措施提供决策依据和技术支持,可以有效提高纯净水安全监管效率和管理水平,及时化解可能出现的安全危机.近年来,我国在从国家宏观层面探讨建立纯净水安全预警机制的研究方面,已取得了不少理论成果但由于我国地域辽阔,经济社会发展水平很不平衡,如何构建有效的预警机制并应用到饮用水安全监控过程还处于起步阶段.某城区共有九家生产并销售纯净水的公司,其中A公司和B公司规模较大,其余均为小公司.针对该城区提供的近年的关于各公司的纯净水检测报告(见附件),请你利用数学建模的方法回答以下问题:1、结合本问题所给数据,给出纯净水安全风险分析的科学评价方法,确定评价的标准和评价的规则,对该城区所有批次的纯净水进行评判排序.2、对该城区范围内的监控对象(各公司)按风险度进行排序评价,并对它们分类综合评价,指出各公司产品的主要可能的危害因素,并指出同类公司的实际特点.3、对检测出的不合格的样品成因分析:评价纯净水生产流通环节(归为仓库和销售网点两类)的危害因素以及各个危害指标的分布规律,并通过四类危害指标的分析,讨论A、B、D公司的管理状况. 4、国家相关部门每年要面对各种专项检验,对于纯净水专项检验的投入经费有限,已知该城区下一年度投在纯净水方面的检验总批次为100个批次,在现有历史数据的基础上,并考虑各公司的实际运行状况,如何设置各公司检验批次的分布,使得抽检方案的针对性最优(即检出的风险性为最大).5、阐述你的观点,评价该城区的饮用水安全形势并给出监控对策. 2.2问题的假设与变量的限定2.2.1模型的假设:1、假设所给的数据能基本真实反应这个城市各纯净水公司的真实状况;2、假设检验各公司的样本数目与市场占有率成正比;3、假设抽样数据服从正态分布.2.2.2符号约定: Vm: m=A,B D表示三个公司的样本总数,Wmi: i=1,2,3,4分别表示m公司电阻率,菌落总数,大肠杆菌,霉菌与酵母的超标的个数Umj: m公司第j个单项判断的值.,mki: m公司k项目i词的值,(k=1,2,3,4.依次表示电阻率,菌落总数,大肠杆菌,霉菌与酵母)i表示在m公司的次序(i=1,2,3,4)Pmj: m公司样本第j次检测的样本数目Var为公司的产品风险度,:第i种产品的风险度,:该批次产品数量,:公司的总检验数,n:所检验的产品总数.2.3模型建立及求解2.3.1根据检测结果做出评价题中已知检验合格要求电导率小于等于10,菌落总数小于等于20,大肠菌落小于等于3,霉菌和酵母不得检出.我们根据这四项检验数值来给待测的纯净水样本分类,根据检验结果,把纯净水分为全部合格,一项不合格,两项不合格(三,四项不合格没有出现).分类如下:统计结果全部合格的共19批次有一项不合格的11项有两项不合格的5项厂商时间批号厂商时间批号厂商时间批号A2007071120070425A2007071820070704D2008091020080827A2007071120070425A2007071920070703A2007071920070704A2007071120070415A2007071920070704C2008091020080827A2007071120070609A2007071920070704D2008091020080902A2007071120070512B2007122020071219G2009012020090112B2007081620070809E2008091020080901B2007081620070809F2009012020090111B2007081620070810H2009012020090112B2007081620070810H2009012020090112B2007121920071218I2009012020090110B2007121920071216I2009012020090111B2007121920071216B2007122020071220B2007122020071218B2007122920071216C2008091020080827D2008091020080826D2008091020080827H20090120200901092.3.2建立风险度求解的数学模型如果生产出的纯净水电导率为0,菌落总数为0,大肠菌群数为0,霉菌和酵母数为0,就设定其风险度为0.针对具体情况,可设定风险度上限为1.当电导率小于等于10,菌落总数小于等于20,大肠菌群数小于等于3时,风险度为0.05.由此可建立一个方程,求出各产品的风险系数.假设风险系数其中是电导率、菌落群数、大肠菌群、酵母和霉菌数相应的检测值,是风险度为0时各检测值.假设电导率占权重为0.2,菌落总数和大肠菌群数所占权重均为0.4,则可得一个风险系数函数由此可以计算各批次产品的风险系数.受检方时间批号样品数量风险度0003312C200809102008082710.0003423C200809102008082710.0003423A200707112007051240.00055A200707112007042530.000726A200707112007042530.000726001135700157610019076B200708162007081010.0019893D200809102008082610.00207940023524B200712292007121610.00248470031081A200707112007041560.003751B200708162007080910.0037854B200708162007080910.0039197B200708162007081010.0051575A200707112007060940.010435D200809102008082710.020262042823E200809102008090110.059206063504D200809102008082710.0645840687074034077284D200809102008090220.146621483571234986432007071920070704312007071920070704312.3.3对公司销售问题状况的描述对于公司的评价,主要依赖于对各个公司不合格产品的分析.其中,A公司生产的产品共10批20件,其中不合格的有6批16件,其中2件是同时有电导率和菌落总数超标,2件因为电导率超标不合格.B公司有16件产品,其中有3件因为菌落总数超标不合格.C公司有两批共7件产品,全部合格.D公司有四批6件产品,全都不合格,其中3件因为菌落总数超标和菌落总数超标而不合格一件因为电导率超标不合格,1件因为含有霉菌不合格.E公司、F公司和G公司产品都合格,格H公司共有三批共五件产品被检测,都不合格,其中三件因为菌落总数超标不合格,1件因为电导率超标不合格,一件因为电导率超标,菌落总数超标不合格.I公司共有2批3件产品,也全都不合格,其中2件因为电导率超标且菌落总数超标不合格,1件因为电导率超标而不合格.2.3.4公司产品风险度的计算每个公司的风险度等于其每一批次每一产品的风险度乘以该批次产品数量的权重之和,即Var=i=1nVariGiCi其中,Var为公司的产品风险度,为第i种产品的风险度,为该批次产品数量,为公司的总检验数,n为所检验的产品总数.公司检验产品数平均风险度A200.2896445B160.1900979C60.0003224D50.6363348E70.006274F30.002178G60.022606H40.125042I30.112021综合分析,A公司的市场占有份额最大,C公司的产品质量最差.2.3.5公司的分类及对各类公司的评价聚类分析又称为群分析,它是根据样本(或指标)之间距离或相似系数对样本(或指标)进行分类的一种方法.聚类分析的目的是把分类对象按照一定的规则分成若干类,这些类不是事先给定的,而是根据数据的特征确定的,对类的数目和类的结构不必作任何假定.对这个模型中的9家纯净水制造商,我们采用聚类分析的方法来分析各变量之间的区别与联系,并以该分类为指导,确定对公司的政策.根据公司被检产品数,产品平均电导率,平均菌落总数,平均大肠菌群数,总风险度,平均风险度六个指标,对9家公司做聚类分析,以寻找各个厂商之间的内在联系.系统聚类法开始时每个对象自成一类,然后每次将最相似的两类合并.合并后重新计算新类与其他类的相近程度,最终得到聚类谱系图如下:通过统计量判定应该分为三个类或四个类.根据半偏分为三个类、四个类是比较合适的.根据伪F准则分为二个类、三个类、四个类是比较合适的.由统计量分析得分为三个类比较合适.分为四个类的分法:=A公司,B公司=E公司,G公司, F公司=C公司=I公司,H公司,D公司其它.类别公司被检产品数平均电导率平均菌落总数平均大肠杆菌菌落数平均每件产品风险度总风险度第一类A2014.93255.6573420.02057610.28964455.792891B163.0087566.6758240.00725510.19009793.041567第二类C72.09714295.32407411.33333330.00032230.0006446第三类E32.6100.0062740.043918F63.91010.0021780.002178G41300.0226060.022506第四类H516.7926.61071850.00591720.50017111.003422I320.92.22222220.02127660.1120210.336063D618.1333335.98698920.01310040.63633483.181674分析以上四类公司,发现:A公司和B公司市场份额大.B公司的平均菌落数很大,这是由于时间为20070718批号为 20070704的三件产品导致的.C公司的产品质量最好.E、F、G公司的平均风险度较低,市场占有率低.H、I、D公司的平均风险度较高,市场占有率低.(各公司的市场占有率,后文图表中有给出)2.3.6对各公司的不同批次统计以及图形描述数学公式:Vm=i=1nPmj (当m=A,B.n=10.当m=D,n=4.)Wmi=k=1nmki (当m=A,B.n=10.当m=D,n=4.)计算结果如下: 公司VmWm1Wm2Wm3Wm4Wm1/VmWm2/VmWm3/VmWm4/VmA20107020.50.3500.1B16030200.187500.125D614040.1666670.6666700.66667图(1): 对上表进行柱形图比较图(2):三种公司电导率超标的个数占各公司样本总数的比例图(3):三种公司菌落超标的个数占各公司样本总数的比例 图(4):三种公司大肠杆菌超标的个数占本公司样本总数的比例图(5):三种公司霉菌和酵母超标的个数占本公司样本总数的比例图(6):不合格的占总样本的比例 图(1) 图(2) 图(3) 图(4) 图(5) 图(6)2.3.7问题的说明对A公司进行分析:通过附录1和附录2以及上图可以看出A公司电导率不合格占一半,菌落总数不合格率为0.35,霉菌和酵母不合格率为0.1,说明电阻率严重超标,而且从附录1表格上可以看出都电导率不合格的都是在20082009年仓库检验中出现问题,说明A公司在后期生产过程中,尤其是在仓库管理有严重的问题,水有一定的污染.菌落不合格主要出现在成品库和仓库说明在生产过程中监管不力,后期不合格率明显增加,表名公司发展逐渐走下坡路,需要引起注意.B公司的检验结果是电阻率不合格率为0,菌落在不合格率为0.1875.大肠菌落不合格率为0,霉菌和酵母不合格率是0.125,说明B公司的发展还算正常,可以看出B公司的水受一定污染,但是不是很严重,危害性不是很大,监管上也要加强.D公司所有检验都不合格,存在严重问题,霉菌和酵母和菌落的不合格比重都占0.667,电阻率不合格比重为0.1667,菌落总数不合格率为0.6667.这就说明D公司的水受到严重污染,生产条件不符合规定,且D公司在仓库和销售网点都存在很大问题,因此,D公司如果不进行大规模整改,则必须令其停止生产和销售. 2.4模型的分析及问题的决断在对随机现象的观察和研究中,人们发现许多随机变量,它们是由大量的相互独立的随机因素的综合影响而形成的,而其中每个因素在总的影响中所起的作用又很小,且各因素的作用还相对是均匀的,则这种随机变量往往服从或近似服从正态分布. 依赖概率分布进行分层抽样,获得样本.各公司不合格产品比例如下:x=16 3 0 6 0 0 0 5 3;tabulate(x)hist(x)value count percentA 16 48.49% B 3 9.09% C 0 0.00% D 6 18.18% E 0 0.00% F 0 0.00% G 0 0.00% H 5 15.15% I 3 9.09% 假设样本服从正态分布,接下来应用参数检验.可算出样本均值为3.6667,用t检验.x=16 3 0 6 0 0 0 5 3;h=ttest(x,3.67 ,0.05)得到 h=0即说明不能拒绝零假设,且可计算出其均值和标准差置信度为98%的置信区间.(源程序见附录A)亦说明样本服从正态分布.在前面数据分析的基础上,我们由市场占有率以得出下表:公司产品总数批次分布A200.2896450.164603160.484946B160.1900980.108032100.09099D60.6363350.361626360.181817H50.5001710.284245280.151515I30.1120210.06366160.09099C70.0003220.00018311E30.0062740.00356511F60.0021780.00123811G40.0226060.01284711注:代表公司产品的市场占有率 代表A-I公司“”对应的比例代表A-I公司在100个检验批次下按“”所得批次数 A、B、D、G、I公司各占比例进一步考虑导致产品不合格的因素及不合格产品被检地点分布如下表:公司(1)(2)(3)(4)仓库销售网点A8801126B030003D140433G244014I310030注:(1)(2)(3)(4)分别表示由电导率、菌落总数、大肠菌群、霉菌和酵母导致的不合格产品数由上表易知,在下一年中,各公司应基本按照后两列比例来具体分配检验批次,使得抽检方案的针对性最优(即检出的风险性为最大).对于比例中出现0的情况,分配检验批次时则趋近于0,在本模型分配1个,在现实操作当中,可以视情况而定,但总是与检验批次总数成正比.综上,建议检验批次分配如下:公司总批次投放于仓库投放于销售网点A463115B918D1798G15312I981C1随机分配E1F1H12.5 模型的评价2.5.1优点通过 SAS对数据进行聚类分析来掌握各变量之间的区别与联系,并以该分类为指导,确定对公司的政策.利用MATLAB自带的函数tabulate()产生频数表,并以频数表的形式来发掘数据分析的规律,避免从直方图中不能不能明显反映规律的情况.针对下一年的检验批次分配问题,用 t检验验证抽样数据服从正态分布.最后批次分配具体到生产流通各环节.2.5.2缺点由于本题原数据较为分散,最后具体到各点时数据就较少,使得抽样时未满足n大于50,这样就降低了模型的说服力.而且最后批次分配时,只能归为仓库与销售网点两类,而不能再具体一些,即使再分析,由于数据少而导致误差很大.第三章 总结多元统计中的数据分类的方法很多,本文主要运用系统聚类法中的类平均法,并将变量间的距离取为欧式距离,类间的距离取为最短距离.在第一章主要介绍了相关理论、系统聚类法的基本思想及其步骤.在第二章中我们运用前面的方法,采用方差度量风险度,建立了一个聚类模型,我们通过 SAS对数据进行聚类分析来掌握各变量之间的区别与联系,并以该分类为指导,确定对公司的政策.利用MATLAB产生频数表,并以频数表的形式来发掘数据分析的规律,对此危害因素以及各个危害指标的分布规律和A、B、D公司的管理状况给出了具体的说明.针对下一年的检验批次分配问题,我们假设抽样数据服从正态分布,接着用 t检验对其进行验证,结果假设成立.再综合各公司的市场占有率和产品不合格率,利用条件概率推算出批次分布.其中,C、E、F、G不结合产品不合格率.在此基础上,评价了该城区的饮用水安全形势,并给出了监控对策.食品危机参考文献1 冯杰,黄立伟,王勤,严成义. 数学建模原理与案例 科学出版社 【2】赵 静,但 琦.数学建模与数学实验,高等教育出版社,2003【3】魏宗舒,概率论与数理统计教程,高等教育出版社【4】梅长林,范金成,数据分析方法,高等教育出版社,2006【5】韩中庚,大学生建模案例精选,高等教育出版社,1999【6】罗万成,数学实验教程(Matla

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论