数据挖掘统计分析在紧固件疲劳试验数据处理中的应用 - 阎菲-_第1页
数据挖掘统计分析在紧固件疲劳试验数据处理中的应用 - 阎菲-_第2页
数据挖掘统计分析在紧固件疲劳试验数据处理中的应用 - 阎菲-_第3页
数据挖掘统计分析在紧固件疲劳试验数据处理中的应用 - 阎菲-_第4页
数据挖掘统计分析在紧固件疲劳试验数据处理中的应用 - 阎菲-_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、收稿日期:2004-11-16作者简介:阎菲(1955-,女,长春人,湖北汽车工业学院副教授;西安电子科技大学硕士,(E-mailyanfei131 。文章编号:1001-2265(200506-0082-03数据挖掘统计分析在紧固件疲劳试验数据处理中的应用阎菲(湖北汽车工业学院计算中心,湖北十堰 442002摘要:文章对紧固件材料疲劳试验进行了详细分析,针对疲劳试验过程中数据剧烈增长以及汽车工业数据统计分析的需要,基于数据挖掘的基本思想进行了统计分析。数据挖掘技术在挖掘有效信息、发现新的知识和规律发挥着重要作用。结合项目,概述了疲劳试验数据处理的特点和关键技术,重点讨论了疲劳试验数据处理数据

2、挖掘的体系结构和基本过程,并指出了要进一步研究的问题。关键词:紧固件材料疲劳试验;数据挖掘;统计中图分类号:TP306-3 文献标识码:AApplication of Data Mining Stat Analyze in Tightener Fatigue Examination Data ProcessingYAN Fei(Computer Center of Hubei Automotive Institute,Shiyan Hubei 442002,ChinaAbstract:The paper carefully analyzes tightener material Fatigue

3、 Examination.A stat analyze based on the data mining.As the number of data in the tightener Fatigue Examination is enormously and Data Processing will be realized in the automotive industry.Data mining tech -nology will play an important role in discovering value informatio,new knowledge and laws.Su

4、mmarize the characteristics and key of data mining tightener Fatigue Examination characteristics.Then mainly discuss the architecture and basic processes of data mining on tightener Fatigue Examination.At last an outlook for Fatigue Examinati on Data Processing is provided.Key words :tightener fatig

5、ue examination;data mi ning;stat analyze0 概述紧固件产品投放市场后,如果在耐久性方面出现问题将会造成许多新产品失去竞争力,给企业带来巨大的经济损失,同时又使企业形象蒙受巨大的负面影响。在我国,由于疲劳耐久性与可靠性不过关造成的产品问题普遍存在,而通过应用疲劳耐久性分析技术,其中的50%是可以避免的,因此许多企业尤其是汽车制造业将紧固件疲劳耐久性定为产品质量控制的重要指标。疲劳破坏的概念:当材料或结构受到多次重复变化的载荷作用后,在应力值虽然始终没有超过材料的强度极限,甚至比弹性极限还低的情况下就可能发生破坏。这种在交变载荷持续作用下材料或结构的破坏现象

6、,就叫做疲劳破坏。疲劳强度分析及概念:某些材料有一个疲劳的极限,在这个疲劳极限之外,不管作用力在什么情况下,材料的疲劳都不会发生。事实上,疲劳极限检测样本测试足够长的时间。通常需要测试达107周期。这也就是说,如果样本在107周期内没有断裂,就认为它讲不会断裂,因此将其称为疲劳强度。SAFL 是Statistical Analysis for Fati gue Limit 的缩写,是分析材料试验失效数据的一种方法,它针对所有待处理的数据临界,在近年得到应用。在给定的负载下,有一组数据丰富有关系的事实或状态交互,其关联方程式是:R a =R f c /(2N f b或log R a =log R

7、 f c +b log (2N f R a 是变化的压力,R f c 是疲劳周期系数,N f 是交变数,若令负载被施加一定的力,可用恒定平均应力R m 进行试验。试验是在室温下进行,沿着紧固件轴向施加外力,从而得到紧固件的疲劳强度。对紧固件轴向疲劳试验,一般采用S /N (次数/应力曲线表示(见图1 。图1 紧固件轴向疲劳实验(次数/应力曲线紧固件失效的定义为:紧固件完全断开成两个部分。疲劳试验结果的评价:要求使用统一的试验和结果评价方法,才能使疲劳强度结果具有可比性。振动试验的结果分析,获得综合的结论,需要采用统计计算方法确定有限寿命范围和过渡范围分布位置和宽度1。1 紧固件疲劳试验数据处理

8、特点在紧固件振动试验系统中,如材料、热处理波动、脱碳现象、结构、工艺因素将影响紧固件的疲劳性能。而导致失效的条件拉伸、压缩、弯曲、剪切等,如何从这些可能的因素中找出影响疲劳强度的主要原因和诱发条件,从而指导实际的操作运行,具有重要的意义。由此看出,此项工作的关键是对积累的大量振动试验和机组参数数据进行分析挖掘,从中找出导致紧固件失效的相关因素。从大量的紧固件疲劳试验数据源中挖掘出有用知识的一般#82#工艺与装备#组合机床与自动化加工技术系统如图2 所示。图2 紧固件疲劳数据挖掘的一般系统结合标准件的振动试验,说明如何利用数据挖掘。数据挖掘技术是数据库知识发现的关键技术,它是从大量的、不完全的、

9、有噪声的、模糊的、随机的应用数据中,提取出隐含在其中的、人们事先不知道的但又是潜在的有用信息和知识的过程。数据挖掘的过程是知识发现和表示的过程。数据处理与知识发现的过程由以下几个步骤组成。(1数据清理与集成。这是数据预处理的前期部分,数据清理是通过填写空缺的值,平滑噪声数据,识别、删除孤立点,并解决不一致来清理数据。数据集成就是将来自多个数据源、数据立方体或文件中的数据按一定的规则集成到数据仓库中。(2数据选择和变换。数据选择就是根据用户挖掘的目的要求,大概选择出需要挖掘的数据范围。数据变换就是通过平滑、聚集、数据概化、规范化、特征构造等手段将数据转化为适合于挖掘的形式。(3数据挖掘。对已生成

10、的预处理后数据,运用关联分析、分类和预测、聚类分析、孤立点分析、演变分析等方法,找出有用的知识。(4评估与表示。评估即根据兴趣度度量,与数据挖掘模块交互,将搜索聚焦在有趣的模式上,从而识别出所挖掘的知识中真正有趣的模式。知识表示即使用可视化和知识表示技术,向用户提供挖掘的知识。2 实例分析系统提出的整个数据仓库系统逻辑上分五个层面,即:源数据层、数据导入层、数据存储与管理层、中间服务层和前端应用层。(1数据层包括该局的业务数据、外部数据和其他数据等。(2数据导入层主要完成源数据向数据仓库系统的抽取、传输、转换和加载,需要配备数据加载转换(ETL服务器。(3数据存储与管理层是整个系统的核心,通过

11、数据仓库统一存储和管理各种数据,这些数据通过逻辑数据模型(LDM进行组织和重构;为了数据挖掘的需要,还可以在该层建立相应的数据挖掘数据集市。(4中间服务层主要包括OLAP 服务器、数据挖掘服务器等,该层为用户对数据仓库的访问提供各种方式的服务,从而实现访问方式的多样化和信息存取的透明化。(5应用层主要包括决策分析用户和数据挖掘用户:决策分析用户主要访问OLAP 服务器或直接对数据仓库进行存取,实现随机查询、统计报表和决策分析功能;数据挖掘用户则需要利用专用的数据挖掘工具进行前端访问和开发2。2.1 建立系统数据仓库此系统采用关系型数据库,数据仓库的设计采用星型模式。关系型数据库能较好地适应多维

12、数据的表示和存储,能将多维数据库中的多维结构划分为两类表。一类是事实表,用来存储事实的度量值和各个维的码值;另一类是维表,对每个维至少有一个表用来保存该维的描述信息,包括维的层次和成员类别等。事实表是通过每一维的码值与维表联系在一起的,该结构称为星型模式。针对振动试验系统数据仓库的设计,现以监测的紧固件横向振动统计为例,并选定与之相关的4个维时间、试验条件、基本参数、运行人员,其物理模型分别如图3 所示。图3 紧固件振动试验数据仓库物理模型在图3中,中间表示振动试验记录情况,四周表示与之相关的信息(时间、试验条件、基本参数、运行人员,每个维表都有自己的属性,维表与事实之间通过维关键字相关联。星

13、型模型的核心是事实表,它是按维查询的中心,事实表属性包含了适当的关于事实表所管理的内容的数字型值。使用星型模型使用户能提高查询的性能和便于安排各种复杂的查询。2.2 进行数据挖掘(1使用关联规则进行挖掘在数据仓库的设计中,已将要分析的数据按一定规则存放到了数据仓库中,现将对这些数据进行数据挖掘。采用先通过Apriority 算法找出频繁项集,并通过频繁项集产生强关联规则的方法进行挖掘。为此,先在振动试验事件表中找出所有的紧固件振动失效记录和断裂的不正常数据记录集,然后再找出在断裂点前后的各机组参数数据。为了分析方便,首先各离散值进行分类化。在疲劳试验中对原始数据进行数据挖掘,将个体数据集和结构

14、数据集的相关数据作为分类器的输入,输出是影响疲劳强度的较为科学量化的预测与结果。下面是一个实际应用实例在去掉原始数据中的冗余信息,选取部分数据后得到如下表2、表3、表4所示的信息表:例如,选用不同的材料进行对比试验,各种材料的化学成分含有不同比例的C 、Si 、Mn 、Cr 、Mo,上述材料在真空炉同时完成淬火工序,所有试样回火后均要求硬度达到40?1HRC(实验过程见参考文献3。此时对每一振动断裂点各相关参数所在段值生成一个表,如表1所示。表1 每一振动断裂点各相关参数所在段数值材料号对数疲劳寿命平均值对数疲劳寿命标准差5.0610.220试样疲劳性能对比试验在高频疲劳试验机上进行,试验采用

15、固定载荷,对比试样的对数疲劳寿命的方式进行。当试样经历的循环次数达到2106次而未失效时,停止该试样的试验,其寿命按2106次计。表1是统计之后的结果。对上面已生成的分段统计表,运用Apriori 算法,找出频繁项集,可得到如下所示的关联规则:对数疲劳寿命最高材料为ML42CrMo,材料最低的是40MnB#83#2005年第6期#工艺与装备#材料;C=80%,S=65%此外,产生某种现象的原因还可能是某几个量相互作用的结果。根据实际需要还应对量硬度、再回火、去应力退火、表面脱碳、滚丝/磷化的先后顺序、头下圆角粗糙度等因素对高强度紧固件疲劳性能的影响3。表2各相关参数所决定的试验条件表试验条件试

16、验时间被测件规格疲劳强度规格标准差再进一步进行数据处理,得到描述疲劳强度如表3。2.3数据挖掘结果分析与技术总结在研究中所选的6种材料在给定条件下的疲劳性能有一定差异,但最大差异只有7.2%,说明材料因素不是影响高强度螺栓疲劳性能的主要因素。其他条件相同,由于热处理波动导致螺栓的硬度在不大的范围年变动时,其疲劳性能吴明显变化。表3描述疲劳强度的表被测件规格试验变化因素参数值疲劳强度平均值标准差试验负责人硬度再回火去应力退火表面脱碳滚丝/磷化1滚丝/磷化2头下圆角粗糙度高强度螺栓表面在脱碳现象时,其疲劳性能将产生较大幅度下降。螺栓先滚丝后磷化比先磷化后滚丝的疲劳强度低。螺栓头下圆角过渡形式、粗糙

17、度、滚丝轮螺纹牙性等结构、工艺因素将显著影响强度螺栓的疲劳性能。紧固件疲劳试验数据处理中的所面临的挑战:(1过程计算机记录的数据是时间上连续变化的数据采样量化得到的,本质上是连续的,其变化受过程状态约束;其次,在空间上,过程变量具有高维数、强关联和非线形的特点。而目前大多数挖掘算法都有维数上的限制,另外,数据的强关联性和非线形也增加了知识表示的浓度,影响知识的可视化和可理解性。(2由于各种干扰,过程数据中含有大量噪声。另外过程数据中也含有大量的不确定性。数据中的噪声影响算法的有效性和结论的可靠性,而数据中的不确定性又给知识的提取带来了困难。且不确定性数据要求挖掘算法本身具有鲁棒性。目前的挖掘算

18、法处理数据中的干扰和不确定性集算法的鲁棒性,距知识发现的要求存在差距,有待进一步研究。(3在过程记录的数据中,绝大多数数据都是正常状态的数据,极少量不正常状态数据,从大量数据中发现小模式是异常检测的主要方法。目前大多数数据挖掘都不能有效地从大规模数据库中辩识小模式。这给数据选择带来了困难。(4效率的挖掘算法的研究。根据所采集数据的特点,既时间上连续变化且高维数。如何充分利用领域知识,有效的处理数据的关联与耦合,剔除与挖掘任务无关的数据,以降低维数,设计出高效的数据挖掘算法是下一步发展的重点。(5紧固件疲劳试验中的数据挖掘结构模型的研究。应与其他系统集成技术和方法的研究,与紧固件疲劳试验系统、数

19、据库、专家系统、可视化工具等多项技术集成。3结束语本文介绍了数据仓库和数据挖掘技术在紧固件疲劳试验的应用。它们正越来越引起紧固件振动试验系统研究人员的关注,并用它来解决紧固件振动试验系统运行时遇到的各种难题。随着紧固件振动试验系统的运作和完善、经济运行方式分析、安全性和可靠性分析的全方位的协调等要求的提高,数据仓库和数据挖掘技术在紧固件振动试验系统应用中将越来越显示出不可忽视的作用。实现数据挖掘的四个关键:(1要踏踏实实做好基础数据库的建设。(2企业要有比较明确的挖掘目标,盲目的数据挖掘是很难成功的。(3数据挖掘必须由来自不同领域的人员共同参与,包括行业专家、数据管理员、数据分析人员、业务分析人员、数据挖掘专家等。大家需要通力合作,寻找一套适合自己企业的开发方法,并逐步建立起挖掘的模型库。(4构建数据挖掘系统,不仅需要很高的资金投入,而且挖掘结果是产品设计使用的,因此必须得到技术决策层的支持、认可和参与。参考文献1螺纹紧固件轴向载荷疲劳试验方法GB/T13682-1992,机械工程标准手册螺纹与紧固件卷1北京:中国标准出版社, 200012Ramez Elmasri Shamkant B.Navathe,邵配英,等译1数据库系统基础M.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论