版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘课程教学课件项目5工厂设备故障预测构建设备故障预测模型,提前识别异常风险,支持工厂预防性维护决策。工厂设备故障预测数据集准备故障预测RUL分析课程导航任务5.1数据集简介及准备任务5.2数据观察任务5.3可视化观察任务5.4使用寿命RUL分析任务5.5特征关联性分析任务5.6绘制RUL剩余使用寿命的演变图项目5_工厂设备故障预测2项目描述你是一名飞机维修工程师,负责监控和维护飞机发动机的运行状态。你的目标是利用时序数据挖掘技术,对飞机发动机的故障进行预测和管理。通过分析发动机的运行数据和传感器测量值等时序数据,你将建立一个发动机故障预测模型,用于预测可能出现的故障以及其发生的时间点。我们的目标是通过提前进行维护和修复,减少发动机的停机时间,保证飞机的安全运行,从而提高航空公司的运营效率。项目5_工厂设备故障预测3项目实施数据收集和准备:收集飞机发动机的运行数据、传感器测量值等时间型数据。确保数据的完整性和准确性,并进行清洗和预处理,包括处理缺失值、异常值和重复值等。特征工程:对数据进行特征提取和工程处理,以提取与故障相关的特征。这可能涉及到特征选择、降维、标准化等操作,以确保模型的有效性和稳健性。建立预测模型:选择合适的机器学习算法,如时间序列预测、分类或回归算法,建立发动机故障预测模型。在建模过程中,采用训练集对模型进行训练,并利用验证集进行模型调优和评估。模型评估:对建立的预测模型进行评估,包括评估模型的准确性、精确度、召回率等指标,以及对模型的泛化能力进行验证,确保模型对未来数据的预测效果。项目5_工厂设备故障预测4项目目标理解飞机喷气发动机故障预测中常用的机器学习算法。熟悉NASATurbofanJetEngine数据集的特征和结构。掌握时间序列预测、分类和回归等算法在发动机故障预测中的应用。在航空工业中,对飞机发动机的状态进行实时监测和故障预测是至关重要的。传统的维护方法可能会导致不必要的停机时间和维修成本,而机器学习技术的应用可以提高预测准确性和降低维护成本。项目5_工厂设备故障预测5企业岗位要求岗位:预测性维护工程师要求:掌握时序数据分析方法,能够运用统计和机器学习技术对设备运行数据进行深入分析。熟悉故障预测模型的构建流程,包括数据预处理、特征工程、模型选择、训练和评估。具备使用专业软件(如Orange3)和编程语言(如Python)进行数据挖掘和模型开发的能力。项目5_工厂设备故障预测6思政目标通过参与实际项目,提高学生的安全意识和责任感。通过学习和应用机器学习技术解决飞机发动机故障预测的实际问题,学生将深入了解技术对社会的重要性,并培养工程伦理和社会责任感。这将有助于他们成为具有社会责任感和使命感的未来工程师,为社会的可持续发展做出积极贡献。项目5_工厂设备故障预测7知识链接.时间型数据时间型数据,也称为时间序列数据,是指随着时间变化而变化的数据。时间型数据通常由一系列数据点组成,每个数据点都有一个时间戳,表示该数据点发生的时间。时间型数据的常见示例包括。股票价格:股票价格会随着时间变化而波动。销售额:销售额会随着时间变化而变化。项目5_工厂设备故障预测8任务5.1数据集简介及准备本任务将使用“NASATurbofanJetEngineDataSet”来模拟实现目标。;“NASATurbofanJetEngineDataSet”NASA涡轮风扇喷气发动机数据集是一个用于故障诊断和预测性维护的标准数据集,常用于机器学习和数据挖掘领域的实验和算法测试。项目5_工厂设备故障预测9任务5.1数据集简介及准备(1/10)本任务将使用“NASATurbofanJetEngineDataSet”来模拟实现目标。“NASATurbofanJetEngineDataSet”NASA涡轮风扇喷气发动机数据集是一个用于故障诊断和预测性维护的标准数据集,常用于机器学习和数据挖掘领域的实验和算法测试。该数据集由NASA的剑桥研究中心提供,它记录了飞机喷气发动机的运行数据,并且包含了在一系列时间点下发动机的传感器测量值。这个数据集通常用于构建预测模型,以便预测发动机在未来时间内是否会出现故障。描述:数据集用于预测工业资产的状态,特别是涡轮风扇喷气发动机的运行至故障模拟数据。项目5_工厂设备故障预测10任务5.1数据集简介及准备(2/10)预测目标:预测测试数据集中每个发动机的剩余有用寿命(RUL),即测试数据集中最后一个数据点之后发动机还能运行的飞行次数。实验场景:数据集包含多个多变量时间序列,分为训练和测试子集。每个时间序列来自不同的发动机,即数据可以看作是同一型号发动机群的数据。每个发动机在开始时都具有不同程度的初始磨损和制造变化,这些对用户来说是未知的。这些磨损和变化被认为是正常的,不被视为故障条件。数据中还包括三个对发动机性能有显著影响的操作设置,以及传感器噪声。数据组织:数据以压缩文本文件的形式提供,包含26列数字,每列由空格分隔。每行是单个操作周期中采集的数据快照,每列代表不同的变量。这些列分别对应于。项目5_工厂设备故障预测11任务5.1数据集简介及准备(3/10).单元编号.时间(周期).操作设置1.操作设置2.操作设置3项目5_工厂设备故障预测12任务5.1数据集简介及准备(4/10).传感器测量1.传感器测量2.....传感器测量21其中传感器1-21的具体含义如表5.1所示。项目5_工厂设备故障预测13任务5.1数据集简介及准备(5/10)||||--------|-----------------------------------||传感器|描述||s1|风扇入口温度(°R)||s2|低压压气机(LPC)出口温度(°R)|项目5_工厂设备故障预测14任务5.1数据集简介及准备(6/10)|s3|高压压气机(HPC)出口温度(°R)||s4|低压涡轮(LPT)出口温度(°R)||s5|风扇入口压力(psia)||s6|旁路管道压力(psia)||s7|HPC出口压力(psia)|项目5_工厂设备故障预测15任务5.1数据集简介及准备(7/10)|s8|物理风扇转速(rpm)||s9|物理核心转速(rpm)||s10|发动机压比(P50/P2)||s11|HPC出口静压(psia)||s12|燃油流量与Ps30的比率(pps/psia)|项目5_工厂设备故障预测16任务5.1数据集简介及准备(8/10)|s13|修正后的风扇转速(rpm)||s14|修正后的核心转速(rpm)||s15|涵道比||s16|燃烧器燃油空气比||s17|旁流焓|项目5_工厂设备故障预测17任务5.1数据集简介及准备(9/10)|s18|所需风扇转速||s19|所需风扇转换速度||s20|高压涡轮(HPT)冷却空气流量||s21|低压涡轮(LPT)冷却空气流量|数据集:提供了四个不同的数据集(FD001、FD002、FD003、FD004),每个数据集都有不同的训练和测试轨迹数量、条件和故障模式。项目5_工厂设备故障预测18任务5.1数据集简介及准备(10/10)数据集可以从kaggle官方网站下载,在kaggle观望中搜索关键词“nasa-cmaps”找到该数据集然后进入数据集页面,单击页面中的“Download”按钮即可下载,如图5.2所示。下载解压后可以得到四组训练集测试集与结果集数据即剩余使用寿命(RUL)。项目5_工厂设备故障预测19任务5.1数据集简介及准备图示补充该页用于课堂中对界面截图、流程结果或图表进行补充说明,适合教师边展示边讲解。项目5_工厂设备故障预测20任务5.2数据观察【例5.1】导入基础库;\子图项目5_工厂设备故障预测21任务5.2数据观察(1/18)【例5.1】导入基础库\子图%matplotlibinline\忽略警告np.random.seed(34)【例5.2】读取文件项目5_工厂设备故障预测22任务5.2数据观察(2/18)\定义列的名称indexnames=\['unitnumber','timecycles'\]\单元编号和时间周期settingnames=\['setting1','setting2','setting3'\]\操作设置sensornames=\['s\{}'.format(i+1)foriinrange(0,21)\]\传感器测量值colnames=indexnames+settingnames+sensornames\所有列的名称\使用pandas的readcsv函数读取训练集和验证集的数据项目5_工厂设备故障预测23任务5.2数据观察(3/18)dftrain=pd.readcsv('trainFD001.txt',sep='\s+',header=None,indexcol=False,names=colnames)\读取训练集dfvalid=pd.readcsv('testFD001.txt',sep='\s+',header=None,indexcol=False,names=colnames)\读取验证集\读取验证集的目标值(剩余使用寿命,RUL)首先定义了一些列名,包括“unitnumber”,“timecycles”,“setting1”,“setting2”,“setting3”,以及“s1”到“s21”。项目5_工厂设备故障预测24任务5.2数据观察(4/18)然后,使用pandas的readcsv函数读取了训练集和验证集的数据,这些数据都是以空格分隔的文本文件。在读取数据时,指定了列名,并且没有使用文件中的任何头信息。此外,还读取了验证集的目标值(剩余使用寿命,RUL)。数据集FD001包含21个传感器的时间序列和100个单位(涡扇发动机)的3个设置。每个引擎在每个时间序列开始时正常工作,在时间序列结束时失效。每一行是在单个操作周期中获取的数据的快照。然后,复制训练数据集(dftrain)和验证数据集(dfvalid),并分别保存到train和valid变量中。这样做的目的是防止在接下来的数据处理过程中对原始数据进行任何改动,以保持原始数据的完整性。项目5_工厂设备故障预测25任务5.2数据观察(5/18)如果在数据处理过程中出现错误,我们可以重新从副本开始,而不必重新加载原始数据。最好,代码输出训练数据集和验证数据集的形状(即它们分别有多少行和列),以及验证数据集在整个数据集(训练数据集和验证数据集的总和)中占的百分比。【例5.3】形状与占比train=dftrain.copy()\复制训练数据集valid=dfvalid.copy()\复制验证数据集训练数据集的形状:(20631,26)项目5_工厂设备故障预测26任务5.2数据观察(6/18)验证数据集的形状:(13096,26)验证数据集在总数据集中的占比:0.3882942449669404检查训练数据集中是否存在缺失值(NaN)。isna()函数会返回一个与原数据集大小相同的布尔类型数据集,如果对应位置的元素是缺失值(NaN),则返回True,否则返回False。sum()函数则会统计数据集中所有True的数量,即所有缺失值的数量。所以,train.isna().sum()会返回训练数据集中所有缺失值的数量。【例5.3】检查缺失值项目5_工厂设备故障预测27任务5.2数据观察(7/18)\检查训练数据集中是否存在缺失值【例5.4】统计性描述使用describe()方法展示unitnumber和timecycles这两列在训练数据集中的基本统计数据,统计数据包括总数、平均值、标准差、最小值、下四分位数(25%分位数)、中位数(50%分位数)、上四分位数(75%分位数)以及最大值。|||||-------|--------------|--------------|项目5_工厂设备故障预测28任务5.2数据观察(8/18)||unitnumber|timecycles||count|20631.000000|20631.000000||mean|51.506568|108.807862||std|29.227633|68.880990||min|1.000000|1.000000||25%|26.000000|52.000000|项目5_工厂设备故障预测29任务5.2数据观察(9/18)|50%|52.000000|104.000000||75%|77.000000|156.000000||max|100.000000|362.000000|统计结果显示,'unitnumber'代表的是飞机发动机的编号,它的总数是20631,范围在1到100之间。平均值约为51.51,标准差约为29.23,说明发动机编号的分布较为平均。'timecycles'代表的是飞机发动机的运行周期数,总数同样是20631。它的最小值是1,最大值是362,平均值约为108.81,标准差约为68.88。项目5_工厂设备故障预测30任务5.2数据观察(10/18)这说明飞机发动机的运行周期数存在较大的差异,有的发动机运行周期数较少,有的发动机运行周期数较多。【例5.5】其他列统计性描述对训练数据集中所有传感器('s1'到's21')数据的描述性统计信息,然后,”T”函数用于转置这个描述性统计信息的DataFrame,使每一行代表一个传感器的统计信息,方便查看和理解。train.loc\[:,'s1':\].describe().T||||||||||项目5_工厂设备故障预测31任务5.2数据观察(11/18)|----|----|----|----|----|----|----|----|----|||count|mean|std|min|25%|50%|75%|max||s1|20631.0|518.670000|6.537152e-11|518.6700|518.6700|518.6700|518.6700|518.6700||s2|20631.0|642.680934|5.000533e-01|641.2100|642.3250|642.6400|643.0000|644.5300|项目5_工厂设备故障预测32任务5.2数据观察(12/18)|s3|20631.0|1590.523119|6.131150e+00|1571.0400|1586.2600|1590.1000|1594.3800|1616.9100||s4|20631.0|1408.933782|9.000605e+00|1382.2500|1402.3600|1408.0400|1414.5550|1441.4900||s5|20631.0|14.620000|3.394700e-12|14.6200|14.6200|14.6200|14.6200|14.6200|项目5_工厂设备故障预测33任务5.2数据观察(13/18)|s6|20631.0|21.609803|1.388985e-03|21.6000|21.6100|21.6100|21.6100|21.6100||s7|20631.0|553.367711|8.850923e-01|549.8500|552.8100|553.4400|554.0100|556.0600||s8|20631.0|2388.096652|7.098548e-02|2387.9000|2388.0500|2388.0900|2388.1400|2388.5600|项目5_工厂设备故障预测34任务5.2数据观察(14/18)|s9|20631.0|9065.242941|2.208288e+01|9021.7300|9053.1000|9060.6600|9069.4200|9244.5900||s10|20631.0|1.300000|4.660829e-13|1.3000|1.3000|1.3000|1.3000|1.3000||s11|20631.0|47.541168|2.670874e-01|46.8500|47.3500|47.5100|47.7000|48.5300|项目5_工厂设备故障预测35任务5.2数据观察(15/18)|s12|20631.0|521.413470|7.375534e-01|518.6900|520.9600|521.4800|521.9500|523.3800||s13|20631.0|2388.096152|7.191892e-02|2387.8800|2388.0400|2388.0900|2388.1400|2388.5600||s14|20631.0|8143.752722|1.907618e+01|8099.9400|8133.2450|8140.5400|8148.3100|8293.7200|项目5_工厂设备故障预测36任务5.2数据观察(16/18)|s15|20631.0|8.442146|3.750504e-02|8.3249|8.4149|8.4389|8.4656|8.5848||s16|20631.0|0.030000|1.556432e-14|0.0300|0.0300|0.0300|0.0300|0.0300||s17|20631.0|393.210654|1.548763e+00|388.0000|392.0000|393.0000|394.0000|400.0000|项目5_工厂设备故障预测37任务5.2数据观察(17/18)|s18|20631.0|2388.000000|0.000000e+00|2388.0000|2388.0000|2388.0000|2388.0000|2388.0000||s19|20631.0|100.000000|0.000000e+00|100.0000|100.0000|100.0000|100.0000|100.0000||s20|20631.0|38.816271|1.807464e-01|38.1400|38.7000|38.8300|38.9500|39.4300|项目5_工厂设备故障预测38任务5.2数据观察(18/18)|s21|20631.0|23.289705|1.082509e-01|22.8942|23.2218|23.2979|23.3668|23.6184|项目5_工厂设备故障预测39任务5.3可视化观察【例5.6】最大运行周期数条形图;\使用train数据集中的'unitnumber'分组,并获取每组中'timecycles'的项目5_工厂设备故障预测40任务5.3可视化观察(1/4)【例5.6】最大运行周期数条形图\使用train数据集中的'unitnumber'分组,并获取每组中'timecycles'的最大值,这个最大值代表了每个发动机的寿命\绘制一个水平条形图,显示每个发动机的寿命\自动调整子图参数,使之填充整个图像区域maxtimecycles=train\[indexnames\].groupby('unitnumber').max():这行代码首先从数据集trai项目5_工厂设备故障预测41任务5.3可视化观察(2/4)n中选择了指定的索引列indexnames,然后按照每个引擎的单位编号('unitnumber')进行分组,对于每个分组,计算出'timecycles'列的最大值,这个值代表了每个引擎的最大运行时间周期。通过观察,发动机的寿命大约在150-280之间。【例5.7】最大运行周期数分布\分布的最大时间周期项目5_工厂设备故障预测42任务5.3可视化观察(3/4)代码绘制了最大时间周期的分布图。maxtimecycles\['timecycles'\]是获取最大时间周期的数据,sns.displot()是seaborn库中的函数,用于绘制分布图。在这个函数中,参数kde=True表示绘制核密度估计(KDE),bins=20表示将数据分为20个区间,height=6,aspect=2设置图形的大小。图中蓝色柱状条表示最大时间循环的频数,中间曲线则表示最大时间循环的密度分布。图表解读:项目5_工厂设备故障预测43任务5.3可视化观察(4/4)最大时间循环的分布呈右偏态,这意味着大多数引擎的失效时间在150到250个时间周期之间。右偏态(positiveskewness),也称为正偏态,是指概率分布或频数分布中,其右侧尾部比左侧尾部更长,分布的主体集中在左侧的情况。在图像上表现为分布图的峰值偏向左侧,右侧拖着一条长长的尾巴。项目5_工厂设备故障预测44任务5.4使用寿命RUL分析步骤1:添加剩余使用寿命RUL;添加每个飞机发动机的剩余使用寿命。项目5_工厂设备故障预测45任务5.4使用寿命RUL分析(1/7)步骤1:添加剩余使用寿命RUL添加每个飞机发动机的剩余使用寿命。【例5.8】添加剩余使用寿命RUL\定义添加RUL列的函数\按"unitnumber"对数据集进行分组项目5_工厂设备故障预测46任务5.4使用寿命RUL分析(2/7)traingroupedbyunit=df.groupby(by='unitnumber')\获取每组中"timecycles"的最大值maxtimecycles=traingroupedbyunit\['timecycles'\].max()\将最大值添加为新列"maxtimecycle"\计算并添加新列"RUL",其值为"maxtimecycle"减去"timecycles"项目5_工厂设备故障预测47任务5.4使用寿命RUL分析(3/7)\删除"maxtimecycle"列merged=merged.drop("maxtimecycle",axis=1)\返回添加了"RUL"列的数据集\调用函数,对训练数据集添加"RUL"列train=addRULcolumn(train)项目5_工厂设备故障预测48任务5.4使用寿命RUL分析(4/7)\输出添加了"RUL"列的训练数据集train代码首先定义一个名为addRULcolumn的函数,用于向数据框(DataFrame)中添加一个新的列'RemainingUsefulLife'(剩余使用寿命,简称'RUL')。函数的输入是一个数据框df,首先根据“unitnumber”(单位编号)将数据框进行分组,得到traingroupedbyunit。项目5_工厂设备故障预测49任务5.4使用寿命RUL分析(5/7)然后计算每个组内“timecycles”(时间周期)的最大值,获得maxtimecycles。接着将这个最大时间周期的数据框与原始数据框df合并,合并的依据是“unitnumber”。在合并后的数据框中,新添加了一个名为“maxtimecycle”的列,它表示每个单位的最大时间周期。然后使用这个最大时间周期减去每一行的“timecycles”,计算出剩余使用寿命,并将结果添加为新的“RUL”列。步骤2:每个飞机发动机的最大运行周期数项目5_工厂设备故障预测50任务5.4使用寿命RUL分析(6/7)【例5.9】添加剩余使用寿命RUL\RUL(剩余使用寿命)分析\使用groupby方法按unitnumber(单位编号)对训练集进行分组,并找出每组的最大值,然后重设索引\显示前五行数据maxrulu.head()项目5_工厂设备故障预测51任务5.4使用寿命RUL分析(7/7)首先使用groupby(‘unitnumber')函数将数据集按照‘unitnumber'列即飞机发动机编号进行分组,然后使用max()函数求出每组的最大值,这个最大值就是每个飞机发动机的最大运行周期数。最后,使用resetindex()函数重置索引。这样,得出的数据表maxrulu中存储了每个飞机发动机的最大运行周期数,结果如图5.6所示。项目5_工厂设备故障预测52任务5.5特征关联性分析创建一个热力图,用于显示训练数据集中所有变量之间的相关性。;【例5.10】相关性热力图项目5_工厂设备故障预测53任务5.5特征关联性分析(1/6)创建一个热力图,用于显示训练数据集中所有变量之间的相关性。【例5.10】相关性热力图\计算相关矩阵corr=train.corr()\创建掩码,排除自相关项项目5_工厂设备故障预测54任务5.5特征关联性分析(2/6)\设置绘图参数cmap=sns.divergingpalette(230,10,ascmap=True)\绘制热力图该段Python代码主要用于绘制训练数据集的相关性矩阵热图。corr=train.corr():这行代码计算训练数据集中所有列的成对关联性。这是一个相对于列索引和列标签的DataFrame。项目5_工厂设备故障预测55任务5.5特征关联性分析(3/6)mask=np.triu(np.oneslike(corr,dtype=bool)):此代码创建一个布尔型的掩码,用于隐藏热图的上三角部分。np.triu表示上三角矩阵,np.oneslike创建一个与给定数组形状和类型相同的,元素全为1的数组。f,ax=plt.subplots(figsize=(10,10)):这行代码创建一个10x10大小的新的matplotlib图形窗口。cmap=sns.divergingpalette(230,10,ascmap=True):这行代码创建一个分散的颜色映射。分散的颜色映射中心通常是白色或浅色,两端颜色深浅对比强烈。项目5_工厂设备故障预测56任务5.5特征关联性分析(4/6)sns.heatmap(corr,mask=mask,cmap=cmap,vmax=.3,center=0,square=True,linewidths=.5,cbarkws={"shrink":.5}):这行代码使用Seaborn的heatmap函数绘制相关性矩阵的热图。指定了掩码(mask参数)、颜色映射(cmap参数)、颜色映射的最大值(vmax参数)、热图的中心值(center参数)、方形热图(square参数)、热图的线宽(linewidths参数)以及颜色条的大小(cbarkws参数)。热力图解读如下。蓝色:表示负相关白色:表示无相关项目5_工厂设备故障预测57任务5.5特征关联性分析(5/6)红色:表示正相关从图中发现的强相关。压力比(pressureratio)与排气温度(exhausttemperature)呈强正相关:压力比越高,排气温度越高,表明燃烧效率更高,排气温度也越高。排气温度(exhausttemperature)与燃料流量(fuelflow)呈强正相关:排气温度越高,燃料流量越高,表明发动机工作负荷越大,燃料消耗也越多。效率(efficiency)与失效时间(timetofailure)呈强负相关:效率越高,失效时间越长,表明发动机运行更可靠,磨损更少,寿命更长。项目5_工厂设备故障预测58任务5.5特征关联性分析(6/6)图中发现的其他相关:压力比(pressureratio)与失效时间(timetofailure)呈弱正相关:这表明发动机设计存在效率与可靠性之间的权衡,即为追求更高效率而设计的发动机可能寿命较短。燃料流量(fuelflow)与失效时间(timetofailure)呈弱负相关:这表明燃油消耗越低的发动机可能寿命更长,因为燃油消耗越低,发动机产生的热量和应力越小,部件磨损也就越少。项目5_工厂设备故障预测59任务5.6绘制RUL剩余使用寿命的演变图创建一个名为Sensordictionary的空字典,并将dictlist中的每个元素作为值,以s\加上相应的索引作为键存储在字典中。;这样做的目的是为了建立一种映射关系,方便根据索引访问对应的传感器数据。项目5_工厂设备故障预测60任务5.6绘制RUL剩余使用寿命的演变图(1/8)创建一个名为Sensordictionary的空字典,并将dictlist中的每个元素作为值,以s\加上相应的索引作为键存储在字典中。这样做的目的是为了建立一种映射关系,方便根据索引访问对应的传感器数据。【例5.11】定义列名含义Sensordictionary={}"(LPCoutlettemperature)(◦R)",项目5_工厂设备故障预测61任务5.6绘制RUL剩余使用寿命的演变图(2/8)"(HPCoutlettemperature)(◦R)","(LPToutlettemperature)(◦R)","(FaninletPressure)(psia)","(bypass-ductpressure)(psia)","(HPCoutletpressure)(psia)",项目5_工厂设备故障预测62任务5.6绘制RUL剩余使用寿命的演变图(3/8)"(Physicalfanspeed)(rpm)","(Physicalcorespeed)(rpm)","(Enginepressureratio(P50/P2)","(HPCoutletStaticpressure)(psia)","(RatiooffuelflowtoPs30)(pps/psia)",项目5_工厂设备故障预测63任务5.6绘制RUL剩余使用寿命的演变图(4/8)"(Correctedfanspeed)(rpm)","(Correctedcorespeed)(rpm)","(BypassRatio)","(Burnerfuel-airratio)","(BleedEnthalpy)",项目5_工厂设备故障预测64任务5.6绘制RUL剩余使用寿命的演变图(5/8)"(Requiredfanspeed)","(Requiredfanconversionspeed)","(High-pressureturbinesCoolairflow)","(Low-pressureturbinesCoolairflow)"\]i=1项目5_工厂设备故障预测65任务5.6绘制RUL剩余使用寿命的演变图(6/8)Sensordictionary\['s\'+str(i)\]=xi+=1Sensordictionary低压压缩机(LPC)和高压压缩机(HPC)向燃烧器提供压缩的高温高压气体。低压涡轮(LPT)可以减速并增压空气,以提高航空煤油的化学能转化效率。高压涡轮(HPT)通过利用高温高压气体冲击涡轮叶片来产生机械能。低压转子(N1)、高压转子(N2)和喷嘴确保了发动机的燃烧效率。项目5_工厂设备故障预测66任务5.6绘制RUL剩余使用寿命的演变图(7/8)绘制特征(传感器)随剩余使用寿命的演变图。【例5.12】剩余使用寿命的演变图try:plotsignal(train,Sensordictionary,'s\'+str(i))except:项目5_工厂设备故障预测67任务5.6绘制RUL剩余使用寿命的演变图(8/8)pass某些图表显示一些传感器是恒定的。因此它们不会影响RUL稍后我们可以去掉这些恒定因素。项目5_工厂设备故障预测68任务5.7异常值检测【例5.13】箱体图;代码为sensornames列表中的每个传感器生成箱线图。项目5_工厂设备故障预测69任务5.7异常值检测【例5.13】箱体图代码为sensornames列表中的每个传感器生成箱线图。箱线图是基于五数概括(最小值,第一四分位数(Q1),中位数,第三四分位数(Q3)和最大值)显示数据分布的标准化方式。绘制箱型图目的是可视化'train'数据集中每个传感器的传感器读数分布,这有助于了解数据的特性并识别任何可能的异常值或异常。通过对信号图和箱图的观察,发现1、5、6、10、16、18、19个传感器是常数,而且其他传感器分布不均匀,存在一些异常值。项目5_工厂设备故障预测70任务5.8模型构建步骤1:数据准备;后继的工作通过Orange3来处理,所以导出训练集和验证集数据到Excel文件。项目5_工厂设备故障预测71任务5.8模型构建(1/9)步骤1:数据准备后继的工作通过Orange3来处理,所以导出训练集和验证集数据到Excel文件。【例5.14】数据导出train.toexcel('train.xlsx',index=False)Xvalid\['RUL'\]=yvalid\['RUL'\]项目5_工厂设备故障预测72任务5.8模型构建(2/9)Xvalid.toexcel('valid.xlsx',index=False)步骤2:数据导入打开Orange3软件,新建一个空白文件。在左侧的组件列表中的“Data”类别下,拖曳一个“文件”组件到工作流中,双击打开后,在弹出的“文件”对话框中上传“train.xlsx”文件。加载完成后,Orange3自动推断了字段的类型,将在数据观察阶段发现的无关列和常数列排除,并设置“RUL”为结果列,如图5.10所示。项目5_工厂设备故障预测73任务5.8模型构建(3/9)将无
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 发电部值长安全职责培训
- 变电站设备交接验收制度培训
- 2026爱面试题库及答案
- 井下中央变电所消防管理制度培训
- 卓越班组建设与班组长综合胜任能力提升
- 矿用防爆锂离子蓄电池电源安全技术要求培训
- 工程施工临边防护的规定
- 高端医疗理赔外包合同
- T∕XYZJY 009-2026郴心服务涉旅企业旅游服务规范 第9部分:休闲农业庄园
- 品牌全网推广外包合同
- 2026年上海市虹口区中考历史二模试卷(含答案)
- 国资委安全生产十条硬措施
- 景德镇辅警考试2026真题
- 2026中国氢能源基础设施建设与政策支持分析报告
- 2025年河北省石家庄市八年级地生会考考试试题及答案
- 交叉作业审批制度
- 初中八年级英语下册 Unit 7 Natural Disasters 写作提升课:灾害事件报道与个人经历叙述教案
- 七年级苏教版数学重难点讲解
- TSG 31-2025工业管道安全技术规程
- 物业采购报销制度及流程
- 2026年离婚登记申请书
评论
0/150
提交评论