




已阅读5页,还剩100页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,I,工业大数据创新竞赛白皮书( 2017 )风机结冰故障分析指南,指导单位:工信部信息化和软件服务业司工业互联网产业联盟编写单位:工业大数据创新竞赛组委会2018 年 1 月,编写说明,2017 年的工业大数据竞赛作为我国首次工业大数据竞赛,在 吸引 人才关 注、 促进 工业智 能化 、建 立工业 大数 据生 态等方面起到重要作用。习近平总书记在党的十九大报告中强调:“建设 现代 化经济 体系 ,深 化供给 侧结 构性 改革, 加快 发展 先进制造业,推动互联网、大数据、人工智能和实体经济深度融合。”这 些都 为制造 业转 型升 级指明 了新 方向 ,数据 成为 制造 业与新一 代信 息技术 融合 的重 要基础 资源 和创 新引擎 。在 工信 部信息化 和软 件服务 业司 、工 业互联 网产 业联 盟指导 下, 本次 竞赛组委 会在 北京天 泽智 云科 技有限 公司 的倾 力支持 下, 组织 参赛者编 写了工 业大数 据竞赛白 皮书 ( 风机结冰 故障分 析指南 ),希 望将本次 竞赛的 经验与技 术成果 固化并加 以推广 ,促进交 流,与业界共同推动工业大数据发展。,白皮书收录了 2017 年工业大数据竞赛 - 风机叶片结冰故障预 测的 获奖算 法, 组成 解法集 ,在 工业 大数据 分析 的方 法论上具 有重 要的指 导意 义, 在风力 发电 机行 业尤其 具有 示范 作用。白 皮书 主要分 为四 个部 分,第 一部 分是 工业大 数据 创新 竞赛概况 ,主 要介绍 此次 竞赛 背景和 开展 情况 。第二 部分 提出 了工业大 数据 分析方 法论 ,并 以本次 数据 竞赛 的题目 作为 案例 ,解释预 测性建模 的各个 分析流程 。第三 部分主要 收录竞 赛优秀算 法,包 括文 献调研 、方 法介 绍、方 法应 用与 验证、 与结 果讨 论。 第,四部分进行方法论总结。,白 皮 书 的编 写 过程 中 得 到竞 赛 组委 会 和 参赛 选 手 的 大 力 支持 。相 关参赛 人员 根据 自己对 竞赛 题目 的解法 ,给 出了 详细、清 晰的 方法流 程与 结果 讨论, 为白 皮书 的提供 了丰 富 的 素材与扎 实的 内容。 同时 ,不 同解法 也为 工业 大数据 分析 从业 人员打开思路、拓宽视野提供了极具价值的参考。,工 业 大 数据 的 发展 还 在 初级 阶 段, 随 着 工业 大 数据 竞 赛 日后 的逐 年举办 与工 业智 能的逐 步发 展, 我们将 根据 各界 的反馈意 见,在持 续调研 与总结的 基础上 ,定期进 行修订 与新版发布。,指导单位: 工业和信息化部信息化和软件服务业司工业互联网产业联盟编写单位: 工业大数据创新竞赛组委会指导专家:孙家广 中国工程院院士谢少锋 工业和信息化部信息化和软件服务业司司长安筱鹏 工业和信息化部信息化和软件服务业司副司长,李 杰,美国辛辛那提大学智能维护系统( IMS )中心主任,王建民 清华大学软件学院院长林诗万 IIC 技术工作组与架构任务组联执主席余晓晖 中国信息通信研究院总工编写组成员(排名不分先后):工业和信息化部信息化和软件服务业司:王建伟、冯伟中 国信 息通 信研 究院 :冯 旭、 朱敏 、刘 默、 李铮 、宋辰超、李南、魏凯北京天泽智云科技有限公司:金超、晋文静、刘宗长、李飞北京工业大数据创新中心:王晨、田春华、崔鹏飞金风科技:张光磊、周杰、李富荣万腾科技:张嗣昌、侯振寰、侯宗波济中节能:纪浩然、张薇、王成金浙江运达风电股份有限公司:周书锋、朱博文、冯文婷北京邮电大学:林文芳西安交通大学:李宁波、闫涛、郭亮,I,序言,随着新工业革命时代的序幕徐徐拉开,物联网、工业互联网、智能 ICT 技术、人工智能等技术成为舞台上最受瞩目的新星 。在 这些新 兴技 术的 推动下 ,工 业领 域中的 大数 据环 境正在逐 渐形 成,数 据从 制造 过程中 的副 产品 转变成 为备 受企 业关注的 战略 资源, 成为 工业 企业传 承制 造知 识和提 供增 值服 务的依托 。然 而,工 业大 数据 在其可 获取 性和 可分析 性方 面仍 然存在许 多的 挑战, 一方 面企 业拥有 大量 数据 但缺乏 专业 的数 据分析人 才, 而另一 方面 拥有 分析能 力的 人才 缺少数 据和 应用 场景 。工 业大 数据由 于其 应用 场景的 专业 性与 多样性 ,使 之兼 具工业体 系的 系统性 与互 联网 的开放 性, 也使 企业很 难独 立建 立完整的 工业 大数据 应用 能力 。在这 样的 挑战 下,需 要建 立一 个开放的 生态 ,将数 据和 场景 的提供 者、 知识 和能力 的提 供者 、产业链 相关 上下游 聚合 在一 起,让 数据 的生 态、知 识的 生态 和服务的生态得以相互促进。,建 立 可 持续 的 大数 据 人 才培 养 模式 和 人 才培 养 体系 是 产 、学 界面 临的共 同挑 战。 可持续 的人 才培 养模式 不仅 局限 于大学中 ,还 包括企 业内 的人 才培养 。大 学的 人才的 培养 需要 鼓励创新 性和 独特性 ,而 企业 则应该 注重 员工 专业技 能和 应用 研发能力 的培 养。工 业大 数据 竞赛是 非常 好的 产、学 界共 同携 手培养人 才的 方式。 产 业 界贡 献场景 和数 据, 可以帮 助学 术界 的研究,更 贴近 真实需 求。 而学 术界也 为企 业提 供最新 的理 论和 最前沿的 技术 成果, 拓宽 了企 业解决 问题 的视 野。 美 国在 这方 面的投入 已 经 持 续 了 多 年 , 从 2008 年 开 始 美 国 的 PHM 学 会 ( PHMSociety )就开始举办工业数据分析竞赛。数据的贡献者主要来自 于企 业或产 业研 究机 构,涉 及的 行业 非常广 泛, 但都 遵循着同 一个 原则, 就是 场景 都来自 于企 业的 真实问 题, 数据 都来自于 真实 的工业 现场 。这 个竞赛 中所 使用 的数据 可供 全世 界的研究 者下 载,比 赛的 胜出 者也会 受邀 在其 期刊中 发表 论文 共享好的分析方法。 IMS 中心参加了从 2008 年至今的 10 次数据竞赛,获得了其中 的 5 次冠军,所贡献的方法在工业界中得到广泛应用。,在 本 届 工业 大 数据 竞 赛 中, 我 们欣 喜 地 看到 参 赛队 伍 包 括了 产业 界和学 术界 ,参 赛的企 业包 括风 电装备 制造 、风 场运营商、服务提供商、以及其他工业领域的企业,总数超过了 1000多 只参 赛队伍 。本 次数 据竞赛 在引 领和 催化工 业大 数据 应用生态形成方面的作用是有目共睹的。,今年 IMS 中心有幸作为顾问单位参与中国第一届工业大数据 竞赛 的组织 工作 ,竞 赛获得 的关 注程 度以及 选手 们在 竞赛中的表现都令人感到惊喜。工业大数据创新竞赛( 2017 )白皮书作 为本 次竞赛 的重 要成 果之一 ,对 工业 大数据 分析 方法 论进行了 系统 性地介 绍, 并对 竞赛优 胜团 队的 解题方 法进 行了 详细地整 理和 解读, 相信 能够 为从事 工业 大数 据应用 研究 的企 业和学者 们提 供有价 值的 参考 。衷心 祝愿 工业 大数据 创新 竞赛 越办越,好 ,成 为产学 界共 同推 崇的传 统和 品牌 ,为中 国工 业大 数据产业生态源源不断地输送优秀人才。,李杰, 2018 年 1 月,目 录,一、工业大数据创新竞赛概况 . 1(一)数据经济的崛起与工业的变革 . 1(二)工业大数据驱动制造业转型升级 . 2(三)工业大数据创新竞赛开展情况 . 4二、工业智能分析方法论 . 6(一)工业智能分析方法流程 . 6(二)案例 - 风机结冰故障 . 12三、首届工业大数据创新竞赛解法集 . 27(一)基于 CNN-LSTM 深度学习网络的风机叶片结冰预测 . 27(二)基于物理原理 +KNN 分类的混合预测模型 . 41( 三) 基于领 域知 识特 征构建 和未 来结 冰概率 估计 的风 机叶片结冰预测 . 48(四)基于数据驱动和非均衡数据学习的故障预测研究 . 62(五)基于敏感特征的风机叶片结冰预测算法 . 75四、方法论总结 . 94,1,一、工业大数据创新竞赛概况,( 一 ) 数 据 经 济 的 崛 起 与 工 业 的变 革,当 前 , 世界 经 济加 速 向 以网 络 信息 技 术 产业 为 重要 内 容 的经 济活 动转变 ,数 字经 济正深 刻地 改变 着人类 的生 产和 生活方式 ,成 为经济 增长 新动 能。 人 类社 会正 在被网 络化 连接 、数据化 描绘 、融合 化发 展, 在这一 进程 中, 数据成 为重 要的 基础性战 略资 源。大 数据 的充 分挖掘 和利 用, 极大促 进了 全社 会要素资 源的 网络化 共享 、集 约化整 合、 协作 化开发 、高 效化 利用,对 经济 发展、 社会 生活 和国家 治理 产生 着越来 越重 要的 作用,推 动了 诸多领 域发 生重 大而深 刻的 变革 ,一个 全新 的大 数据时代正在向我们大踏步地走来。,大 数 据是 一种 资源 , 一种 技术 ,一 种 产业 ,更 是一 个 时代 ,它 通过 构筑信 息互 通、 资源共 享、 能力 协同、 开放 合作 的发展新 体系 ,为提 升政 府治 理能力 、优 化民 生公共 服务 、促 进经济转 型和 创新发 展做 出了 积极 贡 献。 尤其 是随着 近年 来, 互联网产 业对 数据价 值挖 掘的 成功, 使得 传统 行业开 始思 考如 何推动价 值转 型,驱 动工 业变 革 ,这 是新 的技 术条件 下制 造业 生产全流 程、 全产业 链、 产品 全生命 周期 的数 据可获 取、 可分 析、可执 行的 必然结 果, 也是 制造业 隐性 知识 显性化 不断 取得 突破的内在要求。,在 数 据 经济 浪 潮的 推 动 下 , 是 否能 对 数 据进 行 深度 的 价 值挖 掘, 将是各 个行 业竞 争的新 重点 。值 得 明确 提出 的是 ,数据,本 身并 不能创 造价 值。 如果只 是对 数据 进行收 集、 存储 、与管理,是无法为工业飞跃式地创造价值的 。为了实现工业大数据驱 动的 价值转 型, 需要 从工业 中的 问题 出发, 将业 务问 题转化为 数据 预测性 建模 问题 ,从而 达到 解决 用户痛 点、 实现 用户价值转型的目的。,(二)工业大数据驱动制造业转型升级,大 数 据 作为 一种新 的 资 产、 资源和 生 产 要素 ,正驱 动 着制造 业 的 智 能 化 变 革 , 可 以 从 三 方 面 来 理 解 。 首 先, 资 源 优 化 是目 标, 工业大 数据 的创 新价值 集中 体现 在制造 资源 配置 效率的优 化, 以及制 造业 全要 素生产 率的 提高 。 其次 ,信 息流 动是关键 , 工 业大数 据如 何优 化制造 资源 配置 效率, 关键 是要 把正确的 信息 在正确 的时 间传 递给正 确的 人和 机器, 解决 制造 过程的复 杂性 和不确 定性 等问 题。 第 三, 大数 据、人 工智 能、 互联网等 新一 代信息 技术 是基 础, 为 数据 的全 面感知 、在 线汇 聚和智能分析构筑赋能工具和载体,这正是工业大数据的核心功能。关于大数据的分析方法,人们首先想到的可能是 Hadoop ,Spark 等 IT 技术。然而,对于工业中的大数据问题,其重要价值 在于 形成并 不断 优化 认识和 改造 世界 的方法 论 , 除了 分析平台 与数 据处理 基础 设施 ,用户 应该 更加 关心大 数据 分析 所能带来的价值,再选择与分析目标相适应的技术。,通 过 工 业大 数 据创 造 价 值, 需 要围 绕 业 务目 标 ,将 基 于 机,理 模型的模 拟择优 法和数据 模型驱 动的大数 据分析 法进行融 合。正 如 在首 届( 2017 ) 工 业大 数据 创新 竞 赛决 赛答 辩和 颁 奖仪 式,上 ,工 业和信 息化 部 信 息化和 软件 服务 业 副司 长安 筱鹏 所指出的 :机 理模型 与数 据模 型的融 合, 能够 突破隐 性数 据显 性化和隐 性知 识显性 化两 大关 键, 通 过构 建制 造业快 速迭 代、 持续优化 、数 据驱动 的新 方式 , 解决 发生 了什 么、为 什么 发生 、下一步 发生 什么、 如何 改进 优化四 个问 题, 优化制 造资 源的 配置效率。,通 过 工 业大 数 据创 造 价 值, 需 要整 合 不 同学 科 、不 同 领 域的 经验 、知识 和技 术。 美国国 家自 然基 金会产 学合 作智 能维护系 统中 心主任 李杰 教授 提到, 工业 大数 据遇到 的挑 战主 要可以分 为工 业场景 的复 杂性 与不确 定性 两个 方面。 在复 杂性 方面,从 数据 接入、 数据 治理 、模型 建立 、优 化分析 、到 最后 的决策支 持与 行动, 价值 转型 的过程 就是 打通 工业大 数据 信息 与知识链 路的 过程, 关键 在于 如何融 合数 据技 术、分 析技 术、 与运营管 理技 术。在 不确 定性 方面, 工业 大数 据分析 的不 确定 性体现在应用对象、工况、数据、模型等等诸多因素上。,通 过 工 业大 数 据创 造 价 值, 也 需要 面 对 工业 应 用对 象 差 异所 带来 的挑战 。 清 华大 学软件 学院 院长 王建民 强调 了数 据模型泛 化的 能力, 在物 联网 数据采 集规 模化 的今天 ,如 何能 够把训练 好的 模型快 速准 确的 应用到 另一 个同 类对象 上, 是工 业大数据 实施 过程中 的重 点。 同时, 中国 工程 院院士 孙家 广也 阐述了工 业大 数据价 值创 造处 在起步 的初 级阶 段,而 本次 创新 竞赛是推 进工业大 数据普 世化、规 范化、 国际化、 市场化 的绝佳机 会,要 坚持 走出有 中国 特色 的工业 大数 据技 术与产 业创 新道 路,助,理中国工业由大变强、弯道超车。,工 业 大 数据 并 不 单 单 是 某一 种 技术 , 而 是一 种 理念 。 企 业若 想要 通过工 业大 数据 实现价 值转 型, 需要打 破原 有的 技术采购 思路 ,不断 提升 技术 和组织 能力 , 从 自身问 题和 需求 出发,用 工业 大数据 的方 法论 切实解 决问 题 和 创造价 值。 而一 个行业要 想通 过工业 大数 据实 现产业 升级 ,则 需要更 加开 放的 生态、与 共赢 的思维 ,对 行业 通用的 痛点 进行 充分地 讨论 与系 统性的梳 理, 为实现 行业 的平 台化、 标准 化、 规模化 工业 大数 据环境奠定基础。,(三)工业大数据创新竞赛开展情况,为 进 一 步探 索 工业 大 数 据对 工 业改 革 的 深远 影 响, 由 工 业,和 信息化部 指导, 在工业和 信息化 部指导下 ,以“ 赋能与赋 智,构 建工业大 数据应 用生态” 为主题 , 以“开 放共享 、协作共 赢”为 原则 ,中国 信息 通信 研究院 联合 业界 同仁举 办 首 届工 业大数据 创新 竞赛, 这 也 是首 次由政 府主 管部 门组织 的工 业大 数据领域 权威 的全国 性创 新竞 赛。大 赛在 发掘 专业技 术人 才的 同时,助 力于 解决工 业企 业实 际问题 ,以 提升 制造智 能水 平, 推动中国 工业 转型升 级, 推进 工业大 数据 的加 速发展 ,积 极促 进赛事成 果转 化和产 学研 用紧 密结合 ,服 务工 业经济 提质 增效 升级,推荐优秀专业技术人才找到适合发展的平台。,本 次 比 赛围 绕 风电 装 备 预测 性 维护 这 一 应用 场 景, 针 对 风机 叶片 结冰故 障预 测和 风机齿 形带 故障 两个真 实工 业大 数据应用需求,由金风科技分别提供来自于某风场的 13 台风机半年运,行数据,每台风机包括工况、环境等 28 个变量,设置两道赛题面 向全 社会征 集解 决方 案,旨 在通 过竞 赛方式 解决 大数 据技术在 工业 应用落 地过 程中 面临的 “有 数据 没技术 、有 技术 没应用场 景”等问 题。竞 赛过程中 ,得到 了北京工 业大数 据创新中 心、树 根互 联技术 有限 公司 、星河 互联 、美 国国家 仪器 、美 国国家科学基金会智能维护系统中心等企业和研究机构的大力支持。活动自 2017 年 7 月启动,至 2017 年 12 月正式结束。 竞赛注册用户数 1535 人,分别有 830 支和 630 支队伍参加两个竞赛题 目 ,其 中 60% 以 上 来自 于高 校学 生 ,涉 及数 据挖 掘 、控 制 工程 、工业机 器人、 测控技术 、计算 机等多个 领域。 竞赛分初 赛、复赛和决赛三个阶段进行,经过 3 个月的角逐和复赛专家评审,最终 12 支队伍获奖,其中 3 支队伍是北邮、西安交大和浙大的学生团队,其 余 9 支是企业团队,包括富士康等制造企业,以及信息通信、能源等领域的初创企业。,附:获奖队伍,二、工业智能分析方法论,(一)工业智能分析方法流程,简 单 来说 ,工 业智 能 指的 是人 工智 能 技术 在工 业中 的 应用 。工 业智 能的萌 芽得 益于 人工智 能技 术的 进步 , 其技 术驱 动因素包 括传 感器成 本的 降低 、计算 能力 的飞 跃 和机 器学 习算 法准确度 质的 提升。 在多 个通 用人工 智能 领域 ,人工 智能 算法 的准确性 都取 得了巨 大突 破。 而传统 的工 业生 产活动 中, 直至 今天依然 非常 依赖人 力、 经验 、与设 备本 身, 用户往 往重 视管 控“可见 问题”,而忽 略了 挖掘“不 可见问 题”。在工业 对象 数据的自动 化获 取与存 储越 来越 容易越 来越 廉价 的今天 ,工 业作 为智能化 程度 的“洼 地” 及其 潜在的 巨大 商业 价值, 受到 的关 注与日俱增。,工 业 智 能并 不 是通 用 人 工智 能 技术 在 工 业场 景 中的 简 单 复用 。工 业场景 中问 题的 碎片化 、个 性化 、与专 业化 的特 点,决定 了工 业智能 落地 需要 依靠计 算机 科学 、人工 智能 、与 领域知识 的深 度融合 。 与 传统 基于规 则或 单纯 依赖机 理建 模的 方式不同 ,数 据驱动 的工 业智 能技术 的一 大优 势是通 过基 于统 计意义上 的预 测性分 析, 对不 确定性 更加 有效 地管理 ,同 时更 好地结合 专家知识 并将其 固化到软 件中, 形成可持 续迭代 的智能系统。,1,工业系统的智能化转型主要主要体现在以下三方面 :,一 是 从 基于 经 验的 决 策 转变 为 基于 实 证 的决 策 : 传 统 的 工,1,Lee, J., Bagheri, B., & Jin, C. (2016). Introduction to cyber manufacturing. Manufacturing Letters , 8 , 11-15.,业 系统 高度依 赖专 家的 经验。 随着 专家 年龄的 增大 、员 工离职率 的逐 渐攀升 ,这 种经 验越来 越难 以传 承。企 业为 了可 持续发展 ,专家的 经验需 要以某种 方式固 化下来成 为模型 、判断标 准、流 程等,支 持企业 中的各个 方面在 正 确的时 间做出 正确的决策。,二 是 从 解决 可 见问 题 转 变为 避 免不 可 见 问题 : 工业 中 的 问题 可以 被分为 可见 与不 可见两 类。 工业 活动中 的经 典管 理与分析 策略 ,绝大 多数 都聚 焦在解 决可 见问 题,如 设备 定期 维护保养 ,产 品质量 抽检 ,机 器换人 等。 这些 方法的 应用 并不 能阻止出 现设 备的非 预期 停机 、不良 品的 出现 与根因 分析 的困 难、以及 自动 化机器 误操 作等 问题。 这是 由于 生产中 如设 备关 键组件衰 退、 工艺过 程与 质量 关系等 不可 见的 问题没 有被 量化 。将隐性 问题与隐 性关系 显性化, 才能够 从根本上 帮助用 户降低成 本、提升效率。,三 是 从 基于 控 制的 自 动 化转 变 为基 于 机 器学 习 的智 能 化 :自 动化 系统曾 被认 为是 工业智 能的 核心 。然而 ,单 纯的 自动化仍 无法 完全满 足工 业智 能化的 需求 。自 动化系 统能 够解 决的是能 够被 相对清 晰、 明确 定义的 问题 ,即 可见问 题; 而智 能化系统 要暴 露的往 往是 可见 问题暴 露之 前的 隐性问 题。 同时 ,在现代 工业 系统变 得越 来越 复杂的 情况 下, 人工智 能算 法能 够与自动 化模 型相结 合, 超越 传统控 制的 局限 性,实 现全 局优 化,达到增强系统强健性的目的。,在 工 业 系统 中 ,设 备 的 预测 性 智能 维 护 和效 能 动态 优 化 是工 业大 数据的 核心 应用 场景之 一, 也是 实现 智 能化 工业 系统 最,为 关键 的核心 技术 之一 。对设 备性 能的 预测分 析和 对故 障时间的 精准 估计, 将量 化管 理设备 运行 中的 不确定 性, 并 减 少这些不 确定 性的影 响, 来为 用户提 供预 先缓 和措施 和解 决对 策,以防 止设 备运行 中的 非预 期停机 损失 和事 故风险 。 同 时, 根据设备 的健 康状态 、外 部环 境、产 线组 织形 式和生 产目 标等 多维信息 ,基 于工业 大数 据的 预测性 模型 可以 对产线 整体 的效 能进行优 化决 策支持 ,从 而实 现对生 产系 统成 本和效 益的 深度 管理和效益提升。,数据驱动( Data-driven )的分析手段并非是对设备的状态和 效能 进行建 模和 预测 的唯一 途径 ,其 他的方 式还 包括 物理建模 、可 靠性模 型、 和混 合模型 等。 在对 数据驱 动方 法的 原理进行阐述之前,首先要对特征这个重要概念进行解释。特 征 的 含义 是 ,从 数 据 当中 抽 象提 取 出 的与 判 断某 一 事 物的 状态 或属性 有较 强关 联的可 被量 化的 指标。 例如 在人 脸识别的 过程 中首先 要提 取出 脸部主 要器 官的 位置、 形状 、相 对 距离等 特征 ,再对 这些 特征 进行匹 配, 从而 实现身 份的 识别 。在 设备 健康 状态预 测方 面, 提取有 效的 健康 特征 对 预测 准确 性 至关重 要。 常用的 特征 包括 时域信 号的 统计 特征、 波形 信号 的频域特征、能量谱特征、特定工况下的信号读数等。,在 对 原 始数 据 进行 特 征 提取 之 后, 智 能 算法 通 过对 多 维 度数 据的 融合分 析来 建立 健康预 测模 型。 基于统 计或 机器 学习的算 法能 够根据 所定 义的 目标函 数来 优化 预测性 模型 的结 构与参数 ,从 而“记 忆” 数据 中的信 息, 并能 据此对 类似 的数 据做判,断 。模 型所记 录的 信息 可以是 多维 数据 的模态 ,其 与某 一状态的 相似 度,或 者是 输入 特征之 间的 相关 性等。 以对 设备 的状态评估为例,图 2-1 的横轴与纵轴分别代表两个不同的特征,在两 个特 征构成 的特 征空 间中, 设备 的不 同健康 状态 对应 着特征的 不同 分布。 在制 造系 统的运 行过 程中 ,随着 设备 衰退 ,其对应 的特 征分布 会慢 慢偏 移 。特 征的 分布 与正常 状态 分布 的重叠部 分表 征设备 当前 状态 与健康 状态 的相 似度, 即其 健康 的可能性,或称之为“健康值”。若设备的故障状态特征分布已知,则该健康值将可以被正态化为 0-1 之间的量。随着时间的推移,这 个分 布会慢 慢向 某一 个 失效 状态 发展 , j 对 应的 健康 值 时间序 列代 表的是 设备 衰退 的轨迹 。如 果进 一步对 这个 趋势 的发展进 行预 测,就 可以 推断 出在未 来的 什么 时间会 发生 什么 问题或故障。,图 2-1 :利用大数据建模分析制造系统隐性问题的原理 来源:美国智能维护系统中心 对 工 业 大数 据 的建 模 , 其目 的 是为 用 户 创造 价 值。 这 决 定,0,特征 2,健康状态,失效状态,特征 1模 型预 测,模 型预 测 验证,预 测不确定性,预 测 的失 效概率预 测 的健 康值( CV 值),性能衰退的开始,当前状态,了 工业 大数据 的建 模过 程需要 以业 务目 标为驱 动, 同时 要融合算法科学、领域知识、与软件工程。 如图 2-2 所示,工业大数据 的分 析过程 包括 了业 务场景 分析 、数 据问题 定义 、数 据场景化 、模型建 立、模 型价值评 估、以 及最后的 部署实 施六大步骤。,第 一 步 ,业 务 场景 分 析 : 工 业 大数 据 分 析不 同 于互 联 网 ,,对 通过数据 挖掘来 泛泛寻找 相关性 这种模式 在成本 上无法承 受。工 业大 数据分 析应 该从 业务入 手, 在了 解行业 背景 、分 析用户痛 点之 后,制 定明 确的 数据服 务目 标, 定义工 业数 据分 析系统的功能与边界。,第 二 步 ,数 据 问题 定 义 : 在 确 定业 务 目 标之 后 ,需 要 对 问题 进行 数学化 的定 义。 在工业 中, 并非 所有的 问题 都适 用于数据 驱动 的建模 方式 。根 据数据 的数 量、 质量、 与可 采集 变量的完整性,明确数据建模的策略与详细流程。,第 三 步 ,数 据 场景 化 : 原始 数 据往 往 因 为数 据 质量 、 工 况完 整性 、标签 缺失 等问 题无法 用来 直接 建模。 在建 模之 前,有必 要检 测数据 质量 ,将 数据与 业务 场景 相对应 ,之 后提 取能够反映建模对象健康状态的特征,为后续模型输入做准备。第 四 步 ,模 型 建立 : 这 一步 与 通常 意 义 上的 机 器学 习 过 程类 似。 不同的 是, 在工 业数据 预测 性分 析中, 建模 是更 加强调模型的可靠性、泛化能力、以及可解释性。,第 五 步 ,模 型 价值 评 估 : 模 型 本身 性 能 与准 确 性不 是 工 业数 据分 析的唯 一衡 量标 准。如 何能 够让 模型产 生准 确的 可执行信 息,快速 支持用 户决策, 改善设 备健康状 态,优 化运维效 率,,是建模中需要着重强调的关键评估角度。第 六 步 ,模 型 部署 与 实 施: 模 型本 身 不 产生 价 值, 嵌 入 软件 产品 中支持 业务 改善 的模型 才有 价值 。与离 线的 验证 不同,工 业系统的 模型上 线后,仍 需要被 维护、管 理、以 及不断迭 代,以 适应 变换的 工业 场景 与可能 出现 的问 题,持 续为 用户 提供设备洞察,提高生产力。,图 2-2 :工业大数据的建模过程下 面 , 我们 将 针对 本 次 工业 大 数据 竞 赛 的题 目 ,将 其 作 为一个案例对工业大数据的建模过程展开讨论。,(二)案例 - 风机结冰故障1. 结冰预测的整体分析思路,大 量 运 行经 验 表明 , 风 机叶 片 结冰 会 改 变叶 片 叶形 , 破 坏叶 片气 动特性 ,从 而导 致风机 效率 下降 和运行 不稳 定, 进而对电 网的 稳定运 行产 生影 响。因 此, 实现 早期叶 片结 冰预 测可以有效提高风机运行效率和电网运行安全。,风 机 结冰 预测 分析 由 物理 建模 、特 征 提取 、动 态特 性 分析 、建立预测模型和诊断分析几个部分组成。 整体分析流程如图 2-3 所示 。叶片 结冰 可以 看做一 个缓 慢的 能量累 积和 转化 过程,结冰的程度、影响度与环境条件(温度、湿度、风速等)、以及风 机参 数(叶 型、 高度 、额定 功率 等) 有关。 为了 建立 准确的结 冰预 测模型 ,实 现结 冰早期 和全 过程 的预测 诊断 ,首 先要对结 冰的 物理过 程和 风机 参数对 结冰 影响 的特性 进行 分析 ,充分了 解结 冰过程 中的 能量 累积、 转换 和守 恒规律 ,在 此基 础上提取 能够 表征结 冰程 度的 关键参 数。 然后 ,定量 分析 叶片 结冰状态 对风 机效率 的影 响关 系,在 此基 础上 提取表 征风 机受 结冰影响的性能参数。因此,物理模型的分析从以下两个角度入手:, 风机叶片结冰动力学模型, 叶片结冰状态对风机性能的影响模型,这 两 种 方法 能 够从 两 个 视角 透 彻分 析 结 冰过 程 和风 机 性 能之 间的 作用机 理。 一方 面,建 立叶 片结 冰动力 学模 型能 够从本质 上展 示水蒸 汽在 金属 表面的 能量 转换 和累积 过程 ,使 我们能,够 利用给定 的条 件 和数据定 量刻画 结冰的严 重程度 ;另一发 面,建 立叶 片结冰 状态 对风 机性能 影响 的关 系模型 ,使 我们 能够利用 叶片 结冰程 度指 标定 量表征 风机 整体 性能, 从而 实现 完全封闭 的从 观测数 据到 风机 性能的 结冰 关系 模型。 利用 这个 关系,我 们可以从 中进一 步提取相 应的特 征作为训 练模型 的条件属 性,作为结冰预测模型的输入参数。,在 实 际 运行 中 ,严 重 的 结冰 一 般能 够 被 轻易 检 测到 , 并 通过 风机 除冰系 统自 动除 冰。然 而, 除冰 系统 却 难以 检测 早期结冰 状态 。虽然 叶片 在结 冰早期 产生 了一 定的变 形, 但对 机组的性 能影 响不明 显, 因此 难以察 觉。 早期 的叶片 结冰 在不 处理的情 况下 一般都 会演 化成 严重结 冰, 所以 ,分析 结冰 全过 程的动态 特性 对结冰 预测 来说 十分重 要, 它能 够帮助 预测 模型 实现结冰早期的监测和诊断。,结冰动力学模型特征提取,特征子集,结冰 - 风机性能关系模型特征提取,结冰演化过程分析特征提取时序特征子集,分类模型,原始数据预处理,诊断结果图 2-3 :风机叶片结冰预测分析流程在 建 立 预测 分 类模 型 的 时候 , 需要 考 虑 风机 结 冰数 据 的 类不 平衡 问题。 一般 来说 ,对数 据进 行重 采样能 够有 效降 低类不平 衡带 来的建 模误 差。 将结冰 样本 进行 过采样 ,将 非结 冰样本进 行欠 采样, 或者 两者 同时进 行, 以达 到结冰 和非 结冰 样本在模 型训 练时有 基本 相近 的比例 。如 果结 冰样本 足够 多, 也可以选择对类不平衡问题不敏感的分类模型进行建模。2. 风机结冰物理模型与特征提取根据 Makkonen 关于物体表面覆冰模型 1 ,在给定环境温度 的条 件下, 单位 时间 内物体 表面 的覆 冰质量 可由 如下 关系表示:dM 1 2 3 V S dt ( 1 )其中, 1 , 2 , 3 表示结冰状态的 3 个系数,分别为:撞击系,数 、黏 着系数 和增 长系 数。撞 击系 数表 示水滴 从无 穷远 能够成功撞击物体表面的比例(概率);黏着系数表示水滴撞击物体表面后能够附着而不反弹的比例(概率);增长系数表示水滴附着在物体表面后能够持续存在而不融化的比例(概率)。 表示空气中水蒸汽密度(含水量), V 表示无穷远来流速度(风速), S表示物体表面积,为常数。在 风 机 结冰 预 测问 题 中 ,由 于 风机 叶 片 各个 截 面所 处 地 点几 乎相 同,叶 片大 小空 间尺度 远远 小于 空气含 水量 变化 的空间尺度,因此含水量 可以认为是定值。黏着系数 2 在绝大多数情况下均为 1 。因为当温度在 -5 0 时,物体表面会产生雨凇结 冰。 此时物 体表 面会 被一层 粘性 液体 所覆盖 ,此 时水 滴几乎不 能从 撞击中 逃脱 。当 温度低 于 -5 时 , 会产生 雾凇 结冰 ,这时 由于 温度过 低水 滴在 接触物 体表 面会 瞬间凝 结成 冰, 也不会从物体表面逃逸出去。增长系数 3 在雾凇结冰时为 1 ,因为水滴完 全 冻 结, 不 会融 化 。 在雨 凇 结冰 时 , 3 和 含 水 量有 关 , 一 般情 况 下 ,含 水 量越 低 , 3 越 大 。 由于 含 水 量是 定 值, 因 此 在 风机 叶 片 结 冰 预 测 的 问 题 中 , 增 长 系 数 3 也 是 常 数 。 因 此Makkonen 覆冰模型可以简化为:,dM C 1 V dt,( 2 ),为 了 能 够提 取 表征 叶 片 结冰 质 量的 特 征 参数 , 我们 并 不 关心 常数 的具体 取值 ,只 关心能 够用 观测 数表征 结冰 质量 的函数形 式。 因此只 要确 定由 观测参 数表 征撞 击系数 的形 式, 结冰质,0.381,., d Re 2 a dv,量就可以通过观测参数表征。 Finstad 等人 2 通过半经验公式拟合了撞击系数 1 : 1 A 0.028 C B 0.0454 ( 3 )其中:A 1.066 K 0.00616 exp 1.103 K 0.688 ,B 3.641 K 0.498 exp 1.497 K 0.694 ,C 0.00637 100 ,K ,2, , Re =9 D K ,d 为水滴直径,在叶片结冰过程的时间尺度内,近似为定值;D 为物 体截面平均 直径; a 为 湿空气密 度,为 定值; v 为来流速度,等于 V ; 为空气的粘性系数,为常数。通过上述分析可知,撞击系数和来流速度 v 具有直接的对应关系,其他参数由于全部是常数,因此可以推断出: 1 f v ( 4 )将 ( 3 )( 4 ) 代入( 2 )可 以导出 结冰 质量 和风速 之间 的关系,即:,dM 1.762 V dt,( 5 ),上 式 说 明, 在 给定 温 度 条件 下 ,空 气 含 水量 、 空气 密 度 、水 滴形 状均不 变的 情况 下,单 位时 间内 叶片结 冰质 量取 决于风速 的大 小,风 速越 大, 结冰质 量越 大。 当在利 用观 测数 据建模时 ,经 过归一 化后 的风 速,利 用近 似的 风速的 平方 也能 较好的,拟 合上述 模型, 因此 ,在误 差允许 的范 围内, 可以用,dM 2dt, V 模,型代替。当温度发生变化时,结冰质量的关系模型变为:dM 2dt, f T V ,( 6 ),另 一 方面 , 为了 能够 更 加直 观 的表 示结 冰 质量 对 风机 功率的影响 ,需要进一步利 用功率 - 结冰质量 关系来验证( 6 )模型。在 非结 冰情况 下, 风机 会按照 正常 模式 下的风 机功 率特 性曲线工 作, 发生结 冰后 ,实 际运行 的功 率曲 线会偏 离正 常模 式,而这个偏离程度意味着结冰的严重程度,和结冰质量是等价的。首 先 , 利用 模 糊自 适 应 神经 网 络对 训 练 数据 的 正常 样 本 拟合 功率 特性曲 线得 到功 率特性 曲线 的基 线模型 ,然 后利 用该模型 估计 测试数 据下 的功 率输出 。测 试数 据包含 结冰 和非 结冰数据,那么结冰严重程度可以表示为:,P real P predP real, f T V ,W ,dM 2dt ( 7 ),P real , P pred 分 别 表 示 测 试 数 据 的 实 际 功 率 和 通 过 基 线 模 型 估 计的功率。( 7 )表示风功率的相对残差,图 2-4 显示了结冰数据( 红色 部分) 和非 结冰 数据( 蓝色 部分 )的功 率相 对基 线模型的偏离程度。图 2-5 表示了观测数据的结冰严重程度和风速的关系。,图 2-4 :功率特性线拟合,图 2-5 :结冰质量 风速关系通 过 图 2-5 , 我 们 可 以 非 常 明 显的 区 分 大 部 分 的结 冰 数 据和 非结 冰数据 。在 结冰 的状态 下, 结冰 质量和 风速 具有 明显幂律 关系 ,虽然 这个 关系 还受到 环境 温度 的调制 作用 ,但 是在非结 冰数 据上, 这种 关系 是不存 在的 。因 此,我 们可 以提 取结冰,预测的第一组重要的特征:结冰质量的度量参数( V 2 , T )、结冰严重程度( W )。风 机 功 率对 风 速的 响 应 模型 进 一步 解 释 了为 什 么风 功 率 的偏 差 能 够 表 示 结冰 的 严 重 程 度 。 Rahimi 等 人 3 揭 示 了 风 机 功率和风速之间的关系:,P ,1 3 S C2, a p V ( 8 ),这 里 C p 为 风 能 利 用率 , S 为 叶 片 面 积。 在 正 常 情 况 下,,C p 1, S constant ;而在非结冰状态下,风能利用率小于,1 , 并 且,叶 片面 积也会 由于 覆冰 而稍加 改变 。该 模型说 明在 风速 一定的情 况下 ,风机 输出 功率 和结冰 程度 有明 显的单 因素 对应 关系。定义风能综合利用率: C total S C p 。在图 2 所示的功率特性曲线的 基 线 模 型 下 , 可 以 将 实 际 功 率 和 拟 合 功 率 分 别 用 ( 8 ) 式 来 表示:, a real real V ,P real ,1 3 S C2,1P pred a S pred C pred V 32S pred =constant , C pred =1基 线 模 型 表 征 正 常 情 况 下 的 功 率 - 风 速 响 应 , 因 此 可 以 定 义在任意时刻的风机风能综合利用率:,S real C real P real,C total ,S pred C pred P pred,风 机 风 能综 合 利用 率 可 以作 为 另一 个 重 要的 结 冰预 测 模 型的特征,它是结冰严重程度对风机性能影响的量化指标。,通 过 对 风机 叶 片结 冰 过 程的 机 理分 析 和 物理 建 模, 我 们 提取了若干表征结冰的状态和本质属性的特征,如表 2-1 所示这些 特征 能够作 为建 立预 测模型 的输 入参 数,能 够最 大程 度地为分 类算 法提供 相互 独立 的信息 ,在 保证 预测精 度的 前提 下,降低分类模型的复杂度,提高模型的泛化性能。表 2-1 :风机叶片结冰预测模型瞬态特征,特征W V ,描述结冰严重程度平均风速,单位m/s,V 2,风速平方,2,m /s,2,P realC totalWindDirectionT,输出功率风能综合利用率风向角相对湿度平均环境温度,kW%,3. 风机结冰过程演化分析风 机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手势识别手势分割-洞察及研究
- 租赁业务客户隐私保护考核试卷
- 六年级道德与法治教学课题研究计划
- 2025至2030鲜鸡精行业市场占有率及投资前景评估规划报告
- 2025至2030铜版纸行业深度研究及发展前景投资评估分析
- 服务行业内部审计存在问题及改进措施
- 三年级英语考试复习措施
- 分布式能源交易:风险全景透视与保障机制构建
- 2025线上线下混合教学衔接计划
- 上市公司高管过度自信对股利分配决策的影响:理论与实证的深度剖析
- 《企业培训与发展课件-人才储备与管理体系》
- 桥梁安全知识讲座
- 《焊接品质管理培训》课件
- 2025年浙江衢州市大花园集团招聘31人高频重点提升(共500题)附带答案详解
- 光伏电站培训
- 软件项目服务保障方案
- 保险钱教育金课件
- Profinet(S523-FANUC)发那科通讯设置
- 肌力分级护理课件
- 古田会议课件教学课件
- 管道承诺质量保证书范本
评论
0/150
提交评论