版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在生产环境上部署深度学习主讲人:吴书卫关于SKYMINDDeeplearning4j 的商业支持机构SKYMIND是一家提供企业级人工智能深度学习开源平台及企业支援的公司,肩负了提升深度学习开源平台核心 争力的重要使命。竞主要目的是帮助企业、政府及集团设计与部署深度学习架构SKYMIND以专注平台开发、创新、整合、人性化为理念,通过技术与业务模式创新,构建完整的智能生态 链,提升深度学习平台的核心竞争力,为企业、政府及集团提供可靠和稳定的全方位人工智能平台摘要关于深度学习数据科学家在部署深度学习时遇到的难题部署深度学习的解决方案Deeplearning4j 深度学习框架深度学习建模(模型训练)
2、流程运行模型关于深度学习深度学习的概念源于人工神经网络的研究: 机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络大大提高了计算的精度与准确率能识别,分析并学习文字,图片,声音,视频以及 能自动学习与发掘数据的特征 未来计算机发展的必然趋势时间序列数据。高精准度:自动学习与发掘数据的特征深度学习的优势在于它能随着数据的增加,精准度也会随着提高用列:TINDER 手机交友APP第二层第三层输入第一层输出用列:用户分析保留用户活动记录时间离开现在80%65%40%20%产品一产品二产品三产品四追加销售成功率数据科学家遇到的难题数据传输数据传输到另一个集群去处理会把影响整个
3、深度学习模型训练流程的速度 数据传输到另一个集群去处理会吧整个深度学习模型训练流程复杂化集成问题数据摄取,抽取、转换、装载(ETL),矢量化,建模,评估与部署问题 大多数的机器学习工具是由基于过时(上一代)的架构而设计传统架构并行迭代算法架构是很少的问题一:处理海量数据其它建立数据集优化算法挖掘数据的特征收集数据集清理、整理数据参考:/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says问题二
4、:把海量数据向量化(Vectorization)# 例子# (时间序列)例子问题三:建模(训练模型)建模、调模大数据系统数据输出、隔离、清理、转换、格式化、向量化非常耗时间GPU 集群C 代码Hadoop 集群:数据库Java 代码问题四:运用模型建模、调模大数据系统部署深度学习模型在生产环境重新编辑机器学习工具GPU 集群C 代码Hadoop 集群:数据库Java 代码使用深度学习不管拥有大数据或小数据,都可以方便的部署深度学习避免为了升级到大数据系统(HADOOP)时把原本的机器学习工具都换掉避免花费时间在数据矢量化与抽取、转换、装载(ETL) 专注于开发更好的深度学习模型可以同时间实验、
5、训练更多的深度学习模型同时也要避免为了把深度学习部署到生产线时需要重新编辑机器学习工具Deeplearning4j (DL4J) 系列工具Arbiter 深度学习模型检测、评估器 调整及优化机器学习模型ND4J 转为JVM开发的科算引擎 JavaCPP:Java 到 Objective-C 的桥Deeplearning4j 企业级商用的开源深度学习平台 专为Java和Scala编程的深度学习DataVec 深度学习专用的矢量处理器 数据标准化处理器 处理非结构化数据DataVec主要解决数据输出、隔离、清理、转换、格式化、向量化等问题 机器学习的ETL(抽取、转换、装载)操作 主要目的是把原始
6、数据(Raw Data)转化成可用的向量格式,让所有的深度学习工具都可以使用 支持CSV、原始文本及、图像数据 拥有强大功能:数据特征处理、数据清理、数据规范化。这些功能都可以在Spark上 开源工具ASF 2.0许可证:/deeplearning4j/DataVecND4J让数据科学家在同一个集群上充分的利用GPU,CPU和内存:训练和运行深度学习模型。 JavaCPP: Java 到 Objective-C 的桥,可像其他Java 对象一样来使用 Objective-C 对象。 CPU 后瑞:OpenMP、OpenBlas 或MKL、与SIMD的扩展 GPU 后瑞:最新
7、CUDA 及 CuDNN 开源工具ASF 2.0许可证:/deeplearning4j/nd4j深度学习建模(模型训练)流程运行模型把实时预测连接上图形用户界面(GUI)3数据对接数据源LogsProtocolBuffers1IoTRDBMS-使用Protocol Buffers (Protobuf)沟通2- kafka 与 DL4J 之间使用 Flat Buffers- 二进制格式针对故障使用多种机器学习模型应对多种需求。每个模型将会在一台机上运算。无分布式运行(因此也没有平均化),因为之间的沟通是低效的。CPUMKLGPUCUDA机器学习模型机器学习模型DL4J:训练出来的 机器学习模型基于JVM的应用程式层WEB层解决方案数据库+ 建模、调模+ 运行模型GPU 集群C 代码Hadoop 集群Java 代码+DataVec 深度学习专用的矢量处理器 数据标准化处理器 处理非结构化数据ND4J 转为JVM开发的科算引擎 可以在最低内存的配置下高效运行Deeplearning4j 企业级商用的开源深度学习平台 专为Jav
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年65普法知识竞赛试题库及答案
- 2026福建龙岩学院附属幼儿园招聘编外教师若干人模拟试卷及答案详解(真题汇编)
- 2026广州南沙人力资源发展有限公司招聘项目工作人员1人备考题库含完整答案详解(易错题)
- 2026年上半年四川绵阳市游仙区考核招聘教师30人参考题库【培优B卷】附答案详解
- 2026广东揭阳市直学校赴外地院校招聘教师11人(编制)备考题库含完整答案详解(各地真题)
- 2026贵州贵阳云瑞人力资源服务有限公司招聘教育教学服务人员23人笔试题库附完整答案详解【易错题】
- 2026湖北武汉市华中农业大学幼儿园保健医招聘1人笔试题库一套附答案详解
- 2026湖北宜昌市疾病预防控制中心高层次人才引进2人备考题库附参考答案详解【基础题】
- 2026年度下半年四川广元市消防救援支队面向社会招录消防文员6人备考题库带答案详解(巩固)
- 2026贵州安顺市关岭自治县计划生育协会招聘公益性岗位人员1人备考题库含完整答案详解【有一套】
- 2026四川广安爱众股份限公司招聘5人(第四批次)易考易错模拟试题(共500题)试卷后附参考答案
- 2026广东肇庆市端州区教育局招聘中小学教师75人笔试备考题库及答案详解
- 2026年幼儿园学前班课件完整版
- GB/T 45355-2025无压埋地排污、排水用聚乙烯(PE)管道系统
- 周围血管与淋巴管疾病第九版课件
- 机器人操作系统(ROS)课件 1.ROS简介
- 试剂性能验证报告范文
- 子宫内节育器嵌顿查房
- 部门年度工作目标分解与工作计划模板
- 个体餐饮员工的规章制度
- GB/T 7704-2017无损检测X射线应力测定方法
评论
0/150
提交评论