



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、导读:在数字经济时代,互联网、智能设备和其他形式的信息技术的爆炸性增长使得数据以同样令人印象深刻 的速度增长,企业经营的各个阶段都可以被记录下来,产品销售的各个环节也被记录下来,客户的消费行为和 网上行为都被采集下来。数据已成为一种重要的生产要素,通过对数据的收集、存储、再组织和分析建模,隐 藏在数据中的重要价值及规律逐渐展现出来,正成为企业转型升级及可持续发展的重要推动力量。大数据分析 建模是大数据应用的核心和重要基础,己成为科技界和企业界关注的热点话题。I大数据分析建模的背景随着企业信息化的逐步深入,大量信息系统在企业中广泛应用,物联网、云计算、工业互联网等技术与企业经 营生产紧密结合,设
2、备运行、生产加工、测试试验等数据采集过程更加自动化,企业积累了大量的数据,包括 产品销售数据、客户消费数据、客户行为数据、企业运营数据等,企业经营生产的各个阶段都可以被记录下 来,产品销售的各个环节也被记录下来,客户的消费行为和网上行为都被采集下来,这些数据隐藏着大量的有 价值的规律和信息,是企业的重要资产。另一方面,传统的数据报表、即席查询等简单分析手段已无法满足企业对于深层次信息的挖掘需求,大数据融 合、大数据分析、大数据挖掘等技术不断发展,漏斗分析、事件分析、行为分析、留存分析、属性分析等模型 不断完善,神经网络、决策树、关联规则等挖掘算法不断成熟,基于Hadoop、HDFS的分布式存储
3、技术以及基 于Storm、Spark、MapReduce等分布式计算技术迅猛发展,为大数据分析处理及分析建模提供了坚实的技术 支撑。大数据分析建模步骤企业开展大数据分析,首先应开展业务调研和数据调研工作,明确分析需求,其次应开展数据准备工作,即选 择数据源、进行数据抽样选择、数据类型选择、缺失值处理、异常值检测和处理、数据标准化、数据簇分类、 变量选择等,再次应进行数据处理工作,即进行数据采集、数据清洗、数据转换等工作,最后开展数据分析建 模及展现工作。大数据分析建模需要进行5个步骤,即选择模型、训练模型、评估模型、应用模型、优化模型 结构。1I选择分析模型基于收集到的业务需求、数据需求等信息
4、,研究决定选择具体的模型,如行为事件分析、漏斗分析、留存分 析、分布分析、点击分析、用户行为分析、分群分析、属性分析等模型,以便更好地切合具体的应用场景和分 析需求。1训练分析模型每个数据分析模型的模式基本是固定的,但其中存在一些不确定的参数变量或要素在里面,通过其中的变量或 要素适应变化多端的应用需求,这样模型才会有通用性。企业需要通过训练模型找到最合适的参数或变量要 素,并基于真实的业务数据来确定最合适的模型参数。1评估分析模型需要将具体的数据分析模型放在其特定的业务应用场景下(如物资采购、产品销售、生产制造等)对数据分析 模型进行评估,评价模型质量的常用指标包括平均误差率、判定系数,评估
5、分类预测模型质量的常用指标包括 正确率、查全率、查准率、ROC曲线和AUC值等。|应用分析模型对数据分析模型评估测量完成后,需要将此模型应用于业务基础的实践中去,从分布式数据仓库中加载主数 据、主题数据等,通过数据展现等方式将各类结构化和非结构化数据中隐含的信息显示出来,用于解决工作中 的业务问题的,比如预测客户行为、科学划分客户群等。|优化分析模型企业在评估数据分析模型中,如果发现模型欠拟合或过拟合,说明这个模型有待优化;在真实应用场景中,定 期进行优化,或者当发现模型在真实的业务场景中效果不好时,也要启动优化,具体优化的措施可考虑重新选 择模型、调整模型参数、增加变量因子等。I大数据分析建
6、模建议数据分析建模是企业大数据应用的重要基础,通过建模不仅有效地组织了原始数据,而且为数据展现提供了重 要支撑,企业在开展数据分析建模过程中应注意以下几点:1重视需求牵引作用,深化业务问题解决企业应结合业务发展目标,梳理经营生产过程中的瓶颈问题,以问题为导向,重视业务需求调研工作,清理业 务流程和业务数据,研究数据来源、采集通道和映射关系,深入梳理数据基础,不断推进业务问题的解决并构 建合理的业务架构。2 |加大数据积累力度,夯实数据体系基础企业应深化信息系统应用,提升业务流程和业务数据上线力度,深 化物联网、云计算等新兴技术应用,提高数据采集效率,丰富数据积累力度;完善主数据、主题数据、数据建 模等标准规范,构建包含业务、指标、报表等的数据体系,夯实数据体系基础。3加大人员队伍建设,提高技术支撑能力企业应加大技术专家、业务专家、数据分析师、数据管理员、运营专家等专业人员的培养,调动业务部门参与 数据分析的积极性和主动性。同时加大数据分析、数据建模、数据挖掘技术储备、技术工具库和模型库建设, 提高技术支撑能力。结语大数据分析建模是数据到信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB36-T1819.4-2023-受污染耕地安全利用与风险管控规程第4部分:效果评价-江西省
- DB36-T1637-2022-热敏灸安全操作规范-江西省
- 护理责任制度体系构建与实施
- 骨折术后护理要点与实施规范
- 2025学年一年级上学期数学加减法创新应用测试题
- 2025年注册造价工程师计价控制模拟试题汇编:建筑工程造价咨询实务案例分析
- 2025年乡村医生考试:农村医疗卫生服务体系建设专业知识与应用试题
- 2025年教师资格证学科知识高中生物实验设计案例分析卷
- 广东省三校2024-2025学年高三上学期第一次联合模拟考试化学试题(含答案)
- 2025年中学教师资格考试《综合素质》教育研究方法教育研究方法研究与应用试题试卷
- 安全生产事故报告处理制度范本
- (高清版)WST 311-2023 医院隔离技术标准
- 2024年电梯安装与维修工理论考试题库及答案(通用版)
- 天耀中华合唱简谱大剧院版
- 【《我国互联网企业价值评估现状与问题探析11000字》(论文)】
- 智慧农业的无人机技术应用
- 建筑装饰装修工程消耗量定额
- 北京市2023年中考备考语文专题复习 名著阅读题(解析)
- 招聘需求分析报告
- 黄太吉融资商业计划书
- 接警员培训课件模板
评论
0/150
提交评论