版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
商务数据分析的流程项目三:0108商务数据分析商务数据分析的价值在于广泛的应用场景,从识别市场机会到规避潜在风险,从诊断运营问题到检验决策效果,涵盖了企业运营的多个层面。本项目旨在通过应用场景分析,探讨商务数据分析如何赋能企业高效运营以及提升市场竞争力。ProjectObjectives01项目目标项目目标ProjectObjectives1.掌握研究方案的撰写方法2.理解数据的特征3.学会采集数据知识目标能力目标素养目标1.能够根据项目需求设计研究方案2.能够根据研究方案设计调查问卷3.具有数据获取和整合的能力1.培育学生对数据的敏感性2.培养学生对事物分析坚持定性分析与定量分析相结合的职业素养3.培养学生严谨的数据采集和整合的工作态度4.培养学生互补互助、协同合作的团队协作精神02任务二数据获取与处理任务1.2数据获取(1)数据来源常见的数据一般分为两类。一类是一手数据,另一类是二手数据。一手数据一般有两种来源,第一种来源是公司内部数据。一般是公司基于自己各种业务活动所产生的数据。比如电商公司的用户购买行为数据,浏览商品数据,商品评价数据等等。这些数据我们称为公司内部数据,也是一手数据。还有一种来源是外部数据,比如公开的数据,如一些专业网站公开的数据,如CGSS里的数据。一手数据信息较多,一般需要清洗、汇总。二手数据是相对于一手数据而言的,一般是指那些为了研究某个课题收集且整理好的统计资料,这类数据相对而言获取更加容易,且成本更低,不足之处是,二手数据经过加工,会遗失掉一些信息,且这些数据前人为了研究课题收集的,发布出来时候,课题研究至少已经经过了一段时间,且取得了一定的结果,因此数据时效性会较差。另外,数据的相关性也值得大家关注,二手数据与现研究的课题具有较强的相关性是确保结论正确的前提。如国家统计局统计年鉴中的数据,就是二手数据。(2)数据接入数据接入的方法跟数据的存储方式有很大的关系。数据从存储方式一般分为数据库存储和文件存储。对于数据库存存储的数据,需要链接数据库到Wyn平台,对于存在在文件中的数据如CSV、text、Excel数据,以导入的方式将数据接入Wyn平台中。任务1.2数据获取实训操作【实训要求】请将名为“测试数据”的excel数据接入到Wyn平台中【操作步骤】第一步:数据库接入Wyn平台可接入的数据库类型比较丰富,包括关系型数据库、NoSql数据库、开放式数据库连接数据源和网络型数据源。在“文档门户”页面点击左侧菜菜单栏【+】,在弹出的菜单中,点击【数据源】(见图3-6)图3-6点击数据源任务1.2数据获取在所弹出的数据源链接页面,选择对应的数据源所在的数据库,进行链接。例如,图3-7所选择的是【关系型数据库】中的【Oracle】图3-7选择对应的数据库任务1.2数据获取在弹出的Oracle数据库链接窗口,在对应字段中填写信息,并在点击链接数据库之前进行测试,点击左下角【测试数据链接】,测试成功后,点击右侧的【创建】按钮(见图3-8),至此数据库链接成功。图3-8填写相关信息任务1.2数据获取第二步:文件导入Wyn平台可接入的文件型数据源类型包括Excel、Json、CSV、Xml4种类型。“文档门户”页面点击左侧菜菜单栏【+】,在弹出的菜单中,点击【数据源】(见图3-9)图3-9点击数据源任务1.2数据获取在弹出数据源链接页面,数据源对应的文件类型,本次选择【文件型数据源】中的【Excel】(见图3-10)图3-10选择文件类型任务1.2数据获取在所弹出的Excel数据源链接窗口,定义数据名称,并选择文件所在的路径,单击右下角的【下一步】(见图3-11)图3-11填写数据信息任务1.2数据获取选择需导入的数据所在的sheet,单击右下角的【下一步】(见图3-12)图3-12选择所需导入的数据任务1.2数据获取在数据预览页面,单击【创建】,数据即导入到Wyn平台中(见图3-13)。图3-13将数据导入到Wyn平台中任务2.2数据处理数据处理包括数据清洗和数据加工两项内容1.数据清洗数据清洗是指对原始数据进行去重、去噪、纠错等操作,以确保数据的准确性和完整性。数据清洗的重点工作一般放在BI平台之外进行,由专业的技术人员,如数据架构师,数据治理工程师进行,BI平台的数据清洗较少。数据清洗工作中的主要内容是数据的增、删、改、查,如果是针对日志型数据,则在数据清洗之前需要进行数据解析,获取日常分析中需用到的数据字段。数据清洗的大致步骤主要为检查重复数据并进行归一处理,如删除重复数据、保留最新的数据等;删除空白行;(3)补充缺失数据:如将缺失数据填充为null值,均值或者以历史数据填充等(4)检查异常值:如某用户在电商平台的单次浏览时长超过100个小时,则认为该用户数据定义为异常数据。(5)添加新的相关行或者列,如将只有用户id的用户行为表,通过关联用户主数据表来获取用户的属性信息。以上几种情况数据清洗中较为常见,具体的清洗规则需要根据业务情况制定,并形成文档周知相关部门。任务2.2数据处理2.数据加工数据加工是指对原始数据进行清洗、整合、转换和分析的过程,旨在提高数据的质量和可用性,为企业决策提供有力支持。数据加工处理的目标是使数据能够更好地为企业服务,包括将海量的数据转化为有用的信息和知识。数据加工处理的具体步骤包括整合、转换和分析。数据整合是指将不同来源的数据进行统一,消除数据冗余和重复,使数据能够在统一的平台上进行分析和应用。数据转换是指将数据从一种格式转换为另一种格式,以满足不同应用的需求。数据分析是指对数据进行统计、建模和预测等操作,以发现数据中的规律和趋势。数据加工处理的应用非常广泛,可以应用于各种领域和行业。例如,在金融领域,可以对股票交易数据进行加工处理,分析股票市场的趋势和规律;在医疗领域,可以对医疗记录数据进行加工处理,分析疾病治疗方法和效果;在商业领域,可以对销售数据进行加工处理,分析消费者的购买行为和偏好。总之,数据加工处理是现代数据处理技术的重要组成部分,它能够将原始数据进行有效的处理和分析,为企业提供有价值的信息和知识,帮助企业做出更好的决策。任务2.2数据处理实训操作【实训要求】请在Wyn平台中对明细数据进行数据建模【操作步骤】接入BI平台的数据,可以是明细数据,也可以是已经加工过的数据,对于已经加工过的数据,可以直接用于可视化报表的创建,但是对于明细数据,则需要在Wyn平台中进行加工,包括数据模型设计、数据汇总,筛选等。此处我们以数据建模为例进行介绍。数据建模可以构建跨数据源的数据模型,以更加完整的业务建模取代简单的物理模型。可以通过数据建模,补充字段,完善用户信息等。第一步:创建抽取模型,此处以建模“文档门户”页面单击左侧菜单栏【+】,选择【仪表板】的【准备数据】(见图3-14)图3-14准备数据任务2.2数据处理选择【数据模型】下的【抽取模型】,单击【创建】按钮(图3-15)图3-15创建抽取模型为将要抽取的数据模型进行命名(见图3-16)图3-16为抽取的数据模型命名任务2.2数据处理在设计器中依次点击【获取数据】、【来自数据源】(图3-17)图3-17选择数据源选择已经创建的数据源,然后单击【下一步】(见图3-18),勾选需要的表或视图图3-18勾选需要的表和视图任务2.2数据处理接着为表起别名(图3-19)图3-19给表格起别名任务2.2数据处理单击【下一步】加载数据(图3-20)图3-20加载数据任务2.2数据处理数据加载完成后通过【添加关系】按钮,将2个或多个表格进行关联(图3-21),单击左上角的【保存】按钮,进行保存。图3-21添加关系任务2.2数据处理第二步:创建新的计算字段单击实体右侧的更多按钮,根据需要选择添加度量值或添加计算列(图3-22)图3-22添加度量值和计算列任务2.2数据处理单击【添加度量值】,可以添加新的计算字段,该字段就会随着数据报表不同的筛选条件进行调整(见图3-23)。图3-23添加度量值任务2.2数据处理单击【添加计算列】在弹出的窗口中添加计算公式,该公式生成新的列,在数据表中出现,与数据中的其他列具有相同的意义(见图3-24)。图3-24添加计算列数据的加工方式比较多,此处仅介绍最常用的,我
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 妊娠合并多学科门诊核心竞争力提升策略
- 八上语文综合试题及答案
- 女职工健康数据管理与分析应用
- 大数据支持下社区慢病健康管理模式构建
- 大数据分析在职业病突发疫情预警中的应用
- 多联疫苗的接种依从性提升方法-1
- 2025年大学智能家居管理(管理技术)试题及答案
- 多组学标志物推动焦虑症精准分型策略
- 多组学技术在肿瘤早筛中的临床价值
- 2025年中职(印刷媒体技术)印刷排版工艺阶段测试题及答案
- 2025年六年级上册道德与法治期末测试卷附答案(完整版)
- 学堂在线 雨课堂 学堂云 研究生学术与职业素养讲座 章节测试答案
- 京张高铁现场观摩会整体策划方案
- 安捷伦1200标准操作规程
- 合伙人合同协议书电子版
- 离婚协议书下载电子版完整离婚协议书下载三篇
- 磨床设备点检表
- LS/T 8008-2010粮油仓库工程验收规程
- GB/T 27724-2011普通长网造纸机系统能量平衡及能量效率计算方法
- GB/T 18341-2021地质矿产勘查测量规范
- 绿色疗法修正直肠给药教程
评论
0/150
提交评论