商业大数据分析与应用基础-习题答案汇 第1-8章 大数据分析概述-数据分析综合案例_第1页
商业大数据分析与应用基础-习题答案汇 第1-8章 大数据分析概述-数据分析综合案例_第2页
商业大数据分析与应用基础-习题答案汇 第1-8章 大数据分析概述-数据分析综合案例_第3页
商业大数据分析与应用基础-习题答案汇 第1-8章 大数据分析概述-数据分析综合案例_第4页
商业大数据分析与应用基础-习题答案汇 第1-8章 大数据分析概述-数据分析综合案例_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章大数据分析概述课后习题参考答案:1.单选:BDDCCABCCACBBDAA2.多选:(1)BCD(2)ABCD(3)ABCDE(4)ABCD(5)BCD(6)ABC3.判断:××××√√√4.简答:(1)大数据分析是针对海量的多样化的数据集合进行处理、分析和挖掘,提炼有价值信息的过程。(2)大数据的存储数据通常是以GB甚至是TB乃至PB作为存储的数据量级,因而与传统的数据存储方式差异较大。传统数据的获取大多是人工的,或者是简单的键盘输入。在大数据时代,数据获取的方式有这样几类:爬虫抓取、用户留存、用户上传、数据交易和数据共享。(3)大数据对科学活动的影响,大数据对思维方式的影响,大数据对社会发展的影响,大数据对就业市场的影响。(4)第一,在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。第二,大数据和云计算的目标受众不同,云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,而大数据的决策者是业务层。(5)两者都是存储的数据。结构化数据常指存储关系在数据库中的数据,该数据遵循某种标准,如企业财务报表、医疗数据库信息、行政审批数据、学生档案数据等。非结构化数据常指不规则或不完整的数据,包括所有格式的办公文档、XML、HTML、各类报表、图片、图像以及音频、视频信息等。企业中80%的数据都是非结构化数据。(6)Excel、Orange、Tableau和PowerBI在数据分析领域各有所长,形成了从基础工具到专业平台的完整生态链。Excel凭借其易用性和普及性,仍是小规模数据分析的首选工具;Orange以其组件化的工作流和机器学习能力,成为学术研究和数据挖掘的理想选择;Tableau和PowerBI则在商业智能和企业级数据分析领域各领风骚,Tableau以丰富的图表类型和跨平台能力见长,PowerBI则以与Excel的深度集成和企业级功能为优势。第2章业务与数据理解课后习题参考答案:1.单选:DABD2.多选:(1)BCD(2)ABCDE(3)CD(4)ABC(5)ABCD(6)ABCDE(7)ABD3.判断:×√×√√√×4.简答:(1)业务数据,行业数据,内容数据,线上行为数据,线下行为数据(2)1)公开的数据库数据2)网络指数3)基于电商平台的基础数据4)基于电商专业网站的研究数据5)基于电商媒体的报道、评论数据网络爬虫(WebSpider)又称之为网络机器人、网络蜘蛛,是一种通过既定规则,能够自动提取网页信息的程序。爬虫的目地在于将目标网页数据下载至本地,以便进行后续的数据分析。1)txt格式2)doc格式3)xls格式4)pdf格式5)XML格式6)JSON格式7)HTML格式8)tar格式9)dmg格式10)py格式数据采集又称数据获取,是指利用某些装置,从系统外部采集数据并输入到系统内部的一个接口。在互联网行业快速发展的今天,数据采集已经被广泛应用于互联网及分布式领域,比如摄像头、麦克风以及各类传感器等都是数据采集工具。第3章数据预处理课后习题参考答案:1.单选:ABDC2.多选:(1)ABC(2)ABC(3)ADE(4)ABC(5)ABCDE(6)ABCD(7)ABCDE3.判断:√√√×√√√√√×√4.简答:(1)数据定义、数据操作、数据查询、数据控制等。(2)清洗数据、数据转换、数据筛选、数据统计和分析等。(3)连续变量离散化、离散变量连续化、缺失值估计、选择相关特征、选择随机特征、标准化、随机化等。第4章数据基本统计分析课后习题参考答案:1.单选:BBA2.多选:(1)ABCD(2)ABC(3)ABCD(4)AB(5)CDE(6)BC3.判断:√××√√√√√××4.简答:(1)1)数据指标是数据分析的载体,是通过数据指标实现数据分析的目标;2)数据分析离不开数据指标,数据指标贯穿数据分析过程。(2)1)反映现象之间的相互联系程度,说明总体现象的质量、经济效益和经济实力情况。2)使原来不能直接相比的数量关系变为可比,有利于对所研究事物进行分析比较。3)表明事物的发展程度、内部结构以及比例关系,为人们深刻认识事物提供依据。(3)SPSS有两个主要窗口:数据编辑器窗口、结果查看器窗口。数据编辑器窗口的主要功能是对变量进行定义、录入、文件管理、数据分析。结果查看器窗口的主要功能是结果查看与管理。(4)Excel是一款广泛使用的电子表格软件,操作简单,界面直观,适合处理较小规模的数据集。Excel中的数据分析功能主要通过创建数据透视图或数据透视表以及Excel自带的数据分析模块(Excel加载项)进行。Orange是一款开源的数据分析软件,通过拖拽组件的方式构建数据分析流程,提供数据预处理、特征统计、逻辑回归等组件,能够方便地进行数据清洗、特征选择和模型评估等操作,使用户无需编写代码即可进行复杂的数据分析。SPSS是一款专业的统计分析软件,提供丰富的统计分析方法,从基本的描述性统计到复杂的多元统计分析,如回归分析、因子分析、聚类分析等,几乎涵盖了所有的统计分析需求。第5章数据可视化分析课后习题参考答案:1.单选:CBBC2.多选:(1)ABC(2)ABCDE(3)ABC(4)AB3.判断:×√√√√√√√4.简答:(1)一般由下列三个方面组成:1)科学可视化:主要关注三维现象的可视化,包含气象学、生物学、物理学、农学等。重点在于对客观事物的体、面及光源等的逼真渲染。2)信息可视化:将数据信息和知识转换为一种视觉形式,在信息可视化中充分利用了人们对可视模式快速识别度自然能力。3)可视化分析:是科学可视化与信息可视化领域发展的产物,侧重于借助交互式的用户界面而进行对数据的分析与推理。(2)1)明确制作目标;2)确定展示方式;3)确定视图布局;4)图表专业化;5)选择合适的图表。(3)按照数据的作用和功能可以把图表分类以下几类:比较类、分布类、流程类、地图类、占比类、区间类、关联类、时间类和趋势类等。其中在每一种类型的图表中都可包含不同的数据可视化图形,如柱状图、饼图、气泡图、热力图、趋势图、直方图、雷达图、色块图、漏斗图、和弦图、仪表盘、面积图、折线图、K线图、环图、词云等。第6章数据分析报告撰写课后习题参考答案:1.单选:CCDBDBACB2.多选:(1)ABCDE(2)ABC(3)ABCD(4)ABC(5)BCD(6)ABDE(7)ABC3.判断:√√√√×√√×√××4.简答:(1)不足之处包括数据量偏少、数据分析深度不够等。可从数据统计分析等方面进一步修改完善。(2)双样本方差分析(Two-Samplet-Test或Two-SampleF-Test)和单因素方差分析(One-WayANOVA)是统计学中用于比较不同组别之间均值差异的两种方法,但它们的应用场景和假设条件有所不同。双样本方差分析:主要用于比较两个独立样本的方差是否相等,适用于需要检验两个总体方差是否相同的场景。单因素方差分析:主要用于比较三个或三个以上独立样本的均值是否相等,适用于需要检验多个组别均值是否存在显著差异的场景。(3)由年龄与购买自用品时考虑因素交叉表结果可知,不同年龄段的消费者在购买自用品时最关注的因素也各不相同。年龄在30岁以下的消费者在购买自用品时,更加关注产品的外观设计部分,与同年龄段选择的别的因素相比,选择“外观”的消费者最多,占总数的15.0%。年龄在31~50岁的消费者更加注重产品的品牌。与同年龄段选择的别的因素相比,选择“品牌”的消费者最多,占总数的26.7%。年龄在50岁以上的消费者则更加注重产品的质量。与同年龄段选择的别的因素相比,选择“质量”的消费者最多,占总数的33.3%。(4)介绍型报告。第7章数据分析综合案例课后习题参考答案:1.单选:DACDDD2.多选:(1)ABCDE(2)ABCE(3)ABCDE(4)ABCDE(5)ABC3.判断:√×√××4.简答:(1)自带的字段:通常在“数据”窗格中以默认的维度(蓝色)或度量(绿色)显示,其数据类型和名称与原始数据源一致。如果字段来自原始数据表,会直接显示在“维度”或“度量”区域。计算得到的字段:在“数据”窗格中,计算字段会显示为一个带有“fx”图标的字段,并且其定义中会包含具体的计算公式。计算字段可以基于原始字段、其他计算字段或聚合函数生成。(2)在Tableau中,可以通过“数据”窗格中字段名称左侧的图标来判断字段的数据类型:字符串类型(文本值):字段图标为"ABC"或“abcd”的标识。数值类型(数字值):字段图标为"123"或#的标识。地理位置类型:字段图标为地球仪或地理标记的标识。此外,也可以通过右键点击字段,选择“更改数据类型”来查看或修改字段类型,相关数据类型也会以图标形式展示。(3)Tableau中的.twb文件与.twbx文件的不同点在于,后者保存的文件不仅包括图表,还包括导入的源数据。(4)进行数据分析时,选择软件主要应考虑以下五个核心维度:功能性、用户友好性、数据处理能力、成本效益和技术支持。(5)使用Excel软件对会员RFM模型进行分析,主要分为数据准备、RFM指标计算、客户分群与制定策略四个步骤。1)数据准备确保销售数据包含以下字段:客户ID:每个客户的唯一标识符订单日期:每次购买的具体日期订单金额:每次购买的总金额2)计算RFM指标包括计算Recency(最近一次购买时间间隔)、计算Frequency(购买频率)、计算Monetary(消费金额)。3)客户分群评分规则:将R、F、M三个指标按业务需求分为5档(1-5分),5分为最好R分箱:按升序分箱(R值越小分数越高)F/M分箱:按降序分箱(F/M值越大分数越高)例如R分:R≤30天得5分,R≤90天得4分,依此类推客户分类:根据RFM组合分值将用户分为8类:重要价值客户(R↑F↑M↑):近期消费、高频次、高金额,提供VIP服务重要保持客户(R↓F↑M↑):历史消费高但近期未活跃,推送限时优惠重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论