版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
认识商务数据与数据分析全套可编辑PPT课件任务描述在进入大数据时代以来,在日常工作和生活中,人们经常会接触到各类数据。商业是与数据分析关系最紧密的行业,也是数据分析广泛应用的行业之一。商务数据分析需要从枯燥的数据中揭开市场规律,找准运营要点,发现提高利润的路径和方法。了解商务数据与数据分析的基础知识,是步入商务数据分析的前提。任务分析了解商务数据的基本概念。熟悉商务数据分析的要点。商务数据商务数据分析商务数据数据是指对客观事件进行记录并且可以鉴别的符号,是对客观事物的性质、状态和关系等进行记载的物理符号或组合。数据不仅包括数字,还包括文字、字母、数字符号、图像、视频和音频等。数据类型主要有商务数据、股票数据、工业数据和海关数据等,其中商务数据主要是指记载商业、经济等活动领域的数据符号。商务数据主要包括电子商务数据和传统商务数据,本书重点介绍电子商务数据。在电子商务领域,商务数据可以分为两大类:前端行为数据和后端商业数据。其中,前端行为数据涵盖访问量、浏览量、点击量和站内搜索等反映消费者行为的数据,后端商业数据更侧重商业数据,如交易量、投资回报率和生命周期管理等。商务数据随着电子商务的快速发展,选择网上购物的消费者越来越多,各个电子商务平台的数据也随之增加,产生的数据成为越来越有价值的重要资源。电子商务企业或个人经营者通过对海量消费数据进行收集、分析与整合,不仅可以挖掘出对应的商业价值,促进个性化和精确化营销的开展,还可以从分析中发现新的商机,创造新的价值,从而带来更大的市场、更高的利润和更好的发展。因此,对于电子商务企业或个人经营者来说,商务数据往往蕴藏着巨大的商机和价值。商务数据商务数据分析商务数据分析商务数据分析是指通过分析手段、方法和技巧对准备好的商务数据进行探索与分析,从中发现因果关系、内部联系和业务规律,为运营者提供决策参考的过程。进行商务数据分析使用的方法既包括经典的统计学方法,又包括现代的机器学习技术。在通常情况下,商务数据分析涉及3个基本问题:一是面对什么样的数据,二是使用什么方法进行分析,三是运用何种分析工具实现。商务数据分析商务数据相较于传统零售业数据复杂得多。根据来源可以将数据分为直接数据和间接数据。直接数据一般是指通过自身对社会调查、试验等途径获取的数据,一般需要注意数据来源的广泛性、代表性和均衡性;间接数据一般是指借助各种媒介获取的数据。此外,根据维度又可以将数据分为宏观数据与微观数据、内部数据与外部数据。根据宏观数据可以分析各行各业的趋势、现状和用户行为等;而微观数据主要用来分析企业自身情况,如营销预测、流量来源、营销渠道和订单漏斗等。内部数据可以用来分析企业内部的经营状况;外部数据可以用来分析企业业务增长的核心问题,如用户增长、竞品分析、决策支撑和某些业务创新等。商务数据分析根据不同的视角和目标,进行商务数据分析会采用不同的方法。根据分析目的不同,商务数据分析可以分为描述性分析、相关与回归分析、时间序列预测、指数因素分析和抽样估计等。描述性分析是对商务数据进行初步的整理、展示和概括性度量,以找出数据的基本特征;相关与回归分析主要研究两个变量之间的密切程度、因变量与一个或多个自变量的依赖关系;时间序列预测主要根据现阶段的发展方向和趋势进行类推或延伸,预测下一段时间可能达到的水平;指数因素分析主要研究现象总变动中各个因素的影响程度;抽样估计以抽样调查所得到的数量特征来估计总体的数量特征。商务数据分析伴随各种分析软件的出现,数据分析变得相对容易了很多。商务数据分析工具软件大致可以分为商业类软件和非商业类软件。比较常用的商业类软件有Excel、SAS、SPSS、Stata和Minitab等,这些软件虽然侧重点不同,但是功能大同小异,可以满足商务数据分析的需求。目前较为流行的非商业类软件包括R语言和Python,二者的侧重点稍有不同。R语言的主要功能是数据分析和可视化,功能强大。大部分分析可用R语言提供的函数实现,并且代码简单,初学者容易上手。Python则更注重编程,有较好的普适性。使用Python进行商务数据分析常需要编写较长的代码,这对于初学者来说不算友好。商务数据分析其中,作为最基本、最常见的分析工具,Excel的功能十分强大,拥有丰富的函数和分析工具,几乎可以完成所有的统计分析工作,如数据处理、数据可视化和统计分析等。Excel工具也被广泛应用到各行各业的数据分析领域中。因此,本书着重介绍数据分析工具—Excel,帮助经营者使用常用工具、简便方法解决数字化经营问题。需要特别指出的是,数字化改革推动了我国生产模式的变革。随着经济数字化和政府数字化和企业数字化的建设,数据已经成为我国政府和企业的核心资产。在商业活动中,数据分析的前提是确保数据安全。2021年9月1日起施行的《中华人民共和国数据安全法》是数据领域的基础性法律,也是国家安全领域的重要法律。商务数据分析的影响任务描述为了提高运营效率和管理效率,优化相关工作环节,各个行业、商家都在积极通过数据分析寻求更好的提升空间。对数据进行有效的整理和分析,可以为企业经营者决策提供参考依据,为其创造更多的价值。而认识商务数据分析的作用、意义及应用场景是迈入商务数据分析的重要一步。任务分析了解商务数据分析的作用与意义。熟悉商务数据分析的应用场景。商务数据分析的作用与意义商务数据分析的应用场景商务数据分析的作用与意义在商务领域中,进行数据分析的目的是将隐藏在数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,为经营者制定决策提供依据。企业或经营者通过对商务数据进行分析,具有以下几方面作用。能够判断行业现状、发展趋势和竞争情况,以及预测企业发展趋势,从而规划发展策略,以确保自身的行业地位。能够了解客户特征,分析客户价值,以改善客户关系,提升客户满意度,以及实现客户忠诚。能够挖掘客户的新需求,改善用户体验,提高商品的投入回报率。能够进行客户群体细分,对特定群体采用差异化的营销策略,以实现精细化运营。商务数据分析的作用与意义从商务数据分析的方法着手,归纳商务数据分析意义为勾画现实、探究原因和预测未来等。勾画现实。通过各个指标的完成情况来衡量企业等主体的运营情况,体现企业现阶段的整体运营情况,展现企业等主体各项业务的构成,了解各项业务的发展与变动情况。探究原因。在了解企业等主体的现状后,发现问题,分解要素并寻找原因。通过进行商务数据分析,可以帮助各个主体进行因素分析、回归分析,找到复杂问题的主要原因,对症下药,优化完善。预测未来。通过对历史和现状进行分析,可以寻找特征,抓住趋势,预测未来。对各个主体将来的发展提前做出规划、判断,可以规避风险,提高效益,保持可持续健康发展。商务数据分析的作用与意义商务数据分析的应用场景商务数据分析的应用场景根据不同的业务场景,可以将商务数据分析的应用场景划分为以下几方面。数据监控与诊断,即通过数据分析,帮助企业快速发现经营问题,以便早发现早解决,使用较多的工具是数据监控仪表盘。市场分析,即帮助企业占领市场、掌握市场,并预测市场行情,以便及时有效地调整市场及品牌战略。竞争分析,即掌握竞争企业或产品信息,关注产品和市场的差异,优化企业在竞争策略方面的决策。客户分析,即分析客户特征,减少客户流失,令其产生价值,提高客户留存率。商务数据分析的应用场景营销及广告分析,即帮助企业降低营销及广告成本,充分了解营销及广告效果,以便调整营销及广告策略。库存分析,即减少不良库存,针对库存的动销、补货预测等进行分析,避免因为积压而产生不良库存。财务分析,即全面监控财务数据,掌握企业资金流向和资产变动情况。其他分析,主要包括企业各种数据需求分析,如舆情分析、售后分析等。商务数据分析的工作程序任务描述商务数据分析最终是为经营服务的,即通过数据分析结果优化产品和运营,为企业做出高质量、高效率的决策。在面对海量的商务数据时,应该从何处入手,怎样判断先做什么、后做什么。为此,掌握商务数据分析的一般工作程序和基本原则是入手商务数据分析的重中之重。任务分析掌握商务数据分析的一般工作程序。掌握商务数据分析的基本原则。商务数据分析的一般工作程序商务数据分析的基本原则商务数据分析的一般工作程序【实例】某日,公司的领导将电商购物数据交给新入职的数据分析专员张三和李四,并让他们对数据进行分析,生成分析报告。其中,张三先根据电商购物数据集直接计算RFM指标,并将该指标切成5段,同时利用k-均值聚类将其分成4类。然后直接将聚类结果发给领导。而李四则先拿着数据集咨询销售部、市场部和运营部等部门的负责人,了解数据背后的业务逻辑,在将业务理顺之后,运用数学、统计学和算法等分析手段,求出RFM聚类模型,再与具体的商业环境相结合,解释最终的结果。商务数据分析的一般工作程序张三的行为放大了商务数据分析中的“分析”,忽视甚至无视“商务”的结果;而李四先将商务问题转化为数据报表,在得出结果之后再应用到实际的商务环境中。相比之下,李四的分析流程更符合商务数据分析的一般流程,并且更科学、更合理。商务数据分析的一般工作程序商务数据分析的流程:明确分析需求与目的数据采集数据处理数据分析数据可视化商务数据分析的一般工作程序明确分析需求与目的当电商运营者拿到一个数据分析项目时,需要先明确项目的分析需求,即和他人、各个部门等沟通与需求相关的一切内容,并且清晰及准确地理解、表达相关内容,抓住需求的核心内容。同时,还需要明确数据分析的目的,只有目的明确,分析方向才不会偏离,否则得到的数据分析结果将毫无指导意义。商务数据分析的一般工作程序数据采集数据采集是按照确定的数据分析内容,有目的地收集和整合相关数据的过程,是商务数据分析的基础。获取到的数据包括一手数据和二手数据。一手数据是指通过访谈、询问、问卷和测定等方式直接获得的数据。因此,一手数据也被称为原始数据。一手数据的优点是可以回答二手数据不能回答的具体问题,更加及时和可信,以及保密性更强等。二手数据是指通过网络、媒介和统计机构等获取的经过加工整理后的数据。因此,二手数据也被称为次级数据。二手数据的优点是成本低、易获取等。商务数据分析的一般工作程序数据处理数据处理是指对采集到的数据进行加工整理,形成适合数据分析的样式,保证数据一致性和有效性的过程。数据处理是进行数据分析前必不可少的阶段,并且在商务数据分析的整个过程中耗费的时间最长。数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。数据处理主要包括数据清洗、数据转化、数据抽取和数据合并等基本操作。商务数据分析的一般工作程序数据分析在通常情况下,数据分析是指通过适当的分析手段、方法和技巧对已经处理好的数据进行探索与分析,提取出有价值的信息,形成有效结论的过程。到了这个阶段,若电商运营者想要驾驭数据,从容地进行数据分析与研究,就需要为分析的内容确定合适的分析方法和分析工具。商务数据分析的一般工作程序数据可视化通过进行数据分析,隐藏在数据内部的关系和规律就会逐渐浮现出来,此时,一般通过图表的方式来呈现数据关系和规律,即用图表说话。使用数据可视化工具能够让数据分析师更直观地表述想要表达的信息。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图、瀑布图、漏斗图、金字塔图、矩阵图和帕雷托图等。商务数据分析的一般工作程序商务数据分析的基本原则商务数据分析的基本原则在进行商务数据分析的过程中,电商运营者还需要注意把握科学性、系统性、针对性、实用性和趋势性的基本原则。科学性:在收集、处理和分析数据的过程中,一丝差错都可能会使分析结果出现偏差,因此,电商运营者必须以科学、严谨的态度认真对待,保证数据的科学性。系统性:商务数据分析不是单个数据的记录、整理或分析活动,而是经过周密策划、精心组织、科学实施,并由一系列工作环节、步骤、活动和成果组成的过程。一次完整的数据分析,应当包含明确分析需求与目的、数据采集、数据处理、数据分析、数据可视化等。商务数据分析的基本原则针对性:就不同的数据分析方法而言,无论是基础的分析方法还是高级的分析方法,都有其适用领域和局限性。例如,行业宏观分析采用PEST模型,用户行为分析采用5W2H模型,客户价值分析采用RFM模型,销售推广分析采用多维指标监测。只有根据分析目标选择适合的方法与模型,才能保证分析的准确性和有效性。实用性:商务数据分析说到底是为企业决策服务的,在保证其专业性和科学性的同时不能忽略其现实意义。在进行数据分析时,还应考虑指标的可解释性、结论的指导意义与实用价值。趋势性:市场所处的环境是不断变化的,在进行商务数据分析时,要以发展的眼光看待问题,充分考虑社会宏观环境、市场变化与先行指标,不能局限于当前现状与滞后指标。认识Excel任务描述Excel作为微软公司办公套装软件MicrosoftOffice的重要组成部分,可以用来处理各种商务数据、统计分析和辅助决策,广泛应用在商务、金融和管理等领域。Excel2019在办公中得到了普遍应用。利用Excel2019可以高效、便捷地完成各种数据统计和分析,科学地预测发展趋势,为企业决策管理提供可靠依据。了解Excel的用户界面、掌握Excel的基本操作是进行商务数据分析的重要环节。任务分析熟识Excel2019的用户界面。掌握Excel2019的基本操作。认识Excel的用户界面掌握Excel的基本操作认识Excel的用户界面用户通过用户界面与计算机程序进行交流。在安装Windows10操作系统的计算机中,单击【开始】图标,找到Excel图标并单击,或者双击桌面上的Excel图标,打开的用户界面如下图所示。Excel2019的用户界面包括标题栏、功能区、名称框、编辑栏、工作表编辑区和状态栏。认识Excel的用户界面标题栏标题栏位于应用窗口的顶端,如图下所示,包括快速访问工具栏、当前文件名、应用程序名称和窗口控制按钮。在下图中,框1为快速访问工具栏,框2为当前文件名,框3为应用程序名称,框4为窗口控制按钮。认识Excel的用户界面功能区标题栏的下方是功能区,如下图所示,由【文件】选项卡、【开始】选项卡、【插入】选项卡和【页面布局】选项卡等组成,每个选项卡又可以分成不同的组,如【开始】选项卡由【剪贴板】命令组、【字体】命令组、【对齐方式】命令组和【数字】命令组等组成,每个命令组又包含不同的图标。在下图中,框1为选项卡,框2为命令组。认识Excel的用户界面名称框和编辑栏功能区的下方是名称框和编辑栏,如下图所示。其中,名称框可以显示当前活动单元格的地址和名称,编辑栏可以显示当前活动单元格中的数据或公式。在下图中,框1为名称框,框2为编辑栏。认识Excel的用户界面工作表编辑区名称框和编辑栏的下方是工作表编辑区,如下图所示。工作表编辑区由标签滚动按钮、工作表标签、水平滚动滑条、垂直滚动滑条和文档窗口组成。在下图中,框1为标签滚动按钮,框2为工作表标签,框3为水平滚动滑条,框4为垂直滚动滑条,框5为文档窗口。认识Excel的用户界面状态栏状态栏位于用户界面的底部,如下图所示。状态栏由视图按钮和缩放模块组成,用于显示与当前操作相关的信息。在下图中,框1为视图按钮,框2为缩放模块。认识Excel的用户界面掌握Excel的基本操作掌握Excel的基本操作工作簿是指在Excel环境中用于存储并处理工作数据的文件,一个Excel文档就是一个工作簿。工作表是显示在工作簿窗口中的表格。工作表的行编号用阿拉伯数字表示,如1、2;列编号用字母表示,如A、B。行编号显示在工作簿窗口的左边,列编号显示在工作簿窗口的上边。单元格是表格中行与列的交叉部分,是组成表格的最小单位,可拆分或合并。工作表的基本操作主要有插入工作表、重命名工作表、设置标签颜色、移动工作表、复制工作表、隐藏工作表、显示工作表和删除工作表。掌握Excel的基本操作插入工作表在Excel中插入工作表有多种方法,下面介绍常用的两种插入工作表的方法。方法1:以【Sheet1】工作表为例,单击工作表编辑区中的按钮即可在现有工作表的末尾插入一个新的工作表【Sheet2】,如下图所示。掌握Excel的基本操作方法2:以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【插入】命令,如右图所示,打开【插入】对话框,单击【确定】按钮即可在现有工作表之前插入一个新的工作表【Sheet3】,也可以通过快捷键【Shift+F11】在现有的工作表的前面插入一个新的工作表。重命名工作表掌握Excel的基本操作以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【重命名】命令,如右图所示,输入新的名称即可重命名工作表。设置标签颜色掌握Excel的基本操作以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【工作表标签颜色】命令,如右图所示,选择新的颜色即可设置标签颜色。移动或复制工作表掌握Excel的基本操作以【Sheet1】工作表为例,选中【Sheet1】标签,按住鼠标左键向左或向右拖动到新的位置即可移动工作表。以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【移动或复制】命令,打开【移动或复制工作表】对话框,在“下列选定工作表之前”列表中选择【Sheet1】选项,并勾选【建立副本】复选框,如右图所示,单击【确定】按钮即可复制工作表。掌握Excel的基本操作隐藏或显示工作表以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【隐藏】命令即可隐藏【Sheet1】工作表,如左下图所示(注意,当只有一个工作表时不能隐藏工作表)。若要显示隐藏的【Sheet1】工作表,则右击任意标签,在弹出的快捷菜单中选择【取消隐藏】命令,打开【取消隐藏】对话框,在“取消隐藏工作表”列表中选择【Sheet1】选项,如右下图所示,单击【确定】按钮,即可显示之前隐藏的工作表【Sheet1】。删除工作表掌握Excel的基本操作以【Sheet1】工作表为例,右击【Sheet1】标签,在弹出的快捷菜单中选择【删除】命令,如右图所示,即可删除工作表。数据的输入和修改都是在单元格中进行的,在输入数据之前需要先选择单元格。此外,还可以选择单元格区域。掌握Excel的基本操作在选择单元格时,单击某个单元格可以选择该单元格,如单击A1单元格即可选择A1单元格,此时名称框会显示当前选择的单元格地址为A1,如下图所示。此外,还可以通过在名称框中输入单元格的地址来选择单元格,如在名称框中输入“A1”即可选择A1单元格。掌握Excel的基本操作选中要选择的单元格区域左上角的第一个单元格,并按住鼠标左键拖动到要选择的单元格区域右下方的最后一个单元格,松开鼠标左键即可选择单元格区域。例如,选中A1单元格,并按住鼠标左键拖动到C4单元格,松开鼠标左键即可选择A1:C4单元格区域,如下图所示,也可以通过在名称框中输入“A1:C4”来选择A1:C4单元格区域。如果工作表中的数据很多,那么可以通过快捷键的方式快速批量选择单元格区域。按快捷键【Ctrl+Shift+方向键】,可以选中该方向的单元格或单元格区域的全部数据,直到遇到空白单元格。小结本章首先介绍了商务数据分析的基本内容,主要包括商务数据及商务数据分析的概念、类型和价值等,以及商务数据分析的作用与意义、应用场景、一般工作程序及基本原则。然后介绍了商务数据分析工具Excel,包括其用户界面、工作表与单元格的基本操作。数据来源任务描述数据采集是市场研究的重要组成部分,也是进行科学性数据分析的基础。采集数据的准确性直接关系到数据分析结果的价值。为此,在进行数据采集之前,通常需要了解数据的来源,即采用正规、权威、合理的数据来源渠道,了解采集数据的分类,这样才能根据合适的数据来源,采集用户所需的某类数据。任务分析了解商务数据的来源和数据分类。了解宏观数据与微观数据的概念和采集渠道。了解外部数据与内部数据的概念和采集渠道。商务数据的来源宏观数据与微观数据外部数据与内部数据商务数据的来源商务数据的来源十分广泛,常规的会员数据、流量数据、交易及服务数据通常由第三方交易平台提供,如京东的数据开放平台。而商务数据的来源主要有电子商务平台、社交电商平台和O2O数据等。(1)电子商务平台是一个为企业或个人提供线上交易洽谈的平台企业或商家可以利用电子商务平台提供的网络基础实施、支付平台和管理平台等共享资源有效地开展自身的商业活动。支付平台、安全平台和管理平台等可以产生大量的商务数据,如运营数据、销售数据和用户数据等。通过电子商务平台所产生的数据,企业可以用于提升客户服务、帮助定价、改善产品及做竞品分析等。商务数据的来源(2)社交电商平台又分为以下三类:社交内容电商社交分享电商社交零售电商商务数据的来源社交内容电商:是指内容驱动成交,通过社交网络的形式将内容分发出去,让用户沉浸在内容中,引导用户成交,完成购买转化。在内容分发、成交过程中,平台会产生转发率、成交金额、成交数量、转化率和复购率等商务数据。社交分享电商:主要通过用户分享,基于微信等社交媒介进行商品传播,通过商品点击、打开和分享等方式产生商品打开率、商品转发率、用户覆盖率、营销费用、浏览量及访客量等数据。商务数据的来源社交零售电商:主要分为直销和分销两种。直销是指商家利用商城将商品直接推向消费者,由平台承担选品、品控、物流、仓储及售后等服务;分销是指平台直接面向分销商,通过分销商接触消费者,分销商主要负责流量获取和分销,商品供应链及售后服务等由平台承担。在商家、分销商售卖过程中会产生对应的销售数据和流量数据等,平台服务过程中会产生对应的物流数据、库存数据和售后数据等。商务数据的来源(3)O2O数据即O2O电商平台数据通过线上引流线下消费,商家在线上将商家信息、商品信息等展现给消费者,消费者在线上进行筛选并支付,在线下进行消费验证和消费体验。既满足了用户的个性化需求,又可以将网店信息传播得更快、更广。根据不同的维度,还可以将数据划分为宏观数据与微观数据、外部数据与内部数据、直接数据与间接数据。商务数据的来源宏观数据与微观数据外部数据与内部数据宏观数据与微观数据在通常情况下,宏观表示长远的、大的方面,是大概的意思;微观表示小的、比较细的方面。针对不同类型的数据,采集方式也会存在差异。宏观数据是指一系列的宏观经济学的统计指标经过公式计算得到的,是衡量宏观层面国民经济的数据。主要包括国民经济总量、国民经济构成(主要分为GDP部门与非GDP部门)、产业发展阶段与产业结构、经济发展程度(人类发展指数、社会发展指数、社会福利指数和幸福指数)等一系列指标。宏观数据主要由政府公布,如统计局数据、政府报告数据和行业公开数据等。宏观数据与微观数据微观数据主要是衡量微观经济的商务活动数据,涉及单个经济单位的经济活动,如个别企业、经营单位及其经济活动等。微观数据主要来自单个经济单位内部,或者通过外部市场调查获得其他主体商务活动数据。商务数据的来源宏观数据与微观数据外部数据与内部数据外部数据与内部数据根据数据采集空间范围可以将数据划分为外部数据和内部数据。在一般情况下,将来自经济主体以外的数据称为外部数据,主要包括宏观经济数据、市场数据、行业数据和竞争对手数据等。外部数据的主要采集渠道包括市场调查、第三方采集、公开数据等。在通常情况下,将来自经济主体内部的数据称为内部数据,主要包括自身的运营数据、财务数据、人力成本数据和销售数据等。内部数据的主要采集渠道包括企业内部统计、财务核算等。直接数据采集任务描述直接数据通常是公司等各个主体通过各种各样的调研方法采集的,可以解决公司特定的问题,采集到的数据属于公司,且具有保密性。直接数据的采集方法有多种,常用的是问卷调查法。在通过问卷调查法采集特定数据之前,需要初识调查方案的设计内容和原则,以及调查问卷的设计流程等内容,以便快速、准确、便捷地采集所需数据。任务分析掌握直接数据的概念和采集方法。掌握调查方案的设计方法与原则。掌握调查问卷的设计流程和设计原则。直接数据认识与设计调查方案了解与设计调查问卷直接数据直接数据是指来源于本人或本公司直接记录、调查或实验的结果,又称为一手数据,具有准确性高、科学性强等特点。直接数据的时效性较高,更能体现当前企业等各个主体的现状。常见的直接数据的采集方法有观察法、访问法、实验法和问卷调查法等。直接数据观察法:是指调查人员亲自到现场对调查对象进行观察,在被调查者无察觉的情况下获得数据资料。虽然通过观察法获得的资料比较准确,但是需要耗费大量人力和花费很长时间。访问法:通过指派调查人员对被调查者进行提问,并根据被调查者的答复取得资料。访问法的特点是资料准确、全面,但需要较多的被调查人者。实验法:是在设定的特殊场所、特殊状态下,对调查对象进行实验以获得所需数据。问卷调查法:是一种把调查项目列于表格上形成问卷,通过发放问卷来搜集调查对象情况的方法。直接数据在某些情况下,数据分析公司需要使用调查方式来获取直接数据。常用的数据调查方式有普查、抽样调查、重点调查和典型调查。数据分析部门主管在接到数据分析任务后,需要与市场调查人员(规模较小公司的数据分析人员和市场调查人员通常是隶属于同一个部门)明确调研目的、确定调研对象、选择调查方法、确定调查进度和人员需求,以及确定调研预算。这种通过问卷获取数据的方法又称为抽查法。虽然采用问卷调查法省时省力,但由于调查局限在一定的范围内,因此未调查部分出现的问题无法反映出来。直接数据认识与设计调查方案了解与设计调查问卷认识与设计调查方案在企业等各个主体通过调查方式获取数据前,通常需要设计调查方案。调查方案是指在实际调查之前,根据调查的目标和内容制订的调查实施计划和调查工作程序。调查方案的设计是整个调查过程开始的前提,所以非常重要。出色的调查方案能使整个调查工作取得预期的结果。调查方案的内容主要包含确定调查任务与目的、确定调查对象与调查单位、确定调查内容与调查表、确定调查方式与方法、确定调查项目定价与预算,以及确定调查组织与实施等。认识与设计调查方案在设计调查方案时,需要遵循以下原则。科学性原则。为了提高数据质量,必须采用科学合理的方法。以正确的思想观念、严格的规章制度、科学的工作标准和合理的调查方法设计调查方案。可行性原则。设计调查方案必须着眼于实际应用,只有实用性强的调查方案才能真正成为调查工作的行动指导。有效性原则。在一定的经费约束下,调查结果的精度可以满足调查目的的需求,即方案设计应在费用与精度之间寻求某种平衡,讲究效率。虽然科学性原则、可行性原则和有效性原则侧重于方案的不同侧面,但是三者之间又相互联系、相互影响。直接数据认识与设计调查方案了解与设计调查问卷了解与设计调查问卷调查问卷的基础知识问卷是较为常用的调查工具,是由一组问题和答案组成的调查表。问卷能够准确反映调查目的、具体问题和突出重点,记录被调查者回答的事实,提供正确的信息。自20世纪以来,结构式的调查问卷与抽查法相结合,越来越多地被用于定量研究,并成为社会科学研究的主要方式之一。一份完整的问卷通常由问卷标题、问卷说明、调查内容和结束语等内容构成。了解与设计调查问卷在一般情况下,问卷的设计流程如下:明确调查主题:根据所研究的问题确定调查的具体方向。分解调查主题:将调查主题细化为更具体的二级指标或三级指标。设计问卷题目:围绕细分出的二级指标/三级指标设计合适的问题及答案。决定问卷形式和结构:将设计的问卷问题按照一定的原则组合成一份问卷。问卷预测试和评估:在问卷设置好之后,先使用该问卷进行试调查,以发现问卷设计中存在的问题。问卷确定:进行问卷的修订、定稿和印刷,形成用于正式调查的问卷。了解与设计调查问卷问卷预测试时需要注意以下要点:问卷有效回收率是否过低。有效回收率是指回收问卷中除废卷以外的问卷所占比例,主要反映了问卷设计的总体情况。问卷中的填答内容是否存在错误,若内容有误,则可能是相对应的题项存在歧义。问卷问题的填答方式是否有误,即因为对问题填答要求不理解或产生误解而出现错误,反映了问卷指导语或题项的问题形式存在缺陷。问卷问题的填答内容是否完全。若问卷中的部分问题未做填答,则反映出问卷题项中的问题设计存在缺陷。了解与设计调查问卷调查问卷的设计原则在设计问卷时,用户需要有精益求精的态度,做到文字简洁、问题流畅。同时,在调查之后,需要保证被调查者的个人隐私信息不会被泄露。此外,问卷中问题的设计还应遵循以下原则。具体性原则:即问题的内容要具体,不能是抽象、笼统的问题。单一性原则:即问题的内容要单一,不能将两个或两个以上的问题混合到一起。通俗性原则:即表述问题时语言要通俗、易懂,避免使用让被调查者感到陌生的语言,特别要避免使用过于专业的术语。了解与设计调查问卷准确性原则:即表述问题时语言要准确,避免使用模棱两可、含混不清、容易产生歧义的语言或概念。简明性原则:即表述问题时语言要尽可能简单明确,避免使用冗长的语句。客观性原则:即表述问题时语言要客观,避免使用有诱导性或倾向性的语言。非否定性原则:即避免使用否定句表述问题。可能性原则:即问题必须与被调查者的能力相匹配。凡是超过被调查者理解能力、记忆能力、计算能力和回答能力的问题,应尽量避免提出。间接数据采集任务描述在大多数时候,研究人员亲自调查以采集数据往往是不可能的。所使用的数据往往是别人调查或经过科学实验得到的数据,而这些数据通常会公开出版或公开报道,称为间接数据。与直接数据相比,间接数据具有信息含量低、准确性低和及时性低等缺点,但也存在一定的优势,如采集容易、快速等。在采集间接数据之前,需要了解间接数据的基础内容,如概念、作用和主要来源等。任务分析熟悉间接数据的概念、作用、优点和缺点等内容。熟悉间接数据的分类。掌握间接数据的主要来源。间接数据间接数据的分类间接数据间接数据主要来源于其他人调查或实验的数据,又称为二手数据。由于个人和商业公司的力量有限,因此一些数据需要由专门的大型调查公司或相关部门提供,而这些数据主要来源于报纸、书籍、统计年鉴和相关网站等。如果调查的领域专业性比较强,那么需要查阅相关的专业性网站提供的数据,或者使用搜索引擎的高级搜索功能完成。与此同时,用户需要在正规的、有权威的网站上获取间接数据,以确保收集到的数据是准确的、有效的、符合需求的。此外,用户不得侵犯网站的规制,不能将数据运用在违法的事情上,提高自身对数据的保护意识。间接数据间接数据可以作为直接数据的替代,特别是因为时间、成本等理由,使数据采集是一次性完成的或不需要重复采集,如人口数据采集。间接数据的优点主要体现在采集费用低、采集时间短和采集方便,研究者可以在较短的时间内以较低的成本获得必要的信息。另外,间接数据的应用较为广泛,除了用于分析所要研究的问题,还可以提供研究问题的背景,帮助研究者更好地定义问题,寻找解决问题的思路与方法,构造合适的研究方案,回答和检验某些问题及假设等。间接数据间接数据也存在局限性,主要表现为数据的相关性差、时效性差和准确性差等。间接数据往往是别人为了满足其特定的研究目的而收集的,与统计人员目前所研究的口径可能不一致,也许是数据已经过时,也许是数据本身存在质量问题。因此,在使用间接数据之前,需要对间接数据进行评估。间接数据间接数据的分类间接数据的分类根据间接数据的来源,可以将其分为间接内部数据和间接外部数据。间接内部数据又可以分为直接可使用的数据和需要进一步整理才能使用的数据。间接外部数据可以有多种不同的分类方法,可以分为公开的资料、计算机数据库和辛迪加数据库等。间接数据的分类间接内部数据是指来自人们正为之进行市场研究的企业或组织内部,因其他目的而收集的数据,数据主要来源于业务资料、统计数据、财务资料、顾客数据库和其他各类资料等。业务资料:包括与企业经营活动有关的各种文件资料,如下表所示。类别内容物料记录库存保管、进料/出料记录、各种制度等设备资料设备文件,以及设备安装、测试、使用和维护等记录产品资料产品设计图纸及说明书、技术文件、档案、实验数据等生产资料生产作业完成情况、发货单、工时定额、操作规程、产品检验、质量保证等营销资料企业各种营销决策和营销活动记录、文件、合同、广告等间接数据的分类统计数据:各类数据统计报表,如企业的生产和销售费用、交易、库存等各种数据资料,以及各类统计分析等。财务资料:由财务部门提供的各种财务、会计核算和分析资料,包括生产成本、销售成本、商品价格和经营利润等。顾客数据库:可以利用其中包含的顾客交易记录数据找出顾客的共同特征、对产品的偏好和支付方式等。其他各类资料:包括企业日常累积的各种简报、调研报告、顾客意见和建议,以及相关照片和录像资料等。间接数据的分类间接外部数据是指从公司外部,由其他机构(如图书馆、政府机构、新闻媒体和调查公司等)获得的数据,主要来自由政府数据和普通商业数据组成的公开的资料、计算机数据库、辛迪加数据库及其他互联网数据等。其中,公开出版的资料包括报纸、杂志、图书等文献资料,以及各类名录、各种统计年鉴等;计算机数据库包括文献类数据库、数据类数据库和指南类数据库等。市场数据采集实战任务描述在激烈的市场竞争中,谁能先人一步、快人一步地了解市场行业的趋势与动态,把握客户与竞争对手的真实情况,谁就能在激烈的博弈中脱颖而出。某零售企业通过对广东省2022年12月社会消费品零售总额进行采集、分析和挖掘等,全面了解该时间段的消费品销售行情,为企业调整战略发展规划提供依据。任务分析熟悉市场数据采集的作用与意义。掌握市场数据采集的方法与流程。。。市场数据采集的作用与意义采集社会消费品零售总额数据市场数据采集的作用与意义在一般情况下,数据采集包括历史数据采集和当前市场数据采集。市场数据是指交易所提供给各个市场的交易数据,如最新交易价格。市场数据采集是指运用科学的方式与方法,对特定时空范围内市场对象的各种信息进行系统的搜集。市场数据采集是企业了解当前市场行情、竞争对手真实情况,以及开展营销活动的起点。市场数据采集的作用与意义与历史数据采集相比,市场数据采集的重要性体现在以下几方面:针对新项目,由于缺乏可比性历史数据,因此通过当前市场数据采集影响项目需求的主要因素,即相关市场数据,能为项目开发提供支持。当前市场数据能更好地体现市场行情,而采集市场数据能较好地避免因市场变化速度较快,市场发展规律不明确、不稳定等情况而造成后续分析结果存在偏差。新产品更新迭代速度较快,通过采集、分析当前市场产品数据,能在一定程度上降低企业的开发成本、管理成本和广告成本等。通过采集、分析当前市场的客户消费数据,可以了解各个阶段用户的消费行为,顺应消费行为的多变性,及时调整销售策略。。。市场数据采集的作用与意义采集社会消费品零售总额数据采集社会消费品零售总额数据通过各个省份的统计局,可以查看各个方面的数据,如省份综合指标数据、农业生产总值数据和社会消费品零售总额数据等。该类数据是相关机构公开发布的,属于间接数据,用户可以通过Excel的【自网站】图标采集网页中的数据,或者直接通过复制粘贴方式采集数据。为了了解广东省2022年12月的社会消费品零售销售情况,需要搜集广东省统计局在官方网站中发布的社会消费品零售总额数据,即通过Excel的【自网站】图标获取官网中的数据。采集社会消费品零售总额数据具体操作步骤如下:新建工作簿打开【从Web】对话框输入广东省统计局记录的社会消费品零售总额数据网址选择网站数据打开【导入数据】对话框设置数据的存储位置获取数据采集社会消费品零售总额数据(1)新建工作簿新建一个名称为【社会消费品零售总额数据.xlsx】的工作簿,并打开该工作簿。(2)打开【从Web】对话框在【数据】选项卡的【获取和转换数据】命令组中,单击【自网站】图标,如下图所示,打开【从Web】对话框。采集社会消费品零售总额数据(3)输入广东省统计局记录的社会消费品零售总额数据网址在【从Web】对话框的【URL】文本框中输入或粘贴社会消费品零售总额数据网址,如下图所示。采集社会消费品零售总额数据(4)选择网站数据单击上图中的【确定】按钮,在打开的【导航器】对话框中,单击右侧的【Web视图】选项卡,并选择左侧的【Table0】选项,如右图所示。在一般情况下,网页中存在多个数据表格,当用户需要加载多份数据时,可以勾选右图中的【选择多项】复选框,进而选择所需的多个数据表格。采集社会消费品零售总额数据(5)打开【导入数据】对话框单击上图中【加载】旁边的按钮,在下拉列表中选择【加载到】选项,打开【导入数据】对话框,如右图所示。采集社会消费品零售总额数据(6)设置数据的存储位置在上图中,选中【现有工作表】单选按钮,默认选择当前表中的A1单元格。若读者想选择其他的单元格位置,则先单击按钮,选择指定单元格,再单击按钮返回【导入数据】对话框,如右图所示。采集社会消费品零售总额数据(7)获取数据单击上图中的【确定】按钮,将网络数据信息加载到Excel中,获取的数据如下图所示。除了通过单击【自网站】图标获取广东省统计局的官方网络数据,还可以直接采用复制粘贴的方法,将网页中的数据复制粘贴到Excel工作表中,并进行整合。小结本章主要介绍了商务数据采集中的主要数据来源、直接数据采集、间接数据采集等内容。其中,主要数据来源包括商务数据来源、宏观数据与微观数据、外部数据与内部数据;直接数据采集包括直接数据的概念、调查方案和调查问卷的基础知识;间接数据采集包括间接数据的概念及分类;最后通过市场数据采集实战介绍间接市场数据的采集流程。商务数据集成任务描述进入大数据时代以来,为了提高运营、管理效率,优化相关工作环节,各个行业、商家都在积极通过数据分析寻求更好的提升空间。而数据集成是通过将多个数据源合并存放在一个数据存储中,从而方便后续的数据分析、挖掘等工作。了解数据集成的概念,熟练掌握Excel2019常用的数据集成方法,是实现商务数据处理的重要环节。某公司为满足销售人员工作业绩分析、会员个性化服务分析等工作需要,需要针对已收集到的2021年上半年各销售人员的销售业绩数据,以及该公司9月份会员购买商品的订单信息数据,进行数据集成操作。商品销售记录会员信息表会员购物记录表任务分析了解商务数据集成的概念。熟悉商务数据集成的常见问题。使用商务数据集成方法实现某公司相关业务数据的集成操作。商务数据集成的内涵和意义商务数据集成方法商务数据集成的内涵和意义商务数据集成是指将不同数据源、不同数据格式的商务数据合并在一起存储的过程,主要解决数据的分布性、异构性等问题。商务数据集成的目的是运用一定的技术手段将各个独立的数据按一定规则组织成一个整体,从而为企业提供全面的数据,使得用户或系统能够进行有效的数据访问。商务数据集成的内涵和意义1.同种数据的多表数据集成即同一种类的数据由于采集时间、采集人员等因素的不同,从而保存在多个数据表中,为了后续数据分析工作的高效开展,需要将这些数据集成在一个数据表中。例如,销售人员工作量的单月考核数据集成为季度、年度考核数据;多个调查员同时开展同一调查工作,分开录入调查信息,统计分析时需将多个数据表进行数据集成等。**项目问卷调查数据工作人员A
问卷采集数据工作人员B
问卷采集数据工作人员C
问卷采集数据工作人员D问卷采集数据商务数据集成的内涵和意义2.相关联的不同表数据集成即有多个数据表,每个表中的数据不同,但表与表之间的数据是通过各自表中的某一列或几列关联。为了整体了解数据特征,高效开展相关工作,需要通过关联列查找实现多表数据集成,以存储在一个数据表中。例如,【商品销售】工作表中存储的是商品编号、销售数量等信息,【商品信息】工作表中存储的是商品编号、商品名称、生产厂家、单价等信息,需要进行商品销售分析时,可以以“商品编号”为关联信息对两个表的数据进行数据集成。**厂商品销售记录商品信息商品名称
商品编号
单价
生产厂家……商品销售商品名称
商品编号
销售数量……商务数据集成的内涵和意义商务数据集成方法商务数据集成方法商务数据集成的方法是不唯一的,需根据数据特点、数据集成目标等采用不同的方法实现。Excel2019提供了菜单命令、公式、函数等方法来实现不同特点、不同需求的商务数据集成操作。商务数据集成方法1.
同种数据的多表数据集成【例】销售人员的销售业绩是销售人员工作考核的一项重要指标,统计每个销售人员的销售量是考核销售业绩的重要组成部分。某公司2021年上半年各销售人员的商品销售量均按月分别存放在【销售人员销量统计】工作簿的【1月】~【6月】6个工作表中,如右图。商务数据集成方法1.
同种数据的多表数据集成现对销售人员上半年的工作业绩进行考核,需将【1月】~【6月】6个工作表的数据集成到一个表中,既能看到每位销售人员的月销售数据,也方便统计总销售量。由于销售人员的流动性、休假等原因,每个月的销售人员略有不同,所以应注意集成后的数据表应包含所有销售人员。【销售人员销量统计】工作簿的数据说明如表所示。字段描述销售人员销售人员的姓名,注意:每个工作表的销售人员均不完全相同销售量当月该销售人员的商品销售量商务数据集成方法1.
同种数据的多表数据集成使用【销售人员销量统计】工作簿进行数据集成的基本操作步骤如下。(1)修改列名称打开【销售人员销量统计】工作簿,将【1月】工作表中销售量列名称修改为“1月”,如右图所示。用同样方法依次将【2月】~【6月】工作表中销售量列名称修改为“2月”“3月”“4月”“5月”“6月”。商务数据集成方法1.
同种数据的多表数据集成使用【销售人员销量统计】工作簿进行数据集成的基本操作步骤如下。(2)打开【合并计算】对话框选中【Sheet7】工作表中的“A2”单元格,在【数据】选项卡的【数据工具】命令组中,单击【合并计算】图标,弹出【合并计算】对话框。商务数据集成方法1.
同种数据的多表数据集成使用【销售人员销量统计】工作簿进行数据集成的基本操作步骤如下。(3)引用【1月】工作表数据将光标定位到【引用位置】,单击显示【1月】工作表,框选A1:B15的所有数据,然后单击【所有引用位置】旁边的【添加】按钮,即可将【1月】工作表中的所有数据区域添加到引用位置中。商务数据集成方法1.
同种数据的多表数据集成使用【销售人员销量统计】工作簿进行数据集成的基本操作步骤如下。(4)引用【2月】~【6月】工作表数据按照(3)中操作步骤依次将【2月】~【6月】各个工作表的数据区域都添加至【所有引用位置】中。商务数据集成方法1.
同种数据的多表数据集成使用【销售人员销量统计】工作簿进行数据集成的基本操作步骤如下。(5)完成数据集成操作勾选图中【标签位置】的【首行】和【最左列】两个选项,单击【确定】按钮,即可得到6个工作表的集成数据。(6)设置工作表样式选中【Sheet7】工作表中A1:G1单元格区域,并合并单元格,输入“上半年销售人员销量统计表”,适当设置文本格式,得到集成后的数据表。商务数据集成方法2.
相关联的不同表数据集成VLOOKUP函数可以在不同数据表间数据有关联列的情况下,实现按列查找,并复制查结果的功能,其使用格式如下。VLOOKUP(lookup_value,table_array,col_index_num,[range_lookup])参数名称参数说明lookup_value必需,表示要查找的值,查找值所在列必须与查找范围的第一列是对应列table_array必需,表示数据查找范围,查找范围的第一列必须是与查找值对应的列col_index_num必需,表示返回数据列的序号,即选定查找范围的序号,从1开始编号range_lookup必需,表示精确匹配或模糊匹配,0为精确匹配,1为模糊匹配商务数据集成方法2.
相关联的不同表数据集成【例】将【月饼销售信息】工作簿中【会员信息】工作表数据集成到【订单信息】工作表中,使得【订单信息】工作表中每条记录后面都能显示该条记录对应的收货地址。【月饼销售信息】工作簿的数据说明如右表所示。工作表名称字段描述订单信息订单编号顾客购买商品的订单识别号会员昵称顾客的平台昵称,与【会员信息】工作表中“会员昵称”列关联,但顺序不同购买商品顾客购买的商品名称购买时间顾客购买商品的时间会员信息会员昵称顾客的平台昵称,与【订单信息】工作表中“会员昵称”列关联,但数据记录更多,且顺序不同地址顾客购买商品的收货地址会员信息部分数据截图订单信息部分数据截图商务数据集成方法2.
相关联的不同表数据集成由于【会员信息】工作表和【订单信息】工作表都有“会员昵称”列,并且存放的都是该平台会员的昵称,所以可以将其作为关联列。【注意】关联列强调的是内容关联,列名称可以不相同。对【月饼销售信息】工作簿中的两张工作表进行数据集成的基本操作步骤如下。(1)打开VLOOKUP函数参数对话框打开【月饼销售信息】工作簿,在【订单信息】工作表的E1单元格中输入“收货地址”,在E2单元格输入“=VLOOKUP()”,再单击“编辑栏”中的按钮,打开【函数参数】对话框,如图所示。商务数据集成方法2.
相关联的不同表数据集成(2)设置Lookup_value参数单击图中“Lookup_value”参数后的按钮,选择当前工作表下的B2单元格,然后单击右侧按钮,如图所示,返回【函数参数】对话框。①②商务数据集成方法2.
相关联的不同表数据集成(3)设置Table_array参数单击图中“Table_array”参数后的按钮,框选【会员信息】工作表的A、B两列,如图所示,然后单击【函数参数】右侧按钮,返回【函数参数】对话框。商务数据集成方法2.
相关联的不同表数据集成(4)设置其余参数值在图中的“Col_index_num”参数后输入2,“Range_lookup”参数后输入0。商务数据集成方法2.
相关联的不同表数据集成(5)到第一个会员的收货地址单击上页图中的【确定】按钮,为【订单信息】工作表的E2单元格查找复制了与该行用户匹配的地址。商务数据集成方法2.
相关联的不同表数据集成(6)填充所有记录的收货地址选中E2单元格,将鼠标放至单元格右下角,当光标变为“╋”时,左键双击或按下鼠标左键拖曳至最后一行数据对应E列的单元格,填充所有记录的用户收货地址,如图所示。经过数据集成操作后,将【会员信息】工作表中的【地址】列信息匹配添加到【订单信息】工作表中,即可得到用户的收货地址数据。商务数据清洗任务描述为了保证数据分析的正确性,以更好的指导相关运营工作的开展,商务数据的清洗是必不可少的。数据清洗可以用于检测、纠正或删除不准确或损坏的数据,以提高数据质量,降低分析结果误差。了解数据清洗的概念,熟练使用Excel2019进行数据清洗的操作是实现商务数据预处理的重要环节。现有某电商店铺会员基本信息数据,数据中存在某几行重复、某些列数据不完整、某些数据不符合数据特征要求或不符合实际情况等问题,为使后续相关数据分析工作顺利进行,需要对其中的重复数据、缺失数据、异常数据等进行数据清洗。任务分析了解商务数据清洗的概念和作用。了解重复数据、缺失数据、异常数据、不一致数据的概念及处理方法。使用商务数据清洗方法实现某电商店铺会员信息数据的清洗操作。商务数据清洗的内涵和意义商务数据清洗的方法商务数据清洗的内涵和意义商务数据清洗是商务数据预处理的重要操作,是对重复数据、缺失数据、异常数据和不一致数据等的处理过程。商务数据清洗可以删除重复数据,替换或删除缺失数据,纠正或删除异常数据,规范不一致数据等,使得数据符合进一步加工、使用或分析的基本要求。商务数据清洗的内涵和意义1.重复数据数据清洗中经常会遇到重复数据的处理问题。重复数据会导致数据分布发生变化,从而影响数据分析的结果。重复数据一般有两种情况:第一种是行重复,即某些记录的一列或多列特征值完全相同;第二种是列重复,即存在两列或多列虽然列名称不同,但是数据完全相同。处理重复数据一般采用删除操作,但操作前应该分析重复数据产生的原因、数据分析的目标以及删除重复数据可能造成的不良影响等,再根据分析的结果决定删除数据的方法。商务数据清洗的内涵和意义例如,【某超市销售记录表】部分数据如右表所示,其中“金额(元)”列和“合计(元)”列,虽然列名称不同,但是数据完全相同,都表示记录行的销售金额,此种情况可以只保留一列数据。此外,表中序号为2和3的行、9和10的行,其订单号相同,但其他列数据不同,说明是同一个订单的商品;而序号为6和7的行,不仅订单号相同,而且其他列数据均相同,说明是重复记录,可以只保留一行数据。序号订单号商品名称单价(元)数量(件)金额(元)销售时间合计(元)120210809001康师傅红烧牛肉面2.5025.009:05:325.00220210809002可口可乐(瓶装无糖)3.2013.209:22:283.20320210809002桃李菠萝包2.5025.009:22:525.00420210809003德芙巧克力10.00110.009:24:0710.00520210809004海天生抽6.5016.509:38:206.50620210809005天使土豆片(麻辣)5.0015.009:46:375.00720210809005天使土豆片(麻辣)5.0015.009:46:375.00820210809006海天酱油7.8017.809:53:247.80920210809007康师傅香辣牛肉面2.5012.509:58:472.501020210809007康师傅老坛酸菜面2.5012.509:58:532.50商务数据清洗的内涵和意义2.缺失数据若数据中的某个或某些数据元素为空,则称为缺失数据。缺失值是数据清洗中最常需要处理的问题之一。读者可以通过判断数据的情况,选择合适的方法进行缺失数据的处理,如删除法、替换法。删除法是指将包含缺失数据的行或列删除,一般用于一列数据在整体数据分析过程中存在的重要性较低、缺失率较高的情况下。替换法是指用一个特定的值替换缺失数据,一般用于一列数据在整体数据分析过程中存在的重要性较高、缺失率较低的情况下。当使用替换法处理缺失数据时,需要先查看缺失数据的数据类型,如果缺失数据属于数值型,那么可使用平均值、中位数、众数等统计量进行替换;如果缺失数据属于文本型,那么可使用众数等进行替换。商务数据清洗的内涵和意义3.异常数据异常数据是指数据中的个别明显偏离其余数值,或违背客观公理的数据,异常值的存在可能会对分析结果产生不良影响。删除异常数据或将其纠正到正常数据范围是异常数据的常用处理方法。例如,在规定考试成绩0分~100分之间,在进行成绩统计时,如果发现个别同学的成绩低于0分或高于100分,那么可以将这些成绩判定为异常数据;如果在日期时间数据中,出现了2月30日、23:78:00等违背公认时间约定的情况,那么可以将这些日期时间数据判定为异常数据,需要进行删除或纠正。商务数据清洗的内涵和意义4.不一致数据不一致数据通常是指同一事物表述不一致的情况,一般是由于数据采集或集成过程的命名方式、数据代码不一致造成的。将不一致数据按照统一规则进行纠正、整理是不一致数据的常用处理方法。例如,某公司做市场调研时,各工作人员在进行信息征集过程中,对消费者的称谓列命名不同,如“用户名”、“姓名”、“客户”等。虽然各工作人员的表述不同,但是其意思均是表达消费者名称,在后续进行数据分析前需要统一整理命名。商务数据清洗的内涵和意义商务数据清洗的方法商务数据清洗方法现有某电商店铺的【会员信息】工作簿,保存了会员编号、用户名、会员年龄、会员性别等会员信息。该店铺为了进行个性化需求分析,需对会员数据进行数据清洗,主要包括重复数据、缺失数据、异常数据和不一致数据的处理。【会员信息】工作簿的数据说明如表所示。字段描述示例会员编号会员的编号,统一由9位字符组成,以“NO”开始,且编号不能重复NO1002119用户名会员的昵称或系统自动生成昵称tb474994359年龄会员的年龄,规定为0~100之间的数字33性别会员的性别,该值只能是“男”或“女”女收货地址会员购买商品的邮寄地址,为文本型数据。为了保护会员的个人隐私,该数据已进行脱敏化处理浙江省金华市***职业会员的职业,文本型数据医务人员商务数据清洗方法1.重复数据清洗利用Excel2019【数据】选项卡中【数据工具】命令组的【删除重复值】将【会员信息】工作簿中的重复数据删除,其基本操作步骤如下。(1)打开【删除重复值】对话框。打开【会员信息】工作簿,选择非空单元格,在【数据】选项卡的【数据工具】命令组中,单击【删除重复值】图标,弹出【删除重复值】对话框。商务数据清洗方法1.重复数据清洗(2)设置【删除重复值】对话框。全选所有列,取消勾选【数据包含标题】,单击【确定】按钮,弹出【MicrosoftExcel】提示框,如右上图所示。(3)确认删除重复行。单击右上图中的【确定】按钮,重复数据只保留一行,其余均被删除。(4)检测【会员信息】是否还有重复数据。重复步骤(1)~步骤(2),弹出未发现重复值的提示框,如右下图所示,则表示重复数据已清洗完毕。商务数据清洗方法2.缺失数据清洗检测【会员信息】工作簿中各列数据记录数,确认各列是否存在缺失值,根据缺失数据所在列的不同情况选用合适的方法进行缺失数据的处理。(1)检测缺失数据COUNTBLANK函数可以实现对区域内空单元格的计数,当计算结果大于0时,表示存在缺失数据,其使用格式如下。其中,range参数表示要计数的单元格区域。利用COUNTBLANK函数检测数据中各列数据是否存在缺失情况,当统计结果大于0时,表示该列存在缺失数据,基本操作步骤如下。COUNTBLANK(range)商务数据清洗方法2.缺失数据清洗①判断“会员编号”列是否存在缺失数据。在A104单元格输入“=COUNTBLANK(A2:A103)”公式,按回车(Enter)键,如右上图所示。②判断其他各列是否存在缺失数据。选中A104单元格,在单元格的右下角【填充柄】上,光标变为“╋”时按下鼠标左键并向右拖曳至F104单元格,可得到所有列的缺失单元格数量,如右下图所示。经过计算得出“年龄”“性别”和“职业”列均存在缺失数据。商务数据清洗方法2.缺失数据清洗(2)用平均值替换数值缺失数据年龄数据属于数值型数据,进行缺失数据替换时可以选择使用平均值、中位数、众数等进行替换。此处通过平均值替换缺失数据,即利用Excel2019中AVERAGE函数计算“年龄”列现有数据的平均值,并通过IF函数判断单元格是否为空,若为空,则使用平均值替换缺失数据,若不为空,则保留原数据。AVERAGE函数可以实现对区域内数值型数据的平均值计算,其使用格式如下。AVERAGE函数的常用参数及其说明如右表所示。AVERAGE(number1,[number2,…])参数名称参数说明number1必需,表示要计算平均值的第一个数字、单元格或单元格区域number2可选,表示要计算平均值的第2~255个数字、单元格或单元格区域,最多可包含255个商务数据清洗方法2.缺失数据清洗IF函数可以根据条件表达式的真假(True或False)对单元格或单元格区域做出不同的逻辑结果,其使用格式如下。IF函数的常用参数及其说明如下表所示。IF(logical_test,[value_if_true],[value_if_false])参数名称参数说明logical_test必须,表示条件表达式value_if_true必须,表示条件为真(True)时的返回结果value_if_false可选,表示条件为假(False)时的返回结果商务数据清洗方法2.缺失数据清洗使用平均值替换“年龄”列缺失数据的基本操作步骤如下。①计算“年龄”列的平均值。清除检测缺失值数据的统计结果,在C104单元格输入“=AVERAGE(C2:C103)”公式,按回车(Enter)键,如图所示。说明:缺失数据也可以使用众数或中位数进行替换。众数函数为MODE、中位数函数为MEDIAN,它们的使用方法与平均值函数AVERAGE的用法相似,将本步骤中公式里的函数名更换即可。商务数据清洗方法2.缺失数据清洗②用平均值替换“年龄”列的所有缺失数据。在G2单元格输入“=IF(C2<>"",C2,30)”公式,按回车(Enter)键,将鼠标放至单元格右下角,当光标变为“╋”时,左键双击,可实现“年龄”列中缺失数据在G列对应单元格填充为30,如图所示。说明:以上①②两步可以合并为一步,即将第②步中的公式修改为“=IF(C2<>"",C2,AVERAGE(C2:C103))”也可实现如图的效果。商务数据清洗方法2.缺失数据清洗③用替换数据覆盖原始数据。选定G2:G103单元格区域,复制区域数据,选定C2单元格,右键单击,在弹出的快捷菜单中单击
按钮,实现只粘贴数值,如图所示。最后清除C104单元格的内容,并删除G列数据,完成【年龄】列缺失数据的替换操作。商务数据清洗方法2.缺失数据清洗(3)用众数替换文本缺失数据性别数据属于文本型数据,进行缺失数据替换时可以使用众数进行替换。利用Excel2019中COUNTIF函数分别计算“性别”列现有数据中数据值为“男”和“女”的单元格数量,将两个数值中的大数确定为众数,然后用众数替换缺失数据。COUNTIF函数可以统计满足给定条件的单元格区域内的单元格个数,其使用格式如下。其中,range参数表示要计数的区域,可以是数字、名称、数组或包含数字的引用。criteria参数为确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式、单元格引用或文本。COUNTIF(range,criteria)商务数据清洗方法2.缺失数据清洗使用性别众数替换性别缺失值的基本操作步骤如下。①统计不同性别的会员数量。在H2单元格输入“=COUNTIF(D2:D103,”男“)”公式,按Enter键,可统计出“性别”列中数据值为“男”的单元格数量。同理,在H3单元格统计出“性别”列中数据值为“女”的单元格数量,结果如图所示。经过比较,发现女性的会员数量比较多,所以“女”为该列众数。商务数据清洗方法2.缺失数据清洗②用众数替换缺失数据。在G2单元格输入“=IF(D2="","女",D2)”,按Enter键,将鼠标放至单元格右下角,当光标变为“╋”时,左键双击,可实现“性别”列中缺失数据在G列对应单元格填充为“女”,如图所示。③用替换数据覆盖原始数据。选定G2:G103单元格区域,复制区域数据,选定D2单元格,右键单击,在弹出的快捷菜单中单击选项,实现只粘贴值。最后删除G列和H列数据,完成“性别”列缺失数据的替换操作。商务数据清洗方法3.异常数据清洗依据【会员信息】工作簿各字段的数据规则,检测各列数据是否存在异常数据。对于查找出的异常数据应该寻找数据来源比对纠正,若无法纠正,则直接删除异常数据。(1)清洗文本型异常数据“会员编号”列数据要求有9位字符组成,以“NO”开始,不符合要求的数据即为异常数据。通过Excel2019中IF、LEN和LEFT函数的嵌套使用,分别计算字符串长度是否符合要求,判断字符串是否以“NO”开始。LEN函数可以返回字符串的长度,即字符个数,其使用格式如下。其中,text参数表示统计长度的字符串,可以是字符串、单元格名称等。LEN(text)商务数据清洗方法3.异常数据清洗LEFT函数可以返回字符串左侧指定数量的连续字符,其使用格式如下。其中,text参数表示被截取的字符串,num_chars参数表示指定的数量。LEFT(text,[num_chars])商务数据清洗方法3.异常数据清洗检测“会员编号”列中的数据是否异常的基本操作步骤如下。①判断“会员编号”列数据长度是否符合数据长度要求。在G2单元格中输入“=IF(LEN(A2)=9,"符合","不符合")”,按Enter键;选中G2单元格,将鼠标放至单元格右下角,当光标变为“+”时,左键双击,可得到“会员编号”列数据是否符合长度为9的要求结果,如图所示。商务数据清洗方法3.异常数据清洗②筛选出异常数据。选中G1:G103单元格区域的数据,在【开始】选项卡的【编辑】命令组中,单击【排序和筛选】图标下【筛选】命令;单击G1单元格旁边的按钮,在弹出的快捷菜单中仅勾选【不符合】选项,如右图所示;单击【确定】按钮,筛选出异常数据,如下图所示。商务数据清洗方法3.异常数据清洗③删除异常数据。选中筛选出的所有行,右键单击,在弹出的快捷菜单中选择【删除行】选项,如图所示,删除会员编号不符合要求的记录,最后取消数据筛选。④判断会员编号是否以NO开头,若不符合要求,则做修正处理。在H2单元格中输入“=IF(LEFT(A2,2)="NO",A2,"NO"&RIGHT(A2,7))”公式,该公式表示如果A2单元格数据符合以“NO”开头的要求,那么将该数据复制到H2单元格中;如果不符合要求,那么用“NO”连接原数据的后7位字符组成新的数据放在H2单元格中。商务数据清洗方法3.异常数据清洗⑤修正所有不符合NO开头要求的会员编号数据。选中H2单元格,在单元格的右下角【填充柄】上,光标变为“+”时左键双击,可使“会员编号”列所有数据符合以“NO”开始的要求,如图所示。⑥用修正后的数据覆盖原始数据。选定H2:H103单元格区域,复制区域数据,选定A2单元格,单击右击,在弹出的快捷菜单中单击选项,实现只粘贴值。最后删除G列和H列数据,完成“会员编号”列异常数据的纠正。商务数据清洗方法3.异常数据清洗(2)清洗数值型异常数据“年龄”列的数据要求是在0~100之间的数字,但结合实际生活,有能力进行电子商务活动的人群主要集中在12岁~70岁之间,但也不能确定小于12岁或大于70岁的数据就是异常数据。此处将采用箱形图查看“年龄”列的数据分布情况,找出离群点,确定异常数据,基本操作步骤如下。商务数据清洗方法3.异常数据清洗①绘制箱形图查看异常数据。选定C2:C95单元格区域,在【插入】选项卡的【图表】命令组中,单击右下角的按钮,打开【插入图表】对话框,单击【所有图表】选项,在左侧列表中选择【箱形图】,如右图1所示。图1图2②生成箱形图。单击右图1中的【确定】按钮,即可绘制箱形图,将图表标题修改为“查找异常年龄”,如右图2所示。通过右图2可以看出,年龄存在异常数据,主要分布在小于10、大于50的区域,可以使用筛选方法找出异常数据,再进行删除处理。商务数据清洗方法3.异常数据清洗③打开【自定义自动筛选方式】对话框。选中C列数据,在【开始】选项卡的【
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年宜昌市“招才兴业”事业单位人才引进公开招聘189人备考题库·武汉大学站及答案详解1套
- 2026年中国安能集团第一工程局有限公司湖南分公司招聘备考题库及一套参考答案详解
- 2026年度郴州市国资委“英培计划”人才选拔29人备考题库及一套答案详解
- 2026年东莞市高埗镇东联小学招聘临聘教师备考题库及一套答案详解
- 2026年内蒙古农村商业银行管理人员及专业人才公开招聘备考题库及答案详解参考
- 2026年宁夏黄河农村商业银行科技人员社会招聘备考题库及完整答案详解一套
- 2026年多伦县职业教育中心招聘1人备考题库及完整答案详解一套
- 2026年吴川市公开招聘大学生乡村医生28人备考题库带答案详解
- 2026年三明经济开发区管理委员会关于直属事业单位公开招聘专业技术人员备考题库及参考答案详解
- 2026年北京航空航天大学软件学院聘用编科研助理F岗招聘备考题库完整参考答案详解
- 2024-2025学年北京朝阳区九年级初三(上)期末历史试卷(含答案)
- 车辆维修安全培训
- 2025版国家开放大学法学本科《知识产权法》期末纸质考试总题库
- DB11T 354-2023 生活垃圾收集运输管理规范
- 赤石特大桥施工安全风险评估报告
- 九宫数独200题(附答案全)
- QBT 2770-2006 羽毛球拍行业标准
- 部编版八年级上册语文《期末考试卷》及答案
- 售后服务流程管理手册
- 2020-2021学年新概念英语第二册-Lesson14-同步习题(含答案)
- 地下车库建筑结构设计土木工程毕业设计
评论
0/150
提交评论