数据采集与处理 课件项目六 数据分类与处理_第1页
数据采集与处理 课件项目六 数据分类与处理_第2页
数据采集与处理 课件项目六 数据分类与处理_第3页
数据采集与处理 课件项目六 数据分类与处理_第4页
数据采集与处理 课件项目六 数据分类与处理_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据采集与处理》数据分类与处理项目六CONTENT目录任务一数据分类与处理认知任务二数据分类统计任务三数据处理任务四

数据计算学习目标知识目标技能目标1.了解数据分类与处理的作用和原则;2.熟悉Excel中数据分类统计的方法;3.熟悉数据处理的步骤及方法;4.了解电子商务数据计算的常用方法。1.能够使用Excel分类汇总、数据透视表等方法对数据进行分类统计;2.能够根据数据处理目标对数据进行清洗、转化及排序等操作;3.能够使用公式对电子商务运营数据进行计算。任务一数据分类与处理认知任务一数据分类与处理认知

电子商务运营过程中,行为与反馈均可通过数据量化。通过数据分类与处理,可以更加清晰地了解当前状况,更加有效地监控运营过程和目标。1、集中、系统地反映客观实际

数据本身是杂乱无意义的,只有通过分类与处理,才能呈现出一定的规律,挖掘出行为背后潜在的巨大价值。数据分类与处理的维度越多,展示给数据分析的范围就越广,提取到的有用信息也就越丰富。

3.发现规律,实现深度挖掘数据分类与处理的作用任务一数据分类与处理认知客观性原则

坚持用数据说话的基本原则,分类与处理结果应准确、可靠并且客观,应能如实反映企业运营现状。完整性原则

数据分类与处理不是单个数据的整理活动,而是具有相当体量、相互关联、需要进行引用的数据库集成,这一阶段越完整,下一步的数据分析就越全面、越深入。同时,完整性原则还体现在对数据表中字段属性的约束,包括字段的值域、字段的类型和字段的有效规则等。数据分类与处理的原则任务一数据分类与处理认知针对性原则

针对性原则要求紧贴电子商务数据处理方案的要求,依据数据加工的目标,针对不同类型数据的复杂程度、难易程度,选择合适的方法,使结果符合实际需求。严谨性原则

数据分类与处理是整个数据分析过程中最占时间和精力的环节,同时也由于数据的庞大、繁琐而让这一过程显得枯燥乏味,出错的概率较大。便捷性原则

数据分类与处理的结果应便于观察、对比、分析,能简单快速调用,易于发现规律。任务一数据分类与处理认知分类统计根据统计目的将采集到的原始数据分门别类进行统计归类。数据清洗将数据表中多余、重复的数据筛选出来并删除,将缺失、不完整的数据补充填补,将内容、格式错误的数据纠正或剔除的操作行为。数据转化对数据的格式或结构进行转换。数据排序按照一定的规则将数据排列。数据计算对数据表中的数据有目的的进行加、减、乘、除等计算。数据分类与处理的方法任务二数据分类统计任务二数据分类统计数据透视表分类汇总函数合并计算任务二数据分类统计分类汇总

“分类汇总”是对特定类别下的特定信息进行汇总,其步骤是先分类,后汇总,因此汇总前必须先对汇总的数据进行排序。

在“数据”选项卡下的“分级显示”功能组中单击“分类汇总”按钮,打开“分类汇总”对话框,选择“分类字段”、“汇总方式”和“汇总项”。任务二数据分类统计左侧分级显示列表,点击即可显示或隐藏数据明细。分类汇总结果当需要对多个字段同时进行分类汇总,以达到用不同条件对数据进行汇总的目的时,可以选择使用嵌套分类汇总,即在一个已经进行了分类汇总的工作表中继续创建其他分类汇总。嵌套分类汇总任务二数据分类统计合并计算

“合并计算”在Excel2016版本中位于“数据”选项卡下“数据工具”功能组中,其功能是对多个分散的数据进行汇总计算。“合并计算”能够帮助用户将特定单元格区域中的数据,按照项目的匹配,对同类数据进行汇总。

选中数据区域外的单元格,为汇总结果指定存放位置,点击“合并计算”按钮,在打开的“合并计算”对话框中,选择所需的“函数”,指定引用位置,单击“添加”按钮,多个表格合并计算时,需要多次添加,然后在标签位置对“首行”和“最左列”打勾,以便显示标签行和标签列。任务二数据分类统计“合并计算”结果任务二数据分类统计函数

函数是Excel预先定义好的特殊公式,在执行数据统计、数据计算、数据分析等任务中功能强大。函数通常是由函数名称、左括号、参数、半角逗号和右括号构成。格式SUMIF(range,criteria,sum_range)功能根据指定条件对若干单元格求和说明参数range用于条件判断的单元格区域,即求和的原始区域;参数criteria是进行累加的单元格应满足的条件,用于筛选哪些单元格满足求和条件,其形式可以为数字、表达式或文本;参数sum_range指求和的实际单元格,如果省略该参数,则直接对range中的单元格求和。函数SUMIF,即条件求和函数任务二数据分类统计输入函数函数计算结果该店铺无线端的流量来源主要有“付费流量”、“淘内免费”和“自主访问”三类,位于工作表中的C列,访客数位于E列。在H2单元格中输入公式=SUMIF(C:C,"付费流量",E:E),表示计算C列中内容为“付费流量”对应于E列中的访客数之和。任务二数据分类统计数据透视表

数据透视表是一种交互式的表,是计算、汇总和分析数据的强大工具,它不但可以进行数据计算,还可以动态地改变版面布置,任意组合字段,而且在每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。任务二数据分类统计单击“确定”后,Excel自动创建一个空白的数据透视表框架,同时在其右侧展开“数据透视表字段列表”窗格。将需要汇总的字段拖动至相应的“筛选器”、“行”、“列”、“值”区域,生成报表。2如需修改值汇总方式,可单击数值汇总区域中需要调整的字段,选择“值字段设置”命令,然后根据需求进行更改任务三数据处理任务三数据处理数据清洗将数据表中多余、重复的数据筛选出来并删除,将缺失、不完整的数据填补,将内容、格式错误的数据纠正或剔除的操作行为。缺失值清洗逻辑错误清洗无价值数据清洗格式内容清洗重复数据清洗数据集中某个或某些属性的值是不完整的由于系统导出渠道或人为输入习惯的原因,整合而来的原始数据往往不能做到格式统一,内容上也容易出现空格违反逻辑规律的要求和逻辑规则而产生的错误,一般使用逻辑推理就可以发现问题。数据被重复、多次记录。重复数据会影响数据处理结果的正确性,从而导致数据分析出现偏差,因此需要将其删除。对本次数据统计或数据分析没有产生作用的数据,直接删除对应的字段即可。任务三数据处理缺失值清洗步骤1:打开原始数据表格,选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和选择”按钮,点击“定位条件”命令,在弹出的“定位条件”对话框中,选中“空值”,点击“确定”后,所有的空值即可被一次性选中任务三数据处理步骤2:定位到空白值后,直接输入需要补充的内容,按“Ctrl+Enter”快捷键,进行批量填充,根据计算公式:下单转化率=下单买家数/访客数,在G6单元格中输入公式“=F6/E6”,然后按“Ctrl+Enter”进行批量计算。任务三数据处理格式内容清洗“支付转化率”列包含了百分比和小数两种形式,“流量来源”列的字符中间存在空格,需要将其修正,具体操作如下。任务三数据处理步骤1:选中“支付转化率”整列,右键打开弹出式菜单,点击“设置单元格格式”选项,在弹出的“设置单元格格式”对话框中,选择“数字”选项卡,点击“百分比”设置小数位数为2。点击“确定”完成任务三数据处理步骤2:“流量来源”列数据中的空格可以使用“替换”一次性批量去除。选中数据区域,在“开始”选项卡下的“编辑”功能组中单击“查找和选择”按钮,点击“替换”命令,“查找内容”输入一个空格,“替换为”则不输入任何内容,点击“全部替换”即可全部删除表格中的空格。任务三数据处理逻辑错误清洗数据不合理如客户年龄500岁,或者消费金额为-100元,明显不符合客观事实数据自相矛盾如客户的出生年份是1980年,但年龄却显示18岁数据不符合规则如限购1件的商品,客户的购买数量却为3数据逻辑错误种类任务三数据处理北京特产专营店上新一款茯苓饼,并推出优惠试吃活动,每人限购1件。下图是其运营人员导出的该商品订单表,下面将以表中数据为例,进行数据逻辑错误检查。任务三数据处理步骤1:由于该商品限购1件,因此需要将“购买数量”大于1的记录标注出来。选中“购买数量”列,选择“开始”选项卡——“样式”功能组——“条件格式”——“突出显示单元格规格”——“大于”,在弹出的“大于”对话框中,填入数值“1”,点击“确定”即可将错误数据标注出来。任务三数据处理步骤2:尽管用户在付款时可能会使用优惠券或红包,但支付金额仍不会为负,因此,条件格式选择“小于”即可将“支付金额”列的错误数据标注出来。任务三数据处理步骤3:除此之外,“签收时间”应晚于“订单创建时间”,否则该条记录便属于异常。选中“签收时间”列,选择“开始”选项卡——“样式”功能组——“条件格式”——“突出显示单元格规格”——“其他规则”,在弹出的“新建格式规则”中,规则类型选择“使用公式确定要设置格式的单元格”,编辑规则为“=L1<I1”,设置格式为背景色蓝色,点击“确定”即可将错误数据标注出来。任务三数据处理重复数据清洗步骤1:选中工作表中的数据区域,在“数据”选项卡下的“数据工具”功能组中,单击“删除重复项”,在弹出的“删除重复项”对话框中,选择要删除的列,默认情况下所有列同时选中,否则会产生误删任务三数据处理步骤2:单击“确定”按钮完成重复项删除,Excel将显示一条消息,指出有多少重复值被删除,多少唯一值被保留。任务三数据处理数据转化对数据的格式或结构进行转换,是数据处理的前期准备。数据转化包括数据表的行列互换、文本数据提炼等。数据表的行列互换步骤1:打开Excel数据表,选中目标内容,按住“Ctrl+C”组合键进行复制任务三数据处理步骤2:选中要进行数据复制的单元格,点击“开始”选项卡,在“剪贴板”功能组中单击“粘贴”——“转置”按钮,即可让选中的内容进行行列互换,得到新数据表还可以使用键盘快捷方式,按“Ctrl+Alt+V”快捷键会弹出对话框,勾选“转置”复选框,即可实现转置粘贴。任务三数据处理文本数据提炼在导入文本数据时,有时多项数据会显示在同一单元格中,需要对数据进行提炼,使相同属性的数据位于同一列中。文本数据的提炼涉及到文本函数的运用LEFT函数,用于获取字符串左边指定个数的字符EFT函数的语法为:=LEFT(text,[num_chars]),其中text为要取得给定值的文本数据源,num_chars表示需要从左开始算提取几个字符数,其中每个字符按1计数。任务三数据处理RIGHT函数,用于获取字符串右边指定个数的字符RIGHT函数的语法为:=RIGHT(text,[num_chars]),其中text为要取得给定值的文本数据源,num_chars表示需要从右开始算提取几个字符数,其中每个字符按1计数。MID函数,用于获取字符串从指定位置开始指定个数的字符MID函数的语法为:=MID(text,start_num,num_chars),其中text为要取得给定值的文本数据源,start_num表示指定从第几位开始提取,num_chars表示需要从指定位置开始算提取几个字符数,其中每个字符按1计数。任务三数据处理现需要对数据表中的客户姓名、电话、商品口味等信息分别进行提炼步骤1:现要将表格中的客户姓名提炼出来,可以使用LEFT函数,选定客户姓名要放置的单元格,随后点击插入函数“fx”,选择文本函数,从中选取LEFT函数,随后分别输入文本源和数值,如提取A1单元格中,从左开始的7个字符数,点击“确定”,完成姓名提取,如图任务三数据处理步骤2:接下来完成电话号码的提炼,选取文本函数中的MID函数,如图6-33所示,电话号码是从第8位字符开始的,需要提取11位字符,输入参数,点击确定,即可完成电话号码的提炼。任务三数据处理步骤3:提取商品口味,选取文本函数中的RIGHT函数,订单号为从右开始的6个字符,输入函数参数,点击确定,即可完成商品口味的提炼任务三数据处理数据类型的转换数值转字符在Excel输入数据的时候,会默认使用数值型数据,若是数字太长,会变成科学计数法,不利于查看数据任务三数据处理步骤1:在Excel中打开数据表,选择要转换的数字所在的单元格,随后单击“数据”选项卡中的“分列”按钮,在文本分列向导中,使用默认设置,连续点击下一步,完成第1步和第2步的设置。步骤2:进入文本分列向导第3步,单击“列数据格式”下的文本,点击“完成”即可完成设置步骤3:设置完成后,返回Excel数据表,数据前有小三角符号,代表已转换成功。任务三数据处理字符转数值在进行数据统计时,有时获取的原始数据是以文本字符形式展现的。虽然不影响数据展现,但无法进行计算。任务三数据处理将文本字符转换为数值有两种方法,第一种参考数值转文本字符的方法,但在第三步选择“列数据格式”时,勾选“常规”,点击“完成”即可完成转换直接选中要转换的数据列,点击数据列前出现的提醒符号,在给出的选项中点击“转换为数据”,即可将文本型字符转换为数值任务三数据处理文本日期转标准日期在某些统计数据列表中,日期是以文本形式展现的,不是标准日期步骤1:在Excel中打开数据列表,选中为文本格式的日期信息,随后单击“数据”选项卡中的“分列”,在文本分列向导中,使用默认设置,连续点击下一步,完成第1步和第2步的设置,进入第3步后,在列数据格式选择“日期”,在其下拉列表中选择“YMD”选项。点击“完成”后,即可完成标准日期的转换任务三数据处理步骤2:转换后的月份和日期都是单数显示,想要转换成双数,可以打开“设置单元格格式”对话框,在设置页面选择分类为“自定义”,右面的类型设置为“yyyy-mm-dd”,设置完成后点击“确定”按钮,即可完成日期双数的设置。任务三数据处理数据排序简单排序简单排序高级排序自定义排序针对单列数据进行的快速排序,即只有一个关键字段。图是北京特产专营店2月份的无线端流量结构月报,下面将以表中数据为例,采用从高到低的方式,快速找到带来访客数最多的流量来源明细。任务三数据处理点击“访客数”列的任一单元格,在“数据”选项卡下的“排序和筛选”功能组中单击“降序”按钮,即可完成排序,得到该网店无线端推广的效果排行,如图6-49所示。从表中数据可以得出,手淘搜索引流效果最好。任务三数据处理高级排序针对多列数据进行的多重排序,即排序条件包含多个关键字段。以图所示的数据为例,“访客数”从高到低排列后,发现有几条记录的访客数是相同的在这种情况下,引入第二关键字。即修改“北京特产专营店2月份无线端流量结构月报”的排序条件为:按“访客数”降序排列,在“访客数”相同的情况下按“下单买家数”降序排列任务三数据处理步骤1:在“排序”对话框中,“主要关键字”选择“访客数”,“排序依据”选择“数值”,“次序”选择“降序”。步骤2:单击“添加条件”按钮,新增次要关键字,设置参数为“下单买家数”、“数值”、“降序”,排序结果如图。任务三数据处理自定义排序在进行自定义排序时,必须先建立需要排序的自定义序列项目,然后才能根据设置的自定义序列对表格进行排序。下面以图中数据表为例,对其流量来源按照“淘内免费”-“付费流量”-“自主访问”进行排序任务三数据处理步骤1:选择“文件”选项卡下的“选项”命令,弹出“Excel选项”对话框,在“高级”标签下,找到“常规”栏目,单击“编辑自定义列表”按钮。步骤2:在弹出的“自定义序列”对话框中,输入序列,单击“添加”按钮,将其添加到自定义序列中,点击“确定”按钮完成。任务三数据处理步骤3:返回Excel文档中,在“数据”选项卡下的“排序和筛选”功能组中单击“降序”按钮,弹出“排序”对话框,“主要关键字”选择“流量来源”,“排序依据”选择“数值”,“次序”选择“自定义序列”。任务三数据处理步骤4:在弹出的“自定义序列”对话框中,选择已经定义好的序列。步骤5:单击“确定”按钮,完成自定义排序。任务四数据计算任务四数据计算常规计算公式计算与函数计算?利用公式完成数据计算利用函数完成数据计算任务四数据计算日期计算提取日期信息并计算、计算日期间相差天数提取日期信息并计算TODAY函数函数格式:TODAY

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论