ETL数据整合与处理(Kettle)教学大纲教案_第1页
ETL数据整合与处理(Kettle)教学大纲教案_第2页
ETL数据整合与处理(Kettle)教学大纲教案_第3页
ETL数据整合与处理(Kettle)教学大纲教案_第4页
ETL数据整合与处理(Kettle)教学大纲教案_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

泰迪智能科技官网:/联系方式:4006840020泰迪智能科技官网:/联系方式:4006840020《ETL数据整合和处理》教学大纲课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分课程的性质大数据和人工智能时代已经到来,大数据是海量的数据集合。如果把人工智能看成一个嗷嗷待哺拥有无限潜力的婴儿,某一领域专业的海量的、深度的数据就是喂养这个天才的奶粉。奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智力发育水平。帮助行业的客户在合理时间内获取、处理和存储海量的数据,为企业提供符合大数据和人工智能服务质量的数据,就需要使用ETL数据整合和处理技术。数据整合和处理技术是数据分析中的一门先导技术,具有实践经验的数据分析人才,成为了当今企业大数据和人工智能迫切需要的热门人才。为了推动我国大数据、云计算和人工智能行业的发展,满足日益增长的数据分析人才的需求,特开设《ETL数据整合和处理》课程。课程的任务通过对本课程的学习,使学生学会以任务的形式,以处理食品销售数据为例,按照ETL的流程,掌握获取数据,以及数据清洗、删除、合并、去重、排序、过滤和输出等数据整合与处理的操作,掌握数据计算和统计,以及将结果输出到数据文件的方法,学会构建任务操作流程,设定调度时间,自动执行数据整合和处理的任务。并通过真实的无人售货机企业项目案例,理论与案例实践相结合,进一步控股所学到的操作和方法,为将来从事数据处理与分析、数据挖掘研究等大数据工作奠定基础。课程学时分配序号教学内容理论学时实验操作学时其它1项目1开启ETL之旅332项目2获取食品销售源数据333项目3整合和处理食品销售数据884项目4统计食品销售数据775项目5执行食品销售数据整合与处理任务666项目6无人售货机零售项目实战37总计3034教学内容及学时安排理论教学序号章节名称主要内容教学目标学时1开启ETL之旅了解ETL的基本概念了解ETL常用工具安装JDK安装MySQL数据库安装Kettle和配置运行环境熟悉Kettle界面和菜单功能转换与任务工程工程运行与查看结果面板了解ETL的基本概念和常用的工具掌握JDK、MySQL、Kettle的安装和配置Kettle运行环境熟悉Kettle菜单功能和基本操作掌握转换和任务工程的创建,以及它们的区别掌握工程运行与结果面板的查看32项目2获取食品销售源数据创建数据库连接转换工程,并创建数据库连接,测试连接结果共享/停止共享数据库连接创建获取源数据转换工程,创建数据库表输入组件,熟悉组件的参数和使用创建CSV文件组件,熟悉组件的参数和使用创建Excel输入组件,熟悉组件的参数和使用掌握创建数据库连接的方法,以及设置共享/停止共享数据库连接掌握表输入、CSV文件、Excel输入等常用源数据获取组件的创建和参数说明,熟练使用组件获取数据和预览到数据33项目3整合和处理食品销售数据建立整合和处理食品销售数据转换工程。处理多文件销售数据,分别创建排序记录、Multiwaymergejoin(多路合并)、字段选择和Iffieldvalueisnull等组件和连接,熟悉组件的参数和使用合并数据,分别创建合并记录、排序合并组件和连接,熟悉组件的参数和使用创建剪切字符串组件和连接,熟悉组件的参数和使用创建拆分字段组件和连接,熟悉组件的参数和使用删除数据中重复记录,创建字段选择、过滤记录组件和连接,熟悉组件的参数和使用替换不规范的字段,创建过滤记录、字符串操作组件和连接,熟悉组件的参数和使用输出销售数据到数据库表,创建表输出组件和连接,熟悉组件的参数和使用掌握排序记录、Multiwaymergejoin、字段选择和Iffieldvalueisnull、合并记录、排序合并、剪切字符串、拆分字段串、过滤记录、字符串操等组件与连接操作,以及参数说明,熟练使用组件进行数据处理,学会浏览结果数据掌握表输出组件与连接操作,以及参数说明,熟练使用组件进行数据输出,学会浏览结果数据84项目4统计食品销售数据计算销售单利润和利润率,创建利用Janino计算Java表达式组件和连接,熟悉组件的参数和使用计算销售单价,创建计算器组件和连接,熟悉组件的参数和使用聚合统计销售额数据,创建分组、单变量统计、文本文件输出组件和连接,熟悉组件的参数和使用统计平台食品销售数据,创建分组、表输出组件和连接,熟悉组件的参数和使用统计分公司食品销售数据,创建分组、公式、插入/更新组件和连接,熟悉组件的参数和使用统计商品品牌食品销售数据,创建排序、分组、SQL文件输出组件和连接,熟悉组件的参数和使用对销售额进行离散化分段统计,创建数值区间、分组、MicrosoftExceloutput(Excel输出)组件和连接,熟悉组件的参数和使用掌握利用Janino计算Java表达式、计算器、单变量统计、分组、数值区间等组件的创建和参数说明,熟练使用组件计算数据和浏览结果数据掌握文本文件输出、表输出、插入/更新、SQL文件输出、MicrosoftExceloutput组件的创建和参数说明,熟练使用组件进行数据输出和浏览结果数据75项目5执行食品销售数据整合与处理任务建立任务工程,创建组件和连接,熟悉组件的参数和使用检查输入源数据文件,创建检查多个文件是否存在、等待组件和连接,熟悉组件的参数和使用检查输出数据表,创建检查表是否存在、SQL组件组件和连接,熟悉组件的参数和使用执行数据整合与处理工程任务,创建转换组件和连接,熟悉组件的参数和使用添加日志文件,创建添加文件到结果文件中组件和连接,熟悉组件的参数和使用发送日志邮件,创建发送邮件组件和连接,熟悉组件的参数和使用结束任务,创建成功组件和连接,熟悉组件的参数和使用掌握Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等组件创建和参数说明,熟练使用组件运行转换任务和浏览到任务结果66项目3整合和处理食品销售数据了解无人售货机项目背景与目标理解项目的数据字段理解统计客户订单数据任务的数据需求和流程,创建转换工程和组件,统计客户订单数据理解统计商品销售数据任务数据需求和流程,创建组件,统计商品销售数据理解统计售货机日销售数据任务数据需求和流程,创建组件,统计售货机日销售数据理解统计售货机销售盈利数据任务数据需求和流程,创建组件,统计售货机销售盈利数据了解无人售货机项目背景与目标理解项目的数据字段理解统计客户订单数据的需求和流程,并完成统计客户订单数据理解统计商品销售数据需求和流程,并完成统计商品销售数据理解统计售货机日销售数据需求和流程,并完成统计售货机日销售数据理解统计售货机销售盈利数据需求和流程,统计售货机销售盈利数据3学时合计30实验教学序号实验项目名称实验要求学时1项目1开启ETL之旅安装MySQL安装JDK,设置Java运行环境变量安装Kettle软件系统与配置Kettle运行环境创建Kettle转换工程和任务工程创建CSV文件输入组件,设置参数导入“食品销售数据-B平台.csv”CSV文件,并预览结果32项目2获取食品销售源数据创建数据库连接设置共享/停止共享数据库连接创建转换工程,分别创建表输入、CSV文件、Excel输入等组件,设置参数、获取不用来源的食品销售数据,并浏览到结果数据获取并浏览到数据库中的“日化销售数据-a平台”数据获取并浏览到“日化销售数据-B平台.csv”文件的数据。获取并浏览到“日化销售数据-C平台.xls、日化销售数据-C平台1.xls”两份文件的数据33项目3整合和处理食品销售数据创建转换工程,处理多份不同来源的食品销售数据并整合成一份输出数据。分别创建排序记录、Multiwaymergejoin、字段选择、Iffieldvalueisnull、合并记录、排序合并、剪切字符串、拆分字段串、过滤记录、字符串操等组件与连接,设置参数处理多份不同来源的食品销售数据;创建表输出组件,设置参数,把处理好的数据输出到数据库“食品销售数据”表中,并预览到结果数据合并“日化销售数据-D平台1.xls、日化销售数据-D平台1.xls”两份数据,输出到“日化销售数据-D平台.xls”文件中,并预览到结果数据分别对“日化销售数据-B平台.xls、日化销售数据-C平台.xls”两份数据进行处理,并预览到处理结果数据整合“日化销售数据-A平台.xls”,以及上面2、3等A、B、C、D平台的日化销售数据,输出至数据库“日化销售数据”表中,并预览到结果数据对“日化销售数据-B平台.xls”文件中的数据进行处理,输出至数据库“日化销售数据”表中,并预览到结果数据84项目4统计食品销售数据创建转换工程,将项目3处理好的数据库“食品销售数据”表数据,分别统计后并输出结果数据。分别创建Janino计算Java表达式、计算器、单变量统计、公式、数值范围和分组等统计数据组件,并建立组件之间连接,设置参数统计食品销售数据;分别创建文本文件输出、插入/更新数据库表、SQL文件输出和Excel文件输出等输出文件组件,并建立组件之间连接,设置参数,把统计好的结果数据输出到文件中,并预览到结果数据使用数据库“日化销售数据”表数据,计算日化销售数据各个订单的利润、利润率,并预览到结果数据在上面2统计的日化销售数据基础上,统计各个平台日化销售数据,并输出至Excel文件中,并预览到结果数据在上面2统计的日化销售数据基础上,统计分公司日化销售数据,并输出至Excel文件中,并预览到结果数据在上面2统计的日化销售数据基础上,统计商品品牌的日化销售数据,并输出至Excel文件中,并预览到结果数据使用“日化销售数据-A平台.xls”文件数据,计算每个订单的利润、利润率;统计A平台的销售数量、成本总额、销售总额和利润总额;统计各分公司的销售数量、成本总额、销售总额和利润总额;统计的各分公司销售总额数据,总额大于100万,评为优秀经营公司;统计各商品品牌的统计销售数量、成本总额、销售总额和利润总额和利润率;分别预览到结果数据,并输出到有关文件中75项目5执行食品销售数据整合与处理任务创建任务工程,设定时间触发任务,自动地完成整合与处理食品销售数据转换工程的操作。分别创建Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等组件,并建立组件之间连接,设置参数,完成整合与处理食品销售数据的转换任务,并预览到任务执行结果构建任务工程,设置调度时间,自动执行整合和处理日化销售数据转换工程的操作,并预览到任务执行结果构建任务工程,设置调度时间,自动执行统计平台日化销售数据转换工程的操作,并预览到任务执行结果构建任务工程,设置调度时间,自动执行统计A平台日化销售数据转换工程的操作,并预览到任务执行结果66项目6无人售货机零售项目实战了解实战项目的背景和分析流程理解实战项目使用数据字段说明使用客户订单列表、客户订单详情数据,创建转换工程,利用有关组件,实现以下项目:①统计客户订单数据②统计商品销售数据③统计售货机日销售数据④统计售货机销售盈利数据⑤统计商品的年销售数据⑥统计售货机每月的订单数据⑦统计售货机的产品销售金额和利润数据,列出建议撤掉5个地址的售货机数据⑧统计售货机的商品销售数据,并按照从高到低的顺序进行排序⑨构建任务工程,把⑤~⑧的转换工程,分别加载至任务中,设定调度时间,自动统计无人售货机销售数据7学时合计34考核方式突出学生解决实际问题的能力,加强过程性考核。课程考核的成绩构成=平时作业(10%)+课堂参与(20%)+期末考核(70%),期末考试建议采用开卷形式,试题应包括ETL基本概念、组件与参数、分组聚合、数据合并、数据清洗等内容,题型可采用判断、选择、简答、应用题等题型。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目1开启ETL之旅教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:6学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标讲授ETL的基本概念和相关技术,选择流行的Kettle软件为教学的ETL工具,讲授Kettle及支撑其运行的JavaJDK工具包、MySQL数据库等软件的安装,以及Kettle运行环境的配置,并详细讲授Kettle的界面、运行和结果查看等基础操作。让学生达到以下教学目标:了解ETL的基本概念和典型的ETL工具。掌握Kettle运行环境的安装和配置。熟悉Kettle的界面。掌握Kettle的基础操作。掌握Kettle中转换和任务的区别。掌握创建第一个转换工程及其组件的操作,以及查看结果。掌握创建第一个任务工程及其组件的操作,以及查看结果。基本要求了解ETL的概念。了解ETL的技术。了解ETL的流程。了解Kettle的优点。了解Kettle的应用场景。掌握JDK、MySQL和Kettle的安装和配置。掌握Kettle常用菜单功能的使用。了解Kettle中转换和任务的区别。掌握创建转换工程及其组件的操作,查看结果。掌握创建任务工程及其组件的操作,查看结果。问题引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。ETL是什么?生活中哪些数据需要进行清洗?数据抽取的方式有哪些?数据装载是指什么?Kettle工具需要花钱购买吗?Kettle有哪些优点?Kettle最基础的操作是什么?转换和任务分别是什么?探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。ETL的处理过程是怎么样的?ETL能够应用在那些场景?选择ETL工具,通常考虑哪些因素?使用Kettle为什么要安装数据库?Kettle的应用场景有哪些?Kettle需要建立什么,使用什么,才能对数据进行清洗、转换、集成等操作?转换和任务有什么不同?Kettle需要查看什么,才能看到执行结果?拓展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研究探讨,从而完成拓展性的问题。Excel也能对数据进行处理,为什么还要使用ETL工具?Kettle采用图形化界面操作,有什么好处?哪些场景的数据迁移和装载,不需使用数据库?为什么要有转换和任务两种操作?主要知识点、重点与难点主要知识点ETL的概念、流程与应用场景。ETL的处理流程。JDK、MySQL和Kettle的安装和配置。Kettle的常用功能。转转和任务的操作。重点ETL的概念、流程与应用场景。Kettle常用的应用场景和功能。转转和任务的功能。难点ETL的流程。转转和任务的异同。教学过程设计理论教学过程ETL的概念。ETL的技术。ETL的应用场景。ETL的常用工具和选择。Kettle软件的优点。Kettle中转换与任务的区别。实验教学过程在Windows系统上安装JDK、MySQL和Kettle软件。Kettle软件菜单常用功能的使用。创建Kettle第一个转换工程和组件。创建Kettle第一个任务工程和组件。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目2获取食品销售源数据教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:6学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标在Kettle软件上,讲授Kettle与MySQL数据库之间的连接。讲授从数据库、Excel和CSV文件等源数据中获取食品销售数据数据的方法和操作。让学生达到以下教学目标:掌握数据库连接的创建方法和参数设置。熟悉获取不同来源数据的常用方法。掌握获取不同来源数据的组件及其参数设置。熟悉预览组件处理后结果数据的方法。基本要求掌握Kettle与MySQL数据库之间的连接。熟练建立转换工程和创建相关的转换组件。掌握获取源数据的常用组件和参数设置。熟练浏览组件执行结果和掌握出错处理方法。问题引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。Kettle通过什么方法与数据库建立连接?Kettle是怎样获取数据的?Kettle可以获取哪些典型类型文件的数据?获取源数据需要编程吗?探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。获取源数据的处理过程是怎么样的?组件是什么?组件参数有什么用?获取数据库数据与文件数据的方法是否一样?获取Excel、CSV文件数据的组件和参数是否相同?通过什么方法可以浏览获取的源数据?拓展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研究探讨,从而完成拓展性的问题。组件的参数的作用是什么?CSV和Excel文件都能用Excel查看文件数据,为何需要使用CSV文件、Excel输入两个不同的组件来获取其数据?主要知识点、重点与难点主要知识点数据库连接,以及共享/停止数据库连接。表输入、CSV文件、Excel输入等组件的参数设置和使用。重点数据库连接以及共享连接的应用场景。表输入、CSV文件、Excel输入等获取源数据组件的应用场景和操作。难点连接不同类型数据库的连接方法。表输入、CSV文件、Excel输入等组件的参数设置和不同之处。教学过程设计理论教学过程创建数据库连接。共享/停止共享数据库连接。表输入组件及其参数设置。CSV文件组件及其参数设置。Excel输入组件及其参数设置。实验教学过程在Kettle软件上,与MySQL建立数据库连接。进行共享/停止共享数据库连接。建立转换工程和数据库表输入组件,设置组件参数,并预览数据。建立转换工程和CSV文件组件,设置组件参数,并预览数据。建立转换工程和Excel输入组件,设置组件参数,并预览数据。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目3整合和处理食品销售数据教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:16学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标讲授排序记录、Multiwaymergejoin(多路合并)、字段选择、替换NULL值(替换空值)、合并记录、排序合并、剪切字符串、拆分字段、去除重复记录、过滤记录、Replaceinstring(字符串替换)和表输出等常用数据整合和处理组件,让学生达到以下教学目标:熟悉数据整合和处理常用组件的应用。掌握数据整合和处理常用组件的参数设置。熟悉组件处理后预览结果数据的方法。基本要求掌握数据整合和处理常用组件及其参数设置。掌握浏览数据整合和处理常用组件执行结果和出错处理的方法。问题引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。数据处理是不是只针对数据库的数据?是否只用一个组件就可以进行记录处理吗?对数据进行整合和处理的组件参数设置是否类似?表输出组件和其它获取源数据组件的参数是否类似?探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。去除重复记录为什么要先进行排序?数据记录中为什么要替换NULL值?字符串替换对那些数据类型进行操作?过滤记录需要排序吗?那些数据类型的字段可以进行排序?选择字段可以删除数据吗?拆分字段要增加字段吗?删除字段数据使用什么组件?合并记录需要排序吗?排序合并是自动排序后合并吗?表输出是将数据输出到Excel的工作表吗?拓展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研究探讨,从而完成拓展性的问题。表输出组件和其它获取源数据组件有什么差异?剪切字符串、拆分字段有什么异同?过滤记录和去除重复记录组件有什么异同?主要知识点、重点与难点主要知识点排序记录、Multiwaymergejoin、字段选择、替换NULL值、合并记录、排序合并、剪切字符串、拆分字段、去除重复记录、过滤记录、Replaceinstring和表输出等数据整合和处理组件的参数设置和使用。重点排序记录、Multiwaymergejoin、字段选择、替换NULL值、合并记录、排序合并、剪切字符串、拆分字段、去除重复记录、过滤记录、Replaceinstring、表输出等数据整合和处理组件的应用场景和操作。难点排序记录、Multiwaymergejoin、字段选择、替换NULL值、合并记录、排序合并、剪切字符串、拆分字段、去除重复记录、过滤记录、Replaceinstring和表输出等数据整合和处理组件的参数设置和不同之处。字段选择组件的使用。过滤记录组件的使用。字符串替换、字符串替换等组件使用的区别。教学过程设计理论教学过程采用食品销售数据,整合和处理A、B、C、D平台的食品销售数据,并输入出到数据库中。排序记录组件及其参数设置。Multiwaymergejoin组件及其参数设置。字段选择组件及其参数设置。替换NULL值组件及其参数设置。合并记录组件及其参数设置。排序合并组件及其参数设置。剪切字符串组件及其参数设置。拆分字段组件及其参数设置。去除重复记录组件及其参数设置。过滤记录组件及其参数设置。Replaceinstring组件及其参数设置。表输出组件及其参数设置。实验教学过程采用日化销售数据,整合和处理A、B、C、D平台的食品销售数据,并输出到数据库中。建立转换工程,合并D平台的食品销售数据。创建CSV文件输入、排序记录、多路合并、字段选择组件,设置组件参数,运行和预览数据。处理B、C平台的食品销售数据。创建CSV文件输入、字段选择、替换NULL值等组件,设置组件参数,运行和预览数据。合并A、B、C、D平台的食品销售数据。创建CSV文件输入、合并记录、排序合并等组件,设置组件参数,运行和预览数据。剪切平台字段的代码字符串。创建剪切字符串组件,设置组件参数,运行和预览数据。拆分经营单位字段。创建拆分字段组件,设置组件参数,运行和预览数据。删除数据中多余字段和重复记录。创建字段选择与过滤记录组件,设置组件参数,运行和预览数据。过滤并替换不规范的字段数据。创建过滤记录和字符串替换组件,设置组件参数,运行和预览数据。输出销售数据到数据库表。创建表输出组件,设置组件参数,运行和预览数据。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目4统计食品销售数据教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:14学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标讲授利用Janino计算Java表达式、计算器、单变量统计、公式、数值范围和分组等6种统计数据组件,以及文本文件输出、插入/更新数据库表、SQL文件输出和Excel文件输出等4种输出数据文件组件的方法和操作,让学生达到以下教学目标:熟悉数据统计、数据输出等常用组件的应用。掌握数据统计、数据输出等常用组件的参数设置。熟悉组件处理后预览结果数据的方法。基本要求掌握数据统计、数据输出等组件及其参数设置。掌握组件处理后预览结果数据的方法和出错处理的方法。问题引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。一般地,数据统计为什么会产生新的数据字段?数据输出组件的参数是否类似?数据统计的组件与其它数据处理的组件是否类似?探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。数据统计的组件为什么要生成新的数据字段?数据记录中为什么要替换NULL值?那些组件可以进行逻辑判断?什么组件执行诸如A+B+C+D+E的运算需要分多步进行?分组组件能够统计数据吗?那个组件在使用前必须进行排序记录?拆分字段要增加字段吗?数值范围组件有什么作用?为什么需要多个数据输出组件?拓展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研究探讨,从而完成拓展性的问题。数据输出组件与数据输入组件有什么不同?计算器、公式、Janino计算Java表达式组件有什么异同?分组组件能够对多个字段的数据进行计算吗?插入/更新数据库表和SQL文件输出有什么不同?文本文件输出和Excel文件输出有什么异同?主要知识点、重点与难点主要知识点利用Janino计算Java表达式、计算器、单变量统计、公式、数值范围和分组等6种统计数据组件,以及文本文件输出、插入/更新数据库表、SQL文件输出和Excel文件输出等4种输出数据文件组件的参数设置和使用。重点利用Janino计算Java表达式、计算器、单变量统计、公式、数值范围和分组等6种统计数据组件,以及文本文件输出、插入/更新数据库表、SQL文件输出和Excel文件输出等4种输出数据文件组件的应用场景和操作。难点利用Janino计算Java表达式、计算器、单变量统计、公式、数值范围和分组等6种统计数据组件,以及文本文件输出、插入/更新数据库表、SQL文件输出和Excel文件输出等4种输出数据文件组件的参数设置和不同之处。分组组件的使用。公式组件的使用。插入/更新数据库表组件的使用。数值范围组件的使用。教学过程设计理论教学过程对项目3处理好的食品销售数据进行统计,并输入出到不同的数据文件中。Janino计算Java表达式组件及其参数设置。计算器组件及其参数设置。单变量统计组件及其参数设置。公式组件及其参数设置。数值范围组件及其参数设置。分组组件及其参数设置。文本文件输出组件及其参数设置。插入/更新数据库表组件及其参数设置。SQL文件输出组件及其参数设置。Excel文件输出组件及其参数设置。实验教学过程对项目3处理好的食品销售数据进行统计,并输入出到不同的数据文件数据中。建立转换工程,计算销售单利润和利润率。创建字段选择、利用Janino计算Java表达式组件,设置组件参数,运行和预览数据。计算每个订单的销售单价和成本单价。创建计算器组件,设置组件参数,运行和预览数据。聚合统计销售额数据。创建单变量统计组件、文本文件输出等组件,设置组件参数,运行和预览数据。统计平台食品销售数据。创建排序、分组、表输出等组件,设置组件参数,运行和预览数据。统计分公司食品销售数据。创建排序、分组、公式、插入/更新组件等组件,设置组件参数,运行和预览数据。统计商品品牌食品销售数据。创建排序、分组、SQL文件输出等组件,设置组件参数,运行和预览数据。对销售额进行离散化分段统计。创建数值区间、排序、分组、MicrosoftExceloutput(Excel输出)等组件,设置组件参数,运行和预览数据。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目5执行整合与处理食品销售数据任务教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:12学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标讲授Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等9个常用任务组件的方法和操作,让学生达到以下教学目标:熟悉常用任务组件的应用。掌握常用任务组件的参数设置。熟悉组件运行后结果的查阅。基本要求掌握常用任务组件及其参数设置。掌握组件运行后结果查阅的方法和出错处理的方法。问题引导性提问引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。任务组件与前面项目2~项目4的转换组件相同吗?任务组件与前面项目2~项目4的转换组件的参数设置是否类似?Start组件有什么作用?探究性问题探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。一个任务工程中,能够有多个Start组件?检查文件是否存在组件有什么作用?为何要设置等待组件?SQL组件与项目4的SQL文件输出有什么异同点?添加文件到结果文件中有什么作用?为什么要使用邮件组件?检查表是否存在与检查文件是否存在组件的功能一样吗?成功组件有什么用?转换任务组件与前面项目2~项目4中处理数据的转换组件有何不同?拓展性问题拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研究探讨,从而完成拓展性的问题。如果不使用检查文件是否存在组件会有什么后果?对Start组件进行改名会有什么后果?一个任务工程设置多个Start组件会有什么后果?一个任务工程设置多个成功组件又有什么后果?主要知识点、重点与难点主要知识点Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等9个常用任务组件的参数设置和使用。重点Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等9个常用任务组件的应用场景和操作。难点Start、检查多个文件是否存在、等待、检查表是否存在、SQL、转换、添加文件到结果文件中、发送邮件和成功等9个常用任务组件的参数设置和不同之处。Start组件的使用。检查多个文件是否存在和等待组件的配合使用。添加文件到结果文件中的使用。发送邮件组件的使用。检查表是否存在和SQL组件的配合使用。教学过程设计理论教学过程对项目3处理好的食品销售数据进行统计,并输入出到不同的数据文件中。Start组件及其参数设置。检查多个文件是否存在组件及其参数设置。等待组件及其参数设置。检查表是否存在组件及其参数设置。SQL组件及其参数设置。转换组件及其参数设置。添加文件到结果文件中组件及其参数设置。发送邮件组件及其参数设置。成功组件及其参数设置。实验教学过程构建任务工程,执行项目3处理好的整合与处理食品销售数据转换任务,并查阅运行结果。建立任务工程,以便执行整合与处理食品销售数据的转换工作。创建Start组件,设定调度时间等参数,执行和查阅结果。检查输入源数据文件。创建检查多个文件是否存在和等待组件,设置组件参数,执行和查阅结果。检查输出数据表。创建检查表是否存在和SQL组件,设置组件参数,执行和查阅结果。执行数据整合与处理工程任务。创建转换组件,设置组件参数,执行和查阅结果。添加日志文件。创建添加文件到结果文件中组件,设置组件参数,执行和查阅结果。发送日志邮件。创建发送邮件组件,设置组件参数,执行和查阅结果。结束任务。创建成功组件,设置组件参数,执行和查阅结果。教材与参考资料教材教材:郑健,张良均.ETL数据整合和处理(Kettle)(第2版)(微课版)[M].北京:人民邮电出版社.2025.参考资料[1] 王雪松,张良均.ETL数据整合和处理(Kettle)[M].北京:人民邮电出版社.2021.

项目6无人售货机项目实战教案课程名称:ETL数据整合和处理课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论30学时,实验34学时)总学分:4.0学分本章学时:10学时材料清单《ETL数据整合和处理(Kettle)》(第2版)(微课版)教材。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标无人售货机每天为客户提供便利的商品零售服务,同时也产生了大量的商品零售数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论