版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Power
BI数据分析实战模块一
Power
BI数据清洗与分析目录/ContentsPower
BI的基本概念和组成01Power
BI的基本元素02Power
BI的页面认知03Power
BI创建报表的基本流程0405 PowerBI的数据清洗与分析一、Power
BI简介二、
Power
BI可视化案例三、PowerBI组成四、Power
BI工作流程Power
BI的基本概念和组成01一、Power
BI简介Power
BI
是一种由微软提供的业务智能工具,用于数据分析和可视化。它可以从多个来源获取数据,包括
Excel
表格、数据库、在线服务等,并将这些数据整合到一个简单易用的界面中。用户可以使用
Power
BI
创建丰富的交互式报表和仪表盘,以帮助他们理解数据、发现趋势和做出更明智的业务决策。Power
BI
具有强大的数据分析功能,包括数据建模、数据清洗、查询和计算等。它还提供了各种可视化选项,如柱状图、折线图、地图、表格等,使用户能够以多种方式呈现数据并探索数据之间的关系。除此之外,Power
BI
还支持自定义报表主题、安全性设置、数据共享和实时数据更新等功能,以满足不同用户的需求。二、Power
BI可视化案例二、Power
BI可视化案例三、Power
BI组成PowerBI
是一个功能强大的商业智能工具,它的三个主要组成部分为
Power
BIDesktop、Power
BI
服务和
PowerBI
移动应用。通过这三个部分,用户可以实现从数据整理到数据可视化再到数据分享的全过程。三、Power
BI组成PowerBI
DesktopPowerBI
Desktop这是一个用于在本地计算机上创建和编辑报表的桌面应用程序。用户可以通过
Power
BI
Desktop
轻松地连接各种数据源,包括Excel
表格、数据库、在线服务等。一旦获取到数据,用户可以使用
Power
Query
来整理和清洗数据,确保其符合分析要求。接着,用户可以通过
Power
BI
Desktop
建立数据模型,为不同数据表之间建立关系,以便后续的分析。最后,用户可以利用
Power
BIDesktop
的丰富可视化选项,创建各种图表和仪表盘,以直观地展现数据洞察。三、Power
BI组成
Power
BI
服务 这是一个基于云的服务,用户可以通过
Web
浏览器访问。在
Power
BI
服务中,用户可以发布他们在
Power
BIDesktop中创建的报表和仪表盘,并与团队成员或其他用户共享。PowerBI
服务支持自动化数据刷新和调度,确保用户始终看到最新的数据。此外,用户可以在
Power
BI
服务中设置数据安全性和访问权限,保护敏感数据。Power
BI
服务还提供了丰富的嵌入功能,允许开发人员将
Power
BI
的功能集成到他们的应用程序中。三、Power
BI组成Power
BI
移动应用这是适用于
iOS
和
Android
设备的移动应用程序,使用户可以随时随地访问他们的
Power
BI
报表和仪表盘。Power
BI
移动应用提供了实时数据访问功能,用户可以在移动设备上查看最新的业务数据。用户可以与移动应用中的报表进行交互,探索数据趋势并做出即时决策。此外,Power
BI
移动应用还支持数据变化的通知和提醒功能,帮助用户及时了解重要数据的变化情况。四、Power
BI工作流程当使用
Power
BI
进行数据分析时,通常会遵循以下整体工作流程:数据获取与整理:首先,用户使用
Power
BIDesktop连接各种数据源,如
Excel
表格、数据库、在线服务等,获取需要分析的数据。然后,他们使用
PowerQuery
对数据进行清洗、转换和整理,以确保数据符合分析需求。数据建模与关系构建:
在
Power
BI
Desktop
中,用户将获取到的数据导入并建立数据模型。他们可以定义表之间的关系,创建计算字段和度量,并设计数据模型以支持后续的分析。可视化图表创建:在有了数据模型之后,用户可以利用
Power
BI
Desktop
的丰富可视化选项,创建各种图表和仪表盘。他们可以根据需要选择合适的图表类型,将数据直观地展现出来。报表发布与分享:
完成报表和仪表盘的设计后,用户可以将它们发布到
Power
BI
服务中。在
Power
BI
服务中,他们可以与团队成员或其他用户共享报表,并设置数据刷新和安全性等选项。实时数据访问与交互:
用户可以通过
PowerBI
移动应用随时随地访问他们的报表和仪表盘。移动应用提供了实时数据访问功能,用户可以在移动设备上查看最新的业务数据,并与报表进行交互操作。谢谢Power
BI数据分析实战模块一
Power
BI数据清洗与分析目录/ContentsPower
BI的基本概念和组成01Power
BI的基本元素02Power
BI的页面认知03Power
BI创建报表的基本流程0405 PowerBI的数据清洗与分析Power
BI的基本元素一、数据集二、
视觉对象三、报表四、仪表板五、磁贴02一、数据集在
PowerBI
中,数据集(Dataset)是指一个或多个数据表的集合,这些数据表通常来自于不同的数据源,并经过整理、清洗和建模后形成。数据集是
Power
BI
报表和仪表盘的基础,它提供了数据分析和可视化所需的数据。一个数据集通常包含以下组成部分:数据表(Tables):数据集中的数据通常以表格形式组织,每个表格代表一个数据实体,如销售订单、产品信息、客户数据等。关系(Relationships):
如果数据集中包含多个数据表,那么这些表之间通常存在关联关系。在Power
BI
中,用户可以通过定义关系来连接不同的数据表,以便进行跨表的数据分析和可视化。一、数据集计算字段和度量(CalculatedFields
and
Measures):用户可以在数据集中创建计算字段和度量,以便进行更深入的数据分析。计算字段是根据现有字段计算得出的新字段,而度量是基于数据聚合计算而得出的衡量指标,如总销售额、平均订单数量等。数据模型(Data
Model):数据集中的所有数据表、关系、计算字段和度量都构成了一个数据模型。数据模型定义了数据之间的关系和结构,为报表和仪表盘的创建提供了基础。二、视觉对象在
Power
BI
中,"视觉对象"(Visuals)通常指的是报表或仪表盘中的图表、图形和其他可视化元素。这些可视化对象用于将数据呈现为易于理解和分析的形式,帮助用户发现数据之间的关系、趋势和模式。Power
BI
提供了多种类型的视觉对象,包括但不限于:柱状图(BarChart):用于比较不同类别的数据,通常用于展示各种指标的数量或大小。二、视觉对象折线图(Line
Chart):用于显示数据随时间变化的趋势,通常用于展示时间序列数据。二、视觉对象树状图(Tree
Map):以矩形的方式展示层次结构数据,并通过大小和颜色直观地比较各个类别的相对大小和比例。二、视觉对象饼图(Pie
Chart):用于显示数据的占比情况,通常用于展示分类数据的相对比例。二、视觉对象地图(Map):用于将数据在地理位置上进行可视化展示,通常用于展示地理分布情况或地理数据的相关性。二、视觉对象表格(Table):
用于以表格形式展示数据,通常用于展示详细数据或数据的特定属性。三、报表当谈论
Power
BI
中的报表时,我们指的是一种用于展示数据分析结果的交互式页面。这些报表通常由多个可视化图表组成,如柱状图、折线图、地图、表格等,以及一些交互式过滤器和切片器。这些图表和元素共同构成了一个数据故事,帮助用户理解数据、发现趋势,并做出更加明智的决策。首先,报表中的可视化图表起到了关键作用。它们以直观的方式展示了数据的不同方面,例如数据的趋势、分布、比较等。通过图表,用户可以一目了然地了解数据的情况,从而更好地理解业务状况。其次,报表具有强大的交互性。用户可以与报表进行各种交互操作,例如选择特定的数据点、过滤数据、放大缩小等。这种交互性使用户能够根据自己的需求和兴趣,深入分析数据,并从中获取更多的洞察。此外,报表中常常包含过滤器和切片器。这些元素允许用户动态调整报表中显示的数据,从而查看感兴趣的数据子集。用户可以根据需要添加、移除或调整过滤器,以便更好地理解数据。三、报表另外,报表与
Power
BI
仪表盘相关联。用户可以通过报表中的链接跳转到相关的仪表盘,以便查看更详细的数据。这种无缝的集成使用户可以在需要时深入探索数据,并在不同层次上进行分析。最后,Power
BI
报表支持自动更新数据。这意味着报表中的数据将自动刷新,确保用户始终看到最新的数据。这对于需要时刻关注业务动态的用户来说尤为重要。四、仪表板在
Power
BI
中,"仪表板"(Dashboard)是一个用于汇总和展示数据洞察的交互式页面。仪表板通常由多个报表、图表和其他可视化元素组成,以直观的方式展示关键业务指标和数据趋势。具体来说,仪表板包含以下主要特点:汇总数据:仪表板可以汇总来自不同数据源的数据,并以简洁的方式展示关键指标和数据摘要。用户可以一目了然地了解业务的整体状况。可视化图表:仪表板通常包含多个可视化图表,如柱状图、折线图、饼图等,用于展示数据的不同方面。这些图表以直观的方式呈现数据,帮助用户快速理解数据的含义。交互式元素:仪表板中的图表和元素通常是交互式的,用户可以与它们进行交互,例如选择特定的数据点、过滤数据、放大缩小等,以便更深入地分析数据。实时数据更新:仪表板中的数据通常是实时更新的,用户可以随时查看最新的业务数据,而无需手动刷新。自定义布局:用户可以根据自己的需求和喜好自定义仪表板的布局和排列方式,以便更好地组织和展示数据。五、磁贴在
PowerBI
中,"磁贴"(Tile)是指报表、图表或其他可视化元素在仪表板上的一个小型表示。磁贴用于将关键数据和洞察呈现在仪表板上,使用户可以在一张页面上快速浏览和理解数据。具体来说,磁贴具有以下主要特点:小型表示:磁贴通常是在仪表板上的一个小区域内显示的,其大小相对较小,使得用户可以在有限的空间内展示多个磁贴。可视化元素:磁贴可以是报表、图表、数字指标或其他可视化元素的表示。这些元素以简洁的方式展示数据,帮助用户快速理解数据的含义。交互式功能:
磁贴通常是交互式的,用户可以与其进行交互,例如选择特定的数据点、过滤数据、放大缩小等,以便深入分析数据。自定义布局:用户可以根据自己的需求和喜好自定义仪表板上磁贴的布局和排列方式,以便更好地组织和展示数据。谢谢Power
BI数据分析实战模块一
Power
BI数据清洗与分析目录/ContentsPower
BI的基本概念和组成01Power
BI的基本元素02Power
BI的页面认知03Power
BI创建报表的基本流程0405 PowerBI的数据清洗与分析Power
BI的页面认知一、主要视图二、
查询编辑器03一、主要视图在
Power
BI
中,确实有三种主要的视图:报表视图、数据视图和模型视图。这些视图分别用于不同的目的,帮助用户在数据分析过程中进行数据的可视化、整理和建模。这三种视图相互配合,构成了
Power
BI
的核心工作流程。用户可以在数据视图中整理和准备数据,然后在模型视图中建立数据模型,最后在报表视图中创建可视化报表,以呈现数据的分析结果。这种分层结构使用户能够更有效地进行数据分析和可视化,并生成具有洞察力的报告和仪表板。一、主要视图-报表视图报表视图(Report
View):报表视图是用于创建和编辑报表的主要工作区。在报表视图中,用户可以将数据可视化为各种图表、图形和其他可视化元素,以呈现数据的不同方面。用户可以在报表视图中设计和布局报表,添加交互式功能,并设置报表的样式和格式。画布(Canvas):是指报表视图中用于布局和放置可视化元素的区域。画布提供了一个空白的工作区,用户可以在其中创建和设计报表,将数据可视化为各种图表、图形和其他可视化元素。一、主要视图-报表视图主要特点包括:布局自由:
画布上的可视化元素可以自由放置和调整,用户可以根据自己的需求和喜好设计报表的布局和外观。多元素叠加:
用户可以在同一画布上放置多个图表和元素,并进行叠加和重叠。这样做可以使报表更加丰富和复杂,同时保持布局清晰。交互式设计:画布上的可视化元素通常是交互式的,用户可以与其进行交互,例如选择特定的数据点、过滤数据、放大缩小等,以便深入分析数据。自适应布局:
Power
BI
提供了自适应布局功能,使得报表可以根据不同的屏幕大小和设备类型进行自动调整和适配,确保在不同平台上都能正常显示和使用。一、主要视图-报表视图一、主要视图-报表视图页面选项卡在
Power
BI
中,页面选项卡是用于组织和导航报表内容的界面元素。每个报表可以包含多个页面选项卡,每个选项卡代表报表中的一个页面,用户可以通过点击选项卡来切换到不同的页面查看不同的数据视图。主要特点包括:多页面组织:
页面选项卡允许用户将报表内容组织成多个逻辑页面,以便更好地呈现和展示不同方面的数据分析结果。分层结构:通过多个页面选项卡,用户可以创建一个层次化的报告结构,将数据分析结果按照逻辑顺序和主题进行组织,使报告更易于理解和浏览。一、主要视图-报表视图导航和切换:用户可以通过点击页面选项卡来快速切换到不同的页面,从而查看不同的数据视图和可视化图表。自定义设置:
Power
BI
允许用户对页面选项卡进行自定义设置,包括修改页面名称、更改页面顺序、设置页面背景颜色等,以满足不同的需求和偏好。嵌入链接:用户还可以使用页面选项卡来创建嵌入链接,将报表中的特定页面共享给其他用户或嵌入到其他应用程序中,以便与他人共享和查看报告内容。一、主要视图-报表视图字段窗格(Fieldspane):是一个用于管理报表数据字段的区域。该窗格通常位于报表设计器的一侧或底部,提供了对数据字段的访问和操作。主要特点包括:字段列表:字段窗格显示了报表中可用的数据字段列表。这些字段通常来自于已连接的数据源,用户可以从中选择需要在报表中使用的字段。拖放功能:用户可以通过拖放字段到报表画布上的可视化元素中,快速创建图表和报表。例如,将日期字段拖放到柱状图的轴上,就可以创建一个按日期分组的柱状图。字段搜索:用户可以使用字段窗格中的搜索功能,快速定位需要的字段。这对于大型数据模型和包含大量字段的报表特别有用。一、主要视图-报表视图字段属性:
用户可以通过右键单击字段,查看字段的属性和设置,例如更改字段名称、格式、汇总方式等。层次结构:如果数据模型中包含层次结构数据(如产品分类),字段窗格可以显示字段之间的层次关系,使用户可以方便地导航和使用这些数据。一、主要视图-报表视图可视化窗格(Visualizationspane):是用于选择和添加不同类型的可视化图表或图形到报表中的区域。该窗格通常位于报表设计器的一侧或底部,提供了对可视化选项的访问和操作。主要特点包括:可视化图表列表:可视化窗格显示了可用的各种图表类型,例如柱状图、折线图、饼图、散点图等。用户可以从中选择需要的图表类型来呈现数据。拖放功能:用户可以通过从可视化窗格中拖放图表类型到报表画布上,快速创建所需的可视化图表。一旦图表被添加到画布上,用户可以根据需要调整图表的大小和位置。视觉配置:对于已添加到报表中的可视化图表,用户可以通过可视化窗格调整图表的视觉属性和设置,例如更改图表颜色、字体、轴标签、数据标签等。一、主要视图-报表视图样式和格式:可视化窗格还提供了一些预定义的样式和格式选项,帮助用户快速改变图表的外观,使其更加美观和易于理解。交互式功能:对于某些图表类型,可视化窗格提供了一些交互式功能,例如启用数据点的详细信息提示、启用数据筛选器等,使用户可以与图表进行更深入的交互和分析。“字段”:用于控制和配置报表中可视化组件的数据字段,在【可视化】窗格中,用户可以使用字段选项来定义可视化组件的数据维度、度量和其他相关属性。“格式”:提供了一系列设置和选项,用于自定义和美化报表中可视化组件的外观和样式。通过格式选项,用户可以调整图标的颜色额、字体、边框、标签等属性,以及其他与可视化相关的设置。“分析”:提供了一系列功能和工具,用于进行深入的数据分析和探索,通过“分析”选项,用户可以用平均线、中线等方法来揭示数据的模式、趋势和关联性。一、主要视图-报表视图一、主要视图-数据视图数据视图(Data
View):数据视图是用于查看和编辑数据表的工作区。在数据视图中,用户可以查看数据表的结构和内容,并进行数据的编辑和调整。用户可以添加新的数据表、定义列、进行数据清洗和转换等操作,以确保数据的质量和完整性。一、主要视图-数据视图在
Power
BI
的数据视图中,用户可以通过
DAX
表达式(Data
Analysis
Expressions)创建新的计算字段(Measure)和新的列(Column)。这些计算字段和列可以基于现有数据进行计算和衍生,从而丰富数据模型和分析能力。主要特点包括:新建计算字段:用户可以在数据视图中创建新的计算字段,用于对现有数据进行聚合、计算或衍生。通过
DAX
表达式,用户可以定义计算字段的计算逻辑,例如求和、平均值、计数等,以及各种条件逻辑和函数。新建列:用户还可以在数据视图中创建新的列,用于添加额外的数据列或进行数据转换。通过DAX
表达式,用户可以定义新列的计算逻辑,例如字符串拼接、日期计算、条件判断等。一、主要视图-数据视图公式编辑栏:在数据视图顶部,有一个可编辑的公式栏,用户可以在其中输入
DAX
表达式来定义计算字段或新列的计算逻辑。公式栏具有语法高亮和智能提示功能,帮助用户编写正确的
DAX
表达式。实时预览:在输入
DAX
表达式时,Power
BI
提供了实时预览功能,用户可以立即看到计算结果,以便验证和调试表达式的正确性。复用计算:用户可以在数据视图中创建的计算字段和新列可以在整个数据模型中重复使用,以供报表、图表和其他可视化元素使用。一、主要视图-数据视图一、主要视图-数据视图在
Power
BI
的数据视图中,用户可以对数据进行排序和筛选,类似于
Excel
中的操作方式。这样的功能可以帮助用户更好地理解数据、发现模式,并进行深入的数据分析。主要特点包括:排序数据:用户可以单击数据视图中每个字段标题行右侧的下拉按钮,然后在打开的列表中选择排序方式。用户可以按照升序或降序排列数据,以便更清晰地查看数据的顺序和趋势。筛选数据:用户同样可以通过字段标题行右侧的下拉按钮,在打开的列表中选择筛选方式。用户可以选择要包含或排除的特定值、日期范围、文本条件等,以便过滤数据并集中关注感兴趣的数据子集。一、主要视图-数据视图多字段排序和筛选:用户可以同时对多个字段进行排序和筛选,以更精确地控制数据的展示方式。这样的功能使得用户可以根据需要对数据进行多维度分析,并发现不同维度之间的关系。实时预览和应用:在选择排序或筛选方式后,Power
BI
提供了实时预览功能,用户可以立即看到数据的排序或筛选效果。一旦确认满意,用户可以直接应用排序或筛选,将其应用到数据视图中。通过对数据进行排序和筛选,用户可以更好地理解数据的结构和特征,发现数据中的规律和趋势,并支持更深入的数据分析和决策。这样的功能使得
Power
BI
成为了一个强大的数据分析工具,为用户提供了更多的数据洞察和价值。一、主要视图-数据视图一、主要视图-模型视图模型视图(Model
View):模型视图是用于查看和编辑数据模型的工作区。在模型视图中,用户可以查看数据表之间的关系,添加、编辑和删除关系,定义计算字段和度量,并进行其他与数据建模相关的操作。模型视图提供了一个直观的方式来理解和管理数据模型的结构和内容。二、查询编辑器Power
BI
的查询编辑器是一个强大的工具,用于连接、转换和清理数据,以及创建数据模型。它提供了一个直观的界面,让用户能够对数据源进行广泛的操作,包括数据导入、转换、合并、清理和计算。以下是查询编辑器的主要特点:数据连接:查询编辑器允许用户连接各种不同的数据源,如数据库、文件、在线服务等。用户可以通过简单的界面设置连接信息,并轻松地将数据导入
Power
BI
中。数据转换:用户可以使用查询编辑器进行数据转换,包括数据格式化、列拆分、列合并、数据类型转换等。通过强大的转换功能,用户可以将原始数据转换成符合分析需求的形式。二、查询编辑器数据清理:*查询编辑器提供了丰富的数据清理功能,包括删除重复行、填充空值、删除或保留特定行、数据类型转换等。这些功能有助于提高数据质量,并准备数据用于进一步的分析和可视化。查询合并:
用户可以使用查询编辑器将多个数据源进行合并,以创建更丰富和完整的数据集。通过查询合并功能,用户可以将多个数据表或查询结果合并成一个数据模型,以支持更全面的数据分析。高级功能:查询编辑器还提供了许多高级功能,如自定义列、添加索引列、使用函数等。这些功能允许用户根据特定的业务需求进行数据加工和计算,以生成更精确和有用的数据模型。二、查询编辑器查询编辑器主要由查询窗格、数据区域和查询设置窗格等部分组成。二、查询编辑器-打开方式查询编辑器打开方式:方法一:在功能区的【主页】中查找到【查询】选项卡,单击【转转数据】打开查询编辑器。二、查询编辑器-打开方式查询编辑器打开方法:方法二:在功能区的【主页】中查找到【数据】选项卡,单击【获取数据】从某一个数据源获取数据,在【导航器】对话框中选择要导入的表,单击【转换数据】,将打开查询编辑器并在其中显示选中的数据内容。二、查询编辑器-打开方式查询编辑器打开方法:方法三:在报表视图或者数据视图中的【字段】窗格中右击要编辑的表,然后在弹出的快捷菜单中选择【编辑查询】按钮,就可以打开查询编辑器并在其中显示选中的表格数据。二、查询编辑器-查询窗格在
Power
BI
的查询编辑器中,查询窗格(Query
pane)是一个用于管理数据查询的区域。在查询窗格中,用户可以查看和编辑已创建的数据查询,执行数据转换和清理操作,以及管理数据加载选项。主要特点包括:查询列表:查询窗格显示了当前数据模型中的所有数据查询。每个查询通常对应于一个数据源或一个数据转换步骤。用户可以通过查询列表轻松浏览和选择不同的查询。查询编辑:用户可以在查询窗格中编辑选定的查询。这包括添加新的数据源、编辑现有的数据转换步骤、删除不需要的查询等。通过直观的界面和操作,用户可以快速对数据进行操作和修改。二、查询编辑器-查询窗格数据转换:查询窗格提供了丰富的数据转换功能,包括列操作、行操作、数据类型转换、文本处理、日期处理等。用户可以通过简单的拖放和选择操作,实现对数据的多种转换和清理操作。查询设置:用户可以通过查询窗格设置数据加载选项和查询属性。例如,用户可以设置数据加载方式(如直接加载或引入)、数据加载顺序、查询名称等。查询执行:用户可以在查询窗格中执行数据查询,以查看实际数据加载的效果和结果。这使得用户可以在数据转换和清理过程中进行实时调试和验证。通过查询窗格,用户可以对数据查询进行全面管理和操作,实现对数据的灵活处理和转换,以满足不同的分析需求和业务场景。这使得
Power
BI
的查询编辑器成为了一个强大且易用的数据准备工具,为用户提供了丰富的数据操作和转换功能。二、查询编辑器-查询窗格二、查询编辑器-数据区域在
Power
BI
的查询编辑器中,数据区域(Datapane)是显示和操作当前查询数据的主要工作区域。它是查询编辑器中最核心的部分,用户在此区域内可以查看、编辑和转换数据,以准备和清理数据集。以下是数据区域的主要特点和功能:数据预览:数据区域提供了当前查询结果的数据预览。用户可以在这里看到数据的实际内容,包括行和列的详细信息。这有助于用户了解数据的结构和内容,并确认数据转换的效果。列操作:用户可以在数据区域中对列进行各种操作。例如,可以选择某一列并执行删除、重命名、拆分、合并、数据类型转换等操作。这些操作有助于调整数据列以满足分析需求。行操作:数据区域还允许用户对行进行操作,例如删除特定行、筛选行、对行进行排序等。用户可以通过这些操作来清理数据并突出显示重要的数据行。二、查询编辑器-数据区域数据转换步骤:每当用户在数据区域进行一个转换操作,Power
BI
会自动记录这个步骤并显示在查询设置窗格中的“应用步骤”列表中。用户可以随时查看、编辑或删除这些步骤,方便追踪和管理数据转换过程。上下文菜单:用户可以右键单击数据区域中的某一列或某一行,访问上下文菜单,其中包含常用的操作和转换选项。这提供了一种快捷方式来执行常见的数据操作。公式栏:数据区域顶部的公式栏显示了当前选中步骤的
M
语言表达式。高级用户可以直接编辑公式栏中的代码,以实现更复杂的自定义数据转换。过滤和排序:用户可以通过点击列标题右侧的下拉按钮,访问排序和筛选选项。这样可以快速按照特定条件过滤数据或对数据进行排序,类似于
Excel
中的操作。即时反馈:数据区域中的所有操作都是即时应用的,用户可以立即看到每个转换步骤的效果。这有助于在数据准备过程中进行实时调试和验证。二、查询编辑器-数据区域“列标题”在表格视图的顶部,显示了每个列的标题。并提供了一些列操作和设置选项,用户可以通过列标题进行排序、筛选和进行其他列级操作。通过右键单击列标题,可以访问列操作菜单,其中包含了一些常见的列级转换和计算操作,比如更改数据类型、拆分列、计算新列等。二、查询编辑器-数据区域“数据单元格”包含了查询加载的实际数据,每个数据单元格显示了一个字段的值,并与对应的记录和列相关联。“行选择”在数据区中,用户可以选择单个行或多个行来进行操作,通过选择行可以执行删除行、复制行、筛选行等操作。二、查询编辑器-查询设置在
Power
BI
的查询编辑器中,查询设置是一个重要的功能区域,用户可以在这里配置数据加载选项、查询属性以及数据源的连接信息。查询设置提供了一些关键的功能和选项,帮助用户优化数据加载和数据转换的过程。以下是查询设置的主要功能和选项:数据加载选项:**
查询设置允许用户配置数据加载选项,包括数据加载模式(例如直接加载或引入)、数据加载顺序(例如并行加载或串行加载)、数据加载优化等。用户可以根据数据源的特性和加载需求,选择适合的加载选项。查询属性:用户可以在查询设置中配置查询的各种属性,例如查询名称、查询描述、查询标签等。这有助于组织和管理大量的数据查询,以便在报表中更容易识别和使用。二、查询编辑器-查询设置应用步骤列表:查询设置窗格中的“应用步骤”列表显示了当前查询中的所有数据转换步骤。用户可以在这里查看、编辑或删除每个步骤,以调整数据转换的顺序和效果。这使得数据转换过程变得可控和可追踪。数据源设置:
用户可以在查询设置中配置数据源的连接信息,包括服务器地址、数据库名称、表名称、认证方式等。这些设置决定了
Power
BI
如何连接和获取数据源中的数据。高级选项:
查询设置还提供了一些高级选项,用于进一步优化数据加载和查询性能。例如,用户可以配置查询超时时间、内存限制、错误处理方式等。二、查询编辑器-查询设置【查询设置】窗格位于查询编辑器的右侧窗口,其中列出了查询的属性和所应用的步骤,在查询编辑器中对数据所做的每一步操作,都会按顺序自动记录在【查询设置】窗格的【应用的步骤】列表框中,每个步骤都有与其对应的使用M语言创建的公式。二、查询编辑器-查询设置用户可以对【应用的步骤】列表框中的所有步骤执行重命名、移动、删除等操作,选择任意一个步骤,将是数据区域返回到该步骤对应的操作结果。如果步骤名称的右侧有一个齿轮图标,则说明用户可以对该步骤进行编辑。二、查询编辑器-保存工作在
Power
BI
的查询编辑器中,保存工作是指将当前的数据查询和数据转换操作保存到
Power
BI
文件或数据模型中的过程。这确保了用户对数据准备工作的修改和调整得以保存,以便后续在报表和可视化中使用。主要特点包括:保存数据模型:当用户在查询编辑器中完成了数据准备和转换操作后,可以选择保存工作,将当前的数据模型保存为
Power
BI
文件(.pbix
格式)。这样,用户就可以在日后重新打开文件时,继续编辑和使用保存的数据模型。自动保存:Power
BI
在查询编辑器中具有自动保存功能,会定期自动保存用户的工作进度。这可以帮助用户避免数据丢失,并确保在意外关闭或退出应用程序时不会丢失重要的工作。二、查询编辑器-保存工作版本控制:Power
BI
还提供了版本控制功能,允许用户保存数据模型的多个版本,并在需要时进行切换和恢复。这使得用户可以随时查看历史版本的工作,并追溯到先前的数据准备状态。共享和协作:
一旦数据模型保存到
PowerBI
文件中,用户可以将文件共享给其他团队成员或用户,以便他们可以查看、编辑和使用相同的数据模型。这有助于团队之间的协作和共享数据工作。云存储和备份:
PowerBI
还提供了云存储和备份功能,允许用户将数据模型保存到
Power
BI
服务中。这样,用户可以随时随地访问和使用数据模型,并确保数据的安全备份和持久性。谢谢Power
BI数据分析实战模块一
Power
BI数据清洗与分析目录/ContentsPower
BI的基本概念和组成01Power
BI的基本元素02Power
BI的页面认知03Power
BI创建报表的基本流程0405 PowerBI的数据清洗与分析Power
BI创建报表的基本流程一、连接并获取数据二、
整理和转换数据三、数据建模四、创建视觉对象五、创建和共享报表04一、连接并获取数据在
Power
BI
中,连接并获取数据是创建报表的第一步。1.启动Power
BIDesktop2.选择“获取数据”在Power
BI
Desktop界面的左上角,点击“获取数据”按钮。这将打开一个对话框,显示各种数据源选项。3.选择数据源类型从“获取数据”对话框中选择要连接的数据源类型。Power
BI支持多种数据源:文件:Excel、CSV、文本文件、XML、JSON等数据库:SQL
Server、Oracle、MySQL、PostgreSQL等在线服务:SharePoint
Online、Dynamics365、Salesforce、GoogleAnalytics等其他数据源:Web数据源、OData、Azure等一、连接并获取数据4.配置数据源根据所选的数据源类型,系统会提供必要的连接信息。文件:选择文件路径数据库:输入服务器名称、数据库名称,以及身份验证信息(如用户名和密码)在线服务:登录相关服务并授权访问在Power
BI
Desktop界面的左上角,点击“获取数据”按钮。这将打开一个对话框,显示各种数据源选项。一、连接并获取数据5.导入数据配置好数据源信息后,点击“连接”按钮。Power
BI将显示数据源中的表或数据集列表。选择要导入的表或数据集。选择表:
在数据源中勾选您要导入的一个或多个表。预览数据:Power
BI会显示所选表的数据预览,可以确认数据内容。一、连接并获取数据6.加载数据确认要导入的数据后,点击“加载”按钮,将数据导入到PowerBI中。如果需要对数据进行预处理,可以点击“转换数据”按钮,这将打开Power
Query编辑器,可以在其中进行数据清理和转换。二、整理和转换数据1.打开Power
Query编辑器通过“编辑查询”。2.数据预览查看数据表。3.数据清洗删除不需要的列和行。删除空白行或重复数据。4.数据转换更改数据类型。拆分或合并列。5.数据过滤筛选特定条件的数据。6.添加计算列使用DAX或M语言。7.数据合并合并或追加查询。8.应用并加载数据点击“关闭并应用”。9.保存数据模型保存Power
BI文件。在
Power
BI
中,数据建模是指组织和优化数据以支持高效的数据分析和报表创建的过程。数据建模包括定义表之间的关系、创建计算列和度量值、配置数据格式等步骤,以确保数据在分析和可视化过程中具有一致性和准确性。以下是数据建模的详细步骤:打开数据建模视图在
Power
BI
Desktop
中,切换到“模型”视图。可以通过点击左侧导航栏中的“模型”图标来访问此视图。定义表之间的关系为了在不同表之间建立逻辑连接,需要定义表之间的关系。这通常基于表中的键(如主键和外键)来实现。三、数据建模添加关系(1)在模型视图中,找到要连接的两张表。(2)拖动一个表中的列到另一表中的相关列,这将自动创建关系。(3)
可以通过双击连接线来编辑关系的详细信息,如关系类型(单向或双向)和联接类型(内联接、外联接等)。3.
创建计算列和度量值使用
DAX(Data
Analysis
Expressions)来创建计算列和度量值,以实现自定义计算。三、数据建模创建计算列计算列是根据现有列计算得出的新列。(1)
选择目标表。(2)在功能区中选择“建模”选项卡,然后点击“新建列”。(3)在公式栏中输入
DAX
公式,例如:TotalSales=[Quantity]*
[Price]三、数据建模创建度量值度量值是用于聚合数据的计算字段,通常用于报表中的数值计算。(1)
选择目标表。(2)在功能区中选择“建模”选项卡,然后点击“新建度量值”。(3)在公式栏中输入
DAX
公式,例如:TotalRevenue=SUM([Quantity]*[Price])4.
配置数据格式确保每列的数据类型和格式设置正确,这有助于在报表中显示正确的数值和文本格式。更改数据类型(1)选择表中的列。(2)在功能区中选择“建模”选项卡,然后在“数据类型”下拉菜单中选择适当的数据类型(如文本、整数、日期、货币等)。设置数据格式(1)选择表中的列。(2)在功能区中选择“建模”选项卡,然后在“格式”下拉菜单中选择适当的数据格式(如十进制数、小数位数、货币符号等)。三、数据建模5.
创建层次结构层次结构有助于在报表中实现数据的分级显示和钻取操作。创建层次结构(1)在数据视图中,选择目标表。(2)右键点击表中的某个字段,然后选择“创建层次结构”。(3)将其他相关字段拖放到新创建的层次结构中,例如,将“年”、“季度”和“月”字段添加到时间层次结构中。三、数据建模使用命名约定为表、列和度量值使用一致的命名约定,以便于识别和使用。例如,使用前缀标识度量值(如“Total_”、“Avg_”等)。优化数据模型优化数据模型以提高性能和可用性,包括删除不必要的列、减少表的行数、使用聚合表等。三、数据建模四、创建视觉对象在
Power
BI
中,创建视觉对象(可视化)是将数据以图表形式直观展示的重要步骤。以下是创建视觉对象的详细过程:启动
Power
BIDesktop确保
Power
BIDesktop已启动,并且已经导入和准备好了数据。选择报表视图在
Power
BI
Desktop
中,点击左侧的报表图标,进入报表视图。这里是创建和管理可视化的主要工作区。添加画布页面Power
BI
报表画布是放置各种视觉对象的区域。默认情况下,会提供一个空白页面,您可以根据需要添加更多页面。四、创建视觉对象4.
选择可视化类型在画布右侧的“可视化”窗格中,选择您想要创建的可视化类型。Power
BI
提供了多种可视化类型,包括:条形图和柱形图
-
折线图
-
饼图和圆环图
-
散点图
-
矩阵和表格
-
地图
-
树状图
-
漏斗图仪表盘
-
以及其他自定义可视化5.
拖放字段到可视化从右侧的“字段”窗格中,将数据字段拖放到所选的可视化类型中。这些字段可以是数据表中的列,如销售额、日期、产品名称等。四、创建视觉对象配置字段区域不同的可视化类型有不同的字段配置区域。例如:轴:定义图表的
X
轴或
Y
轴数据。值:定义要在图表中显示的数值数据。图例:定义分类数据,用于在图表中区分不同类别。工具提示:定义悬停在图表上时显示的额外信息。6.
自定义可视化在“可视化”窗格中,您可以进一步自定义图表的外观和行为:格式化:调整颜色、标签、标题、轴设置等。-
操作:在“可视化”窗格中点击格式化图标,然后进行各种格式设置。筛选:应用筛选器以显示特定数据。操作:在“筛选”窗格中添加和配置筛选条件。排序:对数据进行排序以更好地展示信息。操作:点击图表右上角的排序按钮,选择排序方式。四、创建视觉对象交互功能配置图表之间的交互行为。添加切片器和筛选器使用切片器控件进行数据筛选。保存和发布报表保存文件并发布到
Power
BI
服务中。五、创建和共享报表在
Power
BI
中,创建和共享报表是利用数据分析和可视化来推动业务洞察的重要环节。一个Power
BI
Desktop文件中可以包含多个页面,每个页面中可以包含多个视觉对象,这些视觉对象的集合构成了报表。五、创建和共享报表制作好报表后,可以在功能区的“主页”选项卡中单击【发布】按钮,将报表发布到Power
BI服务,其他用户可以使用Power
BI服务或在移动设备上使用Power
BI移动应用查看并与报表互动。谢谢Power
BI数据分析实战模块一
Power
BI数据清洗与分析目录/ContentsPower
BI的基本概念和组成01Power
BI的基本元素02Power
BI的页面认知03Power
BI创建报表的基本流程0405 PowerBI的数据清洗与分析Power
BI的数据清洗与分析一、获取和刷新数据二、
调整行和列三、修改和转化数据四、提取和拆分数据五、合并数据六、排序、筛选和汇总数据05一、获取和刷新数据1.连接并获取数据在PowerBI
Desktop的【主页】上,选择【Excel工作簿】,打开【打开】对话框,单击选中获取数据的Excel工作簿,此处选中为“预算可视化数据.xlsx”,点击【打开】。一、获取和刷新数据一种是单击【加载】按钮,将数据直接加载到Power
BI
Desktop中;另一种是单击【转换数据】按钮,将在查询编辑器中打开数据并对数据进行整理。一、获取和刷新数据如果想要获取的数据类型没有显示在功能区,则可以在功能区的【主页】选项卡中单击【获取数据】按钮,在弹出的菜单中选择【更多】选项,然后在打开的对话框中选择要获取的数据类型。一、获取和刷新数据2.获取部分数据例如,要获取名为“营业支出项目小类”的第8行至35行数据,需要在Excel工作簿中选择该工作表,选择第8行至35行对应的单元格区域,此处为A8:D35,然后按Ctrl+C快捷键,将选中的数据复制到剪贴板中。然后打开Power
BIDesktop,在功能区的【主页】选项卡中单击【输入数据】按钮,打开的是【创建表】对话框,在其中的单元格中右击,随后在弹出的快捷菜单中选择【粘贴】命令键。一、获取和刷新数据一、获取和刷新数据将复制的Excel数据粘贴到【创建表】对话框中,默认自动将粘贴的数据的第一行已升级为列标题。如果不想使用该设置,可以单击【撤销标题】按钮取消该操作。还可以在【名称】文本框中为即将创建的表设置一个易于识别的名称。最后单击【加载】按钮,将数据加载到Power
BIDesktop中。如果想在查询编辑器中整理数据,则可以单击【编辑】按钮。一、获取和刷新数据3.刷新数据(1)在Power
BIDesktop中手动刷新:在Power
BI
Desktop中,点击【主页】选项卡上的【刷新】按钮,手动刷新数据。自动刷新:如果数据源支持自动刷新,可以在【主页】选项卡上的【刷新】按钮旁边选择【设置刷新】按钮,设置自动刷新计划和频率。一、获取和刷新数据3.刷新数据(2)在查询编辑器中打开查询编辑器,在功能区的【主页】选项卡中单击【刷新预览】按钮上的下拉按钮,然后在弹出的菜单中选择【刷新预览】或【全部刷新】命令。【刷新预览】按钮只刷新当前显示在数据区域中的查询,【全部刷新】按钮将刷新所有已连接的查询。一、获取和刷新数据4.更改数据源如果改变数据源的名称或位置,在Power
BI
Desktop中或查询编辑器中刷新数据时,由于找不到原来的数据源,会出现报错信息。一、获取和刷新数据为了刷新数据,需要将数据源的名称改回原来的名称,在Power
BI
Desktop或查询编辑器中重新指定数据源,步骤都是一致的。在Power
BI
Desktop打开【主页】选项卡中单击【转换数据】按钮的下拉按钮,选择【数据源设置】;在查询编辑器的【主页】选项卡中单击【数据源设置】。无论使用哪种方法,都将打开【数据源设置】对话框,选择要更改的数据源,然后单击【更改源】按钮,在打开的对话框中单击【浏览】按钮,找到所需的数据源点击【确定】即可。一、获取和刷新数据一、获取和刷新数据,5.删除查询(1)在Power
BIDesktop中在【字段】窗格中右击或点击“…”选择【从模型中删除】按钮,在弹出的快捷菜单中选择【删除】命令,然后在显示确认删除信息的对话框中单击【删除】按钮。一、获取和刷新数据(2)在查询编辑器中打开查询编辑器,在【查询】窗格中右击要删除的查询,在弹出的菜单中选择【删除】按钮,然后在显示确认删除信息的对话框中单击【删除】按钮。二、调整行和列1.删除不需要的行和列获取数据后,数据区域中通常包含一些无意义或无须使用的数据,这些都需要被清洗,用户可以在查询编辑器中快速删除不需要的行和列。在查询编辑器的功能区的【主页】选项卡中的【选择列】和【删除列】两个按钮用于执行删除列的操作,【保留行】和【删除行】两个按钮用于执行删除行的操作。二、调整行和列(1)删除行使用【保留行】功能数据区域中一共有34行数据,删除最前面6行,还剩下28行数据,因此在功能区的【主页】选项卡中单击【保留行】按钮,然后在弹出的菜单中选择【保留最后几行】命令,打开对话框,在【行数】文本框中输入“28”,然后单击【确定】按钮。二、调整行和列二、调整行和列数据区域一共有34行数据,最后只需要保留从第7行开始的一共28行数据,因此在功能区的【主页】选项卡中单击【保留行】按钮,然后在弹出的菜单中选择【保留行的范围】命令,打开对话框,在【首行】文本框输入“7”,在【行数】文本框输入“28”,然后单击【确定】按钮。二、调整行和列二、调整行和列使用【删除行】功能在功能区的【主页】选项卡中单击【删除行】按钮,然后在弹出的菜单中选择【删除最前面几行】命令,打开对话框,在【行数】文本框中输入“6”,然后单击【确定】按钮。二、调整行和列(2)删除列使用【选择列】功能单击任意一个单元格,位于哪一列无关紧要,然后在功能区的【主页】选项卡中单击【选择列】按钮的上半部分,打开【选择列】对话框,取消选中要删除的列的复选框,然后单击【确定】按钮。二、调整行和列使用【删除列】功能单击要删除的列中的任意一个单元格,然后在功能区的“主页”选项卡中单击“删除列”按钮的上半部分。二、调整行和列使用右击键鼠标右击要删除的列顶部的标题,这里将鼠标移到“预算金额”列的标题处,在弹出的菜单栏中选择【删除】按钮。二、调整行和列2.调整列的位置为了优化报表的布局和展示,通过调整列的位置,可以更符合用户的需求和可视化效果。单击要调整位置的列顶部的标题,然后按住鼠标左键进行拖曳,将该列拖动到目标位置即可。拖动过程中显示的竖线指示当前移动到的位置。1.将第一行数据设置为列标题如果要将第一行数据设置为列标题,需要单击数据区域中的任意一个单元格,然后在功能区的【主页】选项卡中单击【将第一行用作标题】按钮,将第一行数据设置为列标题。三、修改和转换数据2.列名重命名双击双击列标题进入编辑状态,输入所需的名称,然后按Enter键。三、修改和转换数据右击键右击列标题,在弹出的菜单中选择【重命名】按钮,然后输入所需的名称并按Enter键。3.更改字段的数据类型单击键单击列标题左侧的图标,在弹出的菜单中选择需要转换的数据类型。三、修改和转换数据右击键鼠标右击要更改数据类型的列标题,在弹出的菜单中选择【更改类型】按钮,然后在子菜单中选择需要改变的数据类型。使用【转换】功能区在功能区的【转换】选项卡,单击【更改数据类型】按钮,选择需要转换的数据类型。如果获取的数据有很多列,查询编辑器也没有为这些数据设置合适的数据类型,则在为这些列设置数据类型时,可以使用功能区的【转换】选项卡中的【检测数据类型】按钮,通过检测功能自动检查各列数据的类型并进行设置。三、修改和转换数据4.批量替换使用【替换值】功能点击功能区的【转换】选项卡中的【替换值】按钮。如果已经选中需要替换的单元格,则【替换值】对话框中的【要查找的值】文本框中会出现单元格的值,在【替换为】文本框中输入需要替换为的值即可,点击【确定】完成替换。三、修改和转换数据右击键右击要修改的值所在的单元格,在弹出的菜单中选择【替换值】按钮。三、修改和转换数据5.
转换文本格式选择需要转换格式的列中的任意一个单元格,在功能区的【转换】选项卡中选择【格式】按钮,在弹出的菜单中选择所需要转化的格式。三、数据建模6.
二维表转为一维表在功能区的【转换】选项卡中选择【逆透视列】按钮,转换后,可以直接修改“属性”和“值”两列列名。三、数据建模】1.
提取数据提取字符以【水果蔬菜销售清单】为例,需要提取“交易编号”后8位数字。单击“交易编号”列中的任意一个单元格,在功能区的【转换】选项卡中单击【提取】按钮,在弹出的菜单中选择【范围】按钮。打开【提取文本范围对话框,在【起始索引】文本框中输入“11”,在【字符串】文本框中输入“8”,点击【确定】即可。四、提取和拆分数据由于索引值从0开始,因此第12位数的索引值是11,【起始索引】设置为“11”。提取日期元素在功能区的【转换】选项卡中单击【日期】按钮,在弹出的菜单中选择需要提取的元素。四、提取和拆分数据2.
拆分列以【水果蔬菜销售清单】为例,“产品”列中同时包含产品名称和种类名称,它们之间以“_”符号分割,为了方便数据的统计和分析,将产品名称和种类名称分别保存到两列中。点击“产品”列中的任意一个单元格,然后在功能区的【转换】选项卡中单击【拆分列】按钮,在弹出的菜单中选择【按分隔符】按钮。四、提取和拆分数据打开【按分隔符拆分列】对话框,在“选择或数据分隔符”下拉列表中选择“自定义”,然后在下方的文本框中输入“_”,再单击【确定】按钮。四、提取和拆分数据拆分后的结果就是将“_”符号左右两侧的内容拆分到两列中。四、提取和拆分数据四、提取和拆分数据3.
使用【条件列】功能返回指定的值以【水果蔬菜销售清单】为例,如果“销售数量”大于1200小于1210,则划分为“一般”;如果“销售数量”大于等于1210小于1215,则划为“明星”;如果“销售数量”大于等于1215,则划为“热销”。点击数据区域中的任意一个单元格,在功能区的【添加列】选项卡中单击【条件列】按钮。打开【添加条件列】对话框,进行相关设置。四、提取和拆分数据在“新列名”文本框中输入即将创建的列名称“分类”。根据上述要求,当“销售数量”小于1210时,分类为“一般”,即在“列名”下拉选项中选择“销售数量”列,在“运算符”下拉选项中选择“小于”,在“值”文本框中输入“1210”,在“输出”文本框中输入“一般”。通过“添加子句”按钮增加一列新的条件选项,当“销售数量”小于1215时,分类为“明星”,即在“列名”下拉选项中选择“销售数量”列,在“运算符”下拉选项中选择“小于”,在“值”文本框中输入“1215”,在“输出”文本框中输入“明星”。最后在“ELSE”文本框中输入“热销”,单击确定即可。四、提取和拆分数据四、提取和拆分数据设置后,将在数据区域中添加名为“分类”的列,其中的值是根据“销售数量”列中的数据判定的。五、合并数据1.
使用【合并查询】横向合并数据以【水果蔬菜销售清单(3月17日前)】和【水果蔬菜销售清单(3月17日后半段)】为例,将3月17日前和3月17日后半段数据合并到一起。在所选查询的数据区域中单击任意一个单元格,再在功能区的【主页】选项卡中单击【合并查询】按钮上的下拉按钮,在弹出的菜单中选择【将查询合并为新查询】按钮。五、合并数据在弹出的【合并】对话框,上方列出的表是在打开该对话框之前选择的查询,在下方的下拉列表中选择要合并的另一个表,此处为“水果蔬菜销售清单(3月17日后半段)”,由于两个表通过“交易编号”建立关联,因此需要在两个表中分别单击“交易编号”列,在【联接种类】下拉列表中选择两个表中数据的匹配方式,选择将【联接种类】设置为【左外部(第一个中的所有行,第二个中的匹配行)】,然后单击【确定】按钮。五、合并数据单击“水果蔬菜销售清单(3月17日后半段)销售地区”列标题右侧的展开按钮,在打开的列表中选择要显示的“销售地区”列,单击【确定】按钮,将在查询中显示所选列中的数据。五、合并数据2.使用【追加查询】纵向合并数据以【水果蔬菜销售清单(3月17日前)】和【水果蔬菜销售清单(3月31日前)】为例,将3月17日前和3月31日之前的数据合并到一起。在所选查询的数据区域中单击任意一个单元格,再在功能区的【主页】选项卡中单击【追加查询】按钮上的下拉按钮,在弹出的菜单中选择【将查询追加为新查询】按钮。五、合并数据在弹出的【追加】对话框,选中【两个表】单选按钮。“这一张表”的列表框中默认自动添加了“水果蔬菜销售清单(3月17日前)”表,这是因为打开该对话框之前已经在所选查询的数据区域中单击了任意一个单元格;在“第二张表”的列表框中选择“水果蔬菜销售清单(3月31日前)”表。五、合并数据合并后数据表作为一张新表出现在【查询】列表中,名称为“追加1”,可以双击或者右击【重命名】修改合并后的表格名称。五、合并数据3.
合并文件夹中的文件以【水果蔬菜销售清单】文件夹为例,将三张表格合并。五、合并数据在功能区的【主页】选项卡中单击【新建源】按钮上的下拉按钮,然后在弹出的菜单中选择【更多】按钮,打开【获取数据】对话框,选择【文件夹】,然后单击【连接】按钮。五、合并数据打开【文件夹】对话框,单击【浏览】按钮,在打开的对话框中选择要合并的文件所在的文件夹,然后单击【确定】按钮,返回【文件夹】对话框,选择的文件夹的完整路径被自动填入【文件夹路径】文本框中,确认无误后单击【确定】按钮。五、合并数据对话框自动打开,其中列出了所选文件夹中所有文件及其相关属性,单击【合并并转换数据】按钮。五、合并数据打开【合并文件】对话框,在【示例文件】下拉列表中选择一个作为格式参照基准的文件,然后单击【确定】按钮。五、合并数据将所选文件夹中的所有文件的数据合并到一起,在Source.Name列中显示了每行数据来源文件的名称。六、排序、筛选和汇总数据1.排序数据以【水果蔬菜销售清单(3月17日前)】为例,将“平均成本”按照降序排序。点击“平均成本”列标题右侧的下拉按钮会显示一个表示升序或降序排列的箭头,选择【降序排序】,以此表示该列正在执行的排序方式。如果要清楚排序的状态,单击排序列的列标题右侧的下拉按钮,在弹出的菜单中选择【清除排序】命令,将清除该列的排序状态。六、排序、筛选和汇总数据2.筛选数据使用“下拉按钮”以【水果蔬菜销售清单(3月17日前)】为例,筛选出“产地”为“America”的行数据。单击“产地”列右侧的下拉按钮,在打开的下拉列表中选择要筛选“America”的值,单击【确定】按钮,将只显示“America”的数据,处于筛选状态的列标题右侧的下拉按钮上会显示一个漏斗图标。六、排序、筛选和汇总数据使用右击键即使不打开下拉列表也可以完成上述筛选操作,只需在“产地”列中右击任意一个包含“America”的单元格,在弹出的菜单中选择【文本筛选器】按钮,然后在子菜单中选择【等于】按钮即可。六、排序、筛选和汇总数据多条件筛选以【水果蔬菜销售清单(3月17日前)】为例,筛选出“平均成本”大于等于5小于等于9的行数据。单击“平均成本”列标题右侧的下拉按钮,在打开的下拉列表中选择【数字筛选器】的【大于或等于】按钮,打开【筛选行】对话框,第一行左侧的下拉列表已自动设置为【大于或等于】,在右侧的文本框中输入“5”,然后选中“且”单选按钮,再在第二行左侧的下拉列表中选择【小于或等于】,并在右侧的文本框中输入“9”,点击【确定】按钮。六、排序、筛选和汇总数据完成以上设置后,将在数据区域中只显示“平均成本”数据大于等于5且小于等于9的水果蔬菜数据。六、排序、筛选和汇总数据3.分类汇总数据以【水果蔬菜销售清单(3月17日前)】为例,展示了“交易编号”、“销售日期”、“产品”、“产地”、“销售数量”、“平均价格”和“平均成本”列数据,现在想要统计各个产品的销售总量,则需要以“产品”列中的数据作为分类依据,然后对“销售数量”列中的数据进行求和。点击“产品”列中的任意一个单元格,在功能区的【主页】选项卡中单击【分组依据】按钮,打开【分组依据】对话框,【分组依据】被自动设置为“产品”,在“新列名”文本框中输入用于放置汇总数据的新列的名称,输入“销售总量”,在“操作”下拉列表中选择“求和”,在“柱”下拉列表中选择“销售数量”,即对销售数量进行求和,单击【确定】按钮。六、排序、筛选和汇总数据六、排序、筛选和汇总数据将统计出每种产品的销售总量。在分类汇总数据时,可以添加多个分组依据,以便可以按照多个类别来汇总数据。在【分组依据】对话框中选中【高级】单选按钮,然后单击【添加分组】按钮,即可新增一个分组依据。单击分组依据文本框右侧的省略号,可以使用弹出菜单中的命令调整分组依据之间的顺序或删除分组依据。谢谢Power
BI数据分析实战模块二
DAX函数目录/Contents理解DAX公式01DAX公式的格式规范02DAX基础函数03筛选器函数0405 DAX函数的特点一、表达式二、
上下文理解DAX公式01一、表达式DAX的全称是DataAnalysis
Expressions(数据分析表达式),它是一种在PowerBI中编写的公式,用于对数据模型中的数据进行不同类型的计算。DAX公式有其特定的输入格式和规则,就像Excel中输入公式也需要遵循一定的语法格式。Excel包含的函数在大多数的计算中发挥了主要作用。在DAX公式中也可以使用大量的函数,其中很多函数的功能和用法与Excel函数相似,如果熟悉Excel函数,就会很容易理解DAX函数。二、上下文上下文(Context)在众多高级程序设计语言中使用,它代表了变量、函数、程序的运行环境。上下文也是DAX的一个重要概念。在DAX中,上下文是公式的计算环境。DAX公式中有两种上下文:行上下文和过滤上下文。1.行上下文行上下文可以理解为当前记录(当前行)。从数据源获取各种数据后,Power
BI
Desktop将其以关系表(二维表)的形式进行存储。在计算函数时,通常都会应用某一行中某个列的数据,此时的行就是当前计算的行上下文。2.过滤上下文过滤上下文可以理解为作用于表的过滤条件(筛选器),函数应用过滤处的数据(单个或多个值)完成计算。谢谢Power
BI数据分析实战模块二
DAX函数目录/Contents理解DAX公式01DAX公式的格式规范02DAX基础函数03筛选器函数0405 DAX函数的特点DAX公式的格式规范02①:销售零售额是度量值的名称,它是在编写DAX公式时需要最先输入的内容,位于等号的左侧。如果创建的是计算列,则该名称将用作列标题。②:=是等号运算符,后面的表达式是要计算的字段或列的定义。③:SUMX是DAX函数,用于对表达式进行求和计算。④:'明细':这是一个表引用,它指向包含数据的表或表的名称。在这里,它指向了一个名为"明细"的表,该表包含了销量和零售价等字段。⑤:'明细'[销量]:这是一个列引用,它指向了表中的一个特定列。"明细"是表的名称,"[销量]"是表中的一个字段,表示销售数量。⑥:*是乘法运算符,用于计算两个列的乘积。⑦:'明细'[零售价]:这同样是一个列引用,它指向了表中的另一个特定列。"明细"是表的名称,"[零售价]"是表中的一个字段,表示每个产品的零售价。⑧:"("和")"是与SUMX函数相关联的一对括号,在括号中输入函数所需的参数,参数是提供给函数进行处理的数据。本公式中'明细'和'明细'[销量]*'明细'[零售价]是函数的参数。注意事项1.在Excel公式中,可以引用单个单元格或单元格区域,而在DAX公式中,只能引用完成的数据表或数据列。如果需要引用列中的部分数据或某个值,则需要使用可以筛选列或返回唯一值的DAX函数。2.DAX公式中引用的列名或度量值必须放在一对方括号中。如果引用的表名中存在空格或特殊字符,则必须将表名放在一对单引号中。为了避免出错,建议始终将引用的表名放在一对单引号中。3.如果引用的列与当前DAX公式所创建的度量值或计算列属于同一个表,则可以直接引用列,而不需要为列添加表名的限定。如果引用的是来自其他表中的列,则必须为列添加表名的限定。4.在DAX公式中输入函数名或列名时,会自动显示与当前输入匹配的内容列表。可以使用方向键和Tab键在列表中选中所需内容并将其添加到公式中。注意事项5.如果DAX公式较长,可以使用快捷键Alt+Enter在公式中的指定位置换行输入。6.如果DAX公式的语法不正确,则会返回语法错误。有时即使没有语法错误,也可能会得到错误的结果。谢谢Power
BI数据分析实战模块二
DAX函数目录/Contents理解DAX公式01DAX公式的格式规范02DAX基础函数03筛选器函数0405 DAX函数的特点一、聚合函数二、
日期和时间函数三、逻辑函数四、文本函数五、信息函数六、数字函数七、关系函数DAX基础函数03一、聚合函数聚合函数也称统计函数,用于执行聚合操作。例如:求和、求平均值、求最小值和最大值等。常用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 婴幼儿口腔护理与亲子互动
- 甘肃省武威市凉州区洪祥中学2026届初三第十七次模拟考试数学试题含解析
- 江苏省苏州市姑苏区2026届初三下学期统练(五)数学试题试卷含解析
- 黑龙江省哈尔滨第六十九中学2026届高一年级5月学情调研数学试题试卷含解析
- 贵州遵义市正安县2025-2026学年初三下学期三模考试数学试题含解析
- 湖北恩施沐抚大峡谷重点达标名校2026届初三下学期期中(第三次月考)考试数学试题含解析
- 广东省汕头市潮南区2025-2026学年初三下学期第二次阶段考试数学试题含解析
- 广东省广州市番禺区广博校2026年初三教学质量调研(四模)考试物理试题含解析
- 公司研发部绩效考核制度
- 培训教育中心管理制度
- 社会组织法律风险防范指南
- Web服务版本发布规范
- HJ349-2023环境影响评价技术导则陆地石油天然气开发建设项目
- GB/T 2423.21-2025环境试验第2部分:试验方法试验M:低气压
- 留园完整版本
- 建设工程工程量清单计价标准(2024版)
- 2025新热处理工程师考试试卷及答案
- 《数智时代下的供应链管理:理论与实践》课件 第1-7章 理解供应链- 供应链经典的生产计划
- 知情同意告知培训
- 江苏单招试题题库及答案
- 废旧空桶处置合同协议
评论
0/150
提交评论