Excel数据分析PPT课件(PPT 72页)_第1页
Excel数据分析PPT课件(PPT 72页)_第2页
Excel数据分析PPT课件(PPT 72页)_第3页
Excel数据分析PPT课件(PPT 72页)_第4页
Excel数据分析PPT课件(PPT 72页)_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Excel教程数据统计和处理分析第1页,共72页。学习要求熟悉Excel使用界面和基本操作了解Excel的常用统计函数掌握使用Excel透视表和透视图进行数据分析和分类汇总学会使用Excel进行数据高级分析第2页,共72页。Excel背景介绍Excel是微软公司office系列办公软件的组件之一,它是一个功能强大的电子表格程序,具有强大的数据处理和数据分析能力,是个人及办公事务中进行表格处理和数据分析的理想工具之一。Excel不仅可以将整齐而美观的表格呈现给用户,还可以用来进行数据的分析和预测,完成许多复杂的数据运算,帮助使用者做出更加有根据的决策。同时它还可以将表格中的数据通过各种各样的图形

2、、图表的形式表现出来,增强表格的表达力和感染力。第3页,共72页。Excel工作界面标题栏(工作簿名称)快速访问工具栏菜单栏功能区编辑栏状态栏全选行标题列标题活动单元格第4页,共72页。Excel功能使用统计函数统计数据按分类汇总统计数据使用图表统计数据数据的假设检验分析数据的描述统计分析规划求解与最优化方案选择使用排序和筛选分析数据数据的预测分析数据的透视分析问卷调查分析使用交互图表分析数据数据的抽样分析第5页,共72页。课程内容1. Excel应用基础1.1 Excel数据录入 1.2 Excel 数据处理 1.3 Excel 安全设置2. Excel函数应用 2.1 Excel函数介绍

3、2.2 常用函数介绍3. Excel图表应用 3.1 图表基础 3.2 常用图表4. 数据透视表与数据透视图4.1 数据透视表 4.2 数据透视图5. Excel统计分析功能5.1 描述统计 5.2 检验分析 5.3 方差分析5.4 回归分析第6页,共72页。1.1 Excel数据录入数据类型数字可进行数学计算【默认右对齐】数值(整数、小数、分数)日期、时间文本用于说明数据的含义,不进行数学计算【默认左对齐】中文汉字、字母数字和文本或符号的组成逻辑值TRUE、FALSE【默认居中对齐】日期默认使用 / 或 隔开1900-1-1时间默认使用 : 隔开,24小时制23:59:59日期时间日期时间默

4、认用空格隔开1900-1-1 23:59:59第7页,共72页。设置单元格格式第8页,共72页。1.2 Excel数据处理排序(数据有序化)普通排序(内置序列) | 自定义排序(自定义序列)单列/行排序 | 多列/行排序第9页,共72页。数据筛选 仅显示满足条件的数据,隐藏不满足条件的数据自动筛选自定义筛选高级筛选筛选不重复记录删除重复项第10页,共72页。分类汇总对数据按类别进行汇总统计分析分类汇总之前一定要先进行排序各列须有列标题(字段名)分类汇总类型单字段分类汇总多字段分类汇总嵌套分类汇总第11页,共72页。1.3 Excel安全设置对工作表保护只希望对工作簿中的某一两个工作表设定只读或

5、隐藏状态打开 审阅-保护工作表选择允许用户进行的操作输入保护密码第12页,共72页。对工作簿保护需要对整个工作簿进行安全设置打开 审阅-保护工作簿输入保护密码第13页,共72页。补充:工作簿和工作表区别?工作簿是处理和存储数据的文件。由于每个工作簿可以包含多张工作表,因此可在一个文件中管理多种类型的相关信息。工作表可以显示和分析数据。用户能够同时在多张工作表上输入并编辑数据,并且可以对不同工作表的数据进行汇总计算。在创建图表之后,既可以将其置于源数据所在的工作表上,也可以放置在单独的图表工作表上。第14页,共72页。函数定义函数就是预定义的公式。它使用一些参数进行运算并产生返回结果。Excel

6、中有350多个内置函数,分数学与三角函数、财务函数、统计函数、工程函数等11大类,用户还可以使用VBA自定义函数。函数可以分为有参数函数和无参数函数函数可以嵌套调用例:=IF(AVERAGE(A2:A5)50,SUM(B2:B5),0)=IF(A2=10,”科技处”,IF(A2=20,”财务处”,“人事处”)2.1 Excel函数介绍 第15页,共72页。公式与函数区别?公式和函数使Excel实现数据计算的重要工具公式:是对数据执行计算和操作的等式函数:是预先定义的计算公式,可实现复杂的计算和操作公式:=(A1+A2+A3+A100)/100函数:= AVERAGE(A1:A100) 第16页

7、,共72页。函数组成参数用括号()括起参数类型: 无参数型括号必须保留 有参数型1个/固定数量/不确定数量 必要参数 可选参数参数形式:引用、表达式、函数、常量函数名称(参数1,参数2,参数3,.)SUM(A1,C3:C6,E5/3,SUM(F1:F9),325)第17页,共72页。2.2 常见函数介绍统计数据的个数的函数COUNT计算日期和数值的个数COUNTA计算数据的个数COUNTBLANK计算空白单元格的个数COUNTIF求满足条件的单元格个数求平均值的函数AVERAGE计算数值数据的平均值AVERAGEA计算所有数据的平均值计算倍数和众数的函数MEDIAN计算数据群的中位数MODE计

8、算数据群的众数第18页,共72页。计算最大值和最小值的函数MAX计算数值的最大值MAXA计算所有数据的最大值MIN计算数值的最小值MINA计算所有数据的最小值计算方差的函数VAR计算数据群的中位数VARA计算数据群的众数VARP通过数值计算方差VARPA通过所有数据计算方差制作频度的函数FREQUENCY计算区间里所含数值的个数计算标准偏差的函数STDEV通过数值推测数据集的标准偏差计算各种总计值的函数SUBTOTAL计算各种总计值第19页,共72页。在单元格中插入函数找到公式选项选择插入函数根据函数类别找到插入函数选择处理的数据区域第20页,共72页。应用举例一某班级的成绩表,如下图所示,其

9、中有两个学生的该门课程缺考,需要分别用到AVERAGE和AVERAGEA函数来计算两个不同的平均值。第21页,共72页。【操作步骤】在单元格D3中输入公式“=AVERAGE(B2:B9)”,可以计算参加考试学生的平均成绩,函数AVERAGE在计算时对缺考的两个学生的成绩自动认为是0。在单元格D6中输入公式“=AVERAGEA(B2:B9)”,可以计算全体学生的平均成绩,对缺考的学生成绩,AVERAGE函数将自动忽略。第22页,共72页。某班级的成绩表,如下图所示。需要用到FREQUENCY函数来来统计各个分数段的分布学生人数。应用举例二第23页,共72页。FREQUENCY函数功能:统计指定单

10、元格区域中数据的频率分布。由于函数 FREQUENCY 返回一个数组,必须以数组公式的形式输入。语法形式: FREQUENCY(data_array,bins_array)data_array为一数组或对一组数值的引用,用来计算频率。如果 data_array 中不包含任何数值,函数 FREQUENCY 返回零数组。bins_array为一数组或对数组区域的引用,设定对 data_array 进行频率计算的分段点。如果 bins_array 中不包含任何数值,函数 FREQUENCY 返回 data_array 元素的数目。第24页,共72页。【操作步骤】在E4E7单元格输入进行频率计算的分段

11、点59,69,79,89;选中F4F8单元格,作为输出统计结果的单元格;在公式栏输入“=FREQUENCY(B2:B11,E4:E8)”,然后按下“CtrlShiftEnter” 组合键锁定数组公式即可。 输入数组公式首先必须选择用来存放结果的单元格区域(可以是一个单元格),在编辑栏输入公式,然后按CtrlShiftEnter组合键锁定数组公式,Excel将在公式两边自动加上花括号“ ”。 第25页,共72页。CORREL函数功能:计算单元格区域中的两个数列之间的相关系数。语法形式: CORREL(arrnyl,arrny2)arrnyl和arrny2表示的都是两个数据列CORREL函数可以用

12、来分辨两种属性之间的关系。第26页,共72页。某医生为了探讨缺碘地区母婴TSH水平关系,应用免疫放射分析测定了160名孕妇(孕周1517w)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据如图所示,试求脐带血TSH水平对母血TSH水平的相关系数。应用举例三第27页,共72页。【操作步骤】选中结果输出单元格B14;在公式栏输入“=CORREL(C3:C12,B3:B12)”,点击公式栏 按钮;在单元格A14输入“相关系数”即可。第28页,共72页。链接:相关系数相关系数是研究变量之间线性相关程度的量,一般用字母 r 表示。Cov(X,Y)为X与Y的协方差,VarX为X的方差,VarY为

13、Y的方差r(X,Y)是表示变量X与Y之间紧密程度的量相关系数定量地刻画了 X 和 Y的相关程度,即|xy|越大,相关程度越大;|xy|=0越大,相关程度越大; 第29页,共72页。3.1 图表基础图表介绍 图表:是数据的图形化表示,是动态的随对应数据的变 化而自动更新。 将数据用图来描述:抽象、枯燥的数据形象直观、易于理解清晰的表现出数据的差异、变化趋势和数据间的关系采用不同的图表类型,可以发现数据不同方面的特点规律 图表放置位置与数据位于相同工作表中嵌入式图表单独占据一个新工作表图表工作表第30页,共72页。图表组成图表区绘图区数据系列(某一行/列)横坐标(分类轴)纵坐标(数值轴)网格线图例

14、标题(图表标题、横纵坐标标题)数据标签第31页,共72页。3.2 常用图表柱形图:显示一段时间内数据变化/各项之间的比较情况折线图:显示在相等时间间隔下数据的变化趋势饼图:显示一个数据系列的中各项大小与各项总和的比例条形图:显示各项之间的比较情况(适于分类轴标签很长的情况)面积图:强调数量随时间变化的程度/引起对总之趋势 的注意XY散点图:显示若干数据系列中两个变量之间的关系第32页,共72页。Excel 中常见图表第33页,共72页。创建图表过程确保数据适合图表选择包含数据的区域插入图表选择图表类型 生成基本图表“图表工具”关联菜单 更改外观/布局、图表数据、图表元素修饰/修改图表第34页,

15、共72页。为了反映医院管理的质量,某市抽样调查了几所医院的6 项指标(指标值越大表示质量越高),其中三所医院的调查结果如图2-65所示,请绘制雷达图反映三所医院的管理质量。应用举例四第35页,共72页。第36页,共72页。THANK YOUSUCCESS2022/7/2037可编辑第37页,共72页。数据透视表是一种对大量数据快速汇总和建立交叉列表的交互式表格。它不仅可以转换行和列以查看源数据的不同汇总结果,显示不同页面以筛选数据,还可以根据需要显示区域中的明细数据,这对分析、组织复杂数据是非常方便有用的。数据透视表最大的特点就是它的交互性。创建一个数据透视表以后,可以任意重新排列数据信息,并

16、且还可以根据习惯将数据分组。4.1 数据透视表第38页,共72页。数据透视表的优势大量数据的速度汇总多维度的数据分析通过筛选对重点关注内容的专题分析生成动态报表,保持与数据源同步更新值显示方式,可以一步搞定百分比(同比、环比、占比.)一张数据透视表仅靠鼠标移动字段位置,可变换出各种类型的报表第39页,共72页。创建数据透视表制作数据透视表所需要的数据选择数据源选择透视表位置第40页,共72页。数据透视表设置和显示数据透视表数据透视表设置区域第41页,共72页。4.2 数据透视图 数据透视图可以看作是数据透视表和图表的结合,它以图形的形式表示数据透视表中的数据。正像在数据透视表里那样,用户可以更

17、改数据透视图报表的布局和显示的数据。数据透视图具有Excel图表显示数据的所有能力,而且同时又具有数据透视表的方便和灵活等特性。第42页,共72页。创建数据透视图1、选中数据透视表2、点击插入3、插入数据透视图4、选择插入的透视图第43页,共72页。数据透视图数据透视表数据透视图第44页,共72页。5.1 描述统计描述统计是基础分析工具之一,用于生成对输入区域中数据的统计分析报表,提供有关数据趋中性和易变性的信息,而这些信息是进一步分析数据的起点,可以指示哪一种检验适合进一步的探讨。描述统计的统计函数一般包括:MAX、MIN、AVERAGE、MEDIAN、GEOMEAN、HARMEAN、AVE

18、DEV、STDEV、VAR、KURT和SKEW函数等,他们分别用于计算最大值、最小值、平均值、中位数、几何平均数、调和平均数,以及变异统计的平均差、标准差、方差峰度和偏度。第45页,共72页。某老师对几名学生的五次考试成绩进行分析,以便对这几个学生在学习方面存在的问题加以解决。使用“描述统计”分析工具对其数据进行分析。应用举例五第46页,共72页。1、执行菜单栏的“数据”|“数据分析”命令,打开“描述统计”对话框。2、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($A$4:$F$8)。3、单击“逐行”选项。4、选中“标志位于第一列”选项。5、在“输出选项”下单击“新工作表组”选项,并

19、在对应编辑框中输入新工作表的名称,如:“描述统计结果”。【操作步骤】第47页,共72页。5.2 检验分析t-检验:“平均值的成对双样本分析”分析工具及其公式可以进行成对双样本t-检验,用来确定样本平均值是否不等。此t-检验窗体并不假设两个总体的方差是相等的。当样本中出现自然配对的观察值时,可以使用这种成对检验。例如,对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。第48页,共72页。某医院用中药治疗9例再生障碍性贫血,结果如下图所示。试用“t-检验:平均值的成对二样本分析”工具,分析治疗前后是否有改变?应用举例六第49页,共72页。【操作步骤】(1)在Excel2016,创建一个新

20、的Excel工作薄,如上图所示输入需要分析的数据;(2)执行菜单栏中的“数据”|“数据分析”命令,打开“数据分析”对话框,选中“分析工具”列表框中的“t-检验:平均值的成对二样本分析”选项。第50页,共72页。5.3 方差分析单因素方差分析该分析工具通过简单的方差分析,对两个以上样本平均值进行相等性假设检验(样本取自具有相同平均值的样本总体)。此方法是对双平均值检验(如t-检验)的扩充。第51页,共72页。某医院用三种方法治疗某种疾病,结果如下表所示,试问三组治愈天数有无差别?中药37762西药9121185中西结合12467应用举例七第52页,共72页。【操作步骤】(1)执行菜单栏中的“数据

21、”|“数据分析”命令,打开“数据分析”对话框,选中“分析工具”列表框中的“方差分析:单因素方差分析”选项;(2)单击“确定”按钮,执行“方差分析:单因素方差分析”对话框; 第53页,共72页。协方差“协方差”工具用来度量两个区域中数据的关系,用于返回各数据点与其各自所在数据组的平均值之间的偏差乘积的平均值。 使用协方差工具可以用来确定两个区域中数据的变化是否相关,即一个集合的较大数据是否与另一个集合的较大数据相对应(正协方差);或者一个集合的较小数据是否与另一个集合的较大数据相对应(负协方差);还是两个集合中的数据互不相关(协方差为零)。协方差对度量单位是敏感的。第54页,共72页。18名儿童

22、身高、体重、表面积测定数据如下图所示,试利用“协方差”分析工具分析身高、体重、表面积三个指标之间的关系。应用举例八第55页,共72页。【操作步骤】(1)执行菜单栏中的“数据”|“数据分析”命令,打开“数据分析”对话框,选中“分析工具”列表框中的“协方差”选项;(2)选择数据输入区域和输出区域(3)单击“确定”按钮,执行“协方差”对话框。 第56页,共72页。5.4 回归分析通过对一组观察值使用“最小二乘法”直线拟合进行线性回归分析,可用来分析单个因变量是如何受一个或几个自变量影响的。例如,观察某个运动员的运动成绩与一系列统计因素的关系,如年龄、身高和体重等。可以基于一组已知的成绩统计数据,确定

23、这三个因素分别在运动成绩测试中所占的比重,使用该结果可对尚未进行过测试的运动员的表现做出预测。在实际工作中,相关系数与回归分析是研究现象之间相互依存关系的不可分割的两个方面。一般先进行相关分析,根据相关系数或相关指数的大小对变量进行筛选,剔除不相关或是相关性小的变量,然后再进行回归分析,建立回归模型,进行预测。第57页,共72页。回归分析步骤1、根据预测目标,确定自变量和因变量2、绘制散点图,确定回归模型3、估计模型参数,建立回归模型4、对回归模型进行检验5、利用回归模型进行预测第58页,共72页。设有某地10名3岁儿童体重与表面积资料如下图所示,试做相关系数分析和回归分析。应用举例九第59页

24、,共72页。【操作步骤】(1)首先进行相关系数的分析。执行菜单栏中的“数据”|“数据分析” |“相关系数”选项;执行“相关系数分析”对话框依次完成。(2)由于3岁儿童的体重与体表面积有较强的相关性,因此需要利用回归分析工具进一步建立回归模型。执行菜单栏中的“数据”|“数据分析”|“回归”选项;执行“回归”对话框依次完成。 第60页,共72页。补充:时间序列预测除了回归分析预测,另一种预测方法就是根据时间发展进行预测。时间序列预测法的基本特点:假设事物发展趋势会延伸到未来预测所依据的数据具有不规则性不考虑事物发展之间的因果关系主要包括移动平均法、指数平滑法等第61页,共72页。3.5 移动平均移动平均法是一种改良的算术平均法,它是根据时间序列逐期退役,依次计算包含一定期数的平均值,形成平均值时间序列,以反映事物发展趋势的一种预测方法。移动期数的大小视具体情况而定,移动期数少,能快速地反映变化,但不能反映变化趋势;移动期数多,能反映变化趋势,但预测值带有明显的滞后偏差。移动平均可以消除或减少时间序列数据受偶然性因素干扰而产生的随机变动影响,适合短期预测。第62页,共72页。移动

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论