EXCEL数据分析工具PPT课件_第1页
EXCEL数据分析工具PPT课件_第2页
EXCEL数据分析工具PPT课件_第3页
EXCEL数据分析工具PPT课件_第4页
EXCEL数据分析工具PPT课件_第5页
已阅读5页,还剩187页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.1,1.1数据1.2基于Excel的1.3属性数据分析1.4数据显示图1.5数值数据分析,第1章数据和数据分析,2,基于数据的属性:数字类型:123.1万元、23.5、4700点连续数据:23.5等温度变化;离散数据:5回弹、120个容器;属性类型:由文字、判断等表示的数据天气;模糊郑智薰;股市上升、下降;CPI高度、中间、低;质量好、中、差、基于属性的数据是分开的。1.1数据、第一章数据和数据分析、业务数据分类、3,根据数据不随更改状态变化的相对稳定的数据称为静态数据。基于状态的数据称为动态数据。1.1数据,业务数据分类,4,时间序列数据剖面数据,1996年2004年农村和城市家庭恩格尔系

2、数(食品支出占家庭总支出的比例,单位:)随时间变化的数据称为时间序列数据。1.1数据,2002206年某市旅游接待及收入情况,每小时,5,陕西南部2007年经济指标:同期发生的数据称为剖面数据。1.1数据,截面数据,6,品类资料(Categorical/Nominal Data)徐璐组织为其他品类的资料称为类别资料。每种类型的数据通常具有不同的类型和单位。徐璐其他类的数据之间可以进行运算,其他数据不能进行运算。1.1数据,关联标准,7,顺序数据(Ordinal Data),仅表示对象排序顺序的数据称为顺序数据,顺序数据之间的差异或比率通常没有意义。1.1数据,固定距离数据(Interval D

3、ata)数据没有绝对零值,没有乘数,没有比例关系,相互之间的差距只有实际意义。1.1数据,9,固定比率数据(Ratio Data),固定比率数据具有明确的原点,可以计算数据的比例。例如,2008年美国的GDP是中国的4.15倍。1.1数据,10,基于数据连续性的离散数据数据为整数或几个可能的结果之一。例如,顾客投诉的次数、产品不合格的次数是天气晴朗、多云或下雨的情况。连续数据数据是连续变量。例如,产品的成本、利润、交货时间等。1.1数据,11,1.1数据,12,主要利用Microsoft Excel的统计分析功能和丰富的统计图表,Microsoft EXCEL是功能强大、灵活和方便的电子表格软

4、件,也是最常用的办公自动化软件。1.2基于Excel,13,如何在工作表和单元格中输入格式数据条件格式工具数据分离工具,基于1.2 Excel,主要内容,14、工作表和单元格;基于1.2 Excel的基本Excel操作。它包含3个工作表。最多可以包含255个工作表。最多可以输入256列。15、工作表和单元格;基于1.2 Excel的单元格是Excel工作表的基本元素。单元格可以分为数据单元格和公式单元格。16,数据单元,=sum (b $ 83336b $11),=sum(c $ 8336 c $ 11),=sum(d $ 8336d $ 11)、17、单元格格式、Excel单元格格式、“常规

5、”、“数字”、“货币”、“日期”、“时间”、“百分比”、“分数”、“科学计数”、“文本”、“特殊”和“自定义”。1.2基于Excel,选择需要定义格式的单元格,打开Excel菜单:设置单元格格式,弹出单元格格式对话框窗口:18 .“常规”和“文本”两种格式没有格式设置选项,而其他格式有其他选项。例如,数字格式包括小数位数、是否选择千位分隔符以及如何显示负数等选项。1.2基于Excel,单元格式,19,日期格式:可以用定义的日期格式显示日期系列数。日期系列数是从1开始的整数,数字1表示1900年1月1日,2表示1900年1月2日,依此类推。,1.2基于Excel,单元格式,20,日期系列数和日期

6、格式转换如下图所示。=A2,=A3,=A20,1.2基于Excel,单元格式,21,其他时间格式为:1.2基于Excel,单元的格式,22,数据输入是数据分析和建模的第一步,使用正确的数据输入方法可以提高数据输入的效率,减少数据输入中的错误。数据输入方法,1.2基于Excel,以自定义格式输入序列输入有效性工具将函数提取为输入条件函数IF输入字符RIGHT,LEFT,MID输入祖怀函数VLOOKUP输入,23,直接键盘输入键盘输入是Excel数据输入最基本、最常用的输入方法。键盘输入经常出现的问题是以数字格式输入的数字最多为15个字符,超过15个字符的数字会自动转换成科学计数格式。例如,在常规

7、或数字格式的单元格中输入名为33010619580210038的18位身份证号码,按回车确认,然后显示为3.310e117。因此,如果需要输入超过15个字符的数字,请将单元格定义为文本格式,或在常规或数字格式单元格中先输入撇号,然后输入数字。数据输入方法,24,输入自定义格式,如果在某些单元格中输入的数据的字符相同(例如,出生于20世纪,出生地点为杭州居民身份证号码的前8个字符为“330619”等),则可以将需要输入身份证号码的单元格定义为“自定义格式”。这样,输入身份证号码的时候,只要输入以下10个字符,就可以完整地显示身份证号码。数据输入方法,25,上述“自定义格式”的对话框窗口如下所示:

8、数据输入方法,26,以自定义格式输入的结果如下图所示。其中黄色单元的自定义格式为“330010619”。数据输入方法,27,输入序列1,2,3,4,一、二、三、四、A、b、c、d、甲、乙、丁、丁;子,丑,嗯,毛,等等顺序。数字序列的输入方法:输入数字序列的前两个数字,然后拖动单元右下角的十字按钮。或者,使用Excel菜单“编辑填充序列”(edit fill sequences)工具创建数据序列。数据输入方法、基于1.2 Excel、其他序列的方法:打开Excel菜单“工具”“选项”“自定义序列”。在对话框中输入序列,然后单击“添加”。定义序列后,可以像输入数字序列一样输入序列。具体流程是、28

9、,Excel菜单:“工具选项自定义系列”对话框窗口如下所示:数据输入方法,29,序列可以在对话框窗口中直接输入,单击“添加”后生成。下图:数据输入方法,您也可以通过在、30或Excel表格中预先输入序列,然后在对话框中单击“从单元格导入序列”(import sequence from cell)、$ A $ 1: $ A $ 7、“导入”(import此方法更适用于生成较长的序列。数据输入方法,基于1.2 Excel,31,用户定义的序列后,可以输入序列的第一个值,拖动单元格右下角的十字光标以输入整个序列。插图:资料输入方法,32,作为有效性工具,Excel有效性输入工具是数据输入的常用方法,

10、可提高输入效率并减少输入错误。Excel菜单:打开数据有效性。此时将显示以下“数据有效性”对话框窗口:设置、输入信息、错误警告和输入法模式。数据输入方法,33 .其中,设置卡用于设置数据的有效性范围。例如,数值资料可以设定最小值和最大值,以文字为基础的资料可以设定文字长度等。如果输入的数据超出了有效范围,则会出现错误警告。例如,员工的出生日期值必须介于1949年(60岁)和1991年(18岁)之间。手机号码必须是11个字符,有线号码必须是8个字符等。,数据输入方法,34,如果输入的数据是员工出生日期,请从允许下拉菜单中选择日期,然后选择开始日期和结束日期、数据输入方法、35,如果输入的数据是员

11、工身份证号码,则允许下拉,文本长度,数据下拉选择等于,长度输入18,数据输入方法,36,输入信息卡用于自定义用户选择的输入单元时出现的提示信息。例如,对于输入身份证号码的单元格,提示信息如下:数据输入方法,37,选择输入单元时,提示消息的效果如下:数据输入方法,38,数据有效性工具还可以自定义输入错误警告。自定义输入员工出生日期的“错误警告”如下:数据输入方法,39,自定义输入员工身份证号码的“错误警告”下的图:数据输入方法,40,输入的身份证号码少于18个字符时发生的错误警告。数据输入方法,41、有效性工具可以为输入项目设置下拉菜单,尤其适用于输入自定义项目。首先选择单元格C2:C17,然后

12、打开“允许”下拉列表并选择“序列”。数据输入方法,42,在“源”中,输入自定义项目单元格范围E2:E13,然后单击确定。将光标放置在选定C2:C17的每个单元上时,将显示下拉箭头。数据输入方法,43,在选定的下拉菜单中,使用大学名称可以轻松输入选择。数据输入方法,44,如果遇到多个条件,则可以用嵌套的IF函数实现。例如,如果奖金发放额由审核等级确定:将审核等级单元格设置为A2,计算奖金限制的函数将嵌套if (a2= a ,2000,if (a2= b ,1000,0) if函数,最多可嵌套7个级别。嵌套在多个层中的IF函数语法很复杂,很容易出错。对于多个条件,建议使用或VLOOKUP函数实现。

13、数据输入方法,45,用文字提取函数RIGHT,LEFT,MID输入(可选)很多数据包含出生地点、出生日期、性别等信息,18位居民身份证号码中包含。身份证上其他位置的数字对应的信息如下。要从居民身份证号码中提取相应的信息,必须使用上述三个函数。数据输入方法,46,将身份证单元设置为A2并提取出生脂肪:LEFT(A2,2)*10000提取出生时:MID(A2,3,2)*100提取出生县:MID(A2,3,4)提取出生日期:MID,在散点图中插入趋势线,5.1一元线性回归,单变量回归方程1。在散点图中插入趋势线2。回归分析工具,使用175、“GDP”和“年度用电”散点图进行观察,表明“GDP”和“年

14、度用电”相关。在散点图中插入趋势线,176,添加图表/趋势线(仅在选择散点图时显示),将趋势线插入散点图,177,选择趋势线类型,线性,在散点图中插入趋势线,178,选择“选项”,选择“趋势线名称”,选择“自动设置”,选择“显示公式”,然后选择“显示r平方值”。趋势线在散点图上,插入179以获得年度用电量和GDP一元线性回归图、回归线和相关系数R2值、将趋势线插入散点图。180,示例5.1中,年度用电是变量,GDP是自变量,一元线性回归。回归分析工具,寻找单变量回归方程的两种方法1。在散点图中插入趋势线2。回归分析工具,5.1一元线性回归,181,回归分析工具,求单变量回归方程的两种方法1。在

15、散点图中插入趋势线2。回归分析工具,步骤:1)打开工具菜单;2)选择数据分析。3)选择回归。4)根据对话框相关,5.1一元线性回归,选择182,或打开Excel的“工具”/“数据分析”/“回归”菜单,然后分别输入变量y和参数x导致的区域,在新工作表中选择结果输出。、回归分析工具、相关系数r、确定系数R2、观测值数n、回归r、截断、参数、回归系数、标准误差、回归分析工具,如上表所示,一元回归方程式如下:年度用电量=26788.264 0.0791 GDP,185,对每年用电量的观察和预测值的图形,回归分析工具,回归分析的说明:测量回归方程优越性的工具通常为:1 .标准误差用于说明回归方程的代表性大小。其中:y是变量的实际值,是根据回归方程计算的变量估计值。从计算公式中可以看出,标准误差实际上是平均误差。数字越大,所有点距离回归线越远,回归方程的代表性越小。数字越小,所有点离回归线越近,回归方程的代表性就越大。2 .决定系数反映引数和变数之间线性关系的强度。实际值y的总变化:如果回归变化=,则此公式表示可通过回归从总变量差解释的百分比,数字越大,所有点越接近回归线。决定系数R2,回归分析工具,年用电量=26788.264 0.0791 GDP,对年用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论