




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
业务数据的分析方法 学员使用EXCEL的熟练程度 学员对数理统计的熟悉程度 议程 利用EXCEL分析数据常用统计软件数据挖掘常用统计方法 描述统计假设检验方差分析回归分析 利用EXCEL分析数据常用图和表 折线图 饼图 面积图 频数表和柱状图 散点图 时间序列数据透视图常用简单的统计命令 AVERAGE VAR STDEV MODE MEDIAN SUM SUMIF SUMPRODUCT COUNT COUNTIF MAX MIN QUARTILE PERCENTILE 利用EXCEL分析数据 折线图 折线图 显示随时间或类别而变化的趋势线 折线图类型 利用EXCEL分析数据 饼图 饼图 显示每一数值相对于总数值的大小 分离饼图强调单个数值的大小 饼图类型 利用EXCEL分析数据 面积图 面积图 显示每一数值所占大小随时间或类别而变化的趋势线 面积图类型 利用EXCEL分析数据 柱状图 柱状图 比较相交于类别轴上的数值大小 堆积柱状图 比较相交于类别轴上的每一数值相对于总数值的大小 柱状图类型 条形图类型 条形图也可用一种类似的方法显示数据 仅仅是将垂直方向换成水平方法而已 堆积条形图可以在同一个条上连续地显示各种数据 而不像簇状条形图那样把条并列在一起显示数据 频数分析和直方图 频数分布表指 在不同的类别里发生了多少次观测值直方图通过图形的方式表达了同样信息 直方图的应用举例 来自Shoes xls 利用EXCEL分析数据 散点图 散点图 比较成对的数值 散点图类型 利用散点图的关系分析 我们经常关心两个变量之间的关系 一个非常有用的显示这个关系的方法是对每一个观测值都在图上作一个点 这个点的坐标代表了两个相关变量的值 结果产生的图就是散点图 通过检查散点的分布 我们可以查看两个变量之间有没有什么关系 如果有 是什么样的关系 来自Actors xls 例5 时间序列制图 时间序列图的本质是散点图 时间序列变量在纵轴 时间变量在横轴 同时为了分布的趋势更加清晰 这些点通常是通过线连接在一起 来自Toys xls 例6 练习 分析某某区近期得业务状况 分析指标 总收件票数 日均收件票数 日人均效能要求 各指标逐月变化情况各指标的相关性各分部的票数占该区总票数的比例变化 数据透视图 数据透视图报表是一种具有图表格式的交互式数据汇总报表 是一个Excel功能很强大 而且易于使用的工具 这个工具提供了大量有用的信息 可以让我们可以从不同角度切割 就是可以把数据分成一些子集 数据透视表的创建与常规的MicrosoftExcel图表不同 在创建数据透视图报表后 您还可以通过拖动其字段和项目来查看不同层次的明细数据或重新组织图表的版式 例7 AccountingProfessionals xls数据集 来自AccountingProfessionals xls 创建数据透视图的步骤 选择数据范围确定所要创建表格的类型确定字段设置选择报表格式选择读取方式 数据透视表的优点在于 如果想要改分析 可以仅仅将带有阴影的变量名拖出透视表 并用其他变量代替 你能轻易地在字段域中增加多个变量来创建不同的数据图 创建数据透视图的优点 利用EXCEL分析数据常用图和表 折线图 饼图 面积图 频数表和柱状图 散点图 时间序列数据透视图常用简单的统计命令 AVERAGE VAR STDEV MODE MEDIAN SUM SUMIF SUMPRODUCT COUNT COUNTIF MAX MIN QUARTILE PERCENTILE 平均值 平均值 是某个变量所有值的平均数 如果数据代表了一个大量数据的样本 我们就叫他样本均值 如果是对象是整体分析 就是整体均值 公式 Excel命令 AVERAGE 四分位数和百分比 Excel命令 QUARTILE salary 1 返回一组数据的四分位点PERCENTILE salary 05 返回一组数据的K百分比的数值点 最小值 最大值 Excel命令 MAX number1 number2 返回一组数据的最大值 忽略文本MIN number1 number2 返回一组数据的最小值 忽略文本 方差 描述样本数据的离散程度公式 Excel命令 VAR supplied STDEV supplied 计算均值 中位数 众数 方差举例 RangenamesSupplier1 A4 A14Supplier2 B4 B14 来自Otis4 xls 相关分析 用于反映分析变量间的密切程度相关系数度量的是两个间隔尺度变量之间线性关联关系的程度 正的相关系数表示一个变量的较大值和另一个变量的较大值是联系在一起的 而负的相关系数则表示一个变量的较大值和另一个变量的较小值之间具有的关联关系 相关分析举例 来自Expenses xls 相关分析举例 用于运动的支出与用于文化的支出的关系 来自Expenses xls 来自Expenses xls 相关分析举例 收入与用于文化的支出的关系 相关分析举例 相关系数与协方差 来自Expenses xls 数据分析的常用软件 MINITABSPSSEXCEL XLSTAT 议程 利用EXCEL分析数据常用统计软件数据挖掘常用统计方法 描述统计假设检验方差分析回归分析 数据挖掘 DataMining 什么是DataMining DataMining的应用DataMining算法包括 预测 Prediction 分类 Classification 联系 Association 回归 Regression 什么是DataMining 通过采用自动或半自动的手段 从大量数据中提取出可信 新颖 有效并能被人理解的信息的高级处理过程按企业既定业务目标 对大量的企业数据进行探索和分析 揭示隐藏的 未知的或验证已知的规律性 并进一步将其模型化的先进有效的方法数据挖掘能够帮助你选择正确瞄准潜在目标 向现有的客户提供额外的产品 识别那些准备离开的好客户 发现最有价值的客户 数据挖掘的作用 使组合销售更有效率 数据挖掘的作用 留住那些最有价值的客户 数据挖掘的作用 用更小的成本发现欺诈现象 数据挖掘的作用 数据挖掘应用领域 电信 流失银行 聚类 细分 交叉销售百货公司 超市 购物篮分析 关联规则 保险 细分 交叉销售 流失 原因分析 信用卡 欺诈探测 细分电子商务 网站日志分析税务部门 偷漏税行为探测警察机关 犯罪行为分析医学 医疗保健 议程 利用EXCEL分析数据常用统计软件数据挖掘常用统计方法 描述统计假设检验方差分析回归分析 假设检验 涉及对总体参数数值有关的两个命题 假设 作推断步骤提出待检验的假设选择显著性水平确定一个作结论的判断准则收集数据并计算检验统计量用决策法则检验统计量并得出结论假设检验包括 t检验和z检验 方差分析 ANOVA 单因素方差分析 通过简单的方差分析 对两个以上样本平均值进行相等性假设检验 样本取自具有相同平均值的样本总体 此方法是对双平均值检验 如t 检验 的扩充 可重复双因素分析 对单因素方差分析的扩展 即每一组数据包含不止一个样本 无重复双因素分析 通过双因素方差分析 但每组数据只包含一个样本 对两个以上样本均值进行相等性假设检验 样本取自具有相同平均值的样本总体 此方法是对双平均值检验 如t 检验 的扩充 回归分析 回归分析是一种用于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论