




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2019 12 21 BasicStatistic基本统计学 2019 12 21 数据的分类 2019 12 21 什么是数据 数据是来自观察的 由一个过程所搜集得来的数据可让我们描绘过程 了解过程 改善过程甚至控制过程 Data 数据驱动决策和行动 2019 12 21 数据在过程改善中的重要性 InGodwetrust我们只相信上帝 所有其他人请拿出数据来 2019 12 21 两种主要数据类型 离散数据 变量数据 2019 12 21 练习一 请标出下列数据的类型 A代表计数型数据 V代表计量型数据 顾客平均消费 电话待机时间产品是否合格职员 Tom Nancy Howard 支出与预算相符输入支出费用的时间 2019 12 21 答案 顾客平均消费 电话待机时间v产品是否合格A职员 Tom Nancy Howard A4 支出与预算相符A5 输入支出费用的时间v 数据类型 VorA 2019 12 21 小组讨论 练习二 计量型数据计量型数据的益处 计量型数据的缺点 计数型数据计数型数据的益处 计数型数据的缺点 2019 12 21 小组讨论 答案计量型数据 益处 1 能够为使用相对小范围抽样的过程提供详细的信息2 适用于低缺陷率3 能够预估发展趋势和情况 缺点 1 通常较难得到数据2 分析更为复杂 2019 12 21 小组讨论 答案计量型数据 益处 容易得到数据 并且计算方法简单2 数据容易理解3 数据随时可得 缺点 1 无法显示缺陷怎样发生及过程如何变化2 不适合低缺陷率 需要大量的抽样 3 不能预测发展趋势和情况 2019 12 21 数据类型比较 2019 12 21 知识水平 1 没有数据 也没有经验 只有观点 2 没有数据 只有经验 3 收集了数据 但只是看数字有多少 4 分组的数据 图表 5 描述性统计数据 中数 标准差等等 6 推理性统计 预测过程绩效 能力分析 回归和实验计划法 2019 12 21 转化计数型数据 如可以 将计数型数据转换为计量型数据能增加它的功能 计数型数据 计量型数据 转换为 2019 12 21 VariableData计量型数据 2019 12 21 计量型数据 学习目的 完成此阶段学习后 学员能够 利用数据的分布形状 中央趋势和变异大小进行特性化 如果数据是正态分布的 计算z数值 利用Z数值表确定超出某一数值的比例 2019 12 21 离散数据与连续数据 连续数据的优点 离散 稀少的信息连续 丰富的信息 2019 12 21 统计学基本术语 Population总体想要测量对象的全部Parameter参数用总体的所有数据计算出的数值 如均值 标准差 称为总体的参数 x 参数总体平均值总体标准差 总体 2019 12 21 统计学基本术语 Sample样本从总体抽出的部分数据Statistics统计量用样本的所有数据计算出的数值 如均值 标准差 称为样本的统计量 x 统计量样本平均值样本标准差 总体 样本 2019 12 21 统计学基本术语 Population总体已制造或将要制造对象的全体集合 用所关注的特性描述我们究竟能否知道真正的整体参数 Sample样本统计研究中实际测量的目标组样本通常是整体的子集 整体标准差 S 样本标准差 2019 12 21 描述计量型数据集 报告上司 河水深度1 6M 士兵平均高度1 7M 过河没有问题 但是 至于我们不能只看平均值 还需要利用其他统计量来分析 2019 12 21 描述计量型数据集 一组计量型数据能显示以下3个特性 CentralTendency Mean Median Mode 中央趋势 均值 中值 众数 Variable range StandardDeviation Variance 变异 全距 标准差 方差 Shape形状 2019 12 21 参数和统计量符号 Mean均值Variance方差StandardDeviation标准差Proportion比例 总体 参数 样本 统计量 s2sp 2019 12 21 位置测量 CentralTendency 中心趋势Mean均值Median中值Mode众数Quartiles四分值 2019 12 21 样本均值若样本 样本量为n 的观测值为x1 x2 xn 则样本均值为 类似地 一个有着大量但限个 N个 观测值的总体 其总体均值为 Mean均值 2019 12 21 Mean均值 练习三10个连接线的拉拔强度为 230240236248252278265262拉拔强度的均值是多少 10个观测值的均值为 2019 12 21 Mean均值 练习四199X年一个行动中 战机进行了3000次战斗 总共用时6900小时 那末每次战斗平均用时多少 每次战斗平均用时为 注意所使用的符号 2019 12 21 均值的特性 均值的计算使用了每个观测值 每个观测值对均值都有影响 所有观测值对均值的偏差的总和为零 均值对极端的观测值很敏感 极端值会导致均值向他偏移 2019 12 21 Median中值 将一组观测值按大小顺序排列 位于中心的数值即为中值若观测值的个数为偶数 则中值为中间2个数值的平均若观测值的个数为奇数 则位于中心的数值即中值 2019 12 21 Median中值 样本中值假如x 1 x 2 x n 是按大小排序的样本值 则样本中值为 中值的优点是不受极端大或极端小的观测值的影响 2019 12 21 Median中值 练习五假设一个样本观测值为 3124786样本均值和样本中值是多少 这2个值是测量数据中心趋势的合理指标吗 2019 12 21 Median中值 b 假如最后一个数值改变为 3124782680则样本平均值和样本中值是多少 据此你有何结论 2019 12 21 Median中值 MedianvsMean中值与均值因为中值不象均值对极端值敏感 因此 当有极端大或极端小值时 中值比均值更能代表数据的位置典型的例子是一个城市居民的收入中位值 2019 12 21 中值有时会有欺骗性 50 50 Rule 一半一半准则 以下一组数据的中值是多少 2 2 2 2 2 2 90可以用一半一半准则吗 2019 12 21 Mode众数 众数是样本中出现次数最多的观测值 众数可以是唯一的 也可以有不止一个 有时并不存在众数 2019 12 21 Mode众数 练习六如果样本观测值为 a 691358134613110136913581346131106256134372681众数是什么 具有一个众数 两个众数或多于两个众数分布的数据分布叫什么 单峰分布 2019 12 21 Mode众数 为何使用众数 当观测值为分类式 如名义数据 序列数据 时 众数是描述数据位置的最好的指标 典型的例子是 一个公司内员工收入的众数 众数的重要信息当众数不止1个时 从中抽取样本的总体通常是多个总体的混合 2019 12 21 均值 中值 众数的比较 正态分布 偏上分布 偏下分布 2019 12 21 Quartiles四分值 将一组按大小顺序排列的数据平均分为四部分 分界点即四分值 第一四分值 低四分值 约25 的观测值小于它 第二四分值 约50 的观测值小于它 即中值 第三四分值 高分值 约75 的观测值小于它 2019 12 21 Quartiles四分值 练习七以下为20个电灯泡失效期间的观测值 已按递增顺序排列 2102162523003664546247208169241216129613921488154224802856319235283710请确定三个四分值 计算方法 先确定位置再计算四分值Q1的位置 n 1 4Q2的位置 2 n 1 4 n 1 2Q3的位置 3 n 1 4 2019 12 21 Quartiles四分值 答案Q1的位置 n 1 4 20 1 4 21 4 5 25Q2的位置 2 n 1 4 2 20 1 4 2 21 4 10 5Q3的位置 3 n 1 4 3 20 1 4 3 21 4 15 75则 Q1 366 454 366 0 25 388Q2 924 1216 924 0 5 1070Q3 1542 2480 1542 0 75 2245 5 2019 12 21 Quartiles四分值 2019 12 21 散布的测量 变异 Range极差Variance方差StandardDeviation标准差Inter QuartileRange四分植极差 2019 12 21 Range极差 样本极差为样本中最大和最小观测值之间的差别 即 极差是测量数据散布或变异的最简单的方法但它忽略了最大和最小值之间的所有信息 r xmax xmin 2019 12 21 Range极差 试考虑以下的2个样本 102050607090 and 10 40 40 40 90 具有相同的极差 r 80 但是 第二个样本的变异只是2个极端数值的变异 而在第1个样本 中间的数值也有相当大的变异 当样本量较小 n 10 时 极差丢失信息的问题不是很严重 2019 12 21 方差与标准差 若x1 x2 xn是一个具有N个观测值的样本 则样本方差为 样本标准差是样本方差的算术平方根 即 2019 12 21 方差计算 练习八 计算下列观测值的方差和标准差 30507090110130 2019 12 21 方差计算 2019 12 21 方差与标准差 再考虑以下2个样本 SampleA 102050607090SampleB 104040404090SampleASampleBRange极差8080Variance方差 StandardDeviation标准差 2019 12 21 方差与标准差 类似于样本方差S2 用总体的所数据计算出总体变异 总体方差 2 总体的标准差 是总体方差的算术平方根对于包含N个数值的有限总体 其方差为 2 2019 12 21 方差特性 方差计算使用了所有观测值 每个观测值对方差都有影响方差对极端值很敏感 因平方的缘故 极端大的观测值会严重的放大方差 2019 12 21 四分值极差 四分值极差是测量散布的另一指标 IQR Q3 Q1四分值极差不如极差对极端值敏感当分布显著不对称时 用它衡量散布会更好样本 10 20 50 60 90 和 10 40 40 40 90 的四分值极差分别是40和0 2019 12 21 TheNormalDistribution正态分布 正态分布是一种具有特定的 非常有用的特性的数据分布这些特性对我们理解所研究之过程的特性十分有用大部分自然现象和人造过程是正态分布或可有正态分布描述 2019 12 21 TheNormalDistribution正态分布 特性1 只需知道下述两项参数就可完整描述正态分布均值标准差 分布1 分布2 分布3 此三项正态分布有何区别 2019 12 21 正态曲线和概率 特性2 曲线下面的面积可用来估算某一特定事件发生的累积概率 得到在两个值之间的某个价值的累积概率 99 73 95 68 离均值的标准差数目 样本值的概率 40 30 20 10 0 2019 12 21 标准差的经验规则 当一组数据不是最理想正态分布时 前述累积概率规则仍可应用比较理论 理想 正态分布和经验 现实 分布 2019 12 21 正态分布特点 StandardDeviation标准差 Average标准差 2019 12 21 长期和短期能力 Z 偏差 ZLT ZST 1 5 2019 12 21 正态分布 鉴于许多过程输出都是呈正态分布 所以可以用正态曲线的特点预测过程对象总体 即使非正态数据也能转化为正态数据 所以正态曲线的特点仍然可以用来做预测 2019 12 21 正态曲线下的区域 分析过程能力时 我们运用正态曲线下的区域预测超过规格界限的产品所占的比例 5 5 规格上限USL 规格下限LSL 2019 12 21 标准正态分布 标准正态分布 也叫Z分布 有下列参数 Z代表距离均值的标准差的数量 0 1 2019 12 21 Z代表从均值到能在达到 容纳 多少个标准差 3S的Z数值是多少 2019 12 21 将实际单位转化为Z单位 文员职位安排时间 u 20 0days 5days 5101520 025303
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 离婚时债务处理与子女抚养费支付协议
- 《离婚谈判实战技巧:三要素构建离婚调解协议》
- 离婚房产分割及原配夫妻赡养费支付协议
- 作物遗传改良-洞察及研究
- 服务网格异步流处理-洞察及研究
- 地图学在人口迁移动态监测中的价值-洞察及研究
- 大数据时代下的隐私保护问题-洞察及研究
- 微观结构设计增强键盘耐久性-洞察及研究
- 全球公共卫生安全治理-洞察及研究
- 2025年应激障碍试题及答案
- 2025年大学辅导员招聘考试题库
- 2025-2026学年七年级英语上学期第一次月考(Unit 1-2)(广州专用沪教版2024)解析卷
- 浙江名校协作体(G12)2025年9月2026届高三返校联考物理(含答案)
- 2025年山东省青岛市中考英语试卷真题(含答案详解)
- 廉租房承包物业合同范本
- 文学社教学课件
- 中小学心理健康c证考试试题及答案
- 污水厂工艺知识培训课件
- 2025年中学教师资格证考试(科目二)教育知识与能力冲刺试卷
- 水利水电工程单元工程施工质量验收标准第8部分:安全监测工程
- 2025年黑龙江全国导游人员资格考试(全国导游基础知识、地方导游基础知识)历年参考题库含答案详解(5套)
评论
0/150
提交评论