版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Basic Statistic根本统计学.数据的分类.什么是数据数据是来自察看的,由一个过程所搜集得来的数据可让我们描画过程,了解过程,改善过程甚至控制过程.Data 数据驱动决策和行动.数据在过程改善中的重要性 In God we trust我们只置信上帝一切其他人请拿出数据来.两种主要数据类型 (类项数据)(测量数据)(名目型)(连续型)(顺序型)(计数型)离散数据变量数据.练习一 请标出以下数据的类型,A代表计数型数据,V代表计量型数据 顾客平均消费,待机时间 产品能否合格职员-Tom, Nancy, Howard. 支出与预算相符 输入支出费用的时间.答案 顾客平均消费,待机时间 v
2、产品能否合格 A 职员- Tom, Nancy, Howard. A 4) 支出与预算相符 A5) 输入支出费用的时间 v数据类型 (V or A).小组讨论练习二 计量型数据 计量型数据的益处 ? 计量型数据的缺陷 ?计数型数据计数型数据的益处 ?计数型数据的缺陷 ?.小组讨论 答案计量型数据 益处 :1.可以为运用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率3. 可以预估开展趋势和情况 缺陷 :1.通常较难得到数据2.分析更为复杂.小组讨论 答案计量型数据 益处 :容易得到数据,并且计算方法简单2. 数据容易了解3. 数据随时可得 缺陷 :1.无法显示缺陷怎样发生及过程如何变化2.
3、不适宜低缺陷率(需求大量的抽样)3.不能预测开展趋势和情况.数据类型比较计量型数据计数型数据连续数据计数数据通常为正态分布通常为二项式分布或泊松分布实际数值合格/不合格实际定义严谨数据定义较差需少量抽样需大量抽样. 知识程度1. 没有数据,也没有阅历 只需观念2. 没有数据 只需阅历3. 搜集了数据 - 但只是看数字有多少4. 分组的数据 - 图表5. 描画性统计数据 中数、规范差等等6. 推理性统计 预测过程绩效:才干分析,回归和实验方案法 .转化计数型数据 如可以,将计数型数据转换为计量型数据能添加它的功能。计数型数据计量型数据转换为.Variable Data计量型数据.计量型数据 学习
4、目的完成此阶段学习后, 学员可以 利用数据的分布外形,中央趋势和变异大小进展特性化假设数据是正态分布的,计算z数值,利用Z数值表确定超出某一数值的比例.离散数据与延续数据延续数据的优点: 离散=稀少的信息 延续=丰富的信息.统计学根本术语Population 总体 想要丈量对象的全部Parameter 参数 用总体的一切数据计算出的数值(如均值, 规范差), 称为总体的参数 x参数总体平均值总体规范差总体.统计学根本术语Sample 样本 从总体抽出的部分数据Statistics 统计量 用样本的一切数据计算出的数值(如均值, 规范差), 称为样本的统计量x统计量样本平均值样本规范差s总体样本
5、.统计学根本术语Population 总体已制造或将要制造对象的全体集合,用所关注的特性描画我们终究能否知道真正的整体参数?Sample 样本 统计研讨中实践丈量的目的组 样本通常是整体的子集=整体规范差S=样本规范差Population整体sample样本.描画计量型数据集“报告上司:河水深度1.6M, 士兵平均高度1.7M, 过河没有问题,但是.至于我们不能只看平均值, 还需求利用其他统计量来分析.描画计量型数据集一组计量型数据能显示以下3个特性:Central Tendency (Mean, Median, Mode)中央趋势 (均值, 中值, 众数)Variable (range, S
6、tandard Deviation, Variance )变异(全距, 规范差, 方差)Shape 外形.参数和统计量符号Mean 均值Variance 方差Standard Deviation规范差Proportion 比例总体参数样本统计量 s2sp.位置丈量( Central Tendency )中心趋势Mean 均值Median 中值Mode 众数Quartiles 四分值.样本均值假设样本样本量为n的观测值为x1,x2,xn,那么样本均值为: 类似地,一个有着大量但限个N个观测值的总体,其总体均值 为:Mean 均值.Mean 均值练习三10个衔接线的拉拔强度为 : 230 240
7、236 248 252 278 265 262拉拔强度的均值是多少?10个观测值的均值为:.Mean 均值练习四199X年一个行动中,战机进展了3000次战斗,总共用时6900小时。那末每次战斗平均用时多少?每次战斗平均用时为:留意所运用的符号. 均值的特性均值的计算运用了每个观测值;每个观测值对均值都有影响。一切观测值对均值的偏向的总和为零。均值对极端的观测值很敏感,极端值会导致均值向他偏移。X x x x x x x6 3 5 1 2 7 4624.Median 中值 将一组观测值按大小顺序陈列,位于中心的数值即为中值 假设观测值的个数为偶数,那么中值为中间2个数值的平均 假设观测值的个数
8、为奇数,那么位于中心的数值即中值.Median 中值样本中值 假设x (1),x (2) ,x (n) )是按大小排序的样本值,那么样本中值为: 中值的优点是不受极端大或极端小的观测值的影响。.Median 中值练习五假设一个样本观测值为 : 3 1 2 4 7 8 6 样本均值和样本中值是多少? 这2个值是丈量数据中心趋势的合理目的吗? .Median 中值b 假设最后一个数值改动为 : 3 1 2 4 7 8 2680 那么样本平均值和样本中值是多少? 据此他有何结论? .Median 中值Median vs Mean 中值与均值 由于中值不象均值对极端值敏感,因此,当有极端大或极端小值时
9、,中值比均值更能代表数据的位置 典型的例子是一个城市居民的收入中位值.中值有时会有欺骗性50%-50% Rule ? 一半一半准那么? 以下一组数据的中值是多少? 2,2,2,2,2,2,90可以用一半一半准那么吗?.Mode 众数众数是样本中出现次数最多的观测值。众数可以是独一的,也可以有不止一个,有时并不存在众数。.Mode 众数练习六假设样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 4 3 7 2 6 8 1众数是什么? 具有一个众数,两个众数或多于两个众数分布的数据分布叫什么?(
10、单峰分布).Mode 众数为何运用众数? 当观测值为分类式(如名义数据, 序列数据)时.众数是描画数据位置的最好的目的.典型的例子是,一个公司内员工收入的众数众数的重要信息当众数不止1个时,从中抽取样本的总体通常是多个总体 的混合.均值、中值、众数的比较MOMeMeMO正态分布偏上分布偏下分布MOMeMOMeMOMe.Quartiles 四分值 将一组按大小顺序陈列的数据平均分为四部分,分界点即四分值. 第一四分值(低四分值),约25%的观测值小于它.第二四分值,约50%的观测值小于它, 即中值.第三四分值(高分值),约75%的观测值小于它.Quartiles 四分值练习七 以下为20个电灯泡
11、失效期间的观测值, 已按递增顺序陈列.210 216 252 300 366 454 624 720 816 924 12161296 2 1488 1542 2480 2856 3192 3528 3710请确定三个四分值.计算方法:先确定位置再计算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/4.Quartiles 四分值答案 Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75
12、那么:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.5.Quartiles 四分值.分布的丈量(变异)Range 极差Variance 方差Standard Deviation 规范差Inter-Quartile Range 四分植极差 .Range 极差样本极差为样本中最大和最小观测值之间的差别,即:极差是丈量数据分布或变异的最简单的方法但它忽略了最大和最小值之间的一切信息r =xmax - xmin.Range 极差试思索以下的2个样本: 10 20 50 60 70 90
13、and 10, 40, 40, 40, 90具有一样的极差(r= 80)但是,第二个样本的变异只是2个极端数值的变异,而在第1个样本,中间的数值也有相当大的变异. 当样本量较小(n10)时,极差丧失信息的问题不是很严重.方差与规范差假设x1, x2, ,xn 是一个具有N个观测值的样本,那么样本方差为:样本规范差是样本方差的算术平方根,即:.方差计算练习八:计算以下观测值的方差和规范差.30 50 70 90 110 130 .方差计算i xi xi-x (xi-x)2 1 30 -50 25002 50 -30 9003 70 -10 1004 90 10 1005 110 30 9006
14、130 50 2500.方差与规范差再思索以下2个样本. Sample A : 10 20 50 60 70 90 Sample B : 10 40 40 40 40 90 Sample A Sample BRange 极差 80 80Variance 方差 ? ?Standard Deviation 规范差 ? ? .方差与规范差类似于样本方差S2,用总体的所数据计算出总体变异总体方差(2)总体的规范差()是总体方差的算术平方根 对于包含N个数值的有限总体,其方差为: 2=.方差特性 方差计算运用了一切观测值,每个观测值对方差都有影响 方差对极端值很敏感,因平方的缘故,极端大的观测值会严重的
15、放大方差。.四分值极差 四分值极差是丈量分布的另一目的:IQR=Q3-Q1 四分值极差不如极差对极端值敏感 当分布显著不对称时,用它衡量分布会更好 样本10,20,50,60,90和10,40,40,40,90的四分值极差分别是40和0.The Normal Distribution 正态分布正态分布是一种具有特定的、非常有用的特性的数据分布 这些特性对我们了解所研讨之过程的特性非常有用大部分自然景象和人造过程是正态分布或可有正态分布描画.The Normal Distribution 正态分布特性 1 :只需知道下述两项参数就可完好描画正态分布均值规范差分布 1分布 2分布 3此三项正态分布
16、有何区别?.正态曲线和概率特性 2 :曲线下面的面积可用来估算某一特定事件发生 的累积概率得到在两个值之间的某个价值的累积概率99.73%95%68%离均值的规范差数目样本值的概率40%-30%-20%-10%-0%-.规范差的阅历规那么 当一组数据不是最理想正态分布时,前述累积概率规那么仍可 运用比较实际(理想)正态分布和阅历(现实)分布Number of Standard Deviations 标准差数目Theoretical Normal 理论正态Empirical Normal经验正态+/- 168%60-75%+/- 295%90-98%+/- 399.7%99-100%.正态分布特
17、点-3-2-112368%95%99.73%Standard Deviation规范差Average规范差.长期和短期才干(Z-偏向)ZLT=ZST-1.5 Sigma水平 短期DPMO 长期DPMO 1158655.3691462.5 2 22750.1308537.5 3 1350.0 66807.2 4 31.7 6209.7 5 0.3 232.7 6 0.0018 3.4.正态分布鉴于许多过程输出都是呈正态分布,所以可以用正态曲线的特点预测过程对象总体.即使非正态数据也能 转化为正态数据, 所以 正态曲线的特点依然可 以用来做预测 .正态曲线下的区域分析过程才干时,我们运用正态曲线下的区域预测超越规格界限的产品所占的比例.5%5%规格上限USL规格下限LSL.规范正态分布规范正态分布,也叫Z分布,有以下参数:Z代表间隔均值的规范差的数量=0 =1 -4 -3 -2 -1 1 2 3 4 .Z 代表从均值到能在到达(包容)多少个规范差 -4 -3 -2 -1 1 2 3 4 3S的Z数值是多少.将实践单位转化为Z单位文员职位安排时间u= 20.0days= 5 days5 10 15 20.0 25 30 35 -3 -2 -1 1 2 3 Days zScale 有多少是需求10至30天?.确定对应Z数值有多少是需求24天
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年生物医学研究题库遗传学与基因工程
- 2026年化学实验操作职业技能鉴定模拟题
- 2026年会计事务所面试常见问题及答案
- 2026年英语能力测试试题集
- 2026年旅游管理专业考试题目与答案
- 2026年生物科学基础知识巩固练习题库
- 2026年环境监测系统大气污染治理效果评估功能测试题
- 2025年广元市青川县三支一扶考试真题
- 浙江省嘉兴市2025-2026学年高一上学期期末考试生物试题(含答案)
- 2026年金融投资专业试题基金经理认证考试模拟题
- 急救培训自查、整改与提升措施
- 免还款协议5篇
- 2024年江苏省无锡市中考数学试卷(副卷)
- 新版GCP培训课件
- 单凤儒《管理学基础》教案
- 客户开发流程图
- 畜牧学概论完整
- DL∕T 516-2017 电力调度自动化运行管理规程
- 钢琴乐理知识考试题库200题(含答案)
- 高一年级英语上册阅读理解专项训练附答案
- 教师的“四大能力”能力结构、评价标准和评价方案
评论
0/150
提交评论