基础统计课件_第1页
基础统计课件_第2页
基础统计课件_第3页
基础统计课件_第4页
基础统计课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础统计统计学介绍概率分布-二项分布-帕松分布-正态分布3.标本分布及推定(Estimation)11.统计学介绍统计学的必要性在发展的电子情报系统社会存在着许多数据,但数据作为未加工的数据没有大的价值,但经过统计处理和加工的数据在进行PROCESS革新时作为决定意向的手段发挥非常大的作用。统计学是?

为判断不确认的未来提供必要的情报进行资料的收集,分类,分析,并以此为基础提示结论的学问。2母集团和标本成为关心对象的所有个体的集合称为母集团,在母集团中作为调查对象采纳的一部分称为标本。母集团标本母集的特性:母数平均µ分散

2

标准偏差

标本的特性:统计量

平均

分散S2

标准偏差S如果能够准确计算母集团的母数时没有问题,但如果难以计算时以标本计算的统计量为基础进行推定.3分布的特性统计量分析是找出分布具有的特性,并将其特性用数字表示的作业。

分布的特性集中化倾向(CentralTendency)(算术平均,中央值,最频数)

-显示资料集中的位置.

分散度(Scatter,Spreadness)(范围,分散,标准偏差)

-资料以算术平均为中心分散的程度

非对称度(Shape)

-资料向哪一方向倾斜?4集中化倾向

最频数(Mode)

最频数是资料的分布中发生频率最多的值

中央值(Median)

由数值形成的资料按大小顺序排序时在中间位置的观测值1)资料为单数时:中间的资料2)资料为复数时:(中间两个资料的和)/2

算术平均

母集团的平均

标本的平均µ==X1+X2+X3+…+Xn

N∑Xi

NX==X1+X2+X3+…+Xn

n∑Xi

n5分散度

范围(Range)

资料集团中最大值和最小值的差异

分散Variance)和标准偏差(StandardDeviation)

母集团的分散

母集团的标准偏差

标本的分散

标本的标准偏差

算术平均是一次元的值,相反分散是2次元,可以求出分散的开方标准偏差。标本的统计量失去一个自由度,因此标准时具有

n-1的自由度

2=∑(Xi–X)2

N

=∑(Xi–X)2

NS2=∑(Xi–X)2

n-1S

=∑(Xi–X)2

n-16特性值

母数

统计量集团数

N

n平均

X分散

2

s2标准偏差

s相关系数

r回归系数 ,

a,b误差

e母数(Parameter)和统计量的符号比较72.概率分布概率分布是与

Histogram一样将分布的形状演变成数据模型成为品质管理及6Sigma开展的基本。8(1)二项分布(Binomialdistribution)Data形态为不良品(Defective)Data时使用掷硬币时出现正面与反面的概率是相互独立的概率分布二项分布需要满足下列条件贝鲁诺实验:实验的结果只存在两种可能性

例)良品,不良品.2)在同一条件下进行实验3)各个实验是相互独立的,即,前结果不影响后结果4)对每个实验结果的概率是相同的.9二项分布的例<问题>某一制造工程一天生产1000个

Diode平均不良率为1%。检查者在每个小时随机地抽取50个样品选出不良品。此时发现一个以下不良品的概率是多少?<解>发现一个以下不良品的概率是发现一个不良品的概率加上一个也发现不了的概率首先求一个不良也发现不了的概率10Minitabmenu中Calc>ProbabilityDistributions>Binomial这里是多种概率分布的菜单,是6SIGMA的基础11先求一个不良品也没有的概率二项分布概率累计概率检查个数(这里是50)成功概率(这里不良率1%)Data为列时Data为常数时(这里是0)不良个数为0时12在Sessionwindow看结果不良率为0.01时抽取50个标本时一个不良品也没有的概率为0.605013求发现一个不良品的概率这时为1结果是0.3056因此,全体概率为:0.6050+3056=0.910614这次看一下利用

Worksheet的方法C1列命名为

x,不良数时输入(0和1)C2命名为

p,准备得出答案

15MinitabMenu中Calc>ProbabilityDistribution>Binomial输入不良个数(x)输入求出概率的列(p)点击OK16得出不良个数为0时的概率和1时的概率两个概率相加为答案17求累计概率选择这里计算累计概率18对二项分布的理解二项分布的概率密度函数

P(X=x)=nCxpx(1-p)n-x

nCx=()=

n!x!(n-x)!nx二项分布在品质管理经常使用,适用于在相当大的母集团中抽取标本,在这里p意味着母集团的不良率(Defectiverate)这里x是抽取任意

n个标本时不良个数.下一页说明的二项分布的平均,分散,标准偏差是C阶段管理图的基础。19二项分布的形态01234P(X)x1/162/163/164/165/166/1601234P(X)x0.10.20.3n=4,p=1/2时二项分布n=9,p=1/3인이항분포56789二项分布的形状1)n即使少

p=0.5时概率分布总是对称的2)p不是0.5,但

n变大时接近对称二项分布的期望值,标准偏差,分散期望值:=E(X)=np分散:2=Var(X)=np(1-p)=npq标准偏差:

=√np(1-p)=√npq20(2)帕松分布(Poissondistribution)定义单位时间或单位空间发生特定事件的发生次数时使用-钢板,织物等连续体平均有

m个缺陷时,随机抽取一定单位检查缺陷时,出现

x个缺陷时出现的概率遵守帕松分布-单位时间到银行的顾客数,某一地区一天的交通事故数帕松分布的密度函数

P(X=x)=e-m

mx

x!m:平均发生次数x:事件发生次数

帕松分布的特性-二项分布中

p<0.1时,转换为帕松分布

-帕松分布中

m>5时,转换为正态分布21帕松分布的例题<问题>半导体装置

unit当wire-bonding缺陷可表示为帕松分布。此时缺陷率为4时,随机抽取一个单位检查时缺陷(defect)为2个以下的概率是?<解>如二项分布求累计概率,minitab中选择帕松分布后求解。即,缺陷为2个,1个,0个的概率相加即可。22Minitabmenu의File>New>MinitabWorksheet生成新的worksheet,C1命名为x,C2为

p.X里输入缺陷的个数计算的值准备输入

p里23Calc>ProbabilityDistribution>Poisson选择累计概率输入平均缺陷选择Inputcolumn

输入x,pOK24缺陷为0的概率缺陷为0,1的概率(累计)缺陷为0,1,2的概率(累计)25帕松分布的理解1.帕松分布在品质管理表示单位面积,单位个数,单位时间当的缺陷数.间接部门的例:一天发生的交通事故件数等也可表示为此分布2.特别是在6Sigma追求的是:比不良(defective)更注重缺陷(defect),所以必须记住此分布3.此分布的平均和标准偏差在今后C阶段的管理图成为对

defect的

controlchart理论根据

26帕松分布和

RTY间的关系

帕松分布

观察帕松分布的概念,可发现与Unit内分布缺陷(

Defect)是同一概念.即可如下展开

事件的平均发生次数

m成为

dpu.RTY是最终工程没有缺陷的概率,即帕松分布中

x=0的概率

即代入帕松分布式时成立下列式.

RTY=e-dpu

dpu=-ln(RTY)P(X=x)=e-m

mx

x!m:平均发生次数x:事件发生次数27(3)正态分布(Normaldistribution)正态分布在统计应用领域最重要的分布并成为6Sigma开展的基本.正态分布也可如下表示

X~N()

2,变量正态分布平均标准偏差即正态分布由平均和标准偏差来定义28正态分布的形态是?95.5%43210-1-2-3-468.3%99.73%

以平均为轴对称(Symmetric)

原点在一个位置(Unimodal)钟形

(Bell-shaped)29Sigma是?95.5%43210-1-2-3-468.3%99.73%

第一个弯曲点(倾斜从减少到增加的位置,DeflectionPoint)

与平均间的距离以平均为中心占据68%的面积30正态分布的函数式

正态分布的密度函数

-<X<+:3.142e:2.7183

:分布的平均

:分布的标准偏差1

√2

2e-(x-)2/22f(X)=X~N()

2,31正态曲线(Normalcurve)形态95.5%43210-1-2-3-468.3%99.73%

1

2

1=1

1

2

1

2

1

2

2

1[因

而异的正态分布形状]

1

2,1=2

1=2,1

2

1

2,1

2

应熟悉教材后部分的正态分布表的读法32标准正态分布平均(中心)为0,标准偏差为1的正态分布

X-

利用

Z=————

将正态分布式进行座标转换95.5%43210-1-2-3-468.3%99.73%

N(0,12)33Minitab中正态分布Calc>Probabilitydistribution>NormalX已知X,求累计概率(面积)时已知累计概率,求

x时Minitab中以

x的左边面积为累计概率时在标准正态分布中x成为

SigmaLevel34正态分布例1<问题>对某一制品的拉长长度进行品质管理,平均为40,标准偏差为2.即

N(40,22).

购买此制品时顾客要求拉长长度在35以上.此工程生产的制品满足顾客要求的概率为多少?35解40235已知这个时面积是多少?N(40,22).Minitab中求面积的部分36check累计概率

平均是40标准偏差是2X值为35Calc>ProbabilityDistribution>Normal37我们想知道的面积(概率)是1-0.0062=0.993838正态分布例2<例2>假设某一工艺的品质特性遵守标准正态分布(平均=0,标准偏差=1)不良率为1%时,z值(Sigmalevel)

是多少?<解>已知累计概率时求Z值,在

minitab的

normal分布中使用

inversecumulativeprobability.39点击这里输入1-0.01=0.9940Z值为2.3341例3

X~N(10,42)的正态分布中

X为8≤X≤12的概率是?

Z=X-

=12-10

4=0.5,此时的概率为0.691510128Z=X-

=8-10

4=-0.5此时的概率为(1-0.6915)因此0.6915-0.3085=0.382942关于正态分布的附加说明影响制造工程的平均值或分散的要因区分为1)偶然要因和2)异常要因.偶然要因指的是如现场的温度变化等不可管理的要因,异常要因指设备的异常,作业者的失误等要因.没有异常要因介入,只有偶然要因作用时取出的数据必然遵守正态分布.在教育中大家也能感觉到利用连续概率分布函数的统计分析中最先观察的是是否正态.就是说正态分布是非常重要的.今后要学习的

t-分布,F-分丰,

2-分布等是人为制造的概率密度函数.但正态分布是说明自然现象的自然的分布.433.标本分布及推定提问:未知母集团的平均值时通过标本求平均.此时依据标本求出的平均在多少程度上能正确的代替母集团的平均呢?44平均的标本分布

标本分布是?

在母集团中按一定大小抽取所有可抽取的标本时其标本的特性值(统计量)的概率分布.

平均的标本分布是?

在特定的母集团中按一定大小抽取所有的标本后计算各个标本的平均时其平均的概率分布.

x2=_

2

n

x=_

√n

平均的标本分布的分散

平均的标本分布的标准偏差

平均的标本分布的平均=45中心极限定理

(CentralLimitTheorem)平均为

,分散为

2的无限母集团中随机抽取大小为

n的标本时如果n充分大时与母集团的分布形状无关,标本平均近似地遵守N(,2/n).即

的分布近似地遵守N(0,1)Z=/nX-

母集团遵守正态分布时标本的平均当然遵守正态分布,但此时标本平均的分散减少到除以标本大小(n),如果母集团不是正态分布,而遵守任意的分布时只要标本的大小充分大小标本的平均分布遵守正态分布.但,此时标本平均的分散减少至除以标本大小(n).

46推定为了解母集团的具体的性质推测母集团的分布函数的母数.推定的种类

1)点推定

用一个推定值显示未知的母数.但因不包括误差的概念不能保障与母数一致.

2)区间推定

因推定包含母数的真值的预想空间,即置信区间不同范围会有所变化.

对母数

进行区间推定指的是求

P(L<<U)=1-的

L和

U

此时[L,U]称为置信区间,1-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论