基础统计课件_第1页
基础统计课件_第2页
基础统计课件_第3页
基础统计课件_第4页
基础统计课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础统计置信区间正态分布与中心极限定理统计量连续数据和离散数据变异的概念功效与样本大小1产品的品质特性一定会有波动!所以我们预期的观测值就会有差异:如果我们研究面板的尺寸,每个面板的尺寸是不是一样的;如果我们测量10台冰箱的能耗,得到的结果也是不一样的;世界上没有两片一模一样的树叶!这种差异使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果,通常收集多个数据点、并且非常注意如何选取这些样本,以减少偏差。变异(变异)的产生是必然的、意料之中的,是统计学的基础。变异2变异来源造成这种变异的原因在于产品或服务实现过程中的因素变异,普遍来源有:测量Measurement流程变异的原因人员Manpower环境Environment设备Machine方法Methods材料Material关键是要分析哪种变异对响应变量的贡献最大--分析技术3变异分类我们把变异分成两类:

系统变异(原因变异、特殊变异)

预期的(和可预测的)测量结果之间的差异;随机变异(偶然变异)

不可预测的测量结果之间的差异;举例:金型正常的磨损→造成IC冲切异常……………普通原因金型非正常的磨损→造成IC冲切异常……………特殊原因

4统计学作用统计学应用以下方法分析&处理变异:统计描述用图形、总结性数据(统计量)来描述一组数据;基础统计量、图形分析设计试验、收集并分析数据,了解过程中变异因素所造成的影响;试验计划确定测量结果之间的差异是由于系统变异还是随机变异所造成的;假设检验、方差分析、多变量分析、回归统计推断试验设计5为了解原料、制程、产品的品质特性,经调查或实验而得到的数字或数量。数据统计学的应用,根本要有“数据”6数据分类9数据分类(Exercise)请说出以下的数据属性:ACF拉力需大于400gf/cm

组立制程预警界限为不良率2.0%17EA07IDD电流需小于900mA

1线的Tacttime为23.5s11/5OQC批退率2000ppm10群体与样本群体大小---N平均数---μ标准差---σ

样本大小---n平均数---Xbar标准差---S代表性?

xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx计算样本统计量并进行检定决策应用于群体分析结论作决策依据试验统计学描述性统计推论统计学11抽样原则我们通过研究样本来估计群体

Xbar→μ;S→σ;并使估计变异尽量小。随机性群体层别取样方法:

随机抽样法系统抽样法分层随机抽样法集体抽样法XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX$$$$$$$$########

#X$X$#XX

XXXX

XXXXX

XXXXXXXXXXXXXXXXXXXXXXX12数据收集收集数据的目的为何?收集的数据可靠性如何?是否有遗漏或重复?数据整理:分类与列表1、分类项目确定;2、归类整理;3、列表;简单化、系统化OK13图表分析频率分析工具频率表直方图了解数据在每类(范围、区间)内出现的频率。查检收数据·直方显分布·柏拉抓重点·散布找相关·层别找差异·特性找要因·管制防变异14QC手法回顾查检收数据柏拉抓重点散布找相关特性找要因15直方显分布管制防变异QC手法回顾16QC手法回顾17数据给你什么信息?图表分析18频率表为了解数据分布,我们构造频率表:全距:

最大值-最小值=23-17.4=5.6公里组数:

K=1+3.32lgn=1+3.32lg100=7.64(8组)组距:

R/K=5.6/8=0.7公里列出各组次数(频率)计算各组比率:该组频率/样本总数*100%图表分析19组界次数(频率)比率累积比率17.4---18.166%6%18.1---18.81616%22%18.8---19.52020%42%19.5---20.21111%53%20.2---20.92222%75%20.9---21.61313%88%21.6---22.31010%98%22.3---23.022%100%频率表给你什么信息?图表分析20直方图直方图是对频率表的图形显示图形给您什么信息?LSLUSL图表分析21

测知制程能力计算产品的不良率

检查样本是否混入两个以上不同群体测知有无假数据(选别)

探测异常值与规格或标准值比较直方图的主要应用图表分析221.测知制程能力图表分析Minitab:BasicStatistics>QualityTools>CapabilityAnalysis232.计算产品的不良率图表分析243.检查样本是否混入两个以上不同群体-40-30-20-10010203040LSLUSLProcessCapabilityAnalysisforDATA直方图成双峰\多峰形态:数据可能为混合两个或多个不同群体.(来自于不同设备、材料、班别等)图表分析254.测知有无假数据(选别)LSLUSL直方图成削壁形态:往往是因制程能力不够,但为求产品符合规格,而进行全数选别。图表分析265.探测异常值异常值:会严重影响统计量(平均数、变异数)的计算;往往是改进的机会;异常是机会图表分析276.与规格或标准值比较制程能力合宜制程能力过剩图表分析28基本统计量=抽样+数据+计算→有益资讯→合理推断→改善资讯统计数据统计量的描述方式平均数

Mean中位数

Median众数

Mode全距

Range四分位距

InterquartileRange变异数

Variance标准差

StandardDeviation置信区间集中趋势离散趋势机率分布概率分布29数据集中趋势

的统计量中位数Median将数据从小至大或大至小依次排列,位居正中的数或中间两个数的平均值,称为中位数。例1:18,20,21,24,26Me=21例2:2,3,4,5,6,84+5位居中间的两个数据为4和5,Me=(4+5)/2=4.5基本统计量平均数Mean(—样本均值;μ—群体均值;))代表一群数据的平均数值。=(

X1+X2+X3+…Xn

)/n30全距(Range)一群数值中最大值与最小值之差,称为全距。全距(R)=最大值-最小值数据离散程度

的统计量变异数(Variance)各测定值与平均值之差之平方总和,称为偏差平方和(变异数)SS=(X1-X)2+(X2-X)2+…+(Xn-X)2

=∑(Xi-X)2ni=1基本统计量31标准差(StandardDeviance)(s—样本标准差;σ—群体标准差;)方差之开方,即为标准偏差(简称标准差)。(σ=R/d2近似计算)数据离散程度

的统计量基本统计量32σ水平良率DPMO±1

68.27317300±2

95.4545500±3

99.732700±4

99.993763±5

99.9999430.57±6

99.99999980.002

+1

+2

+3

+4

+5

+6

-1

-2

-3

-4

-5

-6

+1

+2

+3

+4

+5

+6

-1

-2

-3

-4

-5

-6

1.5

1.5

σ水平良率DPMO±1

30.23697700±2

69.13308700±3

93.3266810±4

99.37906210±5

99.97670233±6

99.9996603.4基本统计量33置信区间为何我们要计算置信区间?34置信区间35置信区间置信区间36通常,置信区间具有附加的不确定性:估计值±变异幅度群体统计量=样本统计量±【

X

】例如:μ,σ例如:x,s置信因素统计变异置信区间置信区间37置信区间区间估计又称为置信区间:是用来估计参数的取值范围的,给结论留一些余地。置信区间(1-σ)与显著性水平(σ)0.95置信区间(1-σ)=0.05显著性水平(σ)的置信区间σ=0.01表示反复抽样1000次,则得到的1000个区间中不包含真值的仅为10个左右。区间估计的原理:样本分布理论置信区间=统计量-标准误到统计量+标准误38置信区间真值(

)各不相同的10個信赖區間例如:所谓90%信赖区间,就是反复信赖区间得的10个信赖区间中,9个包含母体平均的意思。39-1.96(3.0)+1.96(3.0)观察样本平均数,X平均值置信区间置信区间40如前所述汽车汽油效率案例中:X=20.033S=1.254n=100

t.025,99=1.98所以母体平均值的置信区间是:20.033-1.98*1.254/10≤

μ

≤20.033+1.98*1.254/10即:群体平均值置信区间=19.785~20.281置信区间置信区间41现在用Minitab来计算信心区间!所研究的数据信心水准95%置信区间置信区间42样本平均值样本标准差样本最小值样本最大值样本中位数群体平均值置信区间群体标准差置信区间置信区间43概率分布概率分布三种应用已知X→f(X)=?已知ZorSPEC→p=?已知DPMO→Z=?44本案例中,群体中汽车每升汽油﹥23公里的概率有多少?属于哪种类型?概率分布45已知规格→超出概率概率密度样本均值样本标准差预测界限Normalwithmean=20.033andstandarddeviation=1.254xf(x)230.0193643群体中﹥23的概率1.94%概率分布46重要几率分配离散(计数值)几率分配:二项分布超几何分布泊淞分布连续(计量值)几率分配:正态分布指数分布对数分布平均分布来自常态群体的抽样分布:

T分布

F分布中央极限定理概率分布47二项分布二项分布用于描述结果可记为Yes&No的情况。几率分配形式

n---样本大小

p---群体不良率

x---不良品数

b(x;n,p)=()px(1-p)n-xnx主要应用于归还法抽样概率分布48P(x≦2)=∑b(x;30,0.006)x=02=0.9992解答:Example某材料的不良率为6000ppm,现抽检30PCS,问不良品小于2PCS的几率。概率分布49我们用MINITAB来计算!正态分布F分布t分布二项分布超几何分布泊淞分布韦伯分布MINITAB:Calc﹥ProbabilityDistributions﹥‥‥‥?概率分布50样本数不良率或成功几率预期数量CumulativeDistributionFunctionBinomialwithn=30andp=0.006xP(X<=x)20.999223NOTE:成功几率=1-不良率概率分布51超几何分布二项分布用于描述结果可记为Yes&No、群体为有限个数,取出样本不归还。几率分配形式

N---群体大小

n---样本大小

P---群体不良率

x---不良品数主要应用于不归还法抽样h(x;N,n,p)=NpxN(1-p)n-x()()Nn()概率分布52Example在一批总量N为50的产品中,随机抽取10件作检验。该产品不良率为0.06,买卖双方约定不良数1允2退,问:该批产品允收概率多少?群体数量群体中不良数或成功数样本数量预期数量NOTE:M=N*P概率分布53CumulativeDistributionFunctionHypergeometricwithN=50,M=3,andn=10xP(X<=x)0.902041即:抽到1个以下不良品的概率是90.2%概率分布54泊淞分布二项分布用于描述结果可记为Yes&No;当样本量相当大、不良率趋近于0时。(n>16、N>10n、P<0.1)几率分配形式p(x;μ)=(℮-μ*μx)x!℮=2.71828μ=np概率分布55Example在一批总量N为1200的产品中,随机抽取100件作检验。该产品不良率为0.5%,买卖双方约定不良数1允2退,问:该批产品允收概率多少?Mean=n*p=100*0.5%=0.5预期数量CumulativeDistributionFunctionPoissonwithmean=0.5xP(X<=x)10.909796概率分布56Example:我们统计了90为女士的身高,请制作成直方图概率分布(课堂练习)57正态分布58正态分布特征图正态分布59正态分布正态分布60减少变异Z值与DPMO1s3s平均规格界限3水准的稳定工程1s6s6水准的稳定工程规格界限正态分布61Example零件规格:1.030±0.030″,假设我们测量了30个部件,Xbar=1.050″,S=0.015″请计算不符合规格的比率和该过程Sigma水平USLZUSL=USL-XS=1.060–1.0500.015ZUSL=0.67查正态分布表或计算可得25.14%的零件超出USL。LSLZLSL=X-LSLS=1.050–1.0000.015ZLSL=3.33查正态分布表或计算可得0.04%的零件低于LSL。正态分布62ZBench的定义

PUSL是相对USL的缺陷率

PLSL是相对LSL的缺陷率

PTOT是总缺陷率

PTOT=PUSL+PLSLZBench是总缺陷率对应的Z值,可查正态分布表或计算获得。正态分布63Z值与DPMO计算MINITAB:Calc﹥ProbabilityDistributions﹥Normal已知Z,求Pr(DPMO)CumulativeDistributionFunctionNormalwithmean=0andstandarddeviation=1xP(X<=x)3.330.999566已知Pr(DPMO),求ZInverseCumulativeDistributionFunctionNormalwithmean=0andstandarddeviation=1P(X<=x)x0.2518-0.668836正态分布64正态分布65中心极限定理为什么我们得到的数据通常是正态分布无论其单个变量是何种分布。中心极限定理表明:如果n足够大,则样本平均值Xbar或其总和的分布,一定服从或近似服从正态分布。正态分布66提高过程能力因变量Y(响应变量),取决于自变量X(独立变量)至关重要的少数变量也被称为“杠杆”变量,因为它们对因变量具有重大影响。80%原因变异+20%偶然变异=100%总变异67过程改进的焦点是平均值偏离、还是标准差过大、还是两者兼而有之!68知识关口变异:必然存在于所有过程。来源?分类?计量数据&离散数据:定义、举例?群体和样本:抽样原则?方法列举?图形分析:频率表?直方图?应用列举?统计量:集中趋势统计量列举?离散趋势统计量列举?置信区间:

定义?计算?与信心水准的关系?69分布:二项、泊淞、正态?正态分布:特征?σ?概率计算:Z→P?USL&LSL→PrZbench:定义?P→Z中心极限定理:定义?关注点?Y=f(X):变量分类?改进重点逻辑?提高过程能力的重点?过程改进的焦点?知识关口70功效与样本大小(PowerandSampleSize)

WhatisPower?Therearefourpossibleoutcomesforahypothesistest.Theoutcomesdependonwhetherthenullhypothesis(H0)istrueorfalseandwhetheryoudecideto"reject"or"failtoreject"H0.ThepowerofatestistheprobabilityofcorrectlyrejectingH0whenitisfalse.Inotherwords,poweristhelikelihoodthatyouwillidentifyasignificantdifference(effect)whenoneexists.一种假设检定有四种可能结果。结果取决于原(零)假设(H0)是正确还是错误,取决于你决定是“拒绝”还是“不能拒绝”H0。功效就是当H0原假设是错误时正确的拒绝它的可能性。换句话,功效(power)就是你鉴定出重大差别的可能性。71a风险与

风险OurDecision(得出结论)

NullHypothesis(真实状况)H0=TrueH0=FalseFailtorejectH0不能拒绝H0CorrectDecision1-aTypeⅡerror取伪错误

风险RejectH0拒绝H0TypeⅠerror拒真错误a风险CorrectDecision1-Power=1-

72a风险与

风险WhenH0istrueandyourejectit,youmakeaTypeIerror.Theprobability(p)ofmakingaTypeIerroriscalledalpha(a)andissometimesreferredtoasthelevelofsignificanceforthetest.当H0原假设是正确的而你拒绝它,你将犯第一类错误。即第一类错误的可能性P=a

。也叫拒真风险或是生产方风险。WhenH0isfalseandyoufailtorejectit,youmakeatypeIIerror.Theprobability(p)ofmakingatypeIIerroriscalledbeta(

).当H0原假设是错误而你没有拒绝,你就犯了第二类错误。即第二类错误的可能性P=

。也叫取伪错误或是消费方风险。73Factorsthatinfluencepower影响功效的因素atheprobabilityofaTypeIerror(levelofsignificance).AstheprobabilityofaTypeIerror(a)increases,theprobabilityofatypeIIerror(

)decreases.Hence,asaincreases,power=1-alsoincreases.当a风险(生产方风险)↑,

风险(消费方风险)↓,power=1-

↑σ,thevariabilityinthepopulation.Assincreases,powerdecreases.当总体σ↑,power↓thesizeofthepopulationdifference(effect).Asthesizeofpopulationdifferenceeffect)decreases,powerdecreases.总体差异△↓,power↓samplesize.Assamplesizeincreases,powerincreases.样本大小(n)↑,power↑。74P-value概念如果我们否定原假设H0

,P-value即为我们判定错误的概率;换句话说,当我们否定原假设时,P-value即为拒真错误(α风险)的出错概率;α值是关键,当p>α,不能拒绝原假设H0,当p≤α,拒绝原假设H0。75PowerandSampleSize>1-Samplet计量型数据Supposeyouaretheproductionmanageratadairyplant.Inordertomeetstaterequirements,youmustmaintainstrictcontroloverthepackagingoficecream.Thevolumecannotvarymorethan3ozforahalf-gallon(64-oz)container.Thepackagingmachinetolerancesaresetsotheprocesssis1.Howmanysamplesmustbetakentoestimatethemeanpackagevolumeataconfidencelevelof99%(a=.01)forpowervaluesof0.7,0.8,and0.9?(需要样本量大小?)Minitab操作:1

ChooseStat>PowerandSampleSize>1-Samplet.2

InDifferences,enter3.InPowervalues,enter0.70.80.9.3

InStandarddeviation,enter1.4

ClickOptions.InSignificancelevel,enter0.01.ClickOKineachdialogbox76Interpretingtheresults结果分析分析结果:Power

and

Sample

Size1-Sample

t

TestTesting

mean

=

null

(versus

not

=

null)Calculating

power

for

mean

=

null

+

differenceAlpha

=

0.01

Assumed

standard

deviation

=

1

Sample

TargetDifference

Size

Power

Actual

Power

3

5

0.7

0.894714

3

5

0.8

0.894714

3

6

0.9

0.982651Interpretingtheresults(结果说明):Minitabdisplaysthesamplesizerequiredtoobtaintherequestedpowervalues.Becausethetargetpowervalueswouldresultinnon-integersamplesizes,Minitabdisplaysthepower(ActualPower)thatyouwouldhavetodetectdifferencesinvolumegreaterthanthreeouncesusingthenearestintegervalueforsamplesize.Ifyoutakeasampleoffivecartons,powerforyourtestis0.895;forasampleofsixcartons,poweris0.983.77PowerandSampleSize>2Proportions计数型Asapoliticaladvisor,youwanttodeterminewhetherthereisadifferencebetweentheproportionsofmenandwomenwhosupportataxreformbill.Resultsofaprevioussurveysuggestthat30%(p=0.30)ofthevotersingeneralsupportthebill.Ifyoumail1000surveystovotersofeachgender,whatisthepowertodetectthedifferenceifmenandwomeninthegeneralpopulationdifferinsupportforthebillby5%(0.05)ormore?Minitab操作:1

ChooseStat>PowerandSampleSize>2Proportions.2

InSamplesizes,enter1000.3

InProportion1values,enter0.250.35.4

InProportion2,enter0.30.ClickOK.78结果分析结果:SessionwindowoutputTest

for

Two

Proportions

Testing

proportion

1

=

proportion

2

(versus

not

=)Calculating

power

for

proportion

2

=

0.3Alpha

=

0.05

SampleProportion

1

Size

Power

0.25

1000

0.707060

0.35

1000

0.665570The

sample

size

is

for

each

group.InterpretingtheresultsIf30%(0.30)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论