基础统计学课程.ppt_第1页
基础统计学课程.ppt_第2页
基础统计学课程.ppt_第3页
基础统计学课程.ppt_第4页
基础统计学课程.ppt_第5页
已阅读5页,还剩174页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,基础统计学 Basic Statistic,2,轻松学统计,统计是以下哪一种叙述方式最完整? FPC拉力强度很好 FPC拉力强度平均为5kg/cm2 大多数产品的拉力强度在(50.6)kg/cm2之内 99.73%的产品拉力强度在(50.6)kg/cm2之内,3,什么是统计 ?,就是把不确定的程度量化,用精确的方式表达,4,统计的定义,统计是在面对不确定的情况下,提供人们做出聪明决策的科学方法 过程包括资料的收集、整理、呈现、解释与分析。 并藉由此过程,进而根据分析的结果加以推论,从而获得合理的研判与有效的结论。,5,统计方法的分类,叙述统计,推论统计,统计方法,应用统计,基本统计量,统计

2、分布,估计,假设检定,相关/回归分析,变异数分析,多变量分析,实验设计,基础篇,应用篇,6,统计能帮你做什么?,问题之现况分析,真因验证,对策拟定,效果确认,叙述统计量 估计,假设检定 ANOVA 实验设计,1.假设假定 2.回归分析 3.实验设计,估计 假设检定,解决问题思考,统计工具,基本统计学,应用统计学,7,Syllabus,叙述统计 母体与样本 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,8,叙述统计,内容 收集

3、资料 整理资料 呈现资料 目的 描述数据的特征 找出资料的基本规律,9,母体与样本,母体:具有共同特性的个体所组成的群体,由其数据特性可分为: 计数母体: 其所显现的数据特性为性质者,如男女、成功与失败、 OK与NG之分类 计量母体: 其所显现的数据特性为数量者,如长度、重量、使用时间 样本:由母体中抽取部分个体所组成的集合 一般n在30 以下者称为小样本,n 在30 以上者称为大样本。 统计量:样本对母数概括性的估计值,10,母体与样本的关系,11,基本统计量,数据的特征与测度,集中趋势,分散程度,众数,中位数,平均值,变异数与标准差,全距,变异系数,一般用表示,描述数据分布特征的测度,一般

4、用表示,四分位数,四分位差,(算术),12,集中趋势,一组资料向其中心靠拢的倾向与程度 集中趋势就是寻找一般水平的代表值 选用哪一个测度值来反应资料的集中趋势,要根据资料的类型来决定,13,集中趋势,众数:出现次数最多的资料点,可能没有或有多个众数 中位数QM :排序后,位于中间位置的值 平均值:一组资料的均衡点所在 -各资料点与平均值间的距离和为0 -各资料点与平均值间的距离平方和为最小 -最常用的量测值,14,众数、中位数与平均值的关系,15,分散程度如何反应集中趋势的代表性,A 组资料为 1 、 4 、7 、 10 、 13 B 组资料为 5 、 6 、7 、 8 、 9 两组数据的平均

5、数相同,但明显的 A 组资料的散布程度比较大。,AVG. : 7,AVG. : 7,16,分散趋势,反映各资料点远离其中心的程度 从另一个方式来说明集中趋势的代表程度,17,分散趋势,全距R :资料中最大与最小之差 变异数与标准差 变异系数 :标准差与其对应的平均值之比 -用于对不同资料组别的离散程度比较 -消除资料的不同水准和不同单位的影响,18,分散程度变异数与标准差,变异数,标准差,母体,样本,注意:样本变异分母用n-1去除 !,19,分散程度-自由度(degree of freedom),一组资料中可自由取值的资料点数 例如样本数为3,x1=2,x2=4,x3=9,则 x =5。 当

6、x = 5 确定后,在 x1,x2 ,x3 中,只能有两个资料点可以自由取值,例如当 x1=6,x2=7,那么 x3 则必然为2 样本变异数用自由度去除,从实际应用角度来看,在抽样估计中,当用样本变异数去估计母体变异数2时,它是2的不偏估计量,20,Case study-各统计量的求算,1. 众数: 2. 中位数为QM :第 个数,即为 3. 平均数为:,一商店50周来的营业金额(万元)由小而大排列为:,40、46、59,21,Case study-各统计量的求算,CV = 19.07 / 61.94 =0.308,4. 全距为: 5. 变异数为: 6. 标准差为: 7. 变异系数:,22,利

7、用EXCEL计算统计量集中趋势,23,利用EXCEL计算统计量分散趋势,24,利用EXCEL的分析工具箱,Note: Excel之工具选项中的数据分析有描述统计 P.S. :若没有看到,可先在工具中加载宏的分析工具库打勾,25,利用EXCEL的分析工具箱,此处为样本之标准差/方差,26,Minitab的敘述統計,Stat Basic Statistics Display Description Statistics,27,Minitab的敘述統計,选择所要分析的资料,资料分析结果,28,AUO Proprietary & Confidential,Syllabus,叙述统计 母体与样本 叙述统

8、计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,29,描述分布-分布的呈现,下图为30位工程师的年龄调查,将其人数划成直方图,30,机率分布,若将人数换为比例,划成直方图,如下图,31,常用之分布,常态分布:用在分析变量之集中趋势-平均值,属对称型分配。 另外可导出t 分配,为平均值间的分配,(二). 计量值数据,卡方分配:用在分析变量之分散趋势-变异数(标准差),属偏斜型分配。 另外可导出F分配,可做两变量间分散趋势之比较,(一)

9、. 计数值数据,二项分配:用在计数值,例如良率或不良率,32,二项分布特性,p=0.3 n= 10, 30, 50,1.当n愈大时,对称性愈明显 2.当p愈接近0.5,愈接近左右对称,n= 30,实际应用: np 5 & n(1-p) 5时, 二项分布可用常态分布来描述,33,常用的机率分布常态分布,常态分配函数左右两尾与横轴渐渐接近但不相交 常态分配有两个变相点,分别在 对应的地方 常态分配为左右对称的机率分配 常态分配随机变量的线性函数仍为常态分配,因为自然界中90%,都可以符合此分布的性质! 所以称为常态分布,34,常用的机率分布常态分布,中心到各标准差()之机率分布如下,35,x,f(

10、x),C,A,B,A - B 是什么造成? A - C 是什么造成?,与对常态分布的影响,?,36,标准常态分布,假如 X 服从常态分布 则Z= (X-)/会服从= 0, = 1的常态分布 常态分布的变量,其线性函数仍为常态分布 此= 0, = 1的常态分布称为标准常态分布 Z(X-) /的转换过程称为标准化,一般常态分布,标准常态分布, =1,Z, ,37,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定

11、平均值的检定,38,抽样分布概念要点,所有样本统计量(如平均值,比例,变异数等)所形成的分布称为抽样分布 结果来自样本数相同的所有可能样本,39,样本平均的抽样分布?,假如X1, X2, Xn是从平均为,变异数为2的常态母体中抽出 其抽样平均 若将其视为另外一个变量 则 且服从常态分布 常态分配的变量,其线性函数仍为常态分配,40,样本平均的抽样分布,【例】假设一母体含有四个元素,即母体之总个数N =4四个元素分别为X1=1、X2=2、X3=3、X4=4 。则母体的平均,变异数及分布如下,平均与变异数,41,样本平均的抽样分布,若从母体中抽取n=2的随机样本,共有 42=16 个可能样本,计算

12、出各样本之平均,并给出其平均的分布,0,42,样本平均的抽样分布,比较与总结: 1. 样本平均的平均(数学期望)等于母体平均 2. 样本平均的变异数等于母体变异数的1/n,M为所有可能样本数目,43,中央极限定理,中央极限定理:设从平均值为,变异数为2的一个任意母体中抽出个数为n的样本,当n够大时,样本平均值的抽样分布近似于平均值为、变异数为2/n的常态分布,一个任意分布的母体,44,中央极限定理的限制,中央极限定理必须符合下列二条件: 需已知 样本够大( n 30 ) 思考:但大部分的情况是未知,还可以用中央极限定理吗?,45,t 分布,当未知,且样本不够大时,可以用样本标准差 s 替代,仍

13、可得到跟常态分布接近的性质 此分布称为自由度为n-1之 t 分布,46,t 分配的性质,t 分配因为有两个变量影响( ),因此其变异会较标准常态分布来的大 当t 分布的自由度越大时,会越接近标准常态分布 也就是说,Z分配,不同自由度的 t 分配,47,中央极限定理,样本平均之抽样分布,母体,常态,非常态,大样本(n30),小样本(n30),大样本(n30),小样本(n30),母体已知,母体未知,中央极限定理,常态分布性质,抽样分布未定(视母体而定),当大样本时,亦可用样本标准差代入,Z=,48,样本比例(p)的抽样分布,若母体内成功次数的比例为 令 为所抽出的样本中成功次数的比例 则 则近似于

14、母体比例 ,其标准差为 的常态分布,p,p,49,假设母体服从常态分布N (,2 ), X1,X2,Xn为来自该母体的样本个体,则样本变异数 s2 的分布服从,将c2(n 1)称为自由度为(n-1)的卡方分布,样本变异数的分布,50,卡方 ( 2) 分配之特性,不同样本数的 2分配,c2,n-1=1,n-1=4,n-1=10,n-1=20,51,X1,X2, ,Xn1 是来自常态母体N(1,12 ) 的一个样本 Y1,Y2, ,Yn2 是来自常态母体N(2,22 ) 的一个样本 Xi (i=1,2,,n1 ),Yi (i=1,2, ,n2 ) 相互独立,则,将F(n1-1 , n2-1) 称为

15、第一自由度为 (n1-1),第二自由度为 (n2-1) 的 F 分布,两个样本变异数之抽样分配,52,注意,抽样分布中的n,指的是每次所抽取的样本数,母体,a1,a2,a3,an,b1,b2,b3,bn,x1,x2,x3,xn,每个可能样本的样本数为n,53,Syllabus,叙述统计 母体与样本 叙述统计量 统计分布 机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,54,母体平均值,比例,变异数,统计推论,利用从样本中所得的统计量,来估计母体参数的原理

16、与方法,样本,母体,样本统计量 例如样本平均值,比例,变异数,55,推论统计的两种方式,估计: 用部分资料的信息来估计整个母体的表现 假设检定: 透过收集资料,计算适当的统计量,来推测是否有显著的证据来证实我们对事件的假设成立,或是有显著的证据来推翻假设,56,AUO Proprietary & Confidential,估计 Estimate,57,估计量的优良准则,不偏性 - 估计量的数学期望值等于母体参数,有效性 - 一个变异较小的估计量称为一个较有效的估计量,一致性 - 随着样本数的增加,估计量越接近被估计的母体参数,58,点估计,从母体中抽取一组样本,根据此样本的统计量对母体的未知参

17、数做出一个数值点估计 例如: 用样本平均值作为母体平均值(未知)的估计值就是一个点估计 点估计无法提供其接近程度,59,区间估计,根据一个样本观察值(点估计值) 确定区间包含母体参数的机率 利用抽样分配,依据所给定的机率,计算出母体参数的估计范围 此机率称为信赖水准(1 - ) 此范围通常称为信赖区间(Confidence interval, CI),60,区间估计信赖水准,表示重复做估计时,母体未知参数落在区间内的机率 例如:90% 信赖水准,表示估计变量10次当中,有9次真实值会落在所估计的区间。 常用的信赖水准1- 有 99%, 95%, 90% 相对应的显著性水准是区间内未包含母体参数

18、的机率为0.01,0.05,0.10,61,平均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含 ,区间与信赖水准,62,影响区间宽度的因素,数据的分散程度,用来衡量 样本数大小 信赖水准(1-),影响 Z 的大小,63,区间估计,99% 的样本,90% 的样本,64,区间估计,65,区间估计母体平均(2已知),假定条件 母体服从常态分布,且变异数( 2)已知 母体不是常态分布,可由常态分布来近似 (n 30) 由平均值之抽样分配,利用标准常态分布之概念 母体平均值 之1- 信赖区间为,1-a/2,1-a/2,1-a/2,1-a/2,66,区间估计母体平均(2已知),解:已知XN

19、( ,0.152),x = 21.4, n = 9, 1-a = 0.95,Za/2= 1.96 母体平均的信赖区间为,在95的机率下,该种零件的平均长度在21.30221.498 mm之间,【例】某种零件长度服从常态分布,从该批产品中随机抽取9件做量测,测得其平均长度为21.4 mm。已知母体标准差=0.15mm,求母体平均之95%的信赖区间,1-a/2,1-a/2,1-a/2,67,母体平均的区间估计(常态母体, 2已知) MINITAB分析,在95的机率下,该种零件的平均长度在21.30221.498 mm之间,68,区间估计母体平均( 2未知),假定条件 母体变异数未知( 2未知) 母

20、体必须服从常态分布 使用 tn-1 分布统计量 母体平均值 之1- a信赖区间为,1-a/2,1-a/2,1-a/2,1-a/2,69,区间估计母体平均( 2未知),解:已知XN( , 2),x=50,s=8,n=25, 1- a = 0.95,t a/2=2.0639。,在95的机率下,该母体的平均在46.6953.30之间,【例】从一个常态母体中抽取一个随机样本,n = 25 ,其样本平均50 ,样本标准差 8。求母体平均之95%的信赖区间。,1-a/2,1-a/2,1-a/2,70,母体平均的区间估计(常态母体, 2未知) MINITAB分析,在95的机率下,该母体的平均在46.6978

21、53.3022之间,71,区间估计母体比例,假定条件 母体分类结果服从二项分布 可利用常态分布近似 使用标准常态分布统计量 母体比例p之1- a信赖区间为,1-a/2,1-a/2,注意哦:在计算之前要判断: np=5且n(1-p)=5,72,区间估计母体比例,在95的机率下,因与主管不合离职所占的比率在63.6%76.4%之间,【例】公司对于员工流动率的研究中,对离职员工随机抽取200人对其进行调查,有140个说其离职原因是因为与主管不合,请问公司因该原因离职的真正比例之95%信赖区间,1-a/2,1-a/2,73,母体比例的区间估计(常态母体) MINITAB分析,在95的机率下,因与主管不

22、合离职所占的比率63.65%76.35% 之间,74,区间估计母体变异数,假设母体服从常态分布 母体变异数 2 的点估计量为s2,且 母体变异数在1-信赖水准下的信赖区间为,75,已知 n10,s24,1-95% 2 95%的信赖区间为,区间估计母体变异数,【例】对某金属制品10个样本作抗拉强度测试。从实验数据得到变异数为4。试求2的95%信赖区间。,=chiinv(0.975,9) =2.70039,=chiinv(0.025,9) =19.02277,=0.05 /2=0.025,使用Excel 計算:,76,Test and CI for One Standard Deviation M

23、ethod The standard method is only for the normal distribution. The adjusted method cannot be calculated with summarized data. Statistics N StDev Variance 10 2.00 4.00 95% Confidence Intervals CI for CI for Method StDev Variance Standard (1.38, 3.65) (1.89, 13.33),母体变异数的区间估计(常态母体) MINITAB分析,在95的机率下,该

24、母体的2在1.8913.33之间,77,利用 Excel 算临界值,78,Excel 中的 临界值,/2,/2,t,-t1-a/2 = -tinv(,df),t1-a/2 = tinv(,df),21-/2,df=chiinv(/2,df),2/2,df=chiinv(1-/2,df),c2,/2,/2,F/2,df1,df2 = Finv(1-/2,df1,df2),F1-/2,df1,df2 = 1/F/2,df2,df1,-Z1-a/2=- Normsinv(1-/2),Z,/2,0,/2,Z1-a/2=Normsinv(1-/2),0,79,Syllabus,叙述统计 母体与样本 叙述

25、统计量 统计分布 机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,80,假设检定 Hypothesis Test,81,什么是假设?,对母体参数的一种看法 母体参数包括母体平均,变异数,比例等 分析之前必须先陈述,我认为厂內所生产产品 的B/L 厚度平均为4.5m,82,假设检定 (提出假设抽取样本做出决策),事先对母体参数或分布情形做出某种假设,然后利用样本的信息来判断原假设是否成立,83,统计假设检定,统计假设:对一个或多个母体进行假设性叙述,可能正

26、确也可能错误。 H0 :Null Hypothesis,虛无假设 H1 :Alternative Hypothesis,对立假设 检定:由样本资料来测验此假设性敘述是否成立。 在检定问题里可能发生两种错误: 型I 错误 (拒绝正确的假设) - 型II 错误 (接受错误的假设) - ,过筛,漏筛,84,检定原理,检定的目的:比大小 主要概念: 我们需要知道变异有多大 以及我们愿意承担的风险() 据此进行比大小。,检定的原理: 利用各种品质特性所属的各种机率分配,求发生某一假设之机率 再将此机率与决策者所能承担之冒险率比较,以决定是否要否定假设之判断法。,85,P-value,- “显著水平(si

27、gnificant level), 以表示,以现有的样本数据而言, 能拒绝(reject)虚无假设 H0 的临界值。 在科学领域,常用的显著水平为0.05 或0.01。若= 0.05, 表示20次中可能有1次错误。 显著水平是做检定时我们能容许的型一错误机率上限。因此,显著水平愈小,则拒绝域愈小。 P-value代表资料支持 H0 的程度, 或支持 H0 的证据大小。 若P-value , 则拒绝H0;若p-value , 则接受H0。,86,假设的形式,单尾检定中,将想要证明的放在H1,H0与H1的互补!,87,双尾检定(信赖水准与拒绝区域 ),抽样分布,H0值,临界值,临界值,a/2,a/

28、2,样本统计量,拒绝区域,拒绝区域,接受区域,1 - ,信赖水准,88,右尾检定(信赖水准与拒绝区域 ),a,H0值,临界值,样本统计量,拒绝区域,接受区域,1 - ,信赖水准,抽样分布,89,左尾检定(信赖水准与拒绝区域 ),H0值,临界值,a,样本统计量,拒绝区域,接受区域,抽样分布,1 - ,信赖水准,90,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,91,AUO Proprieta

29、ry & Confidential,计数型资料的检定 1. 1 Proportion Test 2. 2 Proportion Test 3. 列联表检定,92,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,93,单一母体 p 未知时,同母体平均数的推论,只是将推论的母数改为p。 提出假设 计算 Z 统计量 决策 利用 Z分配,在=0.05的假设下若 或 则拒绝虚无假设,表示有足够证据

30、说明母体比例不是p0 。,注意哦:在计算之前要判断: np=5且n(1-p)=5,94,例子说明,事例:Defect ratio是否降低 现况:稳定制程下,异物的不良率大约是2% 试验;改善后 工程师为解决异物的问题,进行改善;改善后试投500片,经测试后异物有5片 请问是否有改善?,95,例子说明,采用 Z 检定,其统计量为 结论:没有足够证据显示改善有效。,并未落在拒绝区域,所以接受H0,96,1 proportion test in Minitab,1 Proportion:是比较特定的比率(目标比率)与调查的一个比率,决定是否有显著性差异。,母体比率为p的总体中取出n个样品,具有特定属

31、性为X时,X遵守二项分配B(n,p),Stat Basic Statistics 1 Proportion,97,1 proportion test in Minitab,输入资料的比例,1-,选择对立假设的型态,输入要比较的目标值,不钩选利用二项分配; 钩选利用大样本近似的Z分配,98,1 proportion test in Minitab,利用二项分配,利用大样本近似的Z分配,P-value是原假设 H0 真实的结论时我们观察到样本的值有多大的概率,简称P值。如果此值小,就下原假设为不真实的结论。 在统计称为小概率事件,即样本不是从原假设的分布中抽出的。一般 P 值大于 ,则无法拒绝原假

32、设,相反,P 值小于,则拒绝原假设。,在Minitab中我们进行假设验证,Pvalue是我们判断的基准,99,AUO Proprietary & Confidential,Syllabus,叙述统计 母体与样本 叙述统计量 统计分布 机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,100,两母体间p之比较,同母体平均数的推论,只是将推论的母数改为p。 提出假设 计算统计量 决策 利用 Z分配,在=0.05的假设下若 或 则拒绝虚无假设,表示有足够证据说明

33、两母体比例不相同 。,注意哦:在计算之前要判断: np=5且n(1-p)=5,101,例子说明,实验方式 :将BL单体按照5PCS和10PCS分别堆栈,试验一周(3.3-3.16)。资料如下:,由上述所收集的资料, 可知P1=1.45%,P2=1.3%,且n1=87387,n2=68119 请问:堆栈5 pcs方式,film材报废比例是否降低?,102,例子说明,已知P1=1.45%,P2=1.3%,且 n1=87387,n2=68119,落在拒绝区域,所以拒绝H0,假设:,统计量:,决策:有足够的证据显示,堆5pcs比堆10pcs好,103,2 proportion test in Mini

34、tab,2 Proportion:是在比较两个比率的差,决定统计上是否显著性差异时使用 。,Stat Basic Statistics 2 Proportion,104,2 proportion test in Minitab,输入资料的比例,1-,选择对立假设的型态,选择用混合的百分比,105,同样资料,假设的不同 会有不同的统计量结果,Test and CI for Two Proportions Sample X N Sample p 1 1266 87387 0.014487 2 887 68119 0.013021 Difference = p (1) - p (2) Estimat

35、e for difference: 0.00146595 95% lower bound for difference: 0.000489999 Test for difference = 0 (vs 0): Z = 2.47 P-Value = 0.007 Fishers exact test: P-Value = 0.007,Test and CI for Two Proportions Sample X N Sample p 1 1266 87387 0.014487 2 887 68119 0.013021 Difference = p (1) - p (2) Estimate for

36、 difference: 0.00146595 95% upper bound for difference: 0.00244190 Test for difference = 0 (vs 0): Z = 2.47 P-Value = 0.993 Fishers exact test: P-Value = 0.993,2 proportion test in Minitab,106,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定

37、计量型资料检定 变异数的检定 平均值的检定,107,r x c 列联表,列(ri),行(cj),fij 表示 i 列,第 j 行的观察个数,由两个以上的变量进行交叉分类的个数分布表 表中列出了行变量与列变量的所有可能组合,所以称为列联表 一个 r 列 c 行的列联表称为 rc 列联表,108,列联表Example,AUO欲进行一项改革,此项改革可能涉及各厂,故采用抽样调查的方式,从L3,L5,L6,L8共抽取420个样本,了解主管对此项改革的看法(alph=0.1),109,期望个数的分布,110,一致性检定-概念要点,检定列联表中目标变量之间是否存在显著差异 步骤 提出假设 H0:P1 =

38、P2 = = Pj (目标变量的各比例一致) H1:P1 , P2 , , Pj不全相等 (各比例不一致) 计算统计量,决策 根据 ,和自由度(r-1)(c-1)查出临界值2 若 2 2 ,拒绝H0;若 2 2 ,接受H0,1-a,1-a,111,一致性检定实例,提出假设 H0:PL3 = PL5 = PL6 = PL8 (赞成比例一致) H1:PL3,PL5,PL6,PL8 不全相等(赞成比例不一致) 计算统计量, 0.1,自由度为(2-1)(4-1)=3 临界值 2 =6.251。 由于2 =3.0319 2 =6.251,接受H0,1-a,1-a,112,独立性检定-概念要点,检定列联表

39、中,行与列是否独立 步骤 提出假设 H0:行,列间独立 H1:行,列间不独立 计算统计量,决策 根据 ,和自由度(r-1)(c-1)查出临界值2 若2 2 ,拒绝H0;若2 2 ,接受H0,1-a,1-a,113,独立性检定实例,一种原料来自三家不同厂商,原料等级分为三种。 从这批原料中抽出500件来检验,结果如下表。 检定各家厂商与原料间是否存在依赖关系( 0.05),114,独立性检定实例,提出假设 H0:厂商与原料等级之间独立 H1:厂商与原料等级之间不独立 计算统计量, 0.05,自由度为(3-1)(3-1)=4 临界值2 =9.488。 由于2 =19.82 2 =9.488 ,拒绝

40、H0,1-a,1-a,115,Minitab中的列联表检定,116,Minitab中的列联表检定,在minitab中,资料整理格式一,117,Minitab中的列联表检定,118,Minitab中的列联表检定,各数据代表的意义,119,Minitab中的列联表检定,120,Minitab中的列联表检定,在minitab中,资料整理格式二,121,Minitab中的列联表检定,122,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定

41、计量型资料检定 变异数的检定 平均值的检定,123,AUO Proprietary & Confidential,计量型资料的检定 1.变异数的检定 2.平均值的检定,124,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,125,单一母体变异(2)之检定(2检定),当你想判断新方法、新材料等所做出来品质的母变异2,是否与原来所做出来母变异o2不同(较小或较大)时,则需要母变异检定来做判

42、断。 提出假设 计算卡方统计量 决策 利用卡方分配,在=0.05的假设下若 或 则拒绝虚无假设,表示有足够证据说明变异数不相等。,0.975,n-1,0.025,n-1,126,例子说明,事例: 蚀刻后ITO 厚度之变异是否改变了? 现况:在目前之作业标准下,蚀刻后ITO 厚度的变异00.136 改善试验: 为了缩小ITO蚀刻后厚度的变异,调整蚀刻时间之条件,共做了10个试验, 得到10个测定值如下:46.023, 45.993, 45.881, 45.859, 45.549, 45.618, 45.936, 45.728, 45.943, 45.929。 请问蚀刻后ITO厚度变异是否变小了?

43、,127,例子说明,检定变异是否相等,采用 检定,利用统计量 结论:没有足够的证据显示改善后的膜厚变异确实有降低。,落在此区,不拒绝假设,20.05,df=9=3.325,0.05,9,128,1 Variances test in Minitab,129,选择数据字段,1-,1 Variances test in Minitab,输入要比较的目标值,130,1 Variances test in Minitab,Test and CI for One Standard Deviation: ITO厚度 Method Null hypothesis Sigma = 0.136 Alternat

44、ive hypothesis Sigma = 0.136 The standard method is only for the normal distribution. The adjusted method is for any continuous distribution. Statistics Variable N StDev Variance ITO厚度 10 0.161 0.0259 95% One-Sided Confidence Intervals Upper Bound Upper Bound Variable Method for StDev for Variance I

45、TO厚度 Standard 0.265 0.0700 Adjusted 0.252 0.0637 Tests Variable Method Chi-Square DF P-Value ITO厚度 Standard 12.59 9.00 0.818 Adjusted 14.73 10.53 0.831,131,两母体2之检定(F检定),当两台机器,两个Process,或两种厂牌的材料之变异皆属尚未确定(通常指的是n30),但欲判断其变异1,2是否显著不同时使用。 提出假设 计算F统计量 决策 利用F分配,在=0.05的假设下若 或 则拒绝虚无假设,表示有足够证据说明两者的变异数有显著差异。,(

46、0.025,n1-1,n2-1),(0.975,n1-1,n2-1),1/F,F(0.025,n1-1,n2-1),132,例子说明,测量方式: 使用3D测量油性笔迹下边缘与CF上边缘之间的距离,比较Teflon和Peak两种不同材质的靠位PIN Wet Clean时的稳定性,Teflon,Peak,油性笔迹下边缘,CF上边缘,实验方式: D01:使用Teflon材质的Wet Clean靠位PIN D02:使用Peak材质的Wet Clean靠位PIN 各擦拭10片,每片的 X 方向测量 3 个点,比较擦拭的稳定性。,133,例子说明,现工程师分别收集Teflon与Peak pin各30笔资料

47、(如上表),请问,两种材质的pin,所造成的变异是否相等?,134,例子说明,假设: 统计量: 决策:有足够的证据显示,Teflon与Peak Pin所造成的变异并不一样,落在拒绝区域,所以拒绝H0,0.975,29,29,135,2 Variances test in excel,136,2 Variances test in Minitab,2 Variances : 针对不同母体资料比较变异数的差异后确认是否有显著性差异时使用。,Stat Basic Statistics 2 Variances,137,2 Variances test in Minitab,选择数据字段,1-,138,

48、2 Variances test in Minitab,当母体不是常态时,应该要看 Levenes Test 的结果哦,Test for Equal Variances: Teflon, Peak 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Teflon 30 0.129744 0.168087 0.236424 Peak 30 0.052278 0.067728 0.095263 F-Test (Normal Distribution) Test statistic = 6.1

49、6, p-value = 0.000 Levenes Test (Any Continuous Distribution) Test statistic = 12.38, p-value = 0.001,139,Syllabus,母体与样本 叙述统计 叙述统计量 统计分布 描述与机率分布 抽样分布 推论统计 估计 假设检定,计数型资料检定 1 proportion test 2 proportion test 列联表检定 计量型资料检定 变异数的检定 平均值的检定,140,单一母体已知时-Z检定,当你在工作中想改变目前某一品质特性之平均0,希望以n 个数据值来判断改变后大量生产之平均是否与目前

50、之0不同时,你可能需要做平均检定。 母体变异数已知的条件下 提出假设 计算Z统计量 决策 利用 Z分配,在=0.05的假设下若 或则拒绝虚无假设。 表示有足够证据说明母体平均数不是0 。,141,例子说明,事例:B/L 中心辉度是否改变了? 现况:制程在目前之作业标准下,平均及标准差如下:3500 cd/m2 87 改善实验 : 工程师为了提高辉度以降低超出规格下限之不良率,因此改变了制程;做了n15个实验数据,为: 3859, 3802,3794, 3645, 3635, 3632, 3631, 3631, 3630, 3627, 3626, 3625, 3625, 3624, 3623等

51、请问此实验是否能改善中心辉度?,142,例子说明,此为母变异已知的单一母体平均值检定,故选用统计量 结论:有足够证据显示改善后的膜厚平均值有增加。,落在此区,拒绝假设,Z0.95=1.645,=,143,1 sample z test in Minitab,Stat Basic Statistics 1-Sample z,144,单一母体未知(n30)时-t检定,用于欲判断改变作法、条件、或材料.后之平均是否与目前之0不同,但目前之尚未能确定,(例如:新产品、新制程、新设备) n30之阶段,而根据专业技术判断不会因改变作法、条件等而改变时使用。 母体变异数未知 提出假设 计算 t 统计量 决策

52、 利用 t分配,在=0.05的假设下若 或则拒绝虚无假设。 表示有足够证据说明母体平均数不是0,145,例子说明,当拔Cable线头向外扭转时,Cable线槽也随之扭转,从而造成Connector扩孔。现工程师加长麦拉片,来减少Cable线头与Connector相对运动而造成Connector损坏,收集8笔拉力数据如下: 8.6,8.0,8.3,8.9,8.1,8.3,8.3,8.5 且已知之拉力规格为 8.5,请问加长麦拉片长度后,是否达到规格要求?,146,例子说明,假设 : 统计量:现收集数据之 x=8.375,s=0.287,在母体未知情况下,利用 t 统计量 结论 :没有足够证据显示

53、,加长麦拉片长度后可符合拉力需求。,并未落在拒绝区域,所以接受H0,=0.05,147,1 sample t test in Minitab,1 Sample检验是比较目标值与个平均值后,决定统计上有无显著性差异时使用。,对一个连续型的资料,如果想知道与母体的目标值有多大差异时使用 1-Sample t验证。,Stat Basic Statistics 1-Sample t,148,1 sample t test in Minitab,选择数据字段,填入所要比较的目标值,1-,选择对立假设的型态,149,1 sample t test in Minitab,150,母体平均数的推论两个母体,两

54、样本独立 两母体变异数已知n 30 (Z test) 两母体变异数未知但相等(n30) (t test) 两母体变异数未知且不相等(n30) (t test) 两样本不独立 成对抽取 (成对t test),151,两独立母体间平均数的推论-母体变异数已知,用于欲判断两种作法、条件、或材料. 之平均是否相等。 母体变异数已知 提出假设 计算 Z 统计量 决策 利用 Z分配,在=0.05的假设下若 或 则拒绝虚无假设,表示有足够证据说明两母体平均数不相等 。,152,例子说明,事例:产品组装尺寸比例偏高 现况:产品的SAS机台精度差异所造成 改善试验 工程师想了解SAS机台是否有机台差异,分别针对

55、F5,F6各收集10笔资料 F5:0.151125, 0.141375, 0.14375, 0.14575, 0.15, 0.143875, 0.17, 0.15825, 0.166, 0.17225 F6:0.17675, 0.152125, 0.176, 0.207, 0.187, 0.2105, 0.1835, 0.170375, 0.176375, 0.19 假设经推定两机台的母体变异分别为F5 =0.0104 , F6 =0.0306 请问两机台所产出的组装尺寸是否有差异?,153,例子说明,在母体的变异已知下,采用 Z 检定,其统计量为 结论:足够证据显示,F5,F6所产出的AS

56、layer的Diff-Overlay明显不同,Z0.025=-1.96,Z0.975=1.96,落在此区,拒绝假设,154,2 sample Z test in excel,155,两独立母体间平均数的推论 -母体变异数未知但相等(n30),用于欲判断两种作法、条件、或材料. 之平均是否相等。但目前之尚未能确定,例如:新产品、新制程、新设备等,n30之阶段,而根据专业技术判断不会因改变作法、条件等而改变时使用。 母体变异数未知 提出假设 计算 t 统计量 其中 决策 利用t分配,在=0.05的假设下若 或,则拒绝假设虚无假设,表示没有足够证据说明两母体平均数相等,156,例子说明,当拔Cabl

57、e线头向外扭转时,Cable线槽也随之扭转,从而造成Connector扩孔。 工程师为改善Connector扩孔问题,尝试加长麦拉片,来减少Cable线头与Connector相对运动而造成Connector损坏,分别收集原本与加长两种情况的拉力数据各8笔如图:,请问加长麦拉片长度后,所能容许拉力是否比原本好?,157,例子说明,假设 : 统计量:现收集数据之 x1=8.44, x2=4.98, s1=0.32, s2=0.25在母体未知且相等情况下,利用 t 统计量 df=8+8-2=14 结论 :有足够证据显示,加长之后,可受拉力变大。,落在拒绝区域,所以拒绝H0,=0.05,0.95,14,158,2 sample t test(等方差) in excel,159,两独立母体间平均数的推论-母体变异数未知且不等(n30),前提同变异数未知但相等之情形 母体变异数未知 提出假设 计算统计量 决策 利用 t 分配,在=0.05的假设下先计算其自由度 若 或,则拒绝虚无假设,表示没有足够证据说明两母体平均数相等,160,为降低IC压痕不良,在COG本压步骤中加上Teflon缓冲材,但增加缓冲材后必须不影响IC的对位精度 工程师收集改善前後数据如左:,请问使用Teflon后,会影响对位精度吗?,例子说明,161,/2=0.025,例子说明,假设 : 统计量:现收集数据之 x1=-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论