




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
吴政哲 本课程为研发部,品保部,联信人员必修 修毕课程并考核合格后具资格担任上述各部门主办职务 本课程约当统计学大专程度课程并适度结合实务操作 统计名词介绍 母體(population) :研究者所考虑具有某种特性 的全体集合. 样本(sample) :由母体中所选出的一个部分集 合. 抽樣(sampling):由母体选择样本的程序或方法 . 参數(parameter) :研究者想了解的母体特性值 . 统计量(statistics) :由样本所计算出来的量,可 以用来对母体参数进行推论. 统计推論(statistical inference) :自样本统计量 对母体参数进行评估的过程. 资料性质 连续型资料:数据本身构成可以以连续性 的数值表示,如长度,重量等. 离散型资料:数据本身构成无法以连续性 的数值表示,如对或錯,赞成或反對,已婚或 未婚等. 利用连续型数据进行统计一般称为计量型 统計,利用离散型资料进行统计一般称为 计数型统计. 统计方法分类 常用商用或工业用统计方法可以分为下列三 种: a.叙述性统计. b.推论性统计. c.多变量分析. 一般本公司研究或检测使用叙述性统计及推 论性统计已经足夠,当研究变数涉及三个以上 且有交互作用时才会用到多变量分析.多变量 分析在一般统计课程归类上属于研究所课程, 适用于主办及以上主管或是资深工程師,将与 实验设计另外开课. 叙述性统计 一般叙述性统计量分为下列四种: a.集中趋势统计量. b.位置统计量. c.离散趋势统计量. d.形状统计量. 其中以集中趋势统计量及离散趋势统计量 最为重要,本课程主要介绍这两种统计量. 集中趋势统计量 集中趋势统计量是用来提供一群资料的中 心点或是代表量.常用的有平均數,中位數, 众數,加权平均数等,一般最常用户为平均 數,以 代表,其公式为: = (x1 + x2 +x3 +xn)/n 离散趋势统计量 集中趋势统计量是用来表达一群资料的分散 状況.常用的有全距,变异數,标准差等,都很常 用. a.全距(range) :为一群数据最大值和最小值的 差距,其代表式为: r = maxxi minxi b.变异數(variance) :为每一笔资料xi与中心點 差距(bias)的平方和平均,其代表式为: 离散趋势统计量续 c.标准差(standard deviation) :变异数的开平 方,可以将之视为数据标准化后的平均差距其 代表式为: 常态分配 常态分配(normal distribution) :又称为正态 分配,钟形分配,高斯分配.在工业统计上,这 个分配是连续型数据最重要的假定分配.下 图为标准化后的常态分配图. 常态分配代表式为: 在常态分配下利用z值查不良率 z值:常态分配在标准化之后只有一个机率 密度函數,以z值所代表位置一查常态分配 表立刻就可以取的机率,相当方便,在应用 上,该机率常用者为不良率,在统计上属于 推论性统计的预測.z值代表式为: 叙述性统计综合应用范例 瑞贤电镀厂使用某一种药水进行top coat,标准 要求盐雾试验必须达到120小時,瑞贤准备使用 两种浓度5%及10%来试验该药水以便于量產, 经试验后盐雾试验结果如下,请问瑞贤使用哪种 浓度效果较佳? 12345678910 5%150130120135155145165150140160 10%140135145135140150145145130145 范例解答 使用5%浓度虽然平均值较高,但是标准偏差较 大显示制程较不稳定,在此状况下加算z值,经查 常态分配z值表后发现不良率以10%浓度制程 不良率远低于5%制程,故使用10%浓度药水进 行量产较佳. 抽样分配 决策通常必须面对不确定性,统计即提供 度量不确定性以提供决策的参考. 由少数样本信息对整个母体作决策的方法 称为推论性统计. 推论性统计分为估計,预测与检定,估计就 是用样本的信息来猜母体的特性,检定就 是检查到底猜的对不對,猜错的机会又是 多少. 母体 样本样本 计算统计量 资料收集 统计推论估计与预测 统计推论检定 推论性统计 确认母体特性 寻找管理意义 抽样 简单随机抽样法. 系统抽样法. 分层随机抽样法. 部落抽样法. 估计与误差 估计总是存在有误差,估计值的误差式为: 估计值=参数(真值) +方法偏差+抽样误差. 在实际应用上,只要方法用對,方法偏差及抽样误 差其实都不是太大,而抽样误差是可以算出而加 以检定. 卡方分配 由自由度为k 的标准常态分配所构成的分配 为卡方分配,其代表式写成: y =x12+x22+x32+xk2 其密度函数图为: 卡方分配 卡方分配最主要的功能是拿来作检定用途, 通常是用来进行适合度检定(goodness of fit test)或是检定常态分配数据的变异数是 否等于某數.也可以以无母数检定的方式用 来检定母体是否为常态分配. 由卡方分配的特性延伸出另外两种分配,分 为t 分配及f 分配. t 分配 进行统计量计算时常以样本标准偏差取代母体 标准偏差进行计算,问题是样本的分配状况由 于样本数通常不大造成以样本标准偏差取代母 体标准偏差的偏誤,此时样本标准偏差可以t 分 配计算后再取代母体标准偏差. t 分配 自由度(freedom) :样本数减一即为自由度. 自由度无限大时t 分配等于常态分配.在实际应 用上,样本数(或组数)大于等于25时可以视为 常态分配应用与计算. t 分配主要的用途是拿来检定母体平均数及计 算信赖区間(confidence interval).运用在t 检 定時,可以用来检定2个不同母体的平均数是否 相等. f分配 f分配起源于两个不同母体变异数的比較, 其主要用途也是拿来检定不同母体变异数 的差异性,另外一个更加重要的用途是用于 anova分析中三组以上母体平均数是否相 等的问題.其代表式过于复雜,此处不列,其 密度函数则如下: 假设与检定 假設(hypothesis) :假设是一种说法,说法对 不對,不经过验证不知道,验证就是检定.统 计上一旦作出假設,就应该进行检定. a.虚无假設(null hypothesis) :虚无假设通常 是研究者所要证实的说法.通常写成h0. b.对立假設(alternative hypothesis) :虚无假 设通常是研究者所怀疑的说法.通常写成h1. 假设与检定 假设经过检定後,就应该做出判定看要接 受虚无假设或是对立假設.此时可能会判 定错誤,该判定错误可以分为: a.type i错误:虚无假设是对的,但判定接受 对立假设. b.type ii错误:虚无假设是错的,但判定接 受虚无假设. 假设与检定 显著水準(significant level) :为了使type i错误 及type ii错误越少越好,实务上在作检定时会 先控制type i错误在一定的机率以下,该机率则 称为显著水準,然后在通过这个显著水平的决策 下载来寻找使type ii错误的决策,这种方法称 为最佳检定法.显著水平是一个机率,通常定为 10%, 5%或是1%,显著水平以 表示. 母体平均数检定 母体平均数检定一般分为三种: a.左尾检定:其假设为 h0 :=0 h1 : 0 双尾检定:其假设为 h0 :=0 a. h1 : 0 母体平均数检定 例子:客戶,供货商及品保人员对电镀膜厚关 心方向对检定的影响: a.客户担心膜厚不足造成保护功能不足,所以 使用左尾检定确保膜厚达到要求. b.供货商担心膜厚太厚造成成本上升,所以使 用右尾检定确保成本不致太高. c.品保人员为顾及客户与供货商双方利益,以 便可以向双方交代,所以使用双尾检定同时 确保质量及成本均在要求范围内. 母体平均数检定范例 友信生产某螺丝杆径要求为6.18mm 6.35mm, 经试产后抽10支样本进行测试后测试值如下: 请问以光标卡尺所测试的资料与分厘卡所测试 的资料其平均数是否均為6.20?又请以测试数据 推论该制程制程参数设定在6.20是否适當?使用 哪种量具效果较佳,为什么? 12345678910 游尺6.206.206.206.196.196.206.206.206.206.19 分厘卡6.1976.1986.2036.1956.1946.1976.1986.1996.1986.194 母体平均数检定范例解答 1.由于数据属于小样本且母体标准偏差未知,因此应使用t 检定母体平均數,计算式为: t = (-0)/(s/n)游标卡尺= -1.96 分厘卡= -3.20 查t 值表t 9, 0.025= 2.2622(双尾检定) 1. 使用光标卡尺时, t t 9,0.025,因此拒绝虚无假設,即平 均数不等于6.20. 3. 但使用单尾检定时状况就不一樣,单尾检定时t 9, 0.05= 1.8331,此时均拒绝虚无假設,即平均数不等于6.20. 母体平均数检定范例解答 2.制程平均值设定于6.20还算适當,以单因子t 检定来看, 游标卡尺平均值的95%信赖区间为6.19354 - 6.20046, 分厘卡平均值的95%信赖区间为6.19539 - 6.19921,标 准偏差分别为0.00483及0.00267,在最倒霉的状况下,游 标卡尺及分厘卡的ppk值分别为0.934及1.921,可以看出 使用如果使用光标卡尺作为量测系统時,则参数定在6.20 是不适当的,应该适度的调升参數,在此范例建议调到 6.21或6.22.如果使用分厘卡的话则制程还算可以. 由上述可以得知使用分厘卡比使用光标卡尺的效果要好, 除了上述原因之外,也可以使用双因t 检定来比较两者之 间的差异. 两组样本的检定 一般运用在检定两组样本时通常我们会介 意的是平均数是否相等?变异数是否相等 ?在实际运用上两者常常搭配使用,检定平 均数让我们可以选择较好的参数设定,而 在质量特性上,变异数较大代表变异大质 量较差.平均数检定通常使用t检定,变异数 检定通常使用f 检定. 两组样本的检定范例 瑞贤电镀厂使用某一种药水进行top coat,标准 要求盐雾试验必须达到120小時,瑞贤准备使用 两种浓度5%及10%来试验该药水以便于量產, 经试验后盐雾试验结果如下,请问这两种制程参 数做出来的产品其平均数是否相等?其变异数是 否相等? 12345678910 5%150130120135155145165150140160 10%140135145135140150145145130145 范例解答 以minitab进行成对样本t 检定得到下列结果: two-sample t for c1 vs c2 n mean stdev se mean c1 10 145.0 13.9 4.4 c2 10 141.00 6.15 1.9 difference = mu c1 - mu c2 estimate for difference: 4.00 95% ci for difference: (-6.50, 14.50) t-test of difference = 0 (vs not =): t-value = 0.83 p value = 0.423 df = 12 由于p value 0.05,检定结果不显著,接受虚无假設,即两 种制程的平均数相等. 范例解答 以minitab进行成对样本f 检定得到下列结果: f-test (normal distribution) test statistic: 5.147 p-value : 0.023 levenes test (any continuous distribution) test statistic: 4.531 p-value : 0.047 由于p value均小于0.05,检定结果显著,拒绝虚无 假設,即两种制程的变异数存在有显著性差异. 卡方检定 卡方检定运用甚廣,通常用来进行适合度 检定或独立性(一致性)检定,本公司一般会 用到的是适合度检定,适合度检定一般是 用来确定样本数据是否符合哪一种分配的 检定法. 连续性资料一致性检定范例 瑞贤电镀厂使用某一种药水进行top coat,标准 要求盐雾试验必须达到120小時,瑞贤准备使用 两种浓度5%及10%来试验该药水以便于量產, 经试验后盐雾试验结果如下,请问这两种制程参 数做出来的产品测试值是否符合常态分配? 12345678910 5%150130120135155145165150140160 10%140135145135140150145145130145 范例解答 以spss进行样本适合性检定得到下列结果 : 由于显著性均大于0.05,检定结果不显著,即该两 组数据均属于常态分配. 5%10% chi-square.8003.000 df84 asymp. sig999.558 变异数分析与假设 前文提及检定两组样本的平均数是否相等 可以使用t 检定,那两组以上样本要用什么 方法来进行检定各组样本的平均数是否相 等?答案就是变异数分析(anova, analysis of variance).通常其检定假设 写为: h0 :1 = 2 = 3 = k h1 :不是所有的平均数都相等 变异数分析方法 变异数分析主要是利用数据的组间平方和 (between group sum of square)及组内平 方和(within group sum of square)进行比 較,如果组间平方和很小,表示说每组变异很 小相当接近,自然我们就可以估计其平均数概 略相等,但这个量要多小我们才能说h0显著 接收虚无假設?自然要有一个比较的对象,所 以就拿组内平方和(变异)来比較.而其比值即 为f 分配,如此又可以使用f检定来作判断. 变异数分析的应用 变异数分析主要用来分析不同的状况(制 程或检验)下,所产生的结果是否相同,如果 有所不同,其差异又在哪裡,又如何进行改 善?因此,变异数分析广泛的应用在制程设 計,实验设計,量测系统研究等方面,因此研 发人員,品保人員,实验室人员均应对本方 法有所了解,以往后的工作方法将有很大 的帮助. 变异数分析范例 某sae 2级螺栓为达成其功能性要求,其抗拉强 度要求为76,000 psi,为此以四种材料进行试验, 其实验数据如表列,研究人员欲寻求最佳材料,请 问何种材料为最佳材料? 单位: ksi 范例解答 以excel进行运算后到下列结果: 范例解答 依照上表结果,p 值为0.000显示出极为显著 的差異,因此,使用不同材料后其结果极为不 同,因此,接下来我们判定哪些较好,哪些较 差,首先看平均數,平均数中以c1018离规格 界限最遠,接着再算出估计不良率,也是 c1018估计不良率最低,因此,本范例中最佳 材料应为c1018. 回归分析与假设 统计再讨论两组(或以上)变数時,常会问两 个问題,一个是这些变量间是否有什么关 係?如果有,关系有多大?另一个问题是变 量对另一个变量是否有影響?第一个问题 可以用相关系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年导电纺织品行业研究报告及未来行业发展趋势预测
- 企业人力资源管理师设备维护与保养考核试卷及答案
- 铸件清理工质量追溯知识考核试卷及答案
- 铣工招聘考核试卷及答案
- 2025年场景金融行业研究报告及未来行业发展趋势预测
- 智能楼宇管理员5S管理考核试卷及答案
- 2025年KTV隔音吸音材料行业研究报告及未来行业发展趋势预测
- 道路客运服务员适应性考核试卷及答案
- 景泰蓝制胎工专业技能考核试卷及答案
- 电光源装配工抗压考核试卷及答案
- DBJT15-98-2019 建筑施工承插型套扣式钢管脚手架安全技术规程
- 2025年部编版新教材语文七年级上册全套教案设计(含教学设计)
- 变电运维安全活动个人发言
- 店面目标管理培训课件
- 2.6戊戌变法课件部编版八年级历史上学期
- 消防设施操作员培训模块1 职业道德
- 小凤教学课件资料包语文
- 检验文件管理办法
- 2025年《三级公共营养师》考试练习题库及答案
- 北京市东城区2024-2025学年高一下学期期末语文试题(含答案)
- 山东吕剧教学课件
评论
0/150
提交评论