基础统计与抽样_第1页
基础统计与抽样_第2页
基础统计与抽样_第3页
基础统计与抽样_第4页
基础统计与抽样_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础统计与抽样基础统计与抽样目录了解数据统计学及应用数据的获取数据的分类数据的特征抽样检验基础Minitab简介1.1

了解数据统计学与应用统计学是研究收集、处理、分析、解释数据并从数据中得出结论的一门科学。统计学是研究数量方面的学问统计学研究的是客观现象总体的数量特征统计学研究的是不确定性现象统计学是一门方法论的科学,具有很强的实用性统计学与应用企业发展战略产品的质量管理市场研究财务分析经济预测人力资源管理….当然,统计也不是万能的,不能解决你所面临的所有问题。统计能帮助你进行数据分析,并从分析中得出某种结论,但对统计结论进一步解释,则需要你的专业知识。有数据的地方就有统计,有统计就会形成判断,推测。数据的获:总体与样本总体

nx

信息由样本信息作为总体信息x抽取一部分图1.1.1 总体和样本的关系估计值数据的获:总体与样本总体(population):把研究的一类对象的全体称为总体。个体(individual):把构成总体的每一个成员称为个体。样本(sample):从总体中抽出的部分个体组成的集合称为样本。样品:样本中包含的个体成为样品。样本容量(sample

size):样本中包含的个体的数量称为样本容量,用n表示。参数μσπ统计量xs

p均值标准差比例描述总体描述样本数据的获:常用的抽样方法简单随机抽样

(simple random

sampling)分层抽样

(stratified sampling)等距抽样,又称系统抽样(systematic sampling)整群抽样(cluster sampling)简单随机抽样定义:

一般地,设一个总体含有N个个体,从中逐个不放回的抽取n个个体作为样本(n≤N),如果每次抽取时总体内的每个个体被抽到的机会相等,就称这种抽样方法为简单随机抽样.特点:个体数有限、逐个抽取、不放回抽取、等可能抽取常用方法:抽签法:定义:(本质上和步骤一致);步骤:编号、制签、均匀搅拌、抽签、确定样本随机数法:定义:利用随机数表,随机数骰(tou)子或计算机产生的随机数进行抽样;

步骤:编号、选定初始值(数)、选号、确定样本简单随机抽样简单随机抽样的实际应用案例1.

汽车零部件质量检测某车间生产100件汽车传动轴,需抽取10件进行直径精度检测。采用抽签法实施简单随机抽样:编号制作:将100件产品编号为1至100;均匀混合:制作100张对应编号的标签,放入容器充分搅匀;连续抽取:闭眼随机抽取10张标签,对应编号的传动轴即为检测样本。*此方法保证了每个零件被选中的概率均为1/100,且抽样过程完全独立。核心特点与适用场景无偏性:所有个体被选概率严格相等;独立性:个体抽取结果互不影响;高效性:适用于小规模总体或均匀分布场景。局限性:大规模抽样时效率较低(如从10万人中抽取样本需完整编号),建议结合分层或系统抽样优化2.

学生代表抽取某班级有120名学生,班主任需挑选5名学生参加校级辩论赛。使用随机数表法进行简单随机抽样:生成随机数:将学生编号为001至120,使用随机数生成器(如Excel的RANDBETWEEN函数)生成5个不重复的随机数(如037、089、012、065、103);确认样本:对应编号的学生直接入选。*该方法避免了人为干预,确保每个学生有均等参与机会。分层抽样1、定义:在抽样时,将整体分成互不相交的层,然后按照一定比例,从各层独立的抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.2、特点:

(1)适用于总体由差异明显的几部分组成的情况、(2)按比例确定每层抽取的个数、(3)抽取时采用系统抽样或简单随机抽样、(4)样本具有良好的代表性、(5)等可能抽样3、步骤:分层、定抽样比、确定各层抽样的数目、抽取个体分层抽样分层抽样应用案例案例一:按硅片尺寸与工艺类型分层的缺陷检测抽样背景:某12英寸半导体硅片制造厂需评估抛光片和外延片两类主流产品的表面缺陷率,同时兼顾不同尺寸(12英寸、8英寸)硅片的工艺差异。分层与抽样步骤:一级分层:按硅片尺寸划分12英寸硅片(占比65%,月产量50万片)8英寸硅片(占比25%,月产量19万片)二级分层:按工艺类型划分抛光片(基础工艺,占总产量70%)

外延片(需外延生长,占总产量30%)样本分配:总样本量1000片,按分层比例分配:12英寸抛光片:50万×70%×(1000÷69万)=约485片12英寸外延片:50万×30%×(1000÷69万)=约208片8英寸抛光片:19万×70%×(1000÷69万)=约145片8英寸外延片:19万×30%×(1000÷69万)=约62片抽样方法:每批次生产完成后,从对应分层单元中随机抽取预分配数量样本;缺陷检测项目包括表面颗粒度、氧化层均匀性等。优势:精准匹配不同尺寸硅片的工艺复杂度(如12英寸外延片对表面平整度要求更高);避免因产量差异导致小尺寸/特殊工艺硅片缺陷数据缺失。分层抽样的核心价值工艺适配性:通过尺寸、工艺环节的分层,匹配半导体硅片制造的高度专业化需求;成本优化:避免对低风险环节(如成熟切割工艺)过度抽样,降低检测成本;数据可解释性:细分层内数据可直接指导工艺参数调整(如外延生长温度优化)案例二:按生产环节与技术成熟度分层的质量监控抽样背景:某硅片企业需评估新引进的SOI硅片(绝缘体上硅)生产线良率,需覆盖拉晶、切割、抛光、键合四类核心工序。分层与抽样步骤:一级分层:按生产环节划分单晶生长(拉晶炉稳定性影响晶格缺陷)切割成型(厚度偏差与边缘崩缺风险)

化学抛光(氧化层均匀性与表面粗糙度)键合工艺(绝缘层粘合强度与界面空洞)二级分层:按技术成熟度划分成熟工艺段(如切割成型,良率>98%)新工艺段(如键合工艺,良率<85%)

样本分配:总样本量800片,按风险优先级分配:键合工艺(新工艺):50%×800=400片

切割成型(成熟工艺):15%×800=120片拉晶与抛光各分配17.5%×800=140片检测方法:键合层缺陷采用扫描电镜(SEM)与能谱分析验证界面成分;抛光片表面质量通过激光散射仪检测亚微米级颗粒。优势:聚焦高风险工艺段(如键合),提升抽样针对性;结合成熟工艺的稳定数据,建立良率改进基准线。系统抽样1、定义:在抽样中,当总体中个体数较多时,可将整体分成均匀的几个部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需的样本,这样的方法叫做系统抽样.2、特点:(1)个体数目较大且无较大差异、(2)将总体均分成若干部分、(3)分段间隔相等、(4)在第一段内用简单随机抽样抽取,其余依次加上间隔的整数倍、(5)等可能抽样.3、步骤:编号、分段(确定k,当N/n是整数时,取

k=N/n,

否则,剔除总体中多余的个体,取k=[N/n]);确定第一个个体编号l(采用简单随机抽样);

成样,获取整个样本.系统抽样实际生活中系统抽样的应用案例1. 学生考试成绩分析某校有1000名学生参加考试,需抽取50名样本分析成绩。步骤如下:计算间隔:1000÷50=20;随机起始点:通过随机数生成选中第7名学生;抽取样本:依次抽取第7、27、47…987号学生。此方法操作简便,且当学生成绩分布均匀时能保证样本代表性。某一地区用户)。系统抽样的核心特点等距规则:通过固定间隔覆盖总体,操作效率高;适用场景:总体无明显周期性或分层特性;局限性:若数据隐含周期(如每周订单高峰),可能引发偏差,需结合随机起始点降低风险。2.

客户满意度调查连锁超市有10000名注册用户,需抽取100人进行满意度回访:确定间隔:10000÷100=100;随机起点:随机选中第89号客户;抽取样本:89、189、289…9989号客户。此方法确保客户按注册时间均匀分布,避免随机抽样可能导致的群集偏差(如仅抽取某一地区用户)。1、定义:将总体分成群,每个群由个体按一定的方式结合而成,然后随机地抽取若干群,并由这些群中的所有个体组成样本。2、特点:抽样框编制得以简化实施调查便利,节省费用估计效率较低(群内单元有趋同性)3、步骤:确定分群的标注;总体分成若干个互不重叠的部分,每个部分为一群;据各样本量,确定应该抽取的群数;用简单随机抽样或系统抽样方法,从群中抽取确定的群数整群抽样一、整群抽样的应用案例教育领域调研:某市调查小学生体质健康水平时,将全市划分为若干学区,随机抽取3个学区,并对抽中学区内的所有学校进行全员测试。例如,每个学区包含10所学校,被抽中的30所学校所有学生均纳入样本,避免了逐个抽取学生的复杂性。

工业产品质量检测:工厂检验某批次零件的合格率时,将零件按包装盒(每盒50个)分组,随机抽取5盒进行全面检测,而非逐一检查每个零件。这种方法简化了流程,直接以“盒”为群单位进行抽样分析。二、整群抽样的核心特点抽样单位为“群”:以自然形成的群体(如学校、社区、包装盒)为基本抽样单元,而非个体。实施成本低:群内样本地理位置或管理单元集中,减少了调查时间和费用。群内同质性强,群间差异大:同一群内个体特征相似(如同一学校学生年龄相近),可能导致抽样误差较大;需通过增加样本量或结合分层抽样优化精度。适用大规模调查:尤其适合总体范围广、个体分散的场景,如全国性社会调查或连续性生产线质检。整群抽样例1、一个单位的职工有500人,其中不到a.35岁的有125人,b.35~49岁的有280人,c.50岁以上的有95人.为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分层抽样:

a=125*20%

b=280*20%c=95*20%例2、某校有学生1200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得?随机抽样:将学生编号为001至1200,使用随机数生成器(如Excel的RANDBETWEEN函数)生成50个不重复的随机数案例练习案例练习例3:假设有产品微型变压器分别装在100个零件箱中,每箱装20个,共2000个。如果想从中取200个零件组成样本进行测试研究,应如何应用简单随机抽样法、系统抽样法、分层抽样法、整群抽样法这四种抽样方法?随机抽样:将零件编号为001至2000,使用随机数生成器(如Excel的RANDBETWEEN函数)生成200个不重复的随机数进行抽取系统抽样:装箱逻辑:每箱20个,共100箱。第1箱对应编号1~20,第2箱21~40,依此类推,第100箱对应1981~2000

计算抽样间隔:总样本量需抽取200个,因此抽样间隔K=2000/200,即每隔10个零件抽取1个样本随机确定起始点:在1至10之间随机选择一个数字作为起始点

r(例如通过随机数生成器选取r=3)按间隔抽取样本:从起始点

r

开始,每隔10个编号抽取一个样本:抽取的样本编号:3,13,23,33,…,1993,每个零件箱(20个)会被抽取2个样本分层抽样:每箱随机抽取10%,即100*10%*20箱整群抽样:将100个零件箱编号为001至100,使用随机数生成器(如Excel的RANDBETWEEN函数)生成10个不重复的随机数,这10箱即为抽样样本数据的分类连续型数据:在一定区间内的取值是连续不断的、相邻两个数值可作无限分割的数据,也叫计量型数据。例如:尺寸,重量,粘度,拉力等。图1

连续型数据离散性数据:数据的取值是有穷尽的或者可数无穷尽的值,也叫计数型数据。例如:满意和不满意的人数,瓷砖中的缺陷点数,产品的不合格品数等。数据的分类图1.1.3 离散型数据连续和离散型数据特性对比数据类型连续性数据(计量型数据)离散性数据(计数型数据)常用数据收集方式一般用仪器测量计数优点能提供充足的信息,需要的样本量较少通常需要的测量成本较低缺点通常需要的测量成本较高提供的信息较少,需要的样本量较多221.1.4

数据的特征数据分布的特征中心位置离散程度分布形状中心位置离散程度图1.1.4 数据的中心位置与分布数据的特征:中心位置平均值:

算术平均值会:反映出所有数值的影响显著地受到极端值的影响中位数:组数据排序后处于中间位置上的变量值并不须将所有数值导入计算式中不受极端值的影响n为奇数n为偶数数据的特征:中心位置众数:一组数据中出现频数最多的变量值,称为众数(mode),用m0表示。注意:一组数据可能有几个众数,也可能没有众数四分位数:一组数据排序后处于25%和75%位置上的值,称为四分位数(Q1、Q3)练习题1.如下数据:1,

2,

2,

3,

5,

6,

7,

9,

10,

15,其中位数是(

5.5

)已知一位工程师在测量了6只产品的长度数据如下:12,14,5,11,22,22,请问此组数据的中位数为(13)一位工程师在测量产品厚度数据时,得到下面一组数据24,14,18,27,17,32,31,27,此组数据的极差为(

8

)数据的特征:中心位置国家发布的工资水平该用什么度量呢?总体方差总体标准差样本方差样本标准差NNi

i

1

(X

X

)2

22

(x

x)s

n

i

1 n

1i2n

1(x

x)ns2

i

1

iN

i

i

1 N(X

X

)2

数据的特征:离散程度2.1

方差2.2

标准差数据的特征:离散程度2.4

四分位间距:上四分位与下四分位之差,在minitab中用IQR表示。2.3

极差:一组数据的最大值与最小值之差,称为极差(range)用R表示。2.5

变异系数:标准差与均值之商,在minitab中用COV表示。COV=S/𝑥ҧ数据的特征:分布形态3.1

偏度:对数据不对称性的度量右偏态分布(偏度为正),“右尾”部延伸严重,在正态概率曲线呈上凸状;左偏态分布(偏度为负),“左尾”部延伸严重,在正态概率曲线呈下凸状3.2

峰度:对数据分布峰态的度量值峰度为正数时,表示数据分布比正态分布顶峰更峭、两尾更重;峰度为负数时,表示数据分布比正态分布顶峰更平、两尾更轻。负峰度常来自均匀型分布或多个不同均值的正态分布的混合。1.2

抽样检验基础抽样种类一次抽样检验:从Lot中进行一次抽样,根据所提取的样品实验结果,判定合格/不合格的检验方法;二次抽样检验:从Lot中抽取样品,选择其中的次品,与判定基准比较,如果出现明确的合格/不合格的结果时,采纳其判定结果。如果出现不明确的结果时,进行二次的采样,然后按一定的量进行实验,把获得的结果与第一次的结果累计,根据累计后的成绩,判定是合格/不合格的检验方法;多次抽样检验:把二次抽样检验的方式,扩大为三次以上的抽样方式。逐次抽样检验:选择一个或者一定量的样品进行实验的过程中,利用其累计的成绩,随时与判定标准进行比较,迅速判定其是否合格/不合格的检验方式。一次抽样抽样数n=80检查进行不良品数>=Re不良品数<=Ac拒收此Lot接受此Lot图1.4.1

一次抽样操作原理图二次抽样抽样数n=80检查进行不良品数>=Re不良品数<=Ac拒收此Lot接受此Lot图1.4.2 二次抽样操作原理图不良品数<Re

and

>Ac二次抽样进行1次、2次不良总数>=

Re1次、2次不良总数<=Ac抽样范围要全面抽样数量要准确抽样一定要随机抽样要亲自动手挑选样本应注意的原则1.三角抽样法2、对角抽样法常用抽样手法3.层次抽样法4.

S形抽样法抽样方案是由下列项目而定:N=产品批大小(或称批量)n=样本大小(或称样本量或抽样量)Ac=接受数目,即样组中所允许的缺陷数Re=拒收数目逐批检验抽样方案:术语逐批检验抽样方案:术语批允许不合格品百分率(LTPD)

:LTPD是指不合格的水平,其已达到令人不满意的地步,应该按抽样方案加以拒收。0.10的消费者风险是很普遍的,并且已经把LTPD定为批质量,其接受性概率为0.10;即10%的这样的产品批将会被接受。LTPD的本质LTPD

买方(消费者)能够容忍的单批质量极限值。当批次的实际不合格率

LTPD

时,该批次的质量已跌破买方底线,理应被拒收。消费者风险(β风险)指

错误接受劣质批的概率(即批次实际不合格率

LTPD,却被抽样方案判定为“接收”的概率)。行业惯例设定β

=0.10(10%),这意味着:即使一批产品劣质(不合格率

LTPD),仍有

10%

的概率因抽样“运气”而被接收。这是买卖双方协商妥协的结果,兼顾检验成本与风险控制。买方(消费者)需承担

β风险(误收劣质批)

卖方(生产者)需承担

α风险(误退合格批)LTPD

方案优先保护买方(β

10%),而

AQL方案优先保护卖方(α

5%)AQL(可接受质量水平:Acceptable

QualityLevel):-

进行购买方检查时尽量使其合格的品质标准。在M

I

L

MilitaryStandards)中,AQL的品质LOT,尽可能达到较高的合格率,以此选择抽样方式。-

AQL表示次品率(%),或者每100单位中缺点数的多少。在MIL中,当AQL为10以下时,次品率或者每100单位中缺点数均可适用。但是,当AQL超过10时,只适用于每100单位的缺点数。逐批检验抽样方案:术语逐批检验抽样方案:缺陷的严重性分类在MIL-STD-105D中,对检验单位,根据所采取的检验项目所发生的所有缺点,按重要性分为:致命缺陷、严重缺陷、轻微缺陷等3个等级。❶致命缺陷:产品存在的缺陷会给使用者使用、保管时带来危险(人身安全等),如汽车刹车不灵、电器爆炸、燃烧等是致命缺陷;❷严重缺陷:虽然达不到致命缺陷的程度,但是不能使用,或者实际降低产品的使用性,不能达到设定的要求,如电器电源打不开,设定定时不起作用等;❸轻微缺陷:虽然不适合于所规定的要求条件,但实际上使用没有问题的缺陷,如外观的颜色差异一般为轻缺陷,尺寸稍微有差异,但不影响实装,也可能为轻缺陷。逐批检验抽样方案:抽样检验转移原则开始连续至少15批检验合格;生产稳定;负责部门认为放宽检验可取初次检验连续5批或少于5批中有2批是不可接收的。初次加严检验的一系列连续批中未接收批的累计数达到5批或者有1批中抽检到客诉的不良项目放宽检验正常检验加严检验暂停检验一个批未被接收;生产不稳定或延迟;认为恢复正常检验是正当的其他情况。连续5批次认为是可接收的;客诉不良连续10批认为是可接收的。供方为改进所提供产品或服务的质量已采取行动,而且负责部门承认此行动可能有效时。表1.4.1

样品大小代码字母表Population

or

lot

sizeSpecial

inspection

levelsGeneral

inspection

levelsS-1S-2S-3S-4ⅠⅡⅢ2-8AAAAAAB9-15AAAAABC16-25AABBBCD26-50ABBCCDE51-90BBCCCEF91-150BBCDDFG151-280BCDEEGH281-500BCDEFHJ501-1200CCEFGJK1201-3200CDEGHKL3201-10000CDFGJLM10001-35000CDFHKMN35001-150000D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论