数理统计与计量讲义_第1页
数理统计与计量讲义_第2页
数理统计与计量讲义_第3页
数理统计与计量讲义_第4页
数理统计与计量讲义_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计与计量讲义*天津港湾工程质量检测中心1第一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心2概率与数理统计第二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心3一、概率统计基础圆的面积自由落体运动;水的沸点摄氏100度。随机事件抛掷硬币,出现正面还是反面?车站等车人数。抽样检验。必然事件随机事件也是有规律的。概率统计是揭示和研究自然界和人类社会中随机现象数量规律性的一门学科。

第三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心4注1:可能发生的事件的全体是确定的。注2:试验(观察)是可重复的。(1)不确定性在该现象发生之前,人们无法知道将会出现那一种结果;

(2)统计规律性每一个可能结果出现的可能性的大小是确定的。数学家皮尔逊曾投掷硬币12000次,得正面6019次;24000次,得正面12012次。

第四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心5二、频率与概率的统计定义如何描述事件A出现的可能性的大小?频率总是在某一定值附近摆动,事件A发生的频率的稳定中心P(A)称为事件A发生的概率。注1:频率与试验有关,但概率是该事件的客观属性。注2:稳定中心不是极限。注3:概率总是非负的,最大值为1,代表必然事件,最小值为0,代表不可能事件第五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心6三、概率的基本计算第六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心7第七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心8第八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心9四、常用的几种概率(1).均匀分布

第九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心10任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分别是:P和1-P若在相同的条件下,进行n次独立重复试验,用X表示这n次试验中事件A发生的次数,那么X服从二项分布,其概率密度函数为:(2).二项分布

第十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心11对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至达到最大值,随后单调减少.二项分布的图形特点:X~B(n,p)当(n+1)p不为整数时,二项概率P(X=k)在k=[(n+1)p]达到最大值;n=10,p=0.7kPk第十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心12正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.(3).正态分布

第十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心13正态分布的定义若X的概率密度为记作f(x)所确定的曲线叫作正态曲线.其中和都是常数,任意,>0,则称X服从参数为和的正态分布.第十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心14正态分布的图形特点正态分布的密度曲线是一条关于对称的钟形曲线.特点是“两头小,中间大,左右对称”.第十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心15决定了图形的中心位置,决定了图形中峰的陡峭程度.正态分布的图形特点第十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心16用上海99年年降雨量的数据画出了频率直方图.从直方图,我们可以初步看出,年降雨量近似服从正态分布.第十六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心17下面是我们用某大学男大学生的身高的数据画出的频率直方图.红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布.第十七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心18标准正态分布的正态分布称为标准正态分布.第十八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心19它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.

根据上面定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则~N(0,1)

设第十九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心20利用标准正态分布函数数值表,可以解决一般正态分布的概率计算.正态分布表表中给的是x>0时,Φ(x)的值.当-x<0时第二十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心21若~N(0,1)

若X~N(0,1),第二十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心22五、统计的基本概念一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.研究某批灯泡的质量…考察国产轿车的质量1.总体第二十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心23然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.该批灯泡寿命的全体就是总体灯泡的寿命国产轿车每公里的耗油量所有国产轿车每公里耗油量的全体就是总体第二十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心24

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.从国产轿车中抽5辆进行耗油量试验样本容量为52.样本第二十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心253.总体、样本、样本值的关系总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁第二十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心264.几个常见统计量样本均值样本方差样本标准差在教程中称有偏标准差实际上,对样本容量为n的情况,当有平均值时,由其中的n-1个偏差就可以推出剩下的那个偏差,因此,偏差自由度为n-1,在公式中使用n-1是比较合理的,特别是样本容量不大时。当样本容量很大时,使用n-1与n计算出的标准差相差不大。另外,使用n-1也避免了样本容量为1时还能求出标准差的情况。极差第二十六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心275.参数估计

无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计区间估计:根据估计量的分布规律,使得总体指标U在[U1,U2]区间的概率

P(U1≤U≤U2)=1-α,区间[U1,U2]称置信区间,1-α称置信系数,α称置信度(常取0.05)。根据置信度求置信区间的过程就是区间估计。应用例子:由样本均值估计总体均值的范围总体样本(总体参数)(估计量)第二十七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心28六、常用的数理工具1.排列图(巴雷特图、巴氏图)功能:找出主要影响因素三个分区:A区(0%-80%),主要影响因素B区(80%-90%),一般影响因素C区(90%-100%),次要影响因素频率由高到低第二十八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心292.直方图功能:掌握质量数据的分布和估算不合格品率步骤:1)收集数据,不少于50-100个2)分析数据,计算极差R=Xmax-Xmin3)确定组数k和组距h,组数k根据样本容量定,h=R/(k-1)4)确定组界,对于第一组:下限:Xmin-h/2;上限:Xmin+h/2;第二十九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心30判断质量分布形态第三十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心313.控制图(管理图)功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于偶然原因引起的变化。原理:“3σ准则”,(三倍标准差原则):对于正态分布的变量,其取值几乎全部集中在区间(概率为99.74):如果没有落在这一区间,则认为出现了异常。应用方法:以下控制线UCL和上控制线LCL取代以中线CL取代中线CL,下控制线UCL和上控制线LCL,为和的函数,应注意:批平均值的均值,不是整体均值批级差的均值,不是整体级差第三十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心32七、抽样检验与评定1.计数一次抽检评定标准:数量基本思想:从N件(不合格品数为D)抽取n件,规定n件中允许不合格数上限为c,当不合格品数量d小于或者等于c时,认为N件产品都合格,否则不合格。表示方法:(N,n,c)接收概率:精确方法:近似方法:超几何分布二项分布泊松分布第三十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心33抽样特征曲线:接收概率和产品不合格率之间的关系曲线。1.总是单调递减的,左高右低2.越陡峭,抽样方案越严,越平坦,方案越宽松两种错误:1.第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为α2.第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为β第三十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心342.计量一次抽检评定标准:统计特征量基本思想:从如果总体为正态分布,,则样本为正态分布标准差已知的一次抽样方案:最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需要较少的样本容量n。根据第一种错误概率α,第二种错误概率β,以及参数m0,m1,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格标准差未知的一次抽样方案:适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,n要增至(1+k2/2)倍(k是合格判定系数)第三十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心35八、一元线性回归1.线性回归的定义:

有些情况下,变量之间有确定的关系,可以用精确的表示方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法来描述。这种大量存在的变量间既互相联系但又不是完全确定的关系,称为相关关系.

回归分析就是研究相关关系的一种重要的数理统计方法.

在回归分析中,当变量只有两个时,称为一元回归分析;当变量在两个以上时,称为多元回归分析.变量间成线性关系,称线性回归,变量间不具有线性关系,称非线性回归.

第三十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心362.线性回归分析的最小二乘法:yxo4000300020001000246810···········

从图看到,数据点大致落在一条直线附近,这告诉我们变量x和y之间大致可看作线性关系.从图中还看到,这些点又不完全在一条直线上,这表明x和y的关系并没有确切到给定x就可以唯一确定y的程度.假定y和x之间存在如下关系:但是由图也可以看到,并不是所有的点都在直线上,也就是说,实际的yi值与理论表达式存在着差异εi。随着a和b的变化,由于这种差异也会变化,如何使得这种差异最小?第三十六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心37第三十七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心38第三十八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心393.相关系数与线性关系的显著性检验定义相关系数:相关系数可以检验回归方程的有效性第三十九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心40第四十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心414.一元非线性回归1)常见的非线性关系2)相关指标R越大,越接近1,表示拟合越好第四十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心42计量基础和误差理论第四十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心43一、数值修约第四十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心44第四十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心45第四十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心46第四十六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心47第四十七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心48进舍规则总结小于5,包括1,2,3,4,401,4999,舍弃大于5,包括6,7,8,9,501,5001,进一等于5,包括,5,50,50,50000000,凑偶数,若5前是奇数,则进一,若5前是偶数,则舍弃,第四十八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心49第四十九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心50二、计量单位1.法定计量单位(1)法定计量单位是用以度量大小的一个标准量,是政府以法令形式明确规定在全国使用的。(2)我国法定计量单位1)国际单位制(SI)的基本单位(7个,m,kg,s,A,K,mol,cd)2)国际单位制(SI)的辅助单位(2个,平面角rad,立体角sr)3)国际单位制(SI)中具有专门名称的导出单位(19个)4)国家选定的非国际单位制单位(分,小时,天,吨,升,海里等)5)由以上单位组成的组合形式的单位(立方米,米每秒,千瓦小时)6)由词头和以单位构成的十进倍数和分数单位(千米,兆帕)第五十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心512.法定计量单位的使用(1)词头1)共16个,又称词冠、前缀。大于1000是用大写,小于或者等于1000是用小写,比如千帕kPa,兆帕MPa。2)词头不是数词,比如2千米3,只能认为是2(千米)3,不是2000米3。3)词头不能重叠使用和单独使用,mμm(毫微米)应是nm(纳米)4)亿108和万104是我国习惯使用的数词,可使用,但不是词头(5)非十进制单位(如小时,分钟等)不得使用SI词头(2)书写1)单位字母用正体(变量用斜体)2)斜线最多不得多于1条,必要时括号,如城市每人每月用水量应为:升/(人.月),不应写成升/人/月或升/人月第五十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心52三、误差及分析1.误差的定义:测量值与真实值的差异2.相对误差实际相对误差标称相对误差额定相对误差最大额定相对误差可以作为测量传感器的精度等级为满量程值第五十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心533.误差的种类(1)系统误差特点:服从某一确定的规律分类:

定值系统误差:误差大小和方向保持不变

变值系统误差:误差大小和方向按确定的规律变化

线性系统误差:误差线性变化

周期性系统误差:误差周期性变化复杂规律变化的系统误差:误差复杂变化(2)粗大误差:明显超出确定条件下期望的误差,往往由于人工疏忽或环境的干扰造成,所以也称疏失误差或粗差(3)随机误差:在相同的条件下,误差以不可预定的方式变化,具有随机性。其产生原因是多种因素共同作用的结果。第五十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心54(1)精密度、正确度和精确度4.误差对测量结果的影响(2)各误差对结果的影响随即误差:主要影响精密度系统误差:主要影响正确度

只有随即误差和系统误差都很小时,精确度才高,结果可靠粗大误差:对测量结果的歪曲,应剔除第五十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心55(1)随机误差通过数理统计的方法对误差进行估计与控制(2)系统误差定值系统误差:替代法或交换法线性系统误差:对称法周期性系统误差:半周期法5.误差的处理第五十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心56三、正交试验为提高某化工产品的转化率,选择了三个有关的因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:A:80-90℃B:90-150MinC:5-7%试验目的是搞清楚因素A、B、C对转化率的影响,哪些是主要因素,哪些是次要因素,从而确定最优生产条件,即温度、时间及用碱量各为多少才能使转化率提高。试制定试验方案。1.正交试验方法的提出-多因素的试验问题第五十六页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心57这里,对因素A、B、C在试验范围内分别选取三个水平A:A1=80℃、A2=85℃、A3=90℃B:B1=90Min、B2=120Min、B3=150MinC:C1=5%、C2=6%、C3=7%正交试验设计中,因素可以定量的,也可以使定性的。而定量因素各水平间的距离可以相等也可以不等。第五十七页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心58若采用全面试验方法,则试验方案如下:

A1B1C1 A2B1C1 A3B1C1A1B1C2 A2B1C2 A3B1C2A1B1C3 A2B1C3 A3B1C3A1B2C1 A2B2C1 A3B2C1A1B2C2 A2B2C2A3B2C2A1B2C3 A2B2C3 A3B2C3A1B3C1 A2B3C1 A3B3C1A1B3C2 A2B3C2 A3B3C2A1B3C3 A2B3C3 A3B3C3共有3³=27次试验,如图所示,立方体包含了27个节点,分别表示27次试验。A1A2A3B3B2B1C1C2C3第五十八页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心59全面试验法的优缺点:优点:对各因素于试验指标之间的关系剖析得比较清楚缺点:(1)试验次数太多,费时、费事,当因素水平比较多时,试验无法完成。

(2)不做重复试验无法估计误差。

(3)无法区分因素的主次。

例如选六个因素,每个因素选五个水平时,全面试验的数目是56

=15625次。第五十九页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心60正交试验是利用一套编好的正交表,从为数众多的多因素的全面试验中,挑选出次数较少,但是很有代表性的组合条件去作试验,通过较少的试验,并进行简单的计算,就能找出较好的工艺条件或最优方案。第六十页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心61正交试验法优点:

(1)试验点代表性强,试验次数少。(2)不需做重复试验,就可以估计试验误差。(3)可以分清因素的主次。(4)可以使用数理统计的方法处理试验结果,提出展望好条件。正交试验(表)法的特点:(1)均衡分散性--代表性。(2)整齐可比性--可以用数理统计方法对试验结果进行处理。2.正交试验方法的优点与特点第六十一页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心62用正交表安排试验时,对于前面的试验:A1A2A3B3B2B1C1C2C3123654789用正交试验法安排试验只需要9次试验A1A2A3B3B2B1C1C2C3第六十二页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心633.正交试验的设计(1)指标、因素和水平试验需要考虑的结果称为试验指标(简称指标)可以直接用数量表示的叫定量指标;不能用数量表示的叫定性指标。定性指标可以按评定结果打分或者评出等级,可以用数量表示,称为定性指标的定量化试验中要考虑的对试验指标可能有影响的变量简称为因素,用大写字母A、B、C…表示每个因素可能出的状态称为因素的水平(简称水平)第六十三页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心64(2)正交表符号的意义L8(27)正交表的代号正交表的横行数字码数(因素的水平数)正交表的纵列数(最多允许安排因素的个数)第六十四页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心65(3)用正交表安排试验(1)明确试验目的,确定试验指标在上例中,试验目的是搞清楚A、B、C对转化率的影响,试验指标为转化率(2)确定因素-水平表A温度(℃)因素水平B时间(Min)C用碱量(x%)123808590901201505%6%7%因素水平ABC123A1A2A3B1B2B3C1C2C3(3)选用合适正交表本试验可选取正交表L9(34)安排试验第六十五页,共七十页,编辑于2023年,星期三*天津港湾工程质量检测中心66

(4)试验方案结果分析

A温度(℃)1B时间(Min)2C用碱量(x%)34转化率(x%)1 1(80℃) 1(90Min)1(5%) 1(X1)312 1(80℃) 2(120Min) 2(6%)2 (X2)543 1(80℃) 3(150Min) 3(7%) 3(X3)384 2(85℃) 1(90Min) 2(6%)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论