数理统计与计量讲义.ppt_第1页
数理统计与计量讲义.ppt_第2页
数理统计与计量讲义.ppt_第3页
数理统计与计量讲义.ppt_第4页
数理统计与计量讲义.ppt_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

07:07,天津港湾工程质量检测中心,1,水运工程试验检测人员培训,公共基础,07:07,天津港湾工程质量检测中心,2,概率与数理统计,07:07,天津港湾工程质量检测中心,3,一、概率统计基础,圆的面积 自由落体运动; 水的沸点摄氏100度。,随机事件 抛掷硬币,出现正面还是反面? 车站等车人数。 抽样检验。,必然事件,随机事件也是有规律的。 概率统计是揭示和研究自然界和人类社会中随机现象数量规律性的一门学科。,07:07,天津港湾工程质量检测中心,4,注1:可能发生的事件的全体是确定的。 注2:试验(观察)是可重复的。,(1) 不确定性 在该现象发生之前,人们无法知道将会出现那一种结果;,(2) 统计规律性 每一个可能结果出现的可能性的大小是确定的。 数学家皮尔逊曾投掷硬币 12000次,得正面6019次;24000次,得正面12012次。,07:07,天津港湾工程质量检测中心,5,二、频率与概率的统计定义,如何描述事件A出现的可能性的大小?,频率总是在某一定值附近摆动,事件A发生的频率的稳定中心P(A)称为事件A发生的概率。 注1:频率与试验有关,但概率是该事件的客观属性。 注2:稳定中心不是极限。 注3:概率总是非负的,最大值为1,代表必然事件,最小值为0,代表不可能事件,07:07,天津港湾工程质量检测中心,6,三、概率的基本计算,07:07,天津港湾工程质量检测中心,7,07:07,天津港湾工程质量检测中心,8,07:07,天津港湾工程质量检测中心,9,四、常用的几种概率,(1). 均匀分布,07:07,天津港湾工程质量检测中心,10,任意一次试验中,只有事件A发生和不发生两种结果,发生的概率分别是: P和1 P 若在相同的条件下,进行n次独立重复试验,用X表示这n次试验中事件A发生的次数,那么X服从二项分布,其概率密度函数为:,(2). 二项分布,07:07,天津港湾工程质量检测中心,11,对于固定n及p,当k增加时 ,概率P(X=k) 先是随之增加直至 达到最大值, 随后单调减少.,当(n+1)p不为整数时,二项概率P(X=k)在k=(n+1)p达到最大值;,07:07,天津港湾工程质量检测中心,12,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.,(3). 正态分布,07:07,天津港湾工程质量检测中心,13,正态分布的定义,若X的概率密度为,记作,f (x)所确定的曲线叫作正态曲线.,其中 和 都是常数, 任意, 0, 则称X服从参数为 和 的正态分布.,07:07,天津港湾工程质量检测中心,14,正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线.,特点是“两头小,中间大,左右对称”.,07:07,天津港湾工程质量检测中心,15,决定了图形的中心位置, 决定了图形中峰的陡峭程度.,正态分布 的图形特点,07:07,天津港湾工程质量检测中心,16,用上海99年年降雨量的数据画出了频率直方图.,从直方图,我们可以初步看出,年降雨量近似服从正态分布.,07:07,天津港湾工程质量检测中心,17,下面是我们用某大学男大学生的身高的数据画出的频率直方图.,红线是拟合的正态密度曲线,可见,某大学男大学生的身高应服从正态分布.,07:07,天津港湾工程质量检测中心,18,标准正态分布,的正态分布称为标准正态分布.,07:07,天津港湾工程质量检测中心,19,它的依据是下面的定理:,标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.,根据上面定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则,N(0,1),设,07:07,天津港湾工程质量检测中心,20,利用标准正态分布函数数值表,可以解决一般正态分布的概率计算.,正态分布表,表中给的是x0时, (x)的值.,当-x0时,07:07,天津港湾工程质量检测中心,21,若,N(0,1),若 XN(0,1),07:07,天津港湾工程质量检测中心,22,五、统计的基本概念,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,研究某批灯泡的质量,1.总体,07:07,天津港湾工程质量检测中心,23,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况. 这时,每个个体具有的数量指标的全体就是总体.,该批灯泡寿命的全体就是总体,灯泡的寿命,07:07,天津港湾工程质量检测中心,24,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.,2. 样本,07:07,天津港湾工程质量检测中心,25,3. 总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,07:07,天津港湾工程质量检测中心,26,4. 几个常见统计量,样本均值,样本方差,样本标准差,在教程中称有偏标准差,实际上,对样本容量为n的情况,当有平均值时,由其中的n1个偏差就可以推出剩下的那个偏差,因此,偏差自由度为n1,在公式中使用n1是比较合理的,特别是样本容量不大时。当样本容量很大时,使用 n1与n计算出的标准差相差不大。另外,使用n1也避免了样本容量为1时还能求出标准差的情况。,极差,07:07,天津港湾工程质量检测中心,27,5. 参数估计,无偏估计量:一个估计量的数学期望恰好等于被估计的总体参数。样本均值就是总体均值的一个无偏估计量。 实际中,由于样本容量有限,参数估计总存在偏差,所谓的无偏只是理论意义上的。比如样本均值和总体均值总存在偏差,如何来衡量这种偏差:区间估计 区间估计: 根据估计量的分布规律,使得总体指标U在U1,U2区间的概率 P(U1U U2)1,区间U1,U2称置信区间, 1称置信系数,称置信度(常取0.05)。根据置信度求置信区间的过程就是区间估计。 应用例子:由样本均值估计总体均值的范围,总体,样本,(总体参数),(估计量),07:07,天津港湾工程质量检测中心,28,六、常用的数理工具,1.排列图(巴雷特图、巴氏图) 功能:找出主要影响因素 三个分区: A区(0-80),主要影响因素 B区(80-90),一般影响因素 C区(90-100),次要影响因素,频率由高到低,07:07,天津港湾工程质量检测中心,29,2.直方图 功能:掌握质量数据的分布和估算不合格品率 步骤: 1)收集数据,不少于50-100个 2)分析数据,计算极差R Xmax Xmin 3)确定组数k和组距h,组数k根据样本容量定,hR/(k-1) 4)确定组界,对于第一组: 下限:Xminh/2;上限:Xminh/2;,07:07,天津港湾工程质量检测中心,30,判断质量分布形态,07:07,天津港湾工程质量检测中心,31,3.控制图(管理图) 功能:是一种动态控制方法,它可以用于辨别某过程由于异常原因引起的变化及由于偶然原因引起的变化。 原理:“3 准则”,(三倍标准差原则): 对于正态分布的变量,其取值几乎全部集中在区间(概率为99.74):,如果没有落在这一区间,则认为出现了异常。 应用方法:以下控制线UCL和上控制线LCL取代,以中线CL取代,中线CL,下控制线UCL和上控制线LCL,为 和 的函数,应注意:,批平均值的均值,不是整体均值,批级差的均值,不是整体级差,07:07,天津港湾工程质量检测中心,32,七、抽样检验与评定,1.计数一次抽检 评定标准:数量,基本思想:从N件(不合格品数为D)抽取n件,规定n件中允许不合格数上限为c,当不合格品数量d小于或者等于c时,认为N件产品都合格,否则不合格。 表示方法:(N,n,c) 接收概率:,精确方法: 近似方法:,超几何分布,二项分布 泊松分布,07:07,天津港湾工程质量检测中心,33,抽样特征曲线:接收概率和产品不合格率之间的关系曲线。 1.总是单调递减的,左高右低 2.越陡峭,抽样方案越严,越平坦,方案越宽松,两种错误: 1.第一种错误,将合格产品判为不合格,对生产方不利,生产风险,其概率记为 2.第二种错误,将不合格产品判为合格,对使用方不利,使用风险,其概率记为,07:07,天津港湾工程质量检测中心,34,2.计量一次抽检 评定标准:统计特征量,基本思想: 从如果总体为正态分布,,,则样本为正态分布,标准差已知的一次抽样方案: 最好的抽检方案,相同的样本容量n,得到最好的检验效果;相同的检验效果,只需要较少的样本容量n。,根据第一种错误概率 ,第二种错误概率 ,以及参数m0,m1,求出样本均值的范围,如果样本均值落在此范围内,则判定为合格,否则不合格,标准差未知的一次抽样方案: 适用性较好;检验效果随n的增大而改善;要达到与标准差已知的一次抽样方案相同的效果,n要增至(1k2/2)倍(k是合格判定系数),07:07,天津港湾工程质量检测中心,35,八、一元线性回归,1.线性回归的定义: 有些情况下,变量之间有确定的关系,可以用精确的表示方法来表述,但对大多数情况,变量之间存在虽有某种关系,但这种关系很难找到一种精确的表示方法来描述。这种大量存在的变量间既互相联系但又不是完全确定的关系,称为相关关系. 回归分析就是研究相关关系的一种重要的数理统计方法. 在回归分析中, 当变量只有两个时, 称为一元回归分析; 当变量在两个以上时, 称为多元回归分析. 变量间成线性关系, 称线性回归,变量间不具有线性关系, 称非线性回归.,07:07,天津港湾工程质量检测中心,36,2.线性回归分析的最小二乘法:,从图看到, 数据点大致落在一条直线附近, 这告诉我们变量x和y之间大致可看作线性关系.从图中还看到, 这些点又不完全在一条直线上, 这表明x和y的关系并没有确切到给定x就可以唯一确定y的程度.,假定y和x之间存在如下关系:,但是由图也可以看到,并不是所有的点都在直线上,也就是说,实际的yi值与理论表达式存在着差异i。随着a和b的变化,由于这种差异也会变化,如何使得这种差异最小?,07:07,天津港湾工程质量检测中心,37,07:07,天津港湾工程质量检测中心,38,07:07,天津港湾工程质量检测中心,39,3. 相关系数与线性关系的显著性检验 定义相关系数:,相关系数可以检验回归方程的有效性,07:07,天津港湾工程质量检测中心,40,07:07,天津港湾工程质量检测中心,41,4. 一元非线性回归,1)常见的非线性关系,2)相关指标,R越大,越接近1,表示拟合越好,07:07,天津港湾工程质量检测中心,42,计量基础和误差理论,07:07,天津港湾工程质量检测中心,43,一、数值修约,07:07,天津港湾工程质量检测中心,44,07:07,天津港湾工程质量检测中心,45,07:07,天津港湾工程质量检测中心,46,07:07,天津港湾工程质量检测中心,47,07:07,天津港湾工程质量检测中心,48,进舍规则总结 小于5,包括1,2,3,4,401,4999,舍弃 大于5,包括6,7,8,9,501,5001,进一 等于5,包括,5,50,50,50000000, 凑偶数 ,若5前是奇数,则进一,若5前是偶数,则舍弃,,07:07,天津港湾工程质量检测中心,49,07:07,天津港湾工程质量检测中心,50,二、计量单位,1.法定计量单位 (1)法定计量单位是用以度量大小的一个标准量,是政府以法令形式明确规定在全国使用的。 (2)我国法定计量单位 1)国际单位制(SI)的基本单位(7个,m,kg,s,A,K,mol,cd) 2)国际单位制(SI)的辅助单位(2个,平面角rad,立体角sr) 3)国际单位制(SI)中具有专门名称的导出单位(19个) 4)国家选定的非国际单位制单位(分,小时,天,吨,升,海里等) 5)由以上单位组成的组合形式的单位(立方米,米每秒,千瓦小时) 6)由词头和以单位构成的十进倍数和分数单位(千米,兆帕),07:07,天津港湾工程质量检测中心,51,2.法定计量单位的使用 (1)词头 1)共16个,又称词冠、前缀。大于1000是用大写,小于或者等于1000是用小写,比如千帕kPa,兆帕MPa。 2)词头不是数词,比如2千米3,只能认为是2(千米)3,不是2000米3。 3)词头不能重叠使用和单独使用,mm(毫微米)应是nm(纳米) 4)亿10 8和万10 4是我国习惯使用的数词,可使用,但不是词头 (5)非十进制单位(如小时,分钟等)不得使用SI词头 (2)书写 1)单位字母用正体(变量用斜体) 2)斜线最多不得多于1条,必要时括号,如城市每人每月用水量应为:升/(人.月),不应写成升/人/月或升/人月,07:07,天津港湾工程质量检测中心,52,三、误差及分析,1.误差的定义:测量值与真实值的差异,2.相对误差,实际相对误差,标称相对误差,额定相对误差,最大额定相对误差,可以作为测量传感器的精度等级,为满量程值,07:07,天津港湾工程质量检测中心,53,3. 误差的种类,(1)系统误差,特点:服从某一确定的规律 分类: 定值系统误差:误差大小和方向保持不变 变值系统误差:误差大小和方向按确定的规律变化 线性系统误差:误差线性变化 周期性系统误差:误差周期性变化 复杂规律变化的系统误差:误差复杂变化,(2)粗大误差: 明显超出确定条件下期望的误差,往往由于人工疏忽或环境的干扰造成,所以也称疏失误差或粗差,(3)随机误差: 在相同的条件下,误差以不可预定的方式变化,具有随机性。其产生原因是多种因素共同作用的结果。,07:07,天津港湾工程质量检测中心,54,(1)精密度、正确度和精确度,4. 误差对测量结果的影响,(2)各误差对结果的影响 随即误差:主要影响精密度 系统误差:主要影响正确度,只有随即误差和系统误差都很小时,精确度才高,结果可靠,粗大误差:对测量结果的歪曲,应剔除,07:07,天津港湾工程质量检测中心,55,(1)随机误差 通过数理统计的方法对误差进行估计与控制 (2)系统误差 定值系统误差:替代法或交换法 线性系统误差:对称法 周期性系统误差:半周期法,5. 误差的处理,07:07,天津港湾工程质量检测中心,56,三、正交试验,为提高某化工产品的转化率,选择了三个有关的因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90 B:90-150Min C:5-7% 试验目的是搞清楚因素A、B、C对转化率的影响,哪些是主要因素,哪些是次要因素,从而确定最优生产条件,即温度、时间及用碱量各为多少才能使转化率提高。试制定试验方案。,1.正交试验方法的提出多因素的试验问题,07:07,天津港湾工程质量检测中心,57,这里,对因素A、B、C在试验范围内分别选取三个水平 A:A180、A285、A390 B:B190Min、B2120Min、B3150Min C:C15%、C26%、C37% 正交试验设计中,因素可以定量的,也可以使定性的。而定量因素各水平间的距离可以相等也可以不等。,07:07,天津港湾工程质量检测中心,58,若采用全面试验方法,则试验方案如下: A1B1C1 A2B1C1 A3B1C1 A1B1C2 A2B1C2 A3B1C2 A1B1C3 A2B1C3 A3B1C3 A1B2C1 A2B2C1 A3B2C1 A1B2C2 A2B2C2 A3B2C2 A1B2C3 A2B2C3 A3B2C3 A1B3C1 A2B3C1 A3B3C1 A1B3C2 A2B3C2 A3B3C2 A1B3C3 A2B3C3 A3B3C3 共有3=27次试验,如图所示,立方体包含了27个节点,分别表示27次试验。,07:07,天津港湾工程质量检测中心,59,全面试验法的优缺点: 优点:对各因素于试验指标之间的关系剖析得比较清楚 缺点:(1)试验次数太多,费时、费事,当因素水平比较多时,试验无法完成。 (2) 不做重复试验无法估计误差。 (3)无法区分因素的主次。 例如选六个因素,每个因素选五个水平时,全面试验的数目是56 15625次。,07:07,天津港湾工程质量检测中心,60,正交试验是利用一套编好的正交表,从为数众多的多因素的全面试验中,挑选出次数较少,但是很有代表性的组合条件去作试验,通过较少的试验,并进行简单的计算,就能找出较好的工艺条件或最优方案。,07:07,天津港湾工程质量检测中心,61,正交试验法优点: (1)试验点代表性强,试验次数少。 (2)不需做重复试验,就可以估计试验误差。 (3)可以分清因素的主次。 (4)可以使用数理统计的方法处理试验结果,提出展望好条件。 正交试验(表)法的特点: (1)均衡分散性代表性。 (2)整齐可比性可以用数理统计方法对试验结果进行处理。,2.正交试验方法的优点与特点,07:07,天津港湾工程质量检测中心,62,用正交表安排试验时,对于前面的试验:,用正交试验法安排试验只需要9次试验,07:07,天津港湾工程质量检测中心,63,3.正交试验的设计,(1)指标、因素和水平 试验需要考虑的结果称为试验指标(简称指标) 可以直接用数量表示的叫定量指标; 不能用数量表示的叫定性指标。定性指标可以按评定结果打分或者评出等级,可以用数量表示,称为定性指标的定量化 试验中要考虑的对试验指标可能有影响的变量简称为因素,用大写字母A、B、C表示 每个因素可能出的状态称为因素的水平(简称水平),07:07,天津港湾工程质量检测中心,64,(2)正交表符号的意义,L8(27),正交表的代号,正交表的横行数,字码数(因素的水平数),正交表的纵列数 (最多允许安排因素的个数),07:07,天津港湾工程质量检测中心,65,(3)用正交表安排试验 (1)明确试验目的,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论