质量工程师:数理统计基本知识_第1页
质量工程师:数理统计基本知识_第2页
质量工程师:数理统计基本知识_第3页
质量工程师:数理统计基本知识_第4页
质量工程师:数理统计基本知识_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质量工程师(初级)相关知识辅导:数理统计基本常识(1)学习数理统计最重要的是树立统计思想,同时要善于联系实际,从而达到掌握数理统计基本理论和方法的目的。学习目标1掌握总体、个体、样本及统计量的概念2熟悉数据的整理方法3掌握样本均值、中位数的概念与计算4掌握样本极差、方差、标准差的概念与计算一 总体与个体1 总体与个体定义:在一个统计问题中,称研究对象的全体为总体。构成总体的每个成员或每个研究对象称为个体。例如,一批灯泡是总体,其中的每个灯泡是个体;一个城市的人口是总体,这个城市的每个人是个体。我们通常关心某个总体的某个(某些)数量指标(或数量化的属性特征),一般用X表示所要考察的数量指标(如灯泡的寿命,零件的尺寸,儿童的身高等)。随机试验是从总体中随机地取出一个个体,测定这个数量指标的值X,那么X作为随机试验中被测量的量是一个随机变量,称它为表征总体的随机变量。例如,对于灯泡这个总体,灯泡的使用寿命就是表征它的随机变量;对于零件这个总体,零件的尺寸就是表征它的随机变量。当然,有时候一个总体会有多个数量指标,比如对于某个学校的学生这个总体,我们不仅仅只关心学生的学习成绩,还关心他的思想状况、身体状况等等。(1)统计学主要的任务若关心的是研究对象的某个数量指标,那么将每个个体具有的数量指标x称为个体,这样一来,总体就是某数量指标值x的全体,是一堆数。若从总体中随机抽取一个个体,它的数量指标x随所抽取个体而变,从而总体也相应于一个随机变量X,它有一个分布,从而总体可用一个分布描述。简单地说,总体就是一个分布,不同总体有不同分布。统计学主要的任务就是:l 研究总体是什么分布?l 这个总体(分布)的均值、方差(或标准差)各是多少?例1 对某产品仅考察其合格与否,并记合格品为0,不合格品为1。分析:总体=该产品的全体=由0或1组成的一堆数若记l在总体中所占比例为P,则该总体可用如下二项分布b(1,P)(n=l的二项分布)表示:例2有两个工厂生产同一产品,甲厂的不合格品率P=0.01,乙厂的不合格品率P=0.08,甲乙两厂所生产的产品(即两个总体)分别用如下两个分布描述:例3考察某橡胶件( 质量工程师考试网 )的抗张强度。它可用0到上的一个实数表示,这时总体可用区间0,上的一个概率分布表示。国内外橡胶业对其抗张强度有较多研究,认为橡胶件的抗张强度服从正态分布 ,该总体常称为正态总体。这时统计要研究的主要问题是:正态均值 是多少?正态方差 是多少?例4 用非对称分布(偏态分布)描述的总体也和常见。例如某型号电视机的寿命全体所构成的总体就是一个偏态分布。又如两个不同的正态总体混合也可以产生一个偏态总体。如将两位不同的操作工(或在不同机器上,或用不同原料,或不同转速等)生产的同一种零件混在一起,其质量特性常呈偏态分布,应该重视考察偏态分布产生的原因。质量工程师(初级)相关知识辅导:数理统计基本常识(2)二 样本与样本容量为了对总体的分布进行各种分析推断,就必须对总体进行抽样(取样)。直观地讲,就是抽取一些个体进行观察或试验;抽象地讲,就是对总体X进行观测。1样本的概念样本:从总体中抽取部分个体所组成的集合称为样本。2样本容量样本中所包含个体的个数,或样本所含的元素个数,称为样本容量。常用n表示。样本中的个体有时也称为样品,如对总体X进行了n次观测,记Xi为第i次观测所得的结果,称(X1,X2,Xn)为容量是n的样本。3抽样的意义人们从总体中( 质量工程师考试网 )抽取样本是为了认识总体。即从样本推断总体,如推断总体是什么分布?总体均值为多少?总体的标准差是多少?为了使此种统计推断有所依据,推断结果有效,由样本获得对总体的正确认识,需要对抽样方法有一定的要求。如为了了解女性所占的比例,不能专门到坦克部队去取样,也不能专门到纺织厂去取样,而应当进行随机抽样。直观地讲就是抽样时,每个个体被抽到的可能性相同。下面介绍一种常见的抽样方法。4简单随机样本简单随机样本:满足下面两个条件的样本称为简单随机样本,简称随机样本,或样本。简单随机样本的基本特点:(1)随机性。总体中每个个体都有相同的机会加入样本。例如,按随机性要求抽出5个样品,记为 ,则其中每一个都应与总体分布相同。只要随机抽样就可保证此点实施。(2)独立性。从总体中抽取的每个个体对其他个体的抽取无任何影响。假如总体是无限的,独立性容易实现,若总体很大,特别与样本量n相比是很大时,即使总体是有限的,此种抽样独立性也可基本得到保证。即把在不变的条件下对总体X的n次独立观测(如n次放回抽样)叫做n次简单随机取样,这样得到的样本称为简单随机样本。定义:设(X1,X2,Xn)为取自总体X的样本,如果X1,X2,Xn相互独立且与总体X同分布(简称X1,X2,Xn独立同分布),则称此样本为简单随机样本。注释:今后讨论的样本都是指满足这些要求的简单随机样本。在实际抽样时,也应按此要求从总体中进行抽样。这样获得的样本能够很好地反映实际总体的状态。两个不同的总体,若是按随机性和独立性要求进行抽样,则机会大的地方(概率密度值大被抽到样本的个体就多;而机会少的地方(概率密度值小),被抽到样本的个体就少。分布愈分散,样本也就分散;分布愈集中,样本也相对集中。抽样切忌受到干扰,特别是人为干扰。某些人为的倾向性会使所得样本不是简单随机样本,从而使最后的统计推断失效。5样本的观测值若 是从总体X中获得的样本,那么 是独立同分布的随机变量。所以样本(X1,X2,Xn)是一个随机向量,它的每个可能值称为样本观测值,用(x1,x2,xn)表示样本观测值。简称为样本值。样本的观测值用 表示,这也是我们常说的数据。有时为方便起见,不分大写与小写,样本及其观测值都用 表示,今后将采用这一方法表示。质量工程师(初级)相关知识辅导:数理统计基本常识(3)统计量与抽样分布样本来自总体,因此样本中包含了有关总体的丰富信息,但是这些信息是零散的,为了把这些零散的信息集中起来反映总体的特征,我们取得样本之后,并不是直接利用样本进行推断,而需要对样本进行一番“加工”和“提炼”,把样本中所包含的有关信息尽可能地集中起来,种有效的办法就是针对不同的问题,构造出样本的某种函数,这就是统计量。不同的函数可以反映总体的不同的特征。1统计量把不含未知参数的样本函数称为统计量。一个统计量也是一个随机变量。定义:设(X1,X2,Xn)为取自总体X的一个样本,g(X1,X2,Xn)为一个连续函数,如果这个函数中不包含任何未知参数,则称g(X1,X2,Xn)为一个统计量。例如,设XN(m ,s 2),其中m 已知,s 2未知,(X1,X2,Xn)为取自X的样本,则 是统计量, 不是统计量。统计量是样本的函数,因而统计量是随机变量。由统计量进行推断,便可获得对总体的认识,统计推断是数理统计的核心内容。2抽样分布统计量的分布称为抽样分布。例5:从均值为 ,方差为 的总体中抽得一个样本量为n的样本 ,其中 与 均未知。在此情形, 是统计量;而 , 都不是统计量,因为后者包含 , 等未知参数。3常用统计量常用统计量可分为两类,一类用来描述样本的中心位置,另一类用来描述样本的分散程度。为此先介绍有序样本的概念,再引入几个常用统计量。有序样本设 是从总体X中随机抽取的样本,样本量为n,将它们的观测值从小到大排列为: ,这便是有序样本。其中 是样本中的最小观测值, 是样本中的最大观测值。例6 从某种合金强度总体中随机抽取样本量为5的样本,记为 ,样本观测值为:140,150,155,130,145解析:将它们从小到大排序后为:130,140,145,150,155,这便是有序样本,其中最小的观测值为 =30,最大的观测值为 =155。(1)描述样本的中心位置的统计量总体中每一个个体的取值尽管是有差异的,但是总有一个中心位置,如样本均值、样本中位数等。描述样本中心位置的统计量反映了总体的中心位置,常用的有以下几种:样本均值样本观测值有大有小,样本均值大致处于样本的中间位置,它可以反映总体分布的均值。例7 上例数据: ,样本观测值为:140,150,155,130,145。样本均值为 =(140+150+155+130+145)/5=144。对分组数据,样本均值的近似值为其中 是分组数, 是第 组的组中值, 是第 组的频数, 。例8 下表是经过整理的分组数据表,给出了110个电子元件的失效时间:分组区间0,400400,800)800,1200)1200,1600)1600, 2000)2000,2400)组中值xi2006001000140018002200频数ni628372397解析:平均失效时间近似为:= 1170.9样本中位数中位数有时也记为Me。当n为奇数, 当n为偶数例9 现有两组数据(已经排序):2,3,4,4,5,5,5,5,6,6,7,7,82,4,4,4,5,6,6,7,7,8,8,8,9,9解析:第一组共有13个数据,处于中间位置的是第7个数据,样本中位数即为 。第二组共有14个数据,处于中间位置的是第7,8个数据,样本中位数即为 。(3)描述样本数据分散程度的统计量总体中各个个体的取值总是有差别的,因此样本的观测值也是有差异的,这种差异有大有小,反映样本数据的分散程度的统计量实际上反映了总体取值的分散程度,常用的有如下几种:样本极差:例10 数据为 ,样本观测值为:140,150,155,130,145,那么将它们从小到大排序后为:130,140,145,150,155解析:最小值为130,最大值为155,因此样本极差R=155-130=25样本方差:同样,对分组数据来讲,样本方差的近似值为:其中 表示第i组的组中值。例11 数据为 ,样本观测值为:140,150,155,130,145解析:上式有两个简化的计算公式:样本极差的计算十分简便,但对样本中的信息利用得也较少,而样本方差就能充分利用样本中的信息,因此在实际中样本方差比样本极差用得更广。样本标准差:在上例中 。在例8中,样本标准差的意义:样本方差尽管对数据的利用是充分的,但是方差的量纲(即数据的单位)是原始量纲的平方,例如样本观测值是长度,单位是“毫米”,而方差的单位是“平方毫米”,单位不同就不便于比较,而采用样本标准差就消除了单位的差异。质量工程师(初级)相关知识辅导:数理统计基本常识(4)样本数据的整理从总体x中获得的样本是总体的一个缩影,具有丰富信息的数据,我们需要对数据进行加工,将有用的信息提取出来,以便对总体有所了解。对数据加工有两种方法:一是计算统计量,二是利用图形与表格。上面提到的便是常用的统计量,它具有概括性,但不够形象,下面给出对数据进行整理的表格与图形描述。我们结合一个例子来叙述对计置数据给出频数频率分布表的步骤。例12 食品厂用自动装罐机生产罐头食品,由于工艺的限制,每个罐头的实际重量有所波动,现从一批罐头中随机抽取100个称其净重,数据如下:342 352 346 344 343 339 336 342 347 340 340 350 347 336 341349 346 348 342 346 347 346 346 345 344 350 348 352 340 356339 348 338 342 347 347 344 343 349 341 348 341 340 347 342337 344 340 344 346 342 344 345 338 351 348 345 339 343 345346 344 344 344 343 345 345 350 353 345 352 350 345 343 347354 350 343 350 344 351 348 352 344 345 349

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论