《有限数据统计处理》PPT课件.ppt_第1页
《有限数据统计处理》PPT课件.ppt_第2页
《有限数据统计处理》PPT课件.ppt_第3页
《有限数据统计处理》PPT课件.ppt_第4页
《有限数据统计处理》PPT课件.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 有限数据的统计处理, 3.1 总体的参数估计 期望值和方差、参数估计 3.2 一般的统计检验 平均值检验、F检验、离群值检验,2,2019年6月11日星期二,总体、个体和样本:,总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量,3,2019年6月11日星期二,示例:有限数据的统计处理,总体,样本,甲,样本容量,平均值,500g,乙,平行测定 3 次,平行测定 4 次,丙,平行测定 4 次,有限数据的处理:,计算,估计,显著性检验,没有系统误差, = T,有系统误差, T,4,2019年6月11日星期二,3.1.1 期望值和方差,数据集中趋势的表示:对一B物质客观存在量为T 的分析对象进行分析,得到n 个个别测定值 x1、x2、x3、 xn,,平均值 Average,中位数Median,有限次测量:测量值向平均值 集中,无限次测量:测量值向总体平均值 集中,数据集中趋势和分散程度的表示,5,2019年6月11日星期二,数据分散程度的表示:,极差R Range,相对极差R,偏差 Deviation,平均偏差 Mean deviation,相对平均偏差 relative mean deviation,标准偏差 standard deviation,相对标准偏差(变异系数) Relative standard deviation (Coefficient of variation , CV ),6,2019年6月11日星期二,总体标准偏差与标准偏差的比较:,总体标准偏差,标准偏差,无限次测量, 对总体平均值的离散,有限次测量 对平均值的离散,自由度,计算一组数据分散度的独立偏差数,自由度的理解:例如,有三个测量值,求得平均值,也知道x1和x2与平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独立的变数。,7,2019年6月11日星期二,平均值的标准偏差:,S(x)的物理意义:在有限次测量中,每个测量值平均所具有的标准偏差。,8,2019年6月11日星期二,对有限次测量:,1、增加测量次数可以提高精密度。,2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。,结论:,9,2019年6月11日星期二,3.1.2 参数估计,矩估计法,最小二乘法,最大似然法,顺序统计量法,估 计 方 法,点 估 计,区间估计,10,2019年6月11日星期二,一、点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 2. 点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,概念要点:,11,2019年6月11日星期二,被估计的总体参数,12,2019年6月11日星期二,估计量的优良性准则,无偏性:估计量的数学期望等于被估计的总体参数,13,2019年6月11日星期二,有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量,样本相比均值是一个更有效的估计量。,14,2019年6月11日星期二,一致性:随着样本容量的增大,估计量越来越 接近被估计的总体参数,15,2019年6月11日星期二,二、区间估计,1. 根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在5070之间,置信度为 95%,概念要点:,16,2019年6月11日星期二,置信区间估计内容:,17,2019年6月11日星期二,问题:,在 的某个范围 内包含 的概率 有多大?,对有限次测量,18,2019年6月11日星期二,总体平均值的置信区间,例:, 包含在 区间,几率相对大,几率 相对小,几率为100% 无意义,平均值的置信区间的问题,19,2019年6月11日星期二,总体未知参数落在区间内的概率 表示为 (1 - 为显著性水平,是总体参数未在区间内的概率 常用的置性水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平:,20,2019年6月11日星期二,区间与置信水平:,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,21,2019年6月11日星期二,影响区间宽度的因素:,1. 数据的离散程度,用 来测度 样本容量, 置信水平 (1 - ),影响 Z 的大小,22,2019年6月11日星期二,落在总体均值某一区间内的样本,23,2019年6月11日星期二,总体均值的置信区间 ( 已知),1.假定条件 总体服从正态分布,且总体方差()已知 如果不是正态分布,可以由正态分布来近似 (n 30) 2.使用正态分布统计量,总体均值 在1-置信水平下的置信区间为,24,2019年6月11日星期二,正态总体实例: 总体均值的区间估计,解:已知N(,0.152),x21.4, n=9, 1- = 0.95,/2=1.96 总体均值的置信区间为,我们可以95的概率保证该种零件的平均长度在21.321.5 mm之间,【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,25,2019年6月11日星期二,非正态总体实例:总体均值的区间估计,解:已知 x26.0, =6,n=100, 1- = 0.95,/2=1.96,我们可以95的概率保证平均每天参加锻炼的时间在24.827.2 分钟之间,【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26.0分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。,26,2019年6月11日星期二,1. 假定条件 总体方差()未知 总体必须服从正态分布 使用 t 分布统计量,3. 总体均值 在1-置信水平下的置信区间为,总体均值的区间估计 (未知),27,2019年6月11日星期二,t 分布曲线:,无限次测量,得到,有限次测量,得到,s,t 分布曲线,u 分布曲线,28,2019年6月11日星期二,t 分布值表,P = 1 - , 置信度,, 显著水平,29,2019年6月11日星期二,t分布值表,还原为 u 分布,单位为 ,单位为,30,2019年6月11日星期二,实例(未知): 总体均值的区间估计,解:已知N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.064。,我们可以95的概率保证总体均值在46.753.3 之间,【例】从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50.0 ,标准差 s = 8。 建立总体均值m 的95%的置信区间。,31,2019年6月11日星期二,3.2 一般的统计检验,问题:是由随机误差引起,或存在系统误差?,显著性差异,非显著性差异,校正,正常,显著性检验,3.2.1 平均值检验,32,2019年6月11日星期二,1.平均值与标准值的比较,t 检验法:,假设不存在系统误差,那么,是由随机误差引起的,测量误差应满足t 分布,,根据 计算出的t 值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。,t 检验法的步骤:,1、根据 算出t 值;,2、给出显著性水平或置信度,3、将计算出的t 值与表上查得的t 值进行比较,若,习惯上说 表明有系统误差存在。,表示 落在 为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。,33,2019年6月11日星期二,【例】某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:,问此测定有无系统误差?(给定 = 0.05),解,查表,比较:,说明 和T 有显著差异,此测定有系统误差。,假设: = T,34,2019年6月11日星期二,u检验法:,u 检验法与t 检验的不同在于用u分布,而不是用t分布。,【例】 某炼铁厂生产的铁水,从长期经验知道它的碳含量服从正态分布,T为4.55%,为0.08%。现在又生产了5炉铁水,其碳含量分别为4.28%,4.40%, 4.42%, 4.35%, 4.37%。试问均值有无变化?(给定 = 0.05),解,假设: = T,查表,比较:,结论:均值比原来的降低了。(表明生产过程有差异),问题:如果分析方法存在系统误差,这个结论可靠吗?,35,2019年6月11日星期二,2、两组平均值的比较,两个实验室对同一标样进行分析,得到:,和,假设不存在系统误差,那么:,是由于随机误差引起的,应满足自由度 f =(n1 + n2 2) 的 t 分布,,36,2019年6月11日星期二,两组平均值的比较的方法:,1、F 检验法检验两组实验数据的精密度S1和S2之间有无显著差异:,查表,精密度无显著差异。,2、t 检验确定两组平均值之间有无显著性差异,3、查表,4、比较,非显著差异,无系统误差,具体计算见教材的例题。,37,2019年6月11日星期二,置信度95%时部分F值(单边) 置信度90%时部分F值(双边),38,2019年6月11日星期二,3.2.2 离群值检验,39,2019年6月11日星期二,离群值检验的两类方法:, 技术判别法 即在实验过程中,人们根据常识或经验,判别由于震动、误读等原因造成的坏值;或根据物理的或化学的性质,进行技术分析,以判别偏差较大的数据是否确系异常值。此种方法的特点,可随时发现,随时剔除。 统计判别法 统计判别法的基本思想在于,给定一置信概率,并由此确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,系属异常数据,应予剔除。,40,2019年6月11日星期二,统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差有下列关系 = 0.7979 0.80 。,4 3,偏差超过4 的测量值可以舍弃。其步骤为:,41,2019年6月11日星期二,(2) Q检验法,(1)将测量的数据按从小至大顺序排列:,(2)计算测定值的极差R 。,(3)计算可疑值与相邻值之差(应取绝对值)d。,(4)计算Q值:,(5)比较:,舍弃。,Q值表,42,2019年6月11日星期二,(3)狄克逊(Dixon),(1)将测量的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论