环境监测数据统计基础【研究材料】_第1页
环境监测数据统计基础【研究材料】_第2页
环境监测数据统计基础【研究材料】_第3页
环境监测数据统计基础【研究材料】_第4页
环境监测数据统计基础【研究材料】_第5页
免费预览已结束,剩余19页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、环境监测数据统计基础,第二讲,1,峰谷书屋,2.1 概述,环境监测会收集到大量的环境监测数据。 对同一环境样品多次重复测定得到的结果会彼此不同。 我们的任务是去伪存真,认识和掌握误差产生的原因及规律。 其是以概率为基础的分析法,是识别误差的科学方法,是分析环境监测数据的必须工具 统计分析包括统计叙述和统计推断两部分。 总体和样本的定义:有限总体,无穷总体,随机样本和样本容量。,2,峰谷书屋,基本概念,总体(或称母体)指从研究对象得到的所有可能的观测结果。样本(或称子样)指从总体中抽取出来的一部分样品的测定值。样本中样品的个数称为样本大小(或容量),当n30时,称为大样本。 必须指出,使用数理统

2、计方法仅仅是分工作者解决问题的有力工具,它不能代替严格的试验工作;而恰恰相反,它只能在可靠的分行测试基础上,才能发挥其应有的作用。,3,峰谷书屋,2.1.1 数据整理和样本特征计算,2.1.1.1有效数字一般运算规则 不管测量仪器,还是数字显示仪表,其准确度都是有限的,有“观测误差”,对结果进行数值计算会存在“舍入”、“纳入”等误差。 得到的近似值与真实值R有一定的误差 测定误差为最小刻度单位的1/2,例如滴定管和米尺的读数。如滴定读数19.23毫升19.225,19.235,某人身高172.0厘米171.5,172.5,4,峰谷书屋,有效数字一般运算规则,有效数字个数:第一位非零数字后的数字

3、数目. 一般来说,非零数字中间的“0”均为有效数字,如2008;在第一个非零数字前的“0”不作为有效数字如0.0167和16.7都有三位有效数字. 16.7毫升和16.70毫升代表了两种精密度,小数点后的“0”不能随便加上和舍去. “四舍六入五单双”的原则:有效数字后面的数字按照此原则修约,14.924114.92,14.926014.93,14.925014.92,14.915014.92,14.925114.93 加减计算中结果的误差限应与数中误差限最大的那一个相同;如在运算会导致效数字变化较大,则要考虑尽量避免此类运算。,5,峰谷书屋,在乘除计算中,结果有效数字与各数中位数最少者相同。

4、近似值的平方(根)、立方(根)或多次方(根)运算时,计算结果的有效数字位数与原数相同。 对有效数字的第一位等于或大于8的数值进行计算时,可以多算一位,如0.0894十分接近0.1000,因此可以把该数认为有四位有效数字。 由于测定平均值的精度要优于个别测定值的精度,因此,在计算准确度相同四个或四个以上的测定值的平均值时,结果有效数字位数可以增加一位。 对于计算式中的常数e等以及乘除因子如 ,1/6之类的数值的有效数值位数可以认为是无限的。 在对数计算时所取的位数(不包括首数)应与真数的有效数字位数一致 对于标准偏差等表示测定精度的修约,一般情况下最多只取两位有效数字,测定次数大于50可多取一位

5、。注意对标准差等修约只进不舍,如计算出的标准偏差为0.213时,则应修约为0.22而不是0.21,修约不会提高精密度的,6,峰谷书屋,误差,误差指分析测定值与真实值之差。根据生产的原因可分为系统误差(可测误差)偶然误差(随机误差)及粗差(过失误差)。 系统误差和偶然误差并没有绝对严格的界限,有时人们对系统误差的复杂规律认识不清,往往把系统误差当作偶然误差来处理。 偏差指分析测定值与平均值之差反映数据之间的离散程度。偏差大小既与方法本身的精确与否,也与实验人员的操作水平有关。通常人们以平均值代替真实值计算误差,严格说来应称作偏差。,7,峰谷书屋,基本概念 误差和偏差,误差 绝对误差 测量值与真值

6、之差 相对误差 误差与真值之比,百分数,8,峰谷书屋,精密度的几种表示方法,精密度和淮确度:精密度指测得的数据之间重复的程度,反映偶然误差的大小。准确度指测定值与真实值(或多次测定平均值)符合的程度,反映偶然误差和系统误差的大小。评定分析数据的好坏,首先要考虑精密度,其次要考虑准确度。一般来说在系统误差已消除的情况下,精密度愈高分析结果愈准确。但若有系统误差存在,则精密度高、准确度不一定高。如图所示。,9,峰谷书屋,精密度与准确度图示,精密度差 准确度差,精密度好 准确度差,精密度好 准确度好,首先要考虑精密度,其次要考虑准确度。 在系统误差已消除的情况下,精密度愈高分析结果愈准确;若有系统误

7、差存在,则精密度高、准确度不一定高。,绿色圆点为真实值, 红色为测定值,10,峰谷书屋,偏差 单次值与多次测量平均值之比(均值代真值) 绝对偏差是测量值与真值之差; 相对偏差是绝对偏差与真值之比 平均偏差是绝对偏差绝对值之和的平均值 相对平均偏差是平均偏差与均值之比(常以百分数表示),11,峰谷书屋,样本特征数的计算,有环境总体随机抽取的样本数据,可以代入一些函数式通过计算得到一些计算值来描述该样本的某些重要性,这些计算值成为样本特征数,又称为统计量。 算术平均值 中位数Me n为基数时候 为 当n为偶数时 众数M0 出现次数最多的变量值 几何均数G n个变量值的几何数等于这些数的乘积的n次方

8、根,也可以用变量值的对数表示,例题见书中P35,12,峰谷书屋,标准偏差和相对标准偏差,1、差方和:亦称离差平方或平方和。是指绝对偏差的平方之和,以S表示。 2、总体方差和总体标准偏差分别以2和表示 3、样本标准偏差用s或sD表示 4、样本方差用s2或V表示 分单个样本和多个样本 5、样本相对标准偏差:又称变异系数,是样本标准偏差在样本均值中所占的百分数, 记为CV : 6、极差:一组测量值中最大值(xmax)与最小值(xmin)之差,表示误差的范围,以R表示,R=xmax-xmin,13,峰谷书屋,权 加权平均值 计算用不同方法或不同条件下对同一样本得到的测定位的平均值时,因为方法及条件不同

9、其数值的精度与测定次数可能不一致,可靠程度也有差异。要把这些因素反映出来,常对不同的数据结以不同酌“权”,即是对一系列不同条件下得到的测定值,用数学的方法对其印好的测定值给予大的信任,在计算平均值时,使好的测定值占有较大的比例。所谓加权就是对精度较高的测定值乘一个较大的系数,对精度较差的测定值乘一个较小的系抵达个系数就称为“权”,14,峰谷书屋,习题 多个样本的标准差计算,测定一批鱼体内的含汞量,抽取7条鱼,每条鱼测定n次,测定结果如下,计算标准差。,15,峰谷书屋,习题,例1,有五组测定值,精密度不一致,其测定值及计算结果如下,加权平均值如何求?,16,峰谷书屋,统计图表,统计表 监测数据经

10、必要的加工、计算后可用待定的表格列出,用统计表的形式可以将各个数据之间的差异或相似性表示出来。它可以一目了然让我们了解数据之间特点。 统计表一般包括标题、表格和底注三部分,优势还在文章中对表中的内容加必要的说明。P43,17,峰谷书屋,统计图表,统计图 P43 A 条图 百分条图 百分位数条图 圆图和放射状图 线图,18,峰谷书屋,19,峰谷书屋,Q值法,20,峰谷书屋,有关正态分布的定理,假设X为服从正态 N(x,x2),Y为服从正态N(y,y2)而又相互独立的两个随机变量,则随机变量X+Y服从N(x+y ,y2+y2)而X-Y服从N(x-y ,y2+y2). 由正态N(x,x2),抽取一个

11、容量为n的随机样本,其独立变量为xi,则,21,峰谷书屋,偶然误差与概率关系,测定值或误差出现的概率95.5,99.7等称为置信概率或置信水平、置信度(P).P=1-, 称为显著性水平,22,峰谷书屋,环境监测数据场均按分布函数,两点分布 二项分布 泊松分布 应用在大气中颗粒数浓度进行监测,对交叉路口的车流量进行统计、测定一个时间间隔里放射性物质的衰变数等。 正态分布和对数分布 几种抽样分布,23,峰谷书屋,对标准物质的分析t检法,一个方法的准确度还可用对照实验来检验,即通过对标准物质的分析或用标准方法来分析相对照。同样的分析方法有时也能因不同实验室、不同分析人员而使分析结果有所差异。通过对照可以找出差异所在,以此判断方法的准确度。 a. 提出一个否定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论