计算药物分析药学与生物信息学第三章_第1页
计算药物分析药学与生物信息学第三章_第2页
计算药物分析药学与生物信息学第三章_第3页
计算药物分析药学与生物信息学第三章_第4页
计算药物分析药学与生物信息学第三章_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章 实验数据的统计分析,3.1 统计分析的基本概念 3.2 实验数据的误差及分布 3.3 平均值的统计检验 3.4 方差的统计分析 3. 非参数统计分析,3.1 统计分析的基本概念,3.1.1 数据处理中的基本术语 3.1.2 样本的数字特征 3.1.3 统计分析的一般步骤,(复习),3.1.1 数据分析中的基本术语一、准确度和精密度,1.准确度和精密度分析结果的衡量指标。 ( 1) 准确度分析结果与真实值的接近程度 准确度的高低用误差的大小来衡量; 误差一般用绝对误差和相对误差来表示。,(2) 精密度几次平衡测定结果相互接近程度 精密度的高低用偏差来衡量, 偏差是指个别测定值与平均值之间

2、的差值。,(3) 两者的关系 精密度是保证准确度的先决条件; 精密度高不一定准确度高; 两者的差别主要是由于系统误差的存在。,精密度及其计算1、平均偏差,平均偏差又称算术平均偏差, 用来表示一组数据的精密度。 平均偏差:,特点:简单 缺点:大偏差得不到应有反映,2、标准偏差,相对标准偏差 :(变异系数),标准偏差又称均方根偏差 分两种: 当测定次数趋于无穷大时 标准偏差 :, 为无限多次测定的平均值(总体平均值); 即,当消除系统误差时,即为真值 有限测定次数 标准偏差 :,例题,用标准偏差比用平均偏差更科学更准确. 例: 两组数据 0.11, -0.73, 0.24, 0.51, -0.14

3、, 0.00, 0.30, -0.21, n=8 d1=0.28 1=0.38 0.18,0.26,-0.25,-0.37, 0.32 , -0.28, 0.31, -0.27 n=8 d2=0.28 2=0.29 d1=d2,12,3、 平均值的标准偏差,m个n次平行测定的平均值:,当n 大于5时, S 变化不大,实际测定5次即可。,由统计学可得:,由S S n 作图:,4、置信度与置信区间,偶然误差的正态分布曲线:,定义,正态分布(或高斯分布).,记作:,正态分布的概率密度与分布函数, 正态分布的定义,记为:,分布曲线的特征:,正态分布的概率密度与分布函数, 正态分布的概率密度与分布函数,

4、其形状.,曲线的形状与一尖塔相似;,曲线将趋于平坦.,正态分布的概率密度与分布函数,正态分布的概率密度与分布函数,标准正态分布的概率密度:,标准正态分布的分布函数:,正态分布的概率密度与分布函数,的性质:,求,解:,正态分布的概率密度与分布函数,也可用用MATLAB命令normcdf计算 P=normcdf(1.96)=0.975,求,解:,正态分布的概率密度与分布函数,也可用用MATLAB命令normcdf计算 P=normcdf(2.5)- normcdf(-1.6) =0.9390,定理,证:,则, 一般正态分布的概率计算,正态分布的概率密度与分布函数,求概率,解:,正态分布的概率密度与

5、分布函数,这里,解:,正态分布的概率密度与分布函数,查附表2得,说明:,若,则,正态分布的概率密度与分布函数,,,根据小概率事件的实际不可能性原理,,通常把区间,区间.,正态分布的概率密度与分布函数,置信度与置信区间,S有限次测定的标准偏差; n为测定次数,对于有限次测定,平均值与总体平均值关系为:,置信度与置信区间,讨论: 1. 置信度不变时:n 增加, t 变小,置信区间变小; 2. n不变时:置信度增加,t 变大,置信区间变大; 置信度真值在置信区间出现的几率(P); 置信水准 = 1 - P 置信区间以平均值为中心,真值出现的范围;,5、有效数字及运算法则,有效数字 实验过程中常遇到两

6、类数字: 数目:如测定次数;倍数;系数;分数 测量值或计算值。数据的位数与测定准确度有关。 记录的数字不仅表示数量的大小,而且要反映测量的精确程度。 有效数字的定义: 实际上能测量到的数字; 末位数欠准(1),有效数字 实际上能测量到的数字;末位数欠准(1)。 结果 绝对误差 相对误差 有效数字位数 0.51800 0.00001 0.002% 5 0.5180 0.0001 0.02% 4 0.518 0.001 0.2% 3,实验数据的记录 容量器皿;滴定管;移液管;容量瓶;4位有效数字 分析天平(万分之一)取4位有效数字 标准溶液的浓度,用4位有效数字表示: 0.1000 mol/L p

7、H 4.34,小数点后的数字位数为有效数字位数 对数值,lgX=2.38;lg(2.4102),(2) 有效数字的运算规则,加减运算 结果的位数取决于绝对误差最大的数据的位数 例: 0.0121 绝对误差:0.0001 25.64 0.01 1.057 0.001 26.71,乘除运算,有效数字的位数取决于相对误差最大的数据的位数。 例:(0.0325 5.103 60.0)/ 139.8 = 0.071179184 0.0325 0.0001/0.0325 100%=0.3% 5.103 0.001 /5.103 100%=0.02% 60.0 0.01 /60.0 100%=0.02% 1

8、39.8 0.1 /139.8 100% =0.07%,数字修约规则 过去沿用“四舍五入”,见五就进,能引入明显的舍入误差(误差累计),使修约后的数值偏高。 “四舍六入五成双”规则是逢五有舍、有入,使由五的舍、入引起的误差,可以自相抵消,因而更为合理, 因此,国家对数字修约的标准采用此规则。,规则: 四舍六入五成双(或尾留双) 例 将下列测量值按数字修约规则,修约为三位数。,4.135修约为4.14; 4.125为4.12; 4.105为4.10(0以偶数计); 4.1251为4.13;4.1250 为4.12(五后非零数的处理) 4.1349为4.13, 不允许分次修约,例:4.1349修约

9、为三位数。不能先修约成 4.135,再修约为4.14,只能修约成4.13。,可先多保留一位有效数字,运算后再修约。,5.3527 + 2.3 + 0.055 + 3.35 5.352.30.053.3511.05 11.0, 对标准偏差的修约,S=0.213,二位: 0.22;,一位: 0.3, 注意点: “0”的双重性: 有效数字和定位. 20.30; 0.02030; 2.03010-2 变换单位位数不变: 20.30 mg; 2.030 10 4g, 首位数8: 位数多计一位。 8.6; 99.2%, 对数: 有效数字以尾数为准。 pH=11.02 H+ = 9.6 10-12, 实验记

10、录数据: 只保留一位欠准数字,总体:,研究对象的全体。,样本:,从总体中抽出的一部分样品。,3.1.2 样本的数字特征,统计分析的目的:,样本 总体,均值:,极差:,标准偏差:,3.1.2 样本的数字特征,甲:,乙:,2.9,2.9,3.0,3.1,3.1,2.7,2.8,3.0,3.2,3.3,相对标准偏差:,样本均值的标准偏差:,样本的数字特征,变异系数,均值:,极差:,标准偏差:,样本的数字特征 (EXCEL - 工具 - 数据分析 描述统计),3.1.3 统计分析的一般步骤,被检验的假设称为原假设或零假设H0,而把原假设的对立面称为对立假设或备择假设,记为H1 。 为了检验是否正确,是

11、先假设正确,根据分析计算的统计量如果出现不合理的结果,则判断不正确,则拒绝接受。 基于小概率事件原理。对所谓的小概率,习惯上使用一个指标,称为显著性水平(significance level)。基于这种原理的检验称为显著性检验。,几个基本问题 检验假设: 零假设 (H0)和备择假设(H1) 检验类型: 单侧、双侧 单尾 、双尾 误差类型: 、 、 检验结果: NS、S 接受、否定H0 否定、接受H1,2. 检验类型:,不同检验类型 H 的格式 H1 12 12 12 否定H0 的区域 1 (左边) 2(两边) 1(右) 检验类型 单侧 双侧 单侧,3. 误差类型: (把客观上符合假设H0判为不

12、符合假设H0的错误,即“以真为假”的错误)、(把客观上不符合假设H0而予以接受的错误,即“以真为假”的错误)。图a说明减小, 将增加;图b说明、 都随样本容量增大而减小。,4. 检验结果: NS、S 接受、否定H0 (P0.05) 否定、接受H1 (P0.05),P 的意义: 概率 P is the probability of observing the given results by chance given that H0 is true. P 大,H0 成立的概率大 ; P小,H0 不成立,H1 成立. 若取=0.05, P0.05, NS; P0.05, S,3.2 实验数据的误差

13、及分布3.2.1 测试误差的分类和特点,(一) 系统误差 1 特点: (1)对分析结果的影响比较恒定; (2)在同一条件下,重复测定,重 复出现; (3)影响准确度,不影响精密度; (4)可以采取措施消除。,2产生的原因,(1)方法误差选择的方法不够完善 例: 重量分析中沉淀的溶解损失 滴定分析中指示剂选择不当 (2)仪器误差仪器本身的缺陷 例: 天平两臂不等,砝码未校正 滴定管,容量瓶未校正 (3)试剂误差所用试剂有杂质 例:去离子水不合格 试剂纯度不够; (含待测组份或干扰离子) (4)主观误差操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅 滴定管读数不准,(二) 偶然误差,1. 特

14、点: (1)不恒定; (2)难以校正; (3)服从正态分布 2. 产生的原因 偶然因素 (三) 过失误差,误差的减免,(一) 系统误差的减免 1.方法误差 采用标准方法,对比实验 2.仪器误差 校正仪器 3.试剂误差 作空白实验 (二) 偶然误差的减免 增加平行测定的次数,定量分析数据的评价,解决两类问题: 1. 可疑数据的取舍 过失误差的判断 方法:Q检验法; 格鲁布斯(Grubbs)检验法。 确定某个数据是否可用。 2. 分析方法的准确性 系统误差的判断 显著性检验:利用统计学的方法,检验被处理的问题是否 存在统计上的显著性差异 方法:t 检验法和F 检验法; 确定某种方法是否可用,判断实

15、验室测定结果准确性。,(5)根据测定次数和要求的置信度,(如90%)查表: 不同置信度下,舍弃可疑数据的Q值表 测定次数 Q90 Q95 Q99 3 0.94 0.98 0.99 4 0.76 0.85 0.93 8 0.47 0.54 0.63 (6)将Q与Qx (如 Q90 )相比, 若Q Qx 舍弃该数据, (过失误差造成) 若Q Qx 保留该数据, (偶然误差所致) 当数据较少时舍去一个后,应补加一个数据。,可疑数据的取舍 过失误差的判断,1 Q 检验法的步骤: (1) 数据排列 (2) 求极差 (3) 求可疑数据与相邻数据之差 或 (4) 计算:,2 格鲁布斯(Grubbs)检验法,

16、(4)由测定次数和要求的置信度,查表得G 表; (5)比较; 若G计算 G 表,弃去可疑值,反之保留。 由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q 检验法高,基本步骤: (1)排序: (2)求 和标准偏差S; (3)计算G值;,3.2.2 分析测试中的误差传递,1、系统误差的传递 若定量分析中各步测量误差是可定的,则系统误差传递的规律可概括为: 和、差的绝对误差等于各测量值绝对误差的和、差; 积、商的相对误差等于各测量值相对误差的和、差。 R = x+y-z R= x+ y-z R=xy/z R/R= x/x+ y/y-z/z 例: 减重法称量 滴定管读数,2、偶然误差的传

17、递 极值误差法 R = x+y-z R= x+ y+z R=xy/z R/R= x/x+ y/y+ z/z 标准误差法: 1) 和、差结果的标准偏差的平方等于各测量值的标准偏差的平方和。 2) 积、商结果的相对标准偏差的平方等于各测量值相对标准偏差的平方和。 例: 样品含量计算,3.2.3 误差的正态分布和t分布,偶然误差的分布曲线: 正态()分布 (n 30) t分布 (n 30 ),3.2.3 误差的正态分布和t分布,统计量 正态分布( n30) x t分布(有限次数: n =35 ),平均值的精密度和置信区间,平均值的精密度- 标准偏差,某样品测试次数100次,平均含量为215,,试求:

18、,含量测定结果250的概率;,统计意义上含量测定结果在200,250,之间的概率;,占测定次数95%的含量范围。,例题:,误差的正态分布和t分布,因测定次数为100,,可按正态分布进行统计检验。,查附表3-2,,得,解:,因本次统计试验为单侧试验,故含量测定的结果250的概率为0.16。,250,之间的概率为:,测定结果在200,占测定次数95%的含量范围应为:,解:,统计意义上含量测定结果在200,占测定次数95%的含量范围。,250,之间的概率;,查表得,3.3 平均值的统计检验-系统误差的判断,1、u 检验 (n30 或已知符合正态分布),3.3 平均值的统计检验-系统误差的判断,b.

19、由要求的置信度和测定次数,查表,得: t表 c. 比较 t计t表 , 表示有显著性差异,存在系统误差,被检验方法需要改进。 t计t表 , 表示无显著性差异,被检验方法可以采用。,1、u 检验 (n30) 2. t 检验 准确度差别检验 样本平均值与标准值()的比较 a. 计算t值,(2)两组数据的平均值比较(同一试样) t 检验法,新方法-经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 a求合并的标准偏差:,也可由两组数据的平均值计算,查表(自由度f f 1 f 2n1n22),比较: t计t表 ,表示有显著性差异,计算值:,两个均值比较,例3-8,甲:,乙:,,,

20、问:这两个实验室的测定结果有无显著性差异?,解:,结论:,95%置信水平上二组数据不存在显著性差异,既可认为两个实验室的测定统计意义上不存在显著性差异。,如:,同一批对象实验前后某一指标的变化,每对实验对象分别予以不同处理,检验假设:,统计量:,若,则,否定,成对地进行对比试验,配对实验,两个均值的比较,样本均数和总体均数的比较,配对实验,例题3-9,某化验师应用两种不同的方法测定10个样品,其结果列表如下,问两者有无显著差异?,两个方法所得结果无显著差别,既统计意义上不存在系统误差。,结论:,样品,结果,解:,3.4 方差的统计分析 检验 精密度差别检验 H0: S12 = S22 H1:S

21、12 S22,查表(单侧表),比较 F计F表 S12 S22,计算值:,注意点: 检验顺序: G F t,双侧检验和单侧检验:表格 临界值: t 0.05,d.f., 1 = t 0.1,d.f.,2 t 0.025,d.f.,1 = t 0.05,d.f.,2, P 或 的选择: 常用 P =0.95 =0.05 过大,易犯第一类错误(以真为假); 过小,易犯第二类错误(以假为真).,F检验,统计量:,方法:,求F值,F与,比较,,,若,则,两组数据的精密度无显著性差异,3.4 方差的统计分析,3.4.1 两个方差的比较,两组数据的精密度显著差异检验,方差分析:,对实验数据的方差进行分析.,基本思想:,实验数据的总方差(复差平方和)分解为组间方差和组内方差,用下一检验判断两种不同来源的方差有无显著性差异。,例3-11,实验室 一二三 四五六七 1.64.61.21.566.23.3 2.92.81.92.73.93.83.8 3.532.93.44.35.55.5 1.84.51.125.84.24.9 2.23.12.93.445.34.5 总数12181013242522 均数2.43.622.64.854.4,现要求七

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论