常用的显著性检验方法解析_第1页
常用的显著性检验方法解析_第2页
常用的显著性检验方法解析_第3页
常用的显著性检验方法解析_第4页
常用的显著性检验方法解析_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章-1 常用的显著性检验方法 1.1 1.1 可疑值和异常值 可疑值:当对同一样品进行重复测定时,一组数据中有一、两个测定值明显地偏大或偏小,称之为可疑值; eg.eg.酸碱滴定检测中,获得下列数据: 5.38, 5.38, 5.39, 5.405.38, 5.38, 5.39, 5.40,5.41, 5.515.41, 5.51 可疑值的处理: : 1. 1. 经分析, ,是属于技术上的失误, ,不论是否属于可疑值, ,均应舍弃; ; 2. 2. 若不能确定是技术上的失误, ,则应进行统计假设检验. .1.可疑值的检验可疑值的检验1.2 几种常用可疑值的检出方法1. 利用算术平均误差检查

2、 除去可疑值后, ,求出 计算可疑值与平均值之差d d =| - | =| - | 若d d2.5 时, , 可疑值舍去; ;反之, ,保留. .x可疑xx可疑2 2 拉衣达准则 对于实验数据x x1 1,x x2 2,xxn n,先计算出平均值 和标准差s,若某个可疑值的离均差满足|d|di i|=|=|xi i - | - |3s(或 2s), 3 3s (或或2s) 作为极限误差,则认为xi i是异常数据,予以剔除。 选择 3 3s 还还是是 2s 作为极限误差, ,取决于检验的显著性水平, ,或者可信度1- 1- . 3s3s相当于显著性水平=0.01, 2s=0.01, 2s相当于显

3、著性水平=0.05.=0.05. 注: :计算平均值和标准差时可疑值包括在内. .xx3. t-检测准则检测准则 实验数据按大小顺序排列: 异常值可能出现在极端值异常值可能出现在极端值 Xmin=x1 或或 Xmax = xn ,若有若有 则可以判断则可以判断Xmin 或或 Xmax为异常值为异常值,予以剔除予以剔除.注注: 计算平均值和标准偏差时可疑值不包括在内计算平均值和标准偏差时可疑值不包括在内. K(n,)为t检验系数,可从下表中查得2 统计假设检验 xxkg520 x kg500 xBA,0 x 通过试验测定得到的每个观测值 ,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随

4、机因素的影响。所以观测值 由两部分组成,即 = += + 总体平均数 反映了总体特征, 表示试验误差。 若样本含量为n n ,则样本平均数: : ixixiixinnxxii/)(00)()(000 x 0: 与H H0 0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。无效假设: : 假设总体参数()()与某一定值(0 0) )相等,记作 H H0 0:0 0 或两个总体参数(1 1,2 2) )相等,记作 H H0 0:1 12 2,或H H0 0:1 12 20 0, 即假设处理间没有效应, , 无显著差异。备择假设: 与无效假设相对应的另一种统计假设,记

5、作 H HA A:0 0或H HA A:1 12 2; 如果测验结果接受了无效假设,说明无显著差异,当然备择假设被否定;反之,否定了无效假设,说明差异显著,也就是接受了备择假设。75. 90 75. 9075. 90nxnxu/020 xx0315.230/053.00975.0119.0 /020nxnxu01.058.2uP05.096.1uP315.2uPu0 x当试验的表面效应是试验误差的概率大于0.05时,即P0.05, 则说明无效假设成立的可能性大,不能被否定,因而接受无效假设。当试验的表面效应是试验误差的概率小于0.05时 ,即P0.05,可以认为在一次试 验中试验表面效应是试验

6、误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。 在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著性水平(significance level),记作。 在试验研究中常取=0.05=0.05或=0.01=0.01。 差异测验显著水平的确定当0.010.050.010.05时,认为差异显著,标记“* *”号,否定H H0 0; 当0.010.01时,便认为差异非常显著,标记“* * *”号; ; 当0.050.05时,则认为其差异不显著,其真差为零,差数来 自抽样误差。因而

7、接受H H0 0。 究竟选用那个显著性水平呢? ?应根据试验要求或试验结论的重要性而定。一般试验材料的变异系数大,难以控制的因素较多,试验误差大,选定0.050.05即可。对试验精度要求较高,不允许反复或试验结论应用事关重大,一般0.010.01,甚至选用0.0010.001。 统计假设检验的步骤建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平。常用的显著水平0.05和0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断。 在上述显著性检验中,对应

8、于无效假设 的备择假设为 。它包含了 或 两种可能。 因而有两个否定域,分别位于分布曲线的两尾。对两尾进行检验的方法称为双尾检验. .00:H0:AH00 这个假设检验的目的在于判断与0 0有无差异,而不考 虑谁大谁小。 这样,在水平上否定域有两个 和 ,对称地分配在u u分布曲线的两侧尾部,每侧的概率为/2/2,如下图所示。这种利用两尾概率进行的检验叫 双侧检验(two-sided testtwo-sided test),也叫双尾检验(two-two-tailed testtailed test), 为双侧检验的临界u u值。 u,uu单尾测验 例: :某酿醋厂曲种酿造醋的醋酸含量保证在12

9、12以上,则其假设H H0 0:1212, H, HA A:1212。如果选择的新曲种酿造醋的醋酸含量小于1212,H H0 0被否定,只能大于1212,若小于1212,便不符合规定的企业标准,没有推广价值。因此,只是在正态曲线的右尾一个否定域。又如: :国家规定酿造白酒中的甲醇含量不得大于0.10.1,因此,其否定域只是在正态曲线的左侧才有意义。这类测验称为单尾测验。 3 样本平均数的假设检验 在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。 70.50210510512505nxxi530. 2108nx067.110/850070

10、.502/0nxu96. 1u067. 1u05. 0 xSxt0t 统计量nSSx均数标准误 例4-2 4-2 用山楂加工果冻,传统工艺平均每100 g100 g加工500g500g果冻,采用新工艺后,测定了1616次,得知每100g100g山楂可出果冻平均为 520g520g,标准差S S12g12g。问新工艺与老工艺在每100g100g加工果冻的量上有无显著差异? 采用双侧t t检验: : 本例总体方差未知,又是小样本。 (1 1)提出无效假设与备择假设 ,即新老工艺没有差异。 ,新老工艺有差异。00:H0:AHxx*667. 635005200 xSuxt151611 ndf自由度31

11、612 均数标准误nSSx(4)查临界t值,作出统计推断 由 =15,查t值表, 得 t0.01(15)= 2.947,因为|t|t0.01, P t22.735 t0.01(10)0.01(10)3.1693.169,P P 0.01 0.01,故应否定无效假设H H0 0,即两种罐头的SOSO2 2含量有高度显著差异,该批罐头质量不合格。醇沉淀法(醇沉淀法(x1x1) 27.5227.5227.7827.7828.0328.0328.8828.8828.7528.7527.9427.94超滤法(超滤法(x2)x2)29.3229.3228.1528.1528.0028.0028.5828.

12、5829.0029.00(1 1)建立假设21:AH210:H(2 2)确定显著水平0.050.05(两尾概率) (3 3)计算 15.281x61.282x)11() 1() 1()()(221121222211nnnnxxxxSxx2121222221212111) 1() 1(nnnnnxxnxx332. 02121xxSxxt381. 13332. 061.2815.28 91516) 1() 1(21)()(nndf(4 4)查临界t t值,作出统计推断 当dfdf=9=9时,查临界值得:t t 0.050.05(9 9)=2.262=2.262,| |t t| |1.381 1.3

13、81 0.050.05,接受 ,表明两种工艺的粗提物中茶多糖含量无显著差异。210:Hkg520 x kg500 xBA,无效假设: : 假设总体参数()()与某一定值(0 0) )相等,记作 H H0 0:0 0 或两个总体参数(1 1,2 2) )相等,记作 H H0 0:1 12 2,或H H0 0:1 12 20 0, 即假设处理间没有效应, , 无显著差异。备择假设: 与无效假设相对应的另一种统计假设,记作 H HA A:0 0或H HA A:1 12 2; 如果测验结果接受了无效假设,说明无显著差异,当然备择假设被否定;反之,否定了无效假设,说明差异显著,也就是接受了备择假设。究竟

14、选用那个显著性水平呢? ?应根据试验要求或试验结论的重要性而定。一般试验材料的变异系数大,难以控制的因素较多,试验误差大,选定0.050.05即可。对试验精度要求较高,不允许反复或试验结论应用事关重大,一般0.010.01,甚至选用0.0010.001。xSxt0t 统计量nSSx均数标准误 (4)查临界t值,作出统计推断 由 =15,查t值表, 得 t0.01(15)= 2.947,因为|t|t0.01, P0.01, 故应否定H0,接受HA, 表明新老工艺的每100g加工出的果冻量差异极显著。df210:H21:AH83.651x77.592x7299.5921S8747.4222S8494. 1S 22112122nnSSxx醇沉淀法(醇沉淀法(x1x1) 27.5227.5227.7827.7828.0328.0328.8828.8828.7528.7527.9427.94超滤法(超滤法(x2)x2)29.3229.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论