第二章统计量、参数估计与区间估计_第1页
第二章统计量、参数估计与区间估计_第2页
第二章统计量、参数估计与区间估计_第3页
第二章统计量、参数估计与区间估计_第4页
第二章统计量、参数估计与区间估计_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 统计量、参数估计与区间估计统计量、参数估计与区间估计 分析测试都采取抽样检验,通过样本测试对总体的分析测试都采取抽样检验,通过样本测试对总体的某个或某些特征进行估计与作出推断。某个或某些特征进行估计与作出推断。 统计推断统计推断: : 参数估计、假设检验参数估计、假设检验 参数估计:参数估计:随机变量分布函数已知,须通过样本值随机变量分布函数已知,须通过样本值估计分布的参数估计分布的参数 假设检验:假设检验:假设随机变量分布具有某种函数分布形假设随机变量分布具有某种函数分布形式式, 根据样本值通过检验分布参数来推断其假设是否正根据样本值通过检验分布参数来推断其假设是否正确。确。

2、已知随机变量分布函数为正态分布,而表已知随机变量分布函数为正态分布,而表示其分布特性的参数有示其分布特性的参数有、2,为总体的参数。,为总体的参数。确定了确定了、2,就可以预测,就可以预测和估计任何测量值和估计任何测量值落在某一区间的概率,了解总体分布的基本落在某一区间的概率,了解总体分布的基本特征。特征。参数的点估计参数的点估计 实际分析测试中,对样本进行的是有限次的实际分析测试中,对样本进行的是有限次的测定,只能得到样本的平均值测定,只能得到样本的平均值 和样本方差和样本方差s2,那么,能否用样本平均值那么,能否用样本平均值 和样本方差和样本方差s2来分别来分别估计总体均值估计总体均值和总

3、体方差和总体方差2,如果理论上证明,如果理论上证明是可行的,就可将求总体均值是可行的,就可将求总体均值和总体方差和总体方差2简简化为求样本的平均值化为求样本的平均值 和样本方差和样本方差s2。 xxx所以,所以,参数估计是根据样本数据估计总体参参数估计是根据样本数据估计总体参数的值,如估计总体均值、总体方差,称为数的值,如估计总体均值、总体方差,称为参数的点估计。参数的点估计。估计值不正好等于待估参数,估计值不正好等于待估参数,而只是其近似值。而只是其近似值。参数的区间估计参数的区间估计 它包括参数存在的区间,同时也给出此区它包括参数存在的区间,同时也给出此区间包含待估参数真值的概率,常以置信

4、区间的间包含待估参数真值的概率,常以置信区间的形式给出形式给出 。 第一节第一节 加和号和期望值的运算加和号和期望值的运算一、加和号的运算一、加和号的运算1. 2. , 或或 3.4. xxxxmnnnmnmii.1xxxxnnii2222112.niiniixx1212nniixxxx 2112212).()(xxxxni5. 6. (a为常数)为常数)7. ( 当样本一定,当样本一定, 为常数)为常数) 即即nnyxyxyxyxii.2211xaxaii naaxnx xinx1xxxxiiinnn1)1(xixnx9. 10. ( 即一组随机样本值对于样本平均值的偏差的加即一组随机样本值

5、对于样本平均值的偏差的加和等于零。和等于零。 ) naxaxii)(0)(xnxxxiixnxnnxii1二、期望值及其运算二、期望值及其运算1.定义定义 对于一个测量值来说,其期望值就是总体的平对于一个测量值来说,其期望值就是总体的平均值(在无系统误差时)均值(在无系统误差时)。 期望值就是理想值期望值就是理想值-真值。即我们并不期望在一次给真值。即我们并不期望在一次给定的试验中,定的试验中, 会取它的期望值,然而在大量的试验会取它的期望值,然而在大量的试验中,我们可合理地预料,中,我们可合理地预料, 的平均值将在的平均值将在 的期望的期望值的附近。值的附近。2. 2. 表示符号表示符号 :

6、 ,对于方差对于方差2( )表示)表示3. 3. 运算规则运算规则(1) a 为常数,为常数, ;xxxaa(2) 若若 是随机变量的随机样本值是随机变量的随机样本值 总体均值总体均值(3) (4)(5) xixix xni122222)(1)()()()(iiiixnxxxxx axaxaxa xixin (6) 证明:证明:(7)若)若 和和 是两个互相独立的随机变量是两个互相独立的随机变量 ,如如: 即对于相互独立的随机变量,各变量之和(或差)即对于相互独立的随机变量,各变量之和(或差)的期望值,都等于各变量的期望值之和的期望值,都等于各变量的期望值之和(或差或差)。)()222222x

7、axxaaxaxax()(xaxa222)(xyyxyxyxxy(8) (9) 平均值的方差,等于各别测量值的方差的平均值的方差,等于各别测量值的方差的 )()()()(2222xnxxxii)1)(.1)(1)(1)()(222222222xnxnnxnxnnxxii(n1(10) 证明:证明:由于由于随机变量相对于它们的平均值的偏差的加和等于随机变量相对于它们的平均值的偏差的加和等于零零。所以所以:)()2)(2)()()()(22222222(yyxxyyxxyyxxyyxxyyxxyxyxyxyxyx0)(xx)0)(1)(xinx)()()(222yxyx)()()(222yxyx(

8、11)证明:证明: 上式上式 若若 则则222)()((xaxax()()(2)()()(2)()()()(2222222xaxxxaxxxaxxxaxxxaxxaxxxax0)(xx2222)()((xaxxaxx0a222)(xxx整理得:整理得: 又又 由上式得:由上式得: 22222)()nnxxxxxii(2() xiSnnSxxi22()()Sxnxi22)()(222)(1)xnxxnii(222)(1)xxiinxnS(222)(xxx 由上可见。由上可见。S是由平均值计算出来的。但是由平均值计算出来的。但通常并不是有限小数,绝大多数都按数字修约通常并不是有限小数,绝大多数都按

9、数字修约规则获得的近似值,于是各偏差也都是近似值,规则获得的近似值,于是各偏差也都是近似值,其平方再加和,会把舍入误差累积起来,使其平方再加和,会把舍入误差累积起来,使 S、s2、s受影响。为了消除上述弊病,同时为了计受影响。为了消除上述弊病,同时为了计算机编程方便起见,算机编程方便起见,可由样本值按上式直可由样本值按上式直接求出方差和接求出方差和S、s2、s 。第二节第二节 统计量统计量一一 、统计量、统计量 1.定义定义 将样本值经过加工运算得到的将样本值经过加工运算得到的样本函数值,称为统计量。样本函数值,称为统计量。 它可以把关于总体的有用信息更明确更集它可以把关于总体的有用信息更明确

10、更集中地反映出来中地反映出来, 如如 、R、s2、s、S 等,这些等,这些数值都是由随机变量的随机样本值数值都是由随机变量的随机样本值 得到得到的。所以,统计量也是随机变量。的。所以,统计量也是随机变量。 2. 作用作用 利用统计量可以对被测物理量的利用统计量可以对被测物理量的数值作出统计意义的推断数值作出统计意义的推断 xxi 选定一个概率(置信概率),并在真值选定一个概率(置信概率),并在真值统计量的两边,各定出一个界限(置信限),统计量的两边,各定出一个界限(置信限),由此画出的区间由此画出的区间置信区间,然后才能断置信区间,然后才能断然说,然说,这个区间包含真值在内的概率是多少,这个区

11、间包含真值在内的概率是多少,这叫做区间估计这叫做区间估计 而被推断出物理量真值的而被推断出物理量真值的某个统计量叫某个统计量叫做参数的点估计做参数的点估计。例如,样本平均值。例如,样本平均值 作为作为总体均值总体均值的估计值,记做的估计值,记做 。 x二、一些统计量的计算二、一些统计量的计算1.平均值平均值 简化计算法简化计算法-编码变换(大的变小,小数变整编码变换(大的变小,小数变整数)数)(1) (2) (3) ( 表示一个数表示一个数) 注意:注意:当测定精密度好,可多保留一位;当当测定精密度好,可多保留一位;当离散度大时,位数与测量值相同或少一位。离散度大时,位数与测量值相同或少一位。

12、 xnxi1aaxxiiixnx1axx2. 差方和(离差平方和)差方和(离差平方和) 方差方差 标准差标准差 2)(xSxi12nSs1nSsS S的计算方法:的计算方法:(1) 由样本值直接求由样本值直接求:利用简化计算法利用简化计算法 与与 的关系:的关系: 22)(1xxiinSS)(axbxiiS各样本值同减去一个数各样本值同减去一个数 a a,其差方和不变,其差方和不变 令令 则则 axxiiaxxSxxaxaxxxSiii222)()()()(SxnxSii22)(1各样本值同乘以一个数各样本值同乘以一个数 b b,其差方和增大,其差方和增大 b b2 2倍倍 令令 iibxx

13、xbx SbxxbxbbxxxSiii22222)()()(2bSS例例21 用用K2Cr2O7法测定某赤铁矿中铁的含量,数法测定某赤铁矿中铁的含量,数据如下:据如下: 66.64, 66.56, 66.65, 66.62, 66.63计算方法的精密度。计算方法的精密度。解:解: 编码公式编码公式: %1001%100 xnSxsRSDix2ixxi100)60.66(iixx66.6466.5666.6566.6266.634-4523101616254970 (2)先计算平均值)先计算平均值 ,再由,再由 ,求,求 S。005.0501002S%053. 0%10062.664005. 0

14、%1001xnSRSDx2)(xSxi62.661051060.6610560.6622ixx50105170)(1222iixnxS习题 某标准水样中氯化物含量为某标准水样中氯化物含量为110 mg/L,银含量法测,银含量法测定定5次的结果分别为次的结果分别为112,115,114,113,115 mg/L。(1)计算平均值的绝对误差和相对误差)计算平均值的绝对误差和相对误差 ;(2)计算样本的差方和、方差、标准偏差和相对标)计算样本的差方和、方差、标准偏差和相对标准偏差。准偏差。第三节第三节 参数的点估计参数的点估计一、参数的点估计一、参数的点估计 点估计:点估计:用样本的统计量作为总体参

15、数的估计值,用样本的统计量作为总体参数的估计值,叫做总体参数的点估计。叫做总体参数的点估计。 表示测定值集中趋势的参数表示测定值集中趋势的参数: : 均值、中位值等,均值、中位值等, 表示测定值离散特性表示测定值离散特性: : 算术平均偏差、极差、方算术平均偏差、极差、方差和标准差。差和标准差。 xx 22ss二、参数二、参数的点估计值的点估计值1 .算术平均值算术平均值 (指各测量值的方差都相等的等精度(指各测量值的方差都相等的等精度的测量)的测量)(1 1) 平均值平均值 是总体均值是总体均值的无偏估计量的无偏估计量,这是,这是因为参数因为参数的估计量的期望值等于被估参数,即的估计量的期望

16、值等于被估参数,即 无偏估计量是说由测定值计算的估计值无偏估计量是说由测定值计算的估计值 离被估离被估参数参数很近,由不同样本得到的估计值很近,由不同样本得到的估计值 在被估参数在被估参数附近波动。附近波动。xxnxnxnxii111xxx(2) 是出现概率最大的值是出现概率最大的值p23 在正态总体中,随机抽出容量为在正态总体中,随机抽出容量为 的样本,独立的样本,独立进行测定,得到进行测定,得到 个测定值个测定值 测定值测定值 出出现的概率现的概率 是指随机变量出现在是指随机变量出现在 区间的概率(即具有各种大小偏差的样本值出现的概区间的概率(即具有各种大小偏差的样本值出现的概率)。率)。

17、 eFaixi2(2121)nxixxinnxxx ,21iFx 假设最佳值为假设最佳值为 ,则,则 为各次测量值所为各次测量值所对应的误差对应的误差 由于由于各次测量值独立进行各次测量值独立进行 ,所以在,所以在 次测定中,次测定中,总总概率概率 F 为:为:exxxaaannxxxFFFFn(222212)()()212121)()()()( naaxi),(),(),(21axaxaxn而在一组测量中,最佳值或最可信赖值乃是当总而在一组测量中,最佳值或最可信赖值乃是当总概率概率P最大时所求出的那个值。最大时所求出的那个值。由指数关系可知,由指数关系可知,当当 F 最大时最大时,则,则 为

18、最小,亦即在一组测量值中各偏差的平方和最为最小,亦即在一组测量值中各偏差的平方和最小,而小,而S为极小值为极小值的条件:的条件: 222221)()()(axaxaxaxin(当当S最小,最小, 算术平均值算术平均值0dadS022daSd0)(2)( 2)( 2)( 221 aaaadadSxxxxinndaSd2222222 00)(0)(2naxaxaxiiixnai1由此可得结论由此可得结论(最小二乘法原理最小二乘法原理): 在一组等精度测量中,在一组等精度测量中, 为其最佳值或最为其最佳值或最可信赖值;可信赖值; 各测量值与各测量值与 的偏差的平方和为最小的偏差的平方和为最小 由正态

19、分布图形也可看出,由于正态分布概率密度由正态分布图形也可看出,由于正态分布概率密度函数曲线对函数曲线对对称,各测定值对真值对称,各测定值对真值的偏差有正有负,的偏差有正有负,正负偏差出现的机会相同。当对测定数据进行算术平正负偏差出现的机会相同。当对测定数据进行算术平均后,一部分正负误差相互抵消,因此,用均后,一部分正负误差相互抵消,因此,用 来估来估计计偏差会更小。偏差会更小。xxx(3 3)在一组测量值中,测定值对算术平均值)在一组测量值中,测定值对算术平均值的偏差之和为零的偏差之和为零 由上可见,算术平均值充分利用了样本测定所由上可见,算术平均值充分利用了样本测定所提供的全部信息,在等精度

20、的测定中,是提供的全部信息,在等精度的测定中,是出现出现概率最大,偏差平方和最小的值,因而是最可概率最大,偏差平方和最小的值,因而是最可信赖的。算术平均值是信赖的。算术平均值是的无偏估计量,用它的无偏估计量,用它来估计来估计是最有效的。是最有效的。0)(1xnxnxnxxxinii)1(xnnnxi2. 加权平均值加权平均值 设有设有m组精度分别为组精度分别为S1、S2、 Sm的不等精度的平的不等精度的平均值均值 (不同的人、不同的室、或一(不同的人、不同的室、或一个人用不同的方法测定同一试样)被测定量个人用不同的方法测定同一试样)被测定量的最佳的最佳值或最佳估计值是样本测定值的加权平均值值或

21、最佳估计值是样本测定值的加权平均值 : ( 表示表示 ) 式中式中 权数与测定值的方差成反比权数与测定值的方差成反比 。wxwxwxiiiwxiixwsix121swiimxxx、21wx 权重权重 : 表示某个精度测定值在样本平均值中所表示某个精度测定值在样本平均值中所占的地位、比例或贡献,即表示测量值可信赖程度的占的地位、比例或贡献,即表示测量值可信赖程度的数值。数值。 可见,测量值的可信赖程度与标准差有关,标准差可见,测量值的可信赖程度与标准差有关,标准差愈小其可信赖程度愈大,因而其权愈大。正态分布的愈小其可信赖程度愈大,因而其权愈大。正态分布的条件下,给于较大权数的测定值必定是最可信赖

22、值,条件下,给于较大权数的测定值必定是最可信赖值,即误差最小,概率最大的测定值。即误差最小,概率最大的测定值。21swiiwi加权平均值的特性加权平均值的特性: :(1) 不等精度测定中,不等精度测定中, 是总体均值是总体均值的无的无偏估计量偏估计量 wxwxwwxwxiiiiiw(2) 在不等精度测量中,在不等精度测量中, 是出现概率最是出现概率最大的值大的值 (3) 对于精密度对于精密度S相同,但测量次数不同的几相同,但测量次数不同的几组测量值,各组测量值组测量值,各组测量值 平均值的精密度不同,平均值的精密度不同,所以所以 (权数测定次数)(权数测定次数)nxnxiiiwwx 在等精度的

23、测定条件下,各测定值的权相在等精度的测定条件下,各测定值的权相同,则加权平均值等于算术平均值,这是不同,则加权平均值等于算术平均值,这是不等精度测定的一种特殊情况,即无论是等精等精度测定的一种特殊情况,即无论是等精度还是不等精度的测量,都可用加权平均值度还是不等精度的测量,都可用加权平均值表示测定结果。表示测定结果。xxnxxwxiiiiw1 例例 22 某一实验室三个分析人员分别用某一实验室三个分析人员分别用光谱法、原子吸收法和化学法测定耐火材料中光谱法、原子吸收法和化学法测定耐火材料中的的CaO ,测定结果分别为,测定结果分别为(%):1.65,1.67,1.70,标准差分别为,标准差分别

24、为0.043,0.024,0.020 ,问该,问该实验室应如何报分析结果?实验室应如何报分析结果? 例例 22 某一实验室三个分析人员分别用光谱法、某一实验室三个分析人员分别用光谱法、原子吸收法和化学法测定耐火材料中的原子吸收法和化学法测定耐火材料中的CaO ,测定结,测定结果分别为果分别为(%):1.65,1.67,1.70,标准差分别为,标准差分别为0.043,0.024,0.020 ,问该实验室应如何报分析结果?,问该实验室应如何报分析结果?解解 : 这是一组不等精度的测量,应用加权平均值报分这是一组不等精度的测量,应用加权平均值报分析结果析结果68. 1)020. 0(1)024. 0

25、(1)043. 0(1)020. 0(70. 1)024. 0(67. 1)043. 0(65. 1122222222ssxwxwiiiiiiwx 三、总体方差三、总体方差 2 2及总体标准差及总体标准差 的点估计的点估计 1. 参数参数2和和的点估计的点估计 常用样本的方差常用样本的方差 s2(单次测定方差)和样本(单次测定方差)和样本的标准差的标准差s作为总体方差作为总体方差2和总体标准差和总体标准差的点的点估计值。估计值。 上式表明,样本方差上式表明,样本方差S2和标准差和标准差S分别是分别是总体方差总体方差2和标准差和标准差的无偏估计量。的无偏估计量。 22ss证明:证明: 即样本的方

26、差是总体方差的无即样本的方差是总体方差的无偏估计量偏估计量上式中:上式中:)()(11)(1)1)1)1)11)()(111)(22222222222xxnnnxnnxnnxnnxnnxnxnxnnxxsiiii()(22xs222)()()(xnxxxii证明:证明: 222222)()(2)()()( 2)()()(xxxxxxxxxxxxiiiiii(22)()(:xnx其中2)(2)( 2)( 2)()( 2)(2xnnxnxnxxxxxxiii222222)()()()(2)()(xnxxnxnxxxiii(222)()(xnxxxii S2 表示在等精度测定条件下单次测定的方差,表

27、示在等精度测定条件下单次测定的方差,其统计含义是,其统计含义是,在多次测定中平均在每次测定上在多次测定中平均在每次测定上的方差,即方差的统计平均值。的方差,即方差的统计平均值。单次测定的方差单次测定的方差不是一次测定的方差,因一次测定不能求方差。不是一次测定的方差,因一次测定不能求方差。 S2 是是总体方差总体方差2 的无偏估计量,以的无偏估计量,以2为其期望值。为其期望值。 当当 很大时,用很大时,用2 与与 S2 估计测定精度,其差别很估计测定精度,其差别很小(比如,小(比如, ,差别只有,差别只有2)。但分析测定)。但分析测定中,通常只有少数几次测定,应用中,通常只有少数几次测定,应用2

28、的无偏估计量的无偏估计量S2来估计测量数据的精密度。来估计测量数据的精密度。n50n 当测定是分当测定是分m组进行的,总的测定方差由组进行的,总的测定方差由m组的方组的方差共同决定。当各组测定次数相等时,单次测定的方差共同决定。当各组测定次数相等时,单次测定的方差按差按并合方差公式并合方差公式计算。并合方差计算。并合方差式中式中 是第是第 组第组第 次测定值,次测定值, 是第是第 组测定的平组测定的平均值,均值, 是第是第 组的测定值的数目,组的测定值的数目, 是第是第 组测组测定的方差。定的方差。 当各组测定值的数目不相同时,则用加权平均值当各组测定值的数目不相同时,则用加权平均值求并合方差

29、。加权并合方差的计算公式是:求并合方差。加权并合方差的计算公式是:msnmxxsmiimiinjij121212) 1()(xijijiniisi2iix 式中,称为式中,称为自由度自由度,是指独立变量的数目,在这里表,是指独立变量的数目,在这里表示差方和中独立项的数目。作为各组差方和的权值。示差方和中独立项的数目。作为各组差方和的权值。 样本方差样本方差 S2 充分利用了测定所提供的全部信息,充分利用了测定所提供的全部信息,是总体方差是总体方差2的无偏估计值,而且在的无偏估计值,而且在2的无偏估计量的无偏估计量中中, S2是最优的,所以方差和标准差应用最广。是最优的,所以方差和标准差应用最广

30、。miimiiimiimiinjijfsfmnxxs11211212)(2. 样本方差的自由度样本方差的自由度 在样本方差和样本标准差的计算中,我们将各测在样本方差和样本标准差的计算中,我们将各测量值对于样本平均值量值对于样本平均值 的偏差的平方取平均时,所的偏差的平方取平均时,所用的分母并不是样本容量用的分母并不是样本容量 n,而是自由度,而是自由度 。何谓自由度?何谓自由度? f:一个关系式中独立项的数目一个关系式中独立项的数目 样本值的线性约束关系式样本值的线性约束关系式x1 nfxnxi10 xnxi 由于由于 属于同一样本的并具有平均属于同一样本的并具有平均值值 ,则由,则由 到到

31、都可以自由取值,当都可以自由取值,当的值取定以后,轮到的值取定以后,轮到 取值时,它就不可能自由了,取值时,它就不可能自由了,它要受到上述关系式的制约,即它要受到上述关系式的制约,即 的取值一定使得的取值一定使得 式成立,否则,样本平均式成立,否则,样本平均 值值 就不就不再是确定的。再是确定的。 所以,虽然样本有所以,虽然样本有 个独立的随机变量,但在差个独立的随机变量,但在差方和中的独立项的数目,实际上只有方和中的独立项的数目,实际上只有 ,即,即自由自由度为度为 。 xnxxx,21x1xn 1121,nxxxxnxn0 xnxixn1n1n 换言之,对于换言之,对于 ,因为差方,因为差

32、方和的计算式中需要计算平均值和的计算式中需要计算平均值 ,用掉,用掉了一个自由度,故样本容量为了一个自由度,故样本容量为 的一组样的一组样本,其自由度为本,其自由度为 。1)(22nxxsixn1 nf3. 样本平均值的标准差样本平均值的标准差 当用样本平均值当用样本平均值 估计总体均值估计总体均值( ),其),其标准差又有多大?换句话说,样本平均值的精度是不标准差又有多大?换句话说,样本平均值的精度是不是比个别测量值的精度要好一些?如何衡量?是比个别测量值的精度要好一些?如何衡量? 设一组等精度的测量值设一组等精度的测量值 ,样本的平均,样本的平均值为值为 ,样本的方差是,样本的方差是 ,由

33、定义可知,由定义可知xnxnxnnxxxnxxnni1.11.2121sxxxxs2nxxx,21而单次测量值而单次测量值 的方差均的方差均为为S2(等等精度精度),根据误差传递公式,则平均值的标准差根据误差传递公式,则平均值的标准差 : sx2nssnnsnsnsnsxxxsxxxsxxxsnnx222222222222212)1()1(.)1()1()(.)()(21nssx22nssxnxxx,21 上述表示,当单次测定的方差不变时,上述表示,当单次测定的方差不变时,平均平均值的方差值的方差 随测定次数的增加而减小,但减随测定次数的增加而减小,但减小的速度随测定次数增加而减慢。小的速度随

34、测定次数增加而减慢。将上式变将上式变换换 , 以以 对对 作图,得作图,得 曲线,曲线,其均值标准差与测定次数的关系如图所示。其均值标准差与测定次数的关系如图所示。 nssx22nssxsx2nssx1ssxnssxn 所以,要使样本的均值反映结果的可靠性,必须所以,要使样本的均值反映结果的可靠性,必须一般平行测定一般平行测定35次次标样定标时标样定标时n=56次次建立分析方法(以建立分析方法(以RSD表示精密度),则表示精密度),则n=11次。求检出限次。求检出限 DL,一般,一般n=11次。当次。当 , 随随n的增加变化不大的增加变化不大 10nsx可见在可见在 时,增加测定次数是减小均值

35、标准差有效时,增加测定次数是减小均值标准差有效的方法之一。当的方法之一。当 愈大,愈大, ,平均值,平均值 的精度上的精度上升,升, 愈靠近愈靠近;当;当 则则 , ,因此,因此,当样本容量愈大,我们愈能肯定样本平均值当样本容量愈大,我们愈能肯定样本平均值 是总体均是总体均值的一个好的估计。当值的一个好的估计。当 ,均值标准差随测定次数,均值标准差随测定次数的增加减小很慢,的增加减小很慢, 变化趋于平稳,尤其是变化趋于平稳,尤其是 后,后, 基本不变,此时,借增加测定次数减小基本不变,此时,借增加测定次数减小均值标准差是不可取的。均值标准差是不可取的。ssx5nssxssxxxnx0sx5n1

36、0nnx总结:总结:单次测定结果单次测定结果 ,平均值,平均值 ,但,但平均值的标准差平均值的标准差 比个别测定值的标准差比个别测定值的标准差S小,只小,只相当于相当于S 的的 ,可见平均值的精度要好,从其分布,可见平均值的精度要好,从其分布来看也可知,来看也可知, 是是的最可信赖值的最可信赖值。4.4.样本标准偏差的标准差样本标准偏差的标准差 在处理数据时,在处理数据时,S的有效数字位数通常较少(的有效数字位数通常较少(12位),这里也存在一个精密度问题。可以用样本标位),这里也存在一个精密度问题。可以用样本标准差准差S的标准差的标准差 来表征来表征 S 的精密度。的精密度。xixsxn1s

37、sx可见,可见, 与样本容量与样本容量n有关,当有关,当n愈大,愈大, 则则 愈小,愈小,n,则,则 0,则,则S。一般,。一般,n50,S 取一位有效数字(最多两位)。取一位有效数字(最多两位)。nss2ss第四节第四节 估计量好坏的评选标准估计量好坏的评选标准 用不同的估计方法得到的估计值是不同的,用不同的估计方法得到的估计值是不同的,这就提出了两个问题:这就提出了两个问题:(1) 对一个参数的许多可能的估计值中,究对一个参数的许多可能的估计值中,究竟选择哪一个估计值为好?评选的标准是什么竟选择哪一个估计值为好?评选的标准是什么(2) 这类估计的可靠性有多大?这类估计的可靠性有多大?评选的

38、标准:评选的标准:无偏性、一致性、有效性无偏性、一致性、有效性和充分性。和充分性。 一、无偏性一、无偏性 无偏性:无偏性:估计值能在待估参数的真值估计值能在待估参数的真值附近摆动。附近摆动。 无偏估计量:无偏估计量:估计量的期望值应等于估计量的期望值应等于待估参数待估参数 xixs2S 二、一致性二、一致性 一致性:一致性: 随着样本容量的增大,估计值与待估参随着样本容量的增大,估计值与待估参数接近的可能性就愈大(无限靠近于真值)。数接近的可能性就愈大(无限靠近于真值)。 当当 n 当当 n 用容量较大的样本比容量较小的样本作出的估计值用容量较大的样本比容量较小的样本作出的估计值更精确。更精确

39、。nxxixx22s22s 三、有效性三、有效性 方差愈小,则估计量接近待估参数的概率方差愈小,则估计量接近待估参数的概率愈大,因此,在诸多无偏估计量中,方差愈愈大,因此,在诸多无偏估计量中,方差愈小的估计量,即为较好的无偏估计量小的估计量,即为较好的无偏估计量有有效性。效性。具有最小方差的无偏估计量称为有效具有最小方差的无偏估计量称为有效估计量。估计量。 对于正态分布的随机变量来说,方差对于正态分布的随机变量来说,方差2愈小,愈小,分布就愈窄,随机变量在期望值分布就愈窄,随机变量在期望值左右摆动的左右摆动的幅度愈小,测定结果的精密度愈好。幅度愈小,测定结果的精密度愈好。对于样本对于样本容量为

40、容量为 的一组样本来说,平均值的一组样本来说,平均值 的方差的方差 比个别测量值比个别测量值 的方差的方差 要小,故平均值要小,故平均值 比用单次测定值比用单次测定值 作作为总体均值为总体均值的估计量更有效。的估计量更有效。 最佳效估计量最佳效估计量nxns2xis2xxix四、充分性四、充分性 充分性:充分性: 充分利用样本信息对待估参数充分利用样本信息对待估参数作出估计。作出估计。 和和 都是充分利用了每个样本值所提都是充分利用了每个样本值所提供的信息,因此,它们都具有充分性。供的信息,因此,它们都具有充分性。 综上所述,综上所述, 和和 具有上述四种特性,是具有上述四种特性,是和和2的最

41、好点估计值。的最好点估计值。xs2xs2第五节第五节 区间估计和分析结果的表达区间估计和分析结果的表达 分析测定的目的,就是由样本测定的算术平分析测定的目的,就是由样本测定的算术平均值来估计总体均值,算术平均值越接近于真均值来估计总体均值,算术平均值越接近于真值(近似程度),说明由算术平均值来估计总值(近似程度),说明由算术平均值来估计总体均值就越准确。体均值就越准确。 确定测定值的允许范围的问题,在统计上就确定测定值的允许范围的问题,在统计上就是区间估计问题。是区间估计问题。 一、置信水平和置信区间一、置信水平和置信区间1. 置信度置信度 表示人们所作判断的把握性程度表示人们所作判断的把握性

42、程度 例例23 标准钢样的含磷量为标准钢样的含磷量为0.079,方法测定的总体标准差方法测定的总体标准差0.002。现用此。现用此方法对钢样进行测定,预测一下测定结果。方法对钢样进行测定,预测一下测定结果。要求:要求: (1)单次测定值在)单次测定值在 0.0790.004 范围内(范围内(2),在此判断的置信度),在此判断的置信度(2)为)为 95.46,则,则a 95.46 。 (2)单次测定值在)单次测定值在 0.0790.002 范围范围内(内(),则),则 a 68.28 。 (3)若)若4次测定的平均值在次测定的平均值在 0.0790.002 范围内(范围内( ),),a = 95

43、.46% 。4s2. 置信度的双重含义置信度的双重含义置信度:置信水平,置信概率置信度:置信水平,置信概率置信区间:在一定的置信水平下,包含样品真值的区置信区间:在一定的置信水平下,包含样品真值的区间范围间范围 。3. 置信水平和置信区间的选择置信水平和置信区间的选择置信区间和置信水平由下列关系:置信区间和置信水平由下列关系: 置信区间置信区间 置信水平置信水平 判断判断 宽宽 高高 无意义无意义 窄(窄(0.67) 低(低(50) 准确度较高,准确度较高, 但失误但失误较多较多 统计意义上的推断,通常不把置信水平定统计意义上的推断,通常不把置信水平定为为100。将置信水平的高低定得合适,可能

44、使。将置信水平的高低定得合适,可能使置信区间的宽度足够小,而置信水平又很高。置信区间的宽度足够小,而置信水平又很高。一般,人们判断若有一般,人们判断若有9090或或9595的把握性,就的把握性,就认为此判断基本正确。认为此判断基本正确。 分析化学中,一般置信水平取分析化学中,一般置信水平取95%,此时,此时,置信区间为置信区间为 1.96,可记为,可记为1.96 ( a=95%, u=1.96 )二、总体均值二、总体均值的区间估计的区间估计置信区间:置信区间:在一定的概率下所估计的总体参数在一定的概率下所估计的总体参数存在的区间,称为置信区间。存在的区间,称为置信区间。区间估计:区间估计:在已

45、求得估计值的条件下对待估在已求得估计值的条件下对待估参数存在的区间作出估计,称为区间估计参数存在的区间作出估计,称为区间估计。 已知已知 , , ,测测量值量值 和算术平均值和算术平均值 均遵从正态分布均遵从正态分布 N(,2)或)或 N(, ),或标准正态分布),或标准正态分布 N(0,1),由此可以估计),由此可以估计落在某一区间的落在某一区间的概率,或反过来可以在一定概率下估计概率,或反过来可以在一定概率下估计的区的区间的大小。间的大小。x22snsx22xixn21. 由样本值对由样本值对进行区间估计进行区间估计若总体标准差若总体标准差是已知的常数,试判断下列两是已知的常数,试判断下列

46、两式的含义:式的含义:(1)(2) a=95%uxuuxux两式的意义:两式的意义: (1)式是用)式是用来判断来判断 在什么范围内,其含在什么范围内,其含义义是一个随机变量出现在指定期间是一个随机变量出现在指定期间( )内及这一事件的概率。是用)内及这一事件的概率。是用对对 的预测的预测。uxuuxx(2)式是用)式是用 来判断来判断所在的范围。其含义是所在的范围。其含义是宽度一定而中心值作随机变动的区间宽度一定而中心值作随机变动的区间( ),其中含有一恒定值),其中含有一恒定值(真值)(真值)以及这一事件的概率。是用以及这一事件的概率。是用 对真值对真值的估计的估计。如图示:如图示: ux

47、uxuxxx 由图可见,图中每一条垂直线的中心代表测定由图可见,图中每一条垂直线的中心代表测定值值 ,两端箭头表示区间(,两端箭头表示区间( )的范围。对)的范围。对于每一测量结果来说,垂直线可能与水平线相交于每一测量结果来说,垂直线可能与水平线相交或不相交,而或不相交,而关于关于的置信区间问题,也就是相的置信区间问题,也就是相交的可能性(置信水平)与垂直线长度(置信区交的可能性(置信水平)与垂直线长度(置信区间的宽度)之间的关系。若以间的宽度)之间的关系。若以 估计估计,只要,只要 在在 内,则内,则一定落在一定落在 内,内, 落落在在 内的概率和内的概率和落在落在 内的概率一内的概率一致(

48、相同致(相同) ) 。 uxxuuxuuxxxxi所以所以的区间估计的区间估计:以测定值为中心,在一定的置以测定值为中心,在一定的置信水平上给出的信水平上给出的的范围。的范围。 表示方法:表示方法: 当当 u=1 a=68.26% u=2 a=95.44% u=3 a=99.73% ux2. 用样本的平均值用样本的平均值 对对进行区间估计进行区间估计 当对样本进行当对样本进行n次测量,对样本容量为次测量,对样本容量为n的分的分析数据进行统计处理,可求得析数据进行统计处理,可求得 和和 ,即,即可将以上估计量代入上式得:可将以上估计量代入上式得: xsxxnssxuxnuxx (1)如果)如果已

49、知已知 对于其标准正态分布,对于其标准正态分布,N(0,1),), ( )xnxuxu),(2nN 显著性水平显著性水平1置信水平置信水平, ,即测量数据即测量数据落在区间以外的可能性(概率)。落在区间以外的可能性(概率)。置信水平置信水平: :nuxa1)(2211a(2) 如果如果是未知的(有限次的测量)是未知的(有限次的测量) 用小样本测定得到的标准差估计值用小样本测定得到的标准差估计值s代替代替来进行来进行的区间估计,偏差较大,其分布应遵从另一种分布的区间估计,偏差较大,其分布应遵从另一种分布 t 分布,应用分布,应用 t 分布则可以得到分布则可以得到的较精确的区间的较精确的区间估计。估计。 t 分布:分布:若若 ,是由遵从正态分布,是由遵从正态分布N(,2)的总体中随机抽取的样本值,统计量:)的总体中随机抽取的样本值,统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论