




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学之参数估计和假设检验抽样分布抽样分布简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质不放回不放回放放 回回放回放回不放不放 回回独立性和同一性独立性和同一性同一性同一性当当n/N5%时,有限时,有限总体不放回抽样等总体不放回抽样等同于放回抽样同于放回抽样P-121统计量与抽样分布统计量与抽样分布统计量:即样本指标。统计量:即样本指标。样本均值样本均值样本成数样本成数样本方差样本方差如:如:nXXinnPi22)(11XXnSi抽样分布:抽样分布:某一统计量所有可能的样本的取值形成的某一统计量所有可能的样本的取值形成的概率分布。概率分布。性性 质质数字特征数字特征0P(Xi
2、) 1P(Xi)=1均值均值E(X) 方差方差Ex-E(x)2样本均值的抽样分布(简称均值的分布)样本均值的抽样分布(简称均值的分布)抽样抽样 均值均值均值均值=Xi/NnxXi样本均值是样本的函数,样本均值是样本的函数,故样本均值是一个统计量,故样本均值是一个统计量,统计量是一个随机变量,统计量是一个随机变量,它的概率分布称为样本均它的概率分布称为样本均值的抽样分布。值的抽样分布。设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下5 . 21NXNii25. 1)(122NXNii现从总体中抽取n2的简
3、单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)式中:M为样本数目比较及结论:1. 样本均值的均值(数学
4、期望)等于总体均值 2. 样本均值的方差等于总体方差的1/nnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11Mxniix抽抽 样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无限)从无限总体抽总体抽 样和样和有限总体放有限总体放回抽样回抽样(2)从有限)从有限总体不放回抽总体不放回抽样样xxE )(xxE )(nx22)1(22NnNnxnx1NnNnx即均值推断的抽样误差和,12NnNnnxx抽样误差抽样误差抽样误差抽样误差 = 50 =10X总体分布总体分布n = 4抽样分布抽样
5、分布n =165x50 x5 . 2x当总体服从正态分布当总体服从正态分布N (,2 )时,来自该总体的所有容量时,来自该总体的所有容量为为n的样本的均值的样本的均值 X也服从正态分布,也服从正态分布, X 的数学期望的数学期望为为,方差为,方差为2/n。即。即 XN(,2/n)x当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布 xn 中心极限定理:设从均值为中心极限定理:设从均值为 ,方差为,方差为 2的一个任意总体中抽的一个任意总体中抽取容量为取容量为n的样本,当的样本,当n充分大时,样本均值的抽样分布近充分大时,样本均值的抽样分布近似服从均值为似服从均值为、方差为、方
6、差为2/n的正态分布的正态分布一个任意分布的总体 x 关于均值的抽样分布有如下的一些结论关于均值的抽样分布有如下的一些结论:1.对于多数总体分布来说,不论其形态如何,如果样对于多数总体分布来说,不论其形态如何,如果样本观察值本观察值超过超过30个个,那么均值的抽样分布将,那么均值的抽样分布将近似于近似于正态分布正态分布。2.2.如果总体是正态分布的,则不管样本大小如何,均如果总体是正态分布的,则不管样本大小如何,均值的抽样分布一定是值的抽样分布一定是正态分布。正态分布。两个样本均值之差的抽样分布两个样本均值之差的抽样分布抽样抽样抽样抽样?21Axx21估计估计),(2111NX ),(2222
7、NX ),()(2221212121nnNxx则(1)如:两个正态总体)如:两个正态总体(2如果两个总体都是非正如果两个总体都是非正态总体,只要态总体,只要n1、n2足够大,足够大,根据中心极限定理,可知:根据中心极限定理,可知:),()(2221212121nnNxx)1()1(,()(2222221111212121NnNnNnNnNxx)1()1(,()(2222221111212121NnNnNnNnNxx样本成数(即比例)的抽样分布(简称成数的分布)样本成数(即比例)的抽样分布(简称成数的分布)抽样抽样 成数成数成数成数P=Ni/N 所有可能的样本的成数(所有可能的样本的成数( )所
8、形成的分布,称为)所形成的分布,称为样本成数的抽样分布。样本成数的抽样分布。nnPi/nPPP,21抽抽 样样 方方 法法 均均 值值 方方 差差 标标 准差准差(1)从无限)从无限总体抽总体抽 样和样和有限总体放有限总体放回抽样回抽样(2)从有限总)从有限总体不放回抽样体不放回抽样PnnEPEi)/()(PnnEPEi)/()(nPqP/2)1(2NnNnPqPnPqP)1(NnNnPqP根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大, 的分布就近似正的分布就近似正态分布。(态分布。(np和和nq大于大于5时)时)抽样误差抽样误差抽样误差抽样误差P两个样本成数之差的抽样分
9、布两个样本成数之差的抽样分布抽样抽样抽样抽样估计估计 当当n1、n2都足够大时,样本成数都足够大时,样本成数 都近似服从正态分布,两个样本成都近似服从正态分布,两个样本成数之差(数之差( )也近似服从正态分)也近似服从正态分布。布。APP21P1-P2=?),()() 1 (2221112121nqPnqPPPNPP)1()1(,)() 2 (2222211111121212NnNnqPNnNnqPPPNPP21,PP21PP 一个样本方差的抽样分布一个样本方差的抽样分布抽样抽样从一个正态总体中抽样所得到的样本方差的分布从一个正态总体中抽样所得到的样本方差的分布),(2NXn,S2则则 ) 1
10、(/) 1(222nSn当当 分布趋近于正态分布2,30n两个样本方差之比的抽样分布两个样本方差之比的抽样分布抽样抽样从两个正态总体中分别独立抽样所得到的两个样本方从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。差之比的抽样分布。),(2111NXn1,S12则则 抽样抽样),(2222NXn2,S22) 1)(1(/2122222121nnFSSF参数估计参数估计点估计点估计以样本指标直接估计总体参数。以样本指标直接估计总体参数。评价准则评价准则的数学期望的数学期望等于总体参等于总体参数,即数,即E该估计量称为无该估计量称为无偏估计。偏估计。无偏性无偏性有效性有效性当当 为为
11、 的无偏的无偏估计时,估计时, 方差方差 越小,无偏估计越小,无偏估计越有效。越有效。2)(E一致性一致性对于无限总体,对于无限总体,如果对任意如果对任意00)|(|nnPLim则称则称的一致估计。的一致估计。是是充分性充分性一个估计一个估计量如能完量如能完全地包含全地包含未知参数未知参数信息,即信息,即为充分量为充分量估计量估计量点估计点估计常用的求点估计量的方法常用的求点估计量的方法 1.1.数字特征法数字特征法: : 当样本容量增大时当样本容量增大时 ,用样本的数字特征去估用样本的数字特征去估计总体的数字特征。计总体的数字特征。 XXniin1221211SnXXiin例如,我们可以用样
12、本平均数例如,我们可以用样本平均数(或成数或成数)和样本方差来估计总和样本方差来估计总体的均值体的均值(或比率或比率)和方差。和方差。区间估计区间估计估计未知参数所在的可能的区间。估计未知参数所在的可能的区间。评价准则评价准则随机区间随机区间置信度置信度精确度精确度随机区间随机区间1)(ULP),(UL包含包含(即可靠程度)(即可靠程度)越大越好。越大越好。的概率的概率),(UL的平均长度的平均长度(误差范围(误差范围)越小越好)越小越好),(LUE一般形式一般形式)()(或或总体参数总体参数点估计值点估计值误差范围误差范围 :一定倍数的抽样误差:一定倍数的抽样误差nZx2例如:例如:抽样误差
13、抽样误差 n/一定时,一定时,2Z越大,越大,x概率(可靠性)大;概率(可靠性)大;随之增大,随之增大,精确度就差。精确度就差。参数的区间估计参数的区间估计待估计参数待估计参数已知条件已知条件置信区间置信区间正态总体,正态总体,2已知已知正态总体,正态总体,2未知未知非正态总体,非正态总体,n30有限总体,有限总体,n30(不放回抽样)(不放回抽样)总体均值总体均值 ()nZX/2nZX/2nStXn/)1(212NnNnZX未知时,用未知时,用S未知时,用未知时,用S222121221)(nnZXX)(21XX 21)2(21121nnStpnn222121221)(nnZXX两个正态总体两
14、个正态总体2221,已知已知两个正态总体两个正态总体2221,未知但相等未知但相等两个非正态总体两个非正态总体,n1,n230两个总体两个总体均值之差均值之差1-2待估计参数待估计参数已知条件已知条件置信区间置信区间无限总体,无限总体,np和和nq都大于都大于5总体成数总体成数 (p)无限总体,无限总体, N1P15, n1q15N2P25, n2q25两个总体两个总体成数之差成数之差(P1-P2)有限总体,有限总体,np和和nq都大于都大于5nqPZP212NnNnqpZP222111221)(nqPnqPZPP有限总体,有限总体, N1P15, n1q15N2P25, n2q2511)(2
15、22222111111221NnNnqPNnNnqPZPP待估计参数待估计参数已知条件已知条件置信区间置信区间正态总体正态总体总体方差总体方差 两个正态总体两个正态总体两个总体方两个总体方差之比差之比)(22212222) 1(,) 1(SnSn2221/21222122221/,/FSSFSS样本数的确定样本数的确定待估计参数待估计参数已知条件已知条件样本数的确定样本数的确定正态总体,正态总体,2已知已知总体均总体均值(值() 例:误差范围例:误差范围简简单单随随机机抽抽样样2222xZn有限总体,不放回抽样,有限总体,不放回抽样,2已知已知2222222ZNNZnx222pPqZnPqZN
16、PqNZnp22222总体成数总体成数 (P)服从正态分布服从正态分布有限总体,不放回抽样有限总体,不放回抽样Pxx2pp2 基本思想基本思想 检验规则检验规则 检验步骤检验步骤 常见的假设检验常见的假设检验 方差分析方差分析 基本思想基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是的,那么不利于或不的,那么不利于或不能支持这一假设的事件能支持这一假设的事件A(小概率事件)在一次试(小概率事件)在一次试验中几乎不可能发生的;要是验中几乎不可能发生的;要是,就有理由怀疑该假设的真实性,就有理由怀疑该假设的真实性,这一假这一假设。设。总总 体体(某种假设)(某种假设)抽
17、样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生假设的形式:假设的形式: H0原假设,原假设, H1备择假设备择假设 双尾检验:双尾检验:H0:=0 , H1:0单尾检验:单尾检验: H0: = 0 , H1:0 H0: = 0 , H1:0 假设检验就是根据样本观察结果对原假设(假设检验就是根据样本观察结果对原假设(H0)进行检验,不拒绝)进行检验,不拒绝H0,就否定,就否定H1;拒绝;拒绝H0,就接受,就接受H1。 检验规则检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,超过检验
18、过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝了临界点,拒绝H0;反之,差异不显著,不拒绝;反之,差异不显著,不拒绝H0差差 异异|0X|0X两类错误两类错误不拒绝或拒绝不拒绝或拒绝H0,都可能犯错误,都可能犯错误I类错误类错误弃真错误,弃真错误, 发生发生 的概率为的概率为 II类错误类错误取伪错误,发生取伪错误,发生 的概率为的概率为检验决策检验决策 H0为真为真 H0非真非真拒绝拒绝H0 犯犯I类错误(类错误() 正确正确接受接受H0 正确正确 犯犯II类错误(类错误() 怎样确定怎样确定c?大大就小,就小,小小就大就大 显著性水平,取值:显著性水平,取值:0.1,
19、 0.05, 0.001, 等。如果犯等。如果犯I类错误损失类错误损失更大,为减少损失,更大,为减少损失,值取小;如果犯值取小;如果犯II类错误损失更,类错误损失更,值取大。值取大。 确定确定,就确定了临界点,就确定了临界点c。),(2nNXX) 1 , 0 (NnXZ|2Z2Z2Z0 当检验判断为不拒绝原假设当检验判断为不拒绝原假设H0时,就有可能犯取伪的错误即时,就有可能犯取伪的错误即II类错类错误。误。确定犯第确定犯第类错误的概率类错误的概率比较困难比较困难 ,具体计算可根据书上的例,具体计算可根据书上的例子。子。统计上把统计上把 称为统计检验的势,它是原假设实际上是错误的应该被拒绝称为
20、统计检验的势,它是原假设实际上是错误的应该被拒绝的概率。的概率。 II类错误的概率类错误的概率的计算的计算1 检验步骤检验步骤根据具体问题的要求,根据具体问题的要求,建立总体假设建立总体假设H0,H112选择统计量选择统计量确定确定H0为真时的抽样分布为真时的抽样分布3给定显著性水平给定显著性水平,当原假设,当原假设H0为真时,求出临界值。为真时,求出临界值。计算检验统计量的数值计算检验统计量的数值与临界值比较与临界值比较4 几种常见的假设检验几种常见的假设检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:022z(2) H0: = 0 H1:0(3) H0: =
21、 0 H1:0z0z0nxZ0正态总正态总体体2已已知知ZZ2Z2Z条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:022t(2) H0: = 0 H1:0(3) H0: = 0 H1:0t0t0nsxt02t2t0正态总正态总体体2未未知知(n30)tt条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:022z(2) H0: = 0 H1:0(3) H0: = 0 H1:0z0z02Z2Z0nxZ0nSxZ0非正态非正态总体总体n302已知或已知或未知未知ZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: 1=2 H1:
22、 1 2 22z(2) H0:1 = 2 H1: 1 2 (3) H0: 1 = 2 H1:1 2 z0z02Z2Z022212121nnxxZ两个正两个正态总体态总体2122,已知已知ZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: 1 = 2 H1: 1 2 22t(2) H0: 1 = 2 H1: 1 2 (3) H0: 1 = 2 H1: 1 2 t0t02t2t0两个正态两个正态总体总体2122,未知,未知,但相等但相等2) 1() 1(21222211nnSnSnSptt212111nnSxxtp条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:1
23、 = 2 H1:1 2 22(2) H0:1 = 2 H1:1 2 (3) H0:1 = 2 H1:1 2 0z02Z2Z0两个非两个非正态体正态体n130 n2302122,已知或已知或未知未知22212121nnxxZ22212121nSnSxxZzzZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:P=P0 H1:PP022z(2) H0:P = P0 H1:PP0(3) H0:P = P0 H1:PP0z0z02Z2Z0np5nq5nqpppZ000ZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:P1=P2 H1:P1 P2 22z(2) H0:
24、P1 P2 H1:P1 P2(3) H0:P1 P2 H1:P1 P2z0z02Z2Z0n1p15n1q15n2p25n2q252122112121nnpnpnpnqpnqpppZZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布222) 1(Sn2020:H2021:H22) 1(22) 1(21nn2020:H2021:H2020:H2021:H222) 1( n2) 1(1n条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布22210:H22211:H22210:H22211:H22210:H22211:H2222222
25、1/SSF ) 1, 1(2) 1, 1(212121nnnnFF)1, 1(21 nnF) 1, 1(121nnFFFF 方差分析方差分析一、问题的提出一、问题的提出同一原材料同一原材料加工产品质加工产品质量量产地产地各组产品的各组产品的质量是否有质量是否有显著差异?显著差异?随机随机 原则原则一个班级一个班级 的学生,的学生,某门课程某门课程的成绩的成绩 地域地域 分组分组各组学生的成绩各组学生的成绩是否有显著差异是否有显著差异?差异差异随机误差随机误差系统误差系统误差随机随机 原则原则加以比较加以比较若存在显著性差异,则说明该因素的影响是显著的若存在显著性差异,则说明该因素的影响是显著的
26、二、假定条件二、假定条件各组水平都服从正态分布,均值和方差未知,但方各组水平都服从正态分布,均值和方差未知,但方差相同差相同),(2iiNX(i=1,2,3, ,k)三、单因素方差分析三、单因素方差分析H0:各水平的均值相等:各水平的均值相等 H1:各水平均值不全相等各水平均值不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和+组内离差平方和组内离差平方和 离差平方和:离差平方和:SST= SSB + SSE自由度:自由度: n-1 = k-1 + n-k方差:方差: MST=MSB + MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即: F=MSB/MSE), 1(k
27、nkF检验规则检验规则学员成绩表1234职员家庭6.27.89.18.9工人家庭5.45.86.97.5农民家庭5.16.35.97.5方差分析:单因素方差分析SUMMARY组计数求和平均方差职员家庭4328 1.766667工人家庭425.66.40.94农民家庭424.86.21方差分析差异源SSdfMSFP-valueF crit组间7.7866672 3.893333 3.151079 0.091771 4.256492组内11.129 1.235556总计18.9066711因为:因为:F=3.15 (0.05)所以接受原假设,认为不同的家庭背景对学员成绩没有所以接受原假设,认为不同
28、的家庭背景对学员成绩没有显著影响。显著影响。 四、不考虑交互作用的两因素方差分析四、不考虑交互作用的两因素方差分析H0 (A):因素因素A的的k个水平的均值相等个水平的均值相等 H1:不全相等不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和 +组内离差平方和组内离差平方和 离差平方和:离差平方和:SST= SS(A)+SS(B)+ SSE自由度:自由度: kh-1 = k-1 +h-1 + (k-1)(h-1)方差:方差: MST=MS(A)+MS(B) +MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即: F(A)=MS(A)/MSE F(B)=MS(B)/MSE
29、H0(B): 因素因素B的的h个水平的均值相等个水平的均值相等 H1:不全相等不全相等)1)(1( , 1(hkkF检验规则检验规则)1)(1( , 1(hkhFB1B2B3B4A115171518A219151815A316191817方差分析:无重复双因素分析SUMMARY计数求和平均方差A146516.252.25A246716.754.25A347017.5 1.666667B1350 16.66667 4.333333B2351174B3351173B4350 16.66667 2.333333 方差分析差异源SSdfMSFP-valueF crit行3.1666672 1.583333 0.3931030.69115 5.143249列0.3333333 0.111111 0.0275860.99317 4.757055误差24.166676 4.027778总计27.6666711因为:因为:F(A)=0.3935.14 F(B)=0.028 (0.05) P(B)(0.99) (0.05)所以接受原假设,认为不同的机器设备和不同的工艺方法所以接受原假设,认为不同的机器设备和不同的工艺方法对生产量都没有显著影响。对生产量都没有显著影响。 五、考虑交互作用的两因素方差分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑工程设计标准试题及答案
- 2025年入团价值追求试题及答案
- 2025年中级会计考试考试策略与试题及答案
- 审计师考试复习中的心理调整试题及答案
- 护理教学法试题及答案解析
- 审计报告中的信息披露要求试题及答案
- 一级建造师考试新形式试题及答案
- 民用航空器维修人员考试模拟试题及答案
- 入团考试2025年行动力评估试题及答案
- 审计全过程控制试题及答案
- GB/T 17766-2020固体矿产资源储量分类
- GB/T 1599-2014锑锭
- 学前教育学 黄人颂
- 《行政组织学通论》配套教学课件
- 曾国藩识人用人之道课件
- 师德师风教育整顿谈心谈话记录表
- 铸造作业指导书
- 电缆修复规范
- 储层地质学(中国石油大学)-2沉积相分析
- 大班-社会语言-小学生的一天-课件
- 大众特殊要求:Formel-Q第八版(中文版)
评论
0/150
提交评论