版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一节 事件与概率(一) 概率的定义 研究随机试验,需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的 统计规律性。能够刻画事件发生可能性大小的数量指标称之为概率 (probability) 。事件 A 的概率 记为 P( A)。1概率的古典定义(先验概率)随机试验具有以下特征,称为古典概型。1. 试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个;2. 各试验的结果出现的可能性相等,即所有基本事件的发生是等可能的;3. 试验的所有可能结果两两互不相容。对于古典概型,概率的定义:设样本空间由 n 个等可能的基本事件所构成, 其中事件 A 包含有 m 个基本事件, 则事件 A
2、 的概率为m/n,即P(A)=m/n 这样定义的概率称为古典概率 2概率的统计定义(经验概率)在相同条件下进行 n次重复试验,如果随机事件 A发生的次数为 m,那么m/n称为 随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地 接近某一数值 p,那么就把 p称为随机事件 A的概率(probability)。2概率的运算法则加法法则:互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和。即 P(A+B)=P(A)+P(B) 。加法定理对于多个两两互斥的事件也成立。P(A+B+N)=P(A)+P(B)+ P(N)P(A+B)=P(A)+P(B)-P(AB)
3、乘法法则:如果 A 事件和 B 事件为独立事件,则事件 A 与 B 事件同时发生的概率等于两独立 事件概率的乘积,即:P(AB)=P(A) ?P(B)乘法定理对于 n 个相互独立的事件也成立,即P(A1A2 ?An)=P(A1) P(A2) ?P (An)书上例题第二节 常用离散变量的理论分布一、二项分布(一) 贝努里试验及其概率函数: 指只有两种可能结果的随机试验,我们将其中比较关注的结果称为“成功 ”,另一个结果称为 “失败 ”。将某随机试验重复进行 n 次,若各次试验结果互不影响,即每次试验结果出现的概 率都不依赖于其它各次试验的结果,则称 n 次试验是独立的 对于 n 次独立的试验如果
4、每次试验结果出现且只出现对立事件A与 之一,在每次试验中出现 A的概率是常数p(0<p<1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为 n重贝努里试验,简称贝努里试验在n重贝努里试验中,事件A可能发生0, 1, 2,,n次,来求事件 A恰好发生k(0< kw n)次的概率 Pn(k)。例:抛掷4次硬币,正面朝上(A)出现2次的概率。先取 n=4, k=2。在4次试验 中,事件A发生2次的方式有以下 C42种:一般,在n重贝努里试验中,事件 A恰好发生k(0w kw n)次的概率为Pn(k) =Cnkpkqn 上k=0,1,2,n(二) 二项分布的定义及性
5、质1、二项分布的定义:设随机变量 x所有可能取的值为零和正整数:0,1,2,,n,且有:Pn(k) nCfpkqZk=0,1,2,n其中p> 0, q>0, p+q=1,则称随机变量x服从参数为n和p的二项分布,记为: B(x;n,p)。二项分布是一种离散型随机变量的概率分布。参数n称为正整数离散参数;p是连续参数,它能取 0与1之间的任何数值(q=1 - p)。2、二项分布的性质:容易验证,二项分布具有概率分布的一切性质,即:(1) P(x=k) = Pn(k)(k=0,1,,n)(2) 二项分布的概率之和等于1,即nk k n -knCn p q = (q p) -1k=0mP
6、(x m) = Pn (k m)=為 C: pkqn-kkmnP(x _ m) = Pn (k _ m)Cn pkqnkm? P(m=Pn(E Ekm?)八 Qpkqn"(m1<m2)k 和i3、二项分布的图形特征:二项分布的图形由 n和p两个参数决定:(1) 当p值较小且n不大时,分布是偏斜的。但随着 n增大,分布逐渐趋于对称;(2) 当p值趋于0.5时,分布趋于对称;(3) 对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至 达到最大值,随后单 调减少。此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当 n时,二 项分布的极限分布是正态分布。(n &g
7、t; 30,np> 5,nq > 5时,近似正态分布。)(三) 二项分布概率计算及应用条件二项分布的应用条件有三:1. 各观察单位只具有互相对立的一种结果,属于二项分类资料;2. 已知发生某一结果的概率为p,其对立结果的概率则为1-p=q,要求p是从大量观察中获得的稳定数值;3. n个观察单位的观察结果互相独立,即每个观察单位的结果不会影响到其它观察单位的观察结果(四) 二项分布的平均数与标准差统计学证明,服从二项分布B(n, p)的随机变量之平均数 、标准差b与参数n、p有如下关系:当试验结果以事件 A发生次数k表示时(Tnpq三. 几何分布(Geometry distribut
8、ion)在贝努里试验中,每次试验成功的概率为p,失败的概率为 q=1-p ,设试验进行到第-次才出现成功。(xi)的分布列为p(=k=pqq kg (k=1.2)是几何级数的、pq二一般项。因此称它为几何分布记为-g(k; p)。四、超几何分布对于抽样调查,只有在大群体(即总体比样本相对大很多)的情况下,二项分布的独立试验要求才能够近似得到满足(重复抽样)。但如果研究对象是小群体,这时总体单位不多,一般只有几十个。假定总体只有两类,其中K个成功类,(N-K )个为失败类,这时如果从总体中抽取一容量为n的样本,那么成功的概率将不再恒定,也就是二相分布所要求的独立试验的条件不再被满足,而超几何分布
9、将适合于这种 小群体的研究。形式:P(X=k)=,xn-xH (x; N, n, K)年严CnK=0,1,min(n,M)超几何概型,例:产品检验。有 N个产品(其中有 K个合格品)从 N个产品中取n个检验, 求n中有X个合格品的概率。(即X 合格品个数) 不回置抽样!期望:E ( X) =nK/N=np方差:D(X)=npq(N-n)/(N-1)当研究对象是小群体,并且采用不回置抽样时,成功的概率将不再恒定,也就是二项分布 所要求的独立试验的条件不再被满足,而超几何分布将适合于这种情况的研究。当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,可用二项分布来近似 超几何分布。一般当 n
10、/N < 0.1时,这种近似就是可以采用的。五、泊松分布泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。例:盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000(一)泊松分布的定义与特征1、定义:若随机变量 x(x=k)只取零和正整数值0, 1, 2,,且其概率分布为xP(x =k)e_,x!x=0 , 1, (稀有事件出现的次数)其中入0 ; e是自然对数的底数(e=2.71828),则称x服从参数为 入的泊松分布(Poisson s distribution),记为 P(x;入)2、泊松分布重要的特征平均数和方差相等,都等
11、于常数入,即= 6 2=入=np3、泊松分布的图形特征:入是泊松分布所依赖的唯一参数。入值愈小分布愈偏倚,随着入的增大,分布趋于对称。当入=20时分布接近于正态分布;当 入=50时,可以认为波松分布呈正态分布。在实际工作中,当入20时就可以用正态分布来近似地处理泊松分布的问题(二) 泊松分布的概率计算泊松分布的概率计算依赖于参数 入,只要参数入确定了,把k=0,1,2,代入公式即可 求得各项的概率。但是在大多数服从泊松分布的实例中, 分布参数入往往是未知的, 只能从所观察的随机样本中计算出相应的样本平均数作为入的估计值,将其代替公式中的入,计算出k = 0,1,2,时的各项概率。例:一个合订本
12、共100页,假定每页上印刷错误的,数目X服从泊松分布(入=1),计算该合订本 中各页的印刷错误都不超过4个的概率。解:由题目P(x;1).P(X W 4)= P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4).查表求值 =?+?+?+?+?所求概率为(?)100=0.0045。【例】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得 如下经计算得每毫升水中平均细菌数 菌数/ml(水)服从泊松分布。以X =0.500,方差S2=0.496。两者很接近,X =0.500代替公式中的入,得故可认为细P(x 二 k)计算结果如下表。0.5kk!-0.5(k=0,1
13、,2 )400个记录细菌数的泊松分布M冰中细菌数中Ip2应合计Q实际次数卩24 %12032400频率卩0.6075P0.30000.0775P0,0150pLOOP概率仪0.6065P0,30330.0758P0.01443LOOP理论次数厂242烦;121.32730.325加400可见细菌数的频率分布与入=0.5的波松分布是相当吻合的,进一步说明用波松分布 描述单位容积(或面积)中细菌数的分布是适宜的。注意:泊松分布的应用条件与二项分布相似(三) 泊松分布与二项分布泊松定理:设随机变量B(x;n,p)。 当n很大时,p很小。有以下近似式:其中入=np实际计算中,n> 10,pw 0
14、.1,近似效果就较好,而n >100, np w 10时近似效果就很好。由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布。例见:P133,例 8.2.3(四)泊松分布与正态分布的关系当,较小时,Piosson分布呈偏态分布,随着,增大,迅速接近正态分布,当 _20时,可以认为近似正态分布。第三节常用连续型随机变量的理论分布 、正态分布正态分布是最重要的概率分布。因为第一,许多自然现象与社会现象,都可用正态分布加以叙述;第二,许多概率分布以正态分布为其极限;第三,许多统计量的抽样分布呈现正态分布。因此,许多统计分析方法都是以正态分布为基础的(一)正态分布的概率函数若连续型随
15、机变量 x的概率分布密度函数为(x 1)2其中为平均数,(T 2为方差,则称随机变量 x服从正态分布(normal distribztion),记为x N(卩,c 2)。相应的概率分布函数为(X卩)21X2F (x) - e 2二 dxa J2齐二标准正态分布的三个常用概率17 / 1868.26% II -;(二)正态分布的特征1. 正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为2. f(x)在x=i处达到极大,极大值3. f(x)是非负函数,以 x轴为渐近线,分布从4. 曲线在x= 1 土 t处各有一个拐点,即曲线在 在1 - T , 1 + T 区间内是上凸的;5. 正态分布有平均数
16、 1和标准差6. 分布密度曲线与横轴所夹面积为s至 +m;(-m , 1 - T )和(1 + T,+m )区间上是下凸的,p( - : X )二T两个参数。1,即:是位置参数,(T是变异度参数。亠. 1- ; 2 二 e(X)22戸dx(三)标准正态分布正态分布是依赖于参数 1和T的一簇分布。将一般的 态分布,应用就方便了。称1 =0, T 2=1的正态分布为标准正态分布标准正态分布的概率密度函数及分布函数分别记作Ng ,T 2)转换为1 = 0 , T 2=1的正0 (z)和(z),得:(z )1(Z)eCOdz随机变量z服从标准正态分布,记作zN(0, 1)。对于任何一个服从正态分布N(
17、卩,2)的随机变量x,都可以通过标准化变换:z=(x- (I )/ b将其变换为服从标准正态分布的随机变量z。z称为标准正态变量或标准正态离差(四)正态分布的概率计算1. 标准正态分布的概率计算设z服从标准正态分布,则z在z1,z2 )何内取值的概率为:=(z2)(z1)而(z1)与(z2)可由附表查得【例】 已知z-N(0 , 1),试求:(1) P(zv -1.64) = ?(2) P (z> 2.58)=?(3) P ( | z|> 2.56)=?(4) P(0.34W zv 1.53) =?关于标准正态分布,以下几种概率应当熟记:P (-1 w zv 1) =0.6826P
18、 (-2< zv 2) =0.9546P (-3< zv 3) =0.9974P (-1.96 w zv 1.96) =0.95P (-2.58 w zv 2.58)=0.99z在上述区间以外取值的概率分别为:P( | z | > 1)=2 (-1)=1- P(-1 w zv 1)=1-0.6826=0.3174P( | z | > 2)=2 (-2)=1- P (-2 w zv 2) =1-0.9545=0.0455P( | z | > 3)=1-0.9973=0.0027P( | z | > 1.96)=1-0.95=0.05P( | z | >
19、2.58)=1-0.99=0.012 .般正态分布的概率计算正态分布密度曲线和横轴围成的区域,其面积为1,是一个必然事件。若随机变量x服从正态分布 N(卩,b2),则x的取值落在任意区间x1, x2)的概率,记作P(x1w xvx2),等于这部分曲边梯形面积。即:.(x-叮1X2 一 2P(x X x2) - e 誤 dx、2 二xi对上式作变换 z=(x-卩)/c ,得dx=(T dz,故有P(为 _X : x2)二-Ud22eX2X1T1 2(X2_J/;-于Ue2 西du(X1 J)/;二1 21 z2 一扌= e 2(Z2)(Z1)2 Z1其中,z1 = (x1-u )/b, z2=
20、(x2-卩)/b)这表明服从正态分布 N(卩,b 2)的随机变量x在x1, x2)内取值的概率,等于服从标准正态 分布的随机变量z在(x1-卩)/ b , (x2-卩)/b)内取值的概率。因此,计算一般正态分布的 概率时,只要将区间的上下限作适当变换 (标准化),就可用查标准正态分布的概率表的方法 求得概率了。【例】设 x服从卩=30.26, b 2=5.102的正态分布,试求P(21.64< x v 32.98)。令则z服从标准正态分布,故= P(-1.69W zv 0.53)=(0.53)-(-1.69)=0.7019-0.0455仁0.6564关于一般正态分布,以下几个概率是经常用
21、到的。P( - b < x v+ b )=0.6826Pg -2 b w xv i +2 b ) =0.9546P ( i -3 b w xv i +3 b ) =0.9974P ( i -1.96 b w x i +1.96 b )=0.95P ( i -2.58 b w x i +2.58 b )=0.993、正态分布分位点计算 正态分布的分位点的定义门(x )= p(X 乞 x 1-:求其中的X:4、单侧概率与双侧概率统计学中,把随机变量 x落在区间(卩-k d,卩+k b )之外的概率称为双侧(两尾)概率, 记作a。对应于双侧概率可以求得随机变量x小于卩kb或大于卩+kd的概率,
22、称为单侧概率,记作a / 2。如,x落在(卩-1.96 d,卩+1.96 d )之外的双侧概率为 0.05,而单侧概率为 0.025。即卩P(x v 卩-1.96 d )=P(x > 卩 +1.96 d )=0.025x落在(卩-2.58 d ,卩+2.58 d )之外的双侧概率为 0.01,而单侧概率P(x v-2.58 d )=P(x > 卩 +2.58 d )=0.005(五)二项分布及泊松分布与正态分布的关系对于二项分布,在 nfg,厂0,且np=入(较小常数)情况下,二项分布趋于泊松分 布。在这种场合,泊松分布中的参数入用二项分布的 np代之;在nis, 0.5时,二项分
23、布趋于正态分布。在这种场合,正态分布中的卩、d 2用二项分布的np、npq代之。在实际计算中,当pv 0.1且n很大时,二项分布可由泊松分布近似;当p>0.1且n很大时 ,二项分布可由正态分布近似。对于泊松分布,当 入is时,泊松 分布以正态分布为极限。在实际计算中,当入20时,用泊松分布中的 入代替正态分布中的卩及d 2,即可由后者对前者进行近似计算。二、抽样分布与中心极限定理研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可 从两方面着手:一是从总体到样本,这就是研究抽样分布(sampling distribution)的问题;二是从样本到总体,这就是统计推断(
24、statistical inference)问题(一)抽样分布的含义与无偏估计量1、抽样分布的含义:统计推断是以总体分布和样本抽样分布的理论关系为基础的。由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量也将随 样本的不同而有所不同。因而样本统计量也是随机变量,也有其概率分布,我们把统计量 的概率分布称为抽样分布。2、无偏估计在统计学上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计 数为总体相应参数的无偏估计值。设有一 n=3的总体,具有变量 3, 4, 5;求得 卩=4 , d 2=0.6667, d =0.8165现以n=2作独立的回置抽样,总共
25、得 Nn=32=9个样本。抽样结果列入下表:N=3 n=2时抽样的平均数方差标准差样本编号样本值平均数方差标准差1234567893, 33, 43, 54 , 34 , 44 , 55 , 35 , 45 , 53.03.54.03.54.04.54.04.55.00.00.52.00.50.00.52.00.50.00.00000.70711.41420.70710.00000.70711.41420.70710.0000刀36.06.05.6567从上表的资料可以求出:样本平均数的平均数卩x=4样本方差的平均数 卩S2=0.6667= d 2样本标准差的平均数 卩S=0.6285丰0.8
26、165= d所以,惟有样本标准差s的平均数不是总体标准差d的无偏差估计值。其余两个参数为无偏差估计值。(二)样本平均数的抽样分布1、样本平均数抽样分布的含义及其参数设有一个总体,总体平均数为卩,方差为d 2,总体中各变数为 xi,将此总体称为原总体。现从这个总体 中随机抽取含量为 n的样本,样本平均数记为。可以设想,从原总体中可抽出很多甚至无穷多个含量为n的样本。如果从容量为 N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起
27、来便构成一个新的总体,平均数 就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样 分布。由这些样本算得的平均数与原总体平均数卩相比往往表现出不同程度的差异。这种差异是由随机抽样造成的,称为抽样误差(sampling error)。由样本平均数构成的总体称为样本平均数的抽样总体,其平均数和标准差分别记为_和 匚_。二X是样本平均数抽样总体的标准差,简称标准误(standard error),它表示平均数抽样误差的大小。统计学上已证明总体的两个参数与x总体的两个参数有如下关系:xCT -XTn2、中心极
28、限定理2, 3, 3, 4。根据 卩=工 x/N 和 d 2=2 (x-卩)2/N设有一个N=4的有限总体,变数为求得该总体的卩、d 2、d为:卩=3, d 2=1 / 2, d =1/21/2=0.707从有限总体作回置随机抽样, 所有可能的样本数为 Nn其中n为样本含量。以上述 总体而论,如果从中抽取 n=2的样本,共可得 42=16个样本;如果样本含量 n为4,则一共可抽得 44=256个样本。分别求这些样本的平均数,其次数分布如下表所示。在n=2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为f x/Nn =48.0/16 =3 =、' fX2-('fX)2/N
29、nNnNn148_482 /1616(r2/nJi 2 八 2, n表 N=4, n=2和n=4时的次数分布矿=4=16q沪=4 *=25闻和产用戸心斥心抒2-E224.00p2,0肿1匚2. OOP4.00022.5卩4心10.Op25.022.25卩8卩18.00*40.50003.W6卩18.0*54.00*32.50P2品70.00P175.0000j3 5心斗14 249.022.75P56p154 00423.5000424.0*>汁皿3叫70210 00*630.0000中q3.25P5脅182.00591.5 000ppp3.50PPS.OOp343.0000ppp3.7
30、5并30.00P1 12.5000仪p否4.OOP24皿16.0000Zp16门48 0148.00恥256e768 002336J0D0P同理,可得n=4时:亠 x - 768 / 256 - 3 - 二 2 = 32/256 二 1/8 二(1/2)/4八 2/n验证了"x二"Lx y八n的正确性。也可以将表中两个样本平均数的抽样总体作次数分布图。由以上模拟抽样试验可以看出,虽然原总体并非正态分布,但从中随机抽取样本,即使样本含量很小,样本平均数的分布却趋向于正态分布形式。随着样本含量n的增大,样本平均数的分布愈来愈从不连续趋向于连续的正态分布。当 n >30时,
31、 的分布就近似正态分 布了。 X变量与 变量概率分布间的关系可由下列两个定理说明:(1) 若随机变量x服从正态分布 Ng2); x1、x2、xn,是由x总体得来的随机样本,则统计量=工x / n的概率分布也是正态分布,且有,即服从正态分布 Ng ,b 2/ n)。(2)若随机变量x服从平均数是 卩,方差是(T 2的分布(不是正态分布);x1、x2、xn,是由此总体得来的随机样本, 则统计量=工x/n的概率分布,当 n相当大时逼近正态分布 N(u 2/n)。这就是中心极限定理。中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n >30,就可认为的分布是正态
32、分布。若x的分布不很偏斜,在 n> 20时,的分布就近似于正态分布了由中心极限定理知,只要样本容量适当大,不论总体分布形状如何,其的分布都可看作为正态分布,且具平均数"和方差 2 J 。在实际应用上,如 n>30就可以应用这n一定理。平均数的标准化分布是将上述平均数 x转换为z变数。3、标准误标准误(平均数抽样总体的标准差)的大小反映样本平均数的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数间差异程度大,样本平均数的精确性低。反之,小,样本平均数的精确性高。的大小与原总体的标准差b成正比,与样本含量 n的平方根成反比。从某特定总体抽样,因为b是一常数,所以只有
33、增大样本含量才能降低样本平均数的抽样误差。在实际工作中,总体标准差b往往是未知的,因而无法求得。此时,可用样本标准差 S估计b。于是,以估计 。记为 , 称作样本标准误或均数标准误。样本标准误是平均数抽样误差的估计值。若样本中各观测值为x1、x2、xn,则SX =' (x-x)2n(n-1)' x2 - (' x)2 / nn(n-1)注意:样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别是样本标准差 s是反映样本中各观测值的变异程度,它的大小说明了对该样本代表性的强弱。的标准差,它是抽样误差的估计值,其大样本标准误是样本平均数小说明了样本间变异程度的大
34、小及精确性的高低。(二)两个独立样本平均数差数的分布ii _假定有两个正态总体各具有平均数和标准差为' 1, '和 2 , " 2,从第一个总体随机抽取n 1个观察值,同时独立地从第二个总体随时机抽取皿个观察值。这样计算出样本平均数和标准差yi,si 和 V2,S2。从统计理论可以推导出其样本平均数的差数()的抽样分布,具有以下特性出y2(1)如果两个总体各作正态分布,则其样本平均数差数(Yi -?2N()准确地遵循正态分布律,2 )丿。-yi -Y2无论样本容量大或小,都有23 / 18(2)两个样本平均数差数分布的平均数必等于两个总体平均数的差数,即(3)两个独立
35、的样本平均数差数分布的方差等于两个总体的样本平均数的方差总和,即2+為22n2其差数标准差为:ni2刃一丫2Z值这个分布也可标准化,获得(儿y2)Cnin2小结:若两个样本抽自于同一正态总体,则其平均数差数的抽样分布不论容量大小亦作正 态分布具:yi 好2 _' yi 2 _v nin2若两个样本抽自于同一总体,但并非正态总体,则其平均数差数的抽样分布按中心 极限定理在n 1和n2相当大时(大于30)才逐渐接近于正态分布。_若两个样本抽自于两个非正态总体,当相差不太远时,也可近似地应用正态接近方法估计平均数差数出现的概率,当然这与匚;种估计的可靠性得依两总体偏离正态的程度和相差大小而转
36、移。 (三)二项总体的抽样分布二项总体的分布参数(成数):八P二 2 二 p(i - p)二 pq: 二n 1和n2相当大、而i21、平均数 方差: 标准差2、样本平均数(成数)的抽样分布从二项总体进行抽样得到样本,样本平均数(成数)抽样分布的参数为: 平均数:方差:pq标准误:n-yP)(四)不重复抽样的修正系数前所讲的抽样分布和抽样平均误差的计算公式,都是就重复抽样而言的。可以证明,采用不重复抽样时,平均数和比例的抽样平均误差应为:二(X)RP)P(1_P)(N 下n ( N -1)P(1- P)n(1(其中:n/N为抽样可见,不重复抽样的抽样平均误差公式比重复抽样的相应公式多一个系数 这
37、个系数称为不重复抽样修正系数。当n很大时,需气匚n 比例)。实际中,当抽样比例很小时,(一般认为小于 5% ),不重复抽样的抽样误差常采用 重复抽样的公式计算。三、t分布1、t分布的定义:若xN(卩,2), 贝UN(卩,b 2/n)。 将随机变量标准化得:,则zN(0,1)。当总体标准差b未知时, 以样本标准差 S代替(T所得到的统计量记为t。在计算时,由于采用S来代替b ,使得t变量不再服从标准正态分布,而是服从t分布(t - distribztion)。它的概率分布密度函数如下:2df_1_(df_1)/2l_)rr(df /2) df式中,t的取值范围是(-8, + 8);df=n-1为自由度。r -函数丨-函数的定义:】r = xr4edx0-函数的定义域:自由度 df(degree of freedom )的含义df=k=n-1T分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 张家口市崇礼县2025-2026学年第二学期四年级语文第七单元测试卷(部编版含答案)
- 洛阳市西工区2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 周口市商水县2025-2026学年第二学期三年级语文期末考试卷(部编版含答案)
- 海藻胶提取工岗前技术理论考核试卷含答案
- 在线学习服务师岗前客户关系管理考核试卷含答案
- 芳烃抽提装置操作工岗前技能安全考核试卷含答案
- 半导体分立器件和集成电路装调工安全生产意识测试考核试卷含答案
- 充电式工具电池组合装配工安全专项知识考核试卷含答案
- 吕梁市交口县2025-2026学年第二学期三年级语文期末考试卷(部编版含答案)
- 黄南藏族自治州尖扎县2025-2026学年第二学期四年级语文第七单元测试卷(部编版含答案)
- 预制梁整体双轨自行式钢台座设计
- 第一章-总论课件
- 烟叶分级工(技师)考试题库-烟叶生产知识
- 新《安全生产法》违法处罚行为一览表
- 2022年高三二模语文试题分类汇编(上海专用) 专题10 文学类现代文阅读1 (含解析)
- 《中医学》第七章 防治原则与治法
- 2021-2022年上海市计算机统招专升本摸底训练【带答案】
- GB/T 37977.23-2019静电学第2-3部分:防静电固体平面材料电阻和电阻率的测试方法
- GB/T 325.3-2010包装容器钢桶第3部分:最小总容量212 L、216.5 L和230 L闭口钢桶
- 初中PISA科学试题选
- 汽车发展史-课件
评论
0/150
提交评论