第四章统计假设检验_第1页
第四章统计假设检验_第2页
第四章统计假设检验_第3页
第四章统计假设检验_第4页
第四章统计假设检验_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二节 样本平均数的假设检验魏玉清一、大样本平均数的假设检验-u检验nxxxuxb0u.转换进行对1、u检验的基本原理c.将计算所得将计算所得u值与设定显著性水平下的否定无值与设定显著性水平下的否定无效假设的临界值效假设的临界值u比较比较a. 根据正态分布的理论分布,计算抽样平均数总根据正态分布的理论分布,计算抽样平均数总体的标准差体的标准差2、u检验的适用条件抽样分布为正态分布(1 1)基础总体为正态分布,无论样本容量大小,其抽样分布)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正态分布肯定为正态分布(2 2)未知基础总体,样本容量很大时,根据中心极限定理,)未知基础总体,样本容量

2、很大时,根据中心极限定理,其抽样分布也可以看作正态分布其抽样分布也可以看作正态分布nsx22 因为用的是大样本的均因为用的是大样本的均方,所以此样本的均方对方,所以此样本的均方对总体方差的估计是有效的。总体方差的估计是有效的。 直接用大样本的均方代直接用大样本的均方代替总体方差,这时替总体方差,这时3 3、一个样本平均数的检验、一个样本平均数的检验例:在江苏沛县调查例:在江苏沛县调查333333 m2 2小地老虎虫害情况的结果,小地老虎虫害情况的结果,=4.73头,头, =2.63头。用某种抽样方法随机抽得一个样本头。用某种抽样方法随机抽得一个样本 (n=30),计算得,计算得 =4.37头。

3、问这个样本对该已知总体有无代头。问这个样本对该已知总体有无代表性?表性?x解解:0a00h73. 4h :头头:注意:此处注意:此处是对总体参是对总体参数做假设数做假设)2(05. 048. 073. 437. 43063. 296. 175. 0|75. 0,48. 0uuuxxnx头a. 提出无效假设提出无效假设(一尾一尾or两尾两尾?)b. 确定一个否定确定一个否定h0的概率的概率 a a 0.05c. 检验概率计算(检验概率计算(首先判断要用什么分布首先判断要用什么分布)q q 总体标准差已知,且抽样为大样本(总体标准差已知,且抽样为大样本(n=30) 可以用可以用u检验检验d. 做出

4、推断结论并加以解释做出推断结论并加以解释根据以上计算可知样本在假定根据以上计算可知样本在假定总体中出现的概率总体中出现的概率p 0.05,即差异不显著,所以,应该接受,即差异不显著,所以,应该接受h0否否定定ha。由此,我们应该认为,由此,我们应该认为,所抽得的样本平均数对总所抽得的样本平均数对总体平均数有代表性,抽样平均数和总体平均数之体平均数有代表性,抽样平均数和总体平均数之间的差异是抽样误差造成的。间的差异是抽样误差造成的。 (1) 在两个样本的总体方差在两个样本的总体方差 和和 为已知时,用为已知时,用u检验检验21 22 由抽样分布的公式知,两样本平均数由抽样分布的公式知,两样本平均

5、数 和和 的差数标准的差数标准误误 ,在,在 和和 是已知时为:是已知时为: 1y2y21yy 212222212121nnyy并有并有:21)()(2121yyyyu 在假设在假设 下,正态离差下,正态离差u值为值为 ,故可对两样本平均数的差异作出假设检验。故可对两样本平均数的差异作出假设检验。21)(21yyyyu0:210h4 4 、两个样本平均数的检验、两个样本平均数的检验 例:例: 据以往资料,已知某小麦品种每平方米产量的据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用。今在该品种的一块地上用a、b两法取样,法两法取样,法取取12个样点,得每平方米产量个样点,得每平

6、方米产量 =1.2(kg);b法取法取8个样点,得个样点,得 =1.4(kg)。试比较。试比较a、b两法的每平方米产量是否有显著差异?两法的每平方米产量是否有显著差异?22)(4 . 0kg1y2y 假设假设h0: a、b两法的每平方米产量相同,即两法的每平方米产量相同,即 系随机误差;对系随机误差;对 显著水平显著水平 2 . 021 yy21:ah05. 0a96. 105. 0u 4022212.8,1221nn)(28870840124021kg.yy690288704121.u 因为实得因为实得|u|0.05 推断推断:接受接受 , 即即a、b两种取样方法所得的每平方两种取样方法所得

7、的每平方米产量没有显著差异。米产量没有显著差异。 210:h0:210hg 当总体的分布情况以及总体的方差未知,且样本容量很小(n30)时,只有用样本算出的均方s2来估计总体的方差,此时,分布。循标准正态分布,而是遵不再遵循化离差而其所得平均数的标准表示,用计算所得平均数标准误tssxsxnsxx二、小样本平均数的假设检验-t 检验是是指指样样本本标标准准差差,而而其其中中,snsxsxstx 1908年年w. s. gosset首先提出,又叫学生氏首先提出,又叫学生氏t分布分布(students t-distribution)1、t 分布的提出一常数),对于特定总体为为自由度(其中,分布的密

8、度函数为:1)( ,)1 ()()(!2/ )2(!2/ )1(212nttftt)(假定(假定)(假定(假定为:为:分布的平均数和标准差分布的平均数和标准差2102tt t2、u分布与分布与t分布的比较分布的比较a. t分布的平均数与分布的平均数与u分分布相同,都是布相同,都是0,并,并在在t=0处曲线最高,处曲线最高,以以0为中心左右对称为中心左右对称c. t分布的曲线性状随自由度分布的曲线性状随自由度而改变,自由度而改变,自由度越小,越小,其分布越离散,随其分布越离散,随值增大,逐渐趋近于值增大,逐渐趋近于u分布,当分布,当自由度增大到自由度增大到30时基本接近时基本接近u分布分布b.

9、与与u分布曲线相比,分布曲线相比,t分布曲线的峰高较低,分布曲线的峰高较低,两侧接近两侧接近x轴的速度轴的速度更缓慢更缓慢3 3、t t分布的概率估计分布的概率估计 tdttftf)()( 1)()()(11tdttftfttp 1)()(1)(11tdttftfttp 1)(2)(2)|(|11tdttftfttp4 4、t t 检验检验 t检验通过比较t值与t的大小关系来判断否定还是接受h0 t可以通过查附表3获得(注意是两尾的临界值) 一尾检验的t临界值t(1)通过查附表中的相应自由度下对应2的t2(2)获得 t表中,相同时,p越大,t值越小,反之亦然 因此,当计算所得|t|大于或等于表

10、中所查t时,说明,其属于随机误差的概率小于或等于规定的显著性水平,即t位于否定区内,则否定h0,否则接受h05、单个样本平均数的假设检验、单个样本平均数的假设检验 这是检验某一样本所属的总体平均数是否和这是检验某一样本所属的总体平均数是否和某一指定的总体平均数相同。某一指定的总体平均数相同。 例:某春小麦良种的千粒重例:某春小麦良种的千粒重0 0 =34g=34g,现自外,现自外地引入一高产品种,在地引入一高产品种,在8 8个小区种植,得其千粒个小区种植,得其千粒重重(g)(g)为:为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,35.6,37.6,33.4

11、,35.1,32.7,36.8,35.9,34.6,问问新引入品种的千粒重与当地良种有无显著差异?新引入品种的千粒重与当地良种有无显著差异? 检验步骤为:h0:新引入品种千粒重与当地良种千粒重指定值相同,即 =0 =34g;对ha: 34g显著水平=0.05检验计算: _y=(35.6+37.6+34.6)/8=35.2(g)83.1887 .2816 .34.6 .376 .35)(s2222222_2nyyyy 查附表3,=7时,t 0.05=2.365。现实得|t|t=2.365,故p0.05。 推断:接受h0: =34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。02764.

12、 04 .43342 .35xsxt6、 两个样本平均数的假设检验两个样本平均数的假设检验 这是由两个样本平均数的相差,以检验这两个样本所属的总体平均数有无显著差异。检验的方法因试验设计的不同而分为成组数据成组数据的平均数比较和成对数据成对数据的比较两种。(1 1)成组数据成组数据的平均数比较的平均数比较 如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数成组数据据,以组平均数组平均数作为相互比较的标准。 1、在两个样本的总体方差已知时,用u 检验。222121_2_1nnyy_2_1)()(21_2_1yyyyu 例: 据以往资料,已知某小麦

13、品种每平方米产量的2=0.4(kg)2。今在该品种的一块地上用a、b两法取样,a法取了12个样点,得每平方米 =1.2(kg);b法取得8个样点,得 =1.4(kg)。试比较a、b两法的每平方米产量是否有显著差异?_1y_2y2 . 0_2_1 yy系随机误差;021假设h0:a、b两法的产量相同,即h0: 对ha:12,=0.05)(2887. 084 . 0124 . 0, 8,12, 4 . 0_2_12122212kgnnyy69. 02887. 04 . 12 . 1u推断:接受h0: 检验计算: 因为实得|u|u0.05=1.96,故p0.05。的加权平均值,即:) 1() 1()

14、()(21_2222_1121212nnyyyyssssse2122212、在两个样本的总体方差和为未知,但可假定22=2,而两个样本又为小样本时,用t 检验。2es首先,从样本变异算出平均数差数的均方,作为对2222es21的估计。由于可假定= 2,故应为两样本均方 当n1=n2=n 时,则上式变为:2212_2_1nsnsseeyynsseyy22_2_1_2_1)()(21_2_1yysyyt由于假设h0: _2_1)(_2_1yysyyt 例:研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:y1(喷施矮壮素)y2(对照)160170160270

15、200180160250200270170290150270210230 170 从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设h0:喷施矮壮素的株高与未喷的相同或更高,即h0: ha: 184005 .37873 .233,3 .17621_2_1sssscmycmy)(688.18)9181(17.147917.1479875 .378718400_2_12cmssyye05. 3688.183 .2333 .176t 按=7+8=15,查t 表得一尾t0.05=1.753(一尾检验t0.05等于两尾检验的t0.10),现实得t=-3.05- t0.05=-1.753

16、,故p0.05。推断:否定h0: 12,接受ha: 12,即认为玉米喷施矮壮素后,其株高显著地矮于对照。(2 2)成对数据成对数据的比较的比较 若试验设计是将性质相同性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据成对数据。 成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。 设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为_2_1_yyd 它具有=n-1。若假设h0:d=0,则上

17、式改成:) 1()(2_nnddsd_ddsdt_dsdt 即可检验 则差数平均数的标准误为: 例:选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种a处理病毒,另一株接种b处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为组别1234567y1(a法)10138320206y2(b法)25121415272018d-151-6-12-7-7-12病毒在番茄上产生的病痕数目,试检验两种处理方法的差异显著性。假设:两种处理对纯化病毒无不同效果,即: ;对检验计算: 3 . 87/587/)12(.1)15(_d43.1677/)58()12(.1)

18、15(2222dss16. 4997. 13 . 8997. 16743.167_tsd查附表4, 第三节第三节 样本频率的假设检验样本频率的假设检验 许多生物试验的结果是用百分数或成数表示的,称为样本频许多生物试验的结果是用百分数或成数表示的,称为样本频率,如结实率、发芽率等,这些百分数系由计数某一属性的个体率,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求得,属数目求得,属间断性的计数资料间断性的计数资料。 在理论上,这类百分数的假设检验应按二项分布进行,即从在理论上,这类百分数的假设检验应按二项分布进行,即从二项式二项式(p+q)n的展开式中求出某项属性个体百分数的展开式中求

19、出某项属性个体百分数 的概率。的概率。 但是,如样本容量但是,如样本容量n 较大,较大,p较小,而较小,而np和和nq又均不小于又均不小于5时时, (p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布处的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的检验。理,从而作出近似的检验。 适于用适于用u检验所需的二项样本容量检验所需的二项样本容量n见下表。见下表。 p p pn(样本百分数样本百分数)0.500.400.300.200.100.05(较小组次数较小组次数)152024406070n(样本容量样本容量)3050802006001400 表表4.1 适于用正态离

20、差检验的二项样本的适于用正态离差检验的二项样本的 和和n值表值表pn一、一个样本频率的假设检验一、一个样本频率的假设检验 检验某一样本频率检验某一样本频率 所属总体频率与某一理论值或期望所属总体频率与某一理论值或期望值值p0的差异显著性。的差异显著性。 由于样本频率的标准误由于样本频率的标准误 为:为:p p nppp)(100故由故由 pppu0即可检验即可检验h0 : p=p0, ha : p p0 。 例例 以紫花和白花的大豆品种杂交,在以紫花和白花的大豆品种杂交,在f2代共得代共得289株,株,其中紫花其中紫花208株,白花株,白花81株。如果花色受一对等位基因控制,株。如果花色受一对

21、等位基因控制,则根据遗传学原理,则根据遗传学原理,f2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为3 1,即紫花理论百分数即紫花理论百分数p=0.75,白花理论百分数,白花理论百分数q=1p =0.25。问该试验结果是否符合一对等位基因的遗传规律?问该试验结果是否符合一对等位基因的遗传规律? 假设大豆花色遗传符合一对等位基因的分离规律,紫花假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是植株的百分数是75%,即,即h0: p=0.75;对;对ha: p0.75。 显著水平显著水平 0.05,作两尾检验,作两尾检验, u0.05=1.96。 a05. 0u 检验计算

22、:检验计算:71970289208.p02550289250750.p1910255075071970.u因为实得因为实得|u|0.05。 推断:接受推断:接受h0: p=0.75,即大豆花色遗传是符合一对等位,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数基因的遗传规律的,紫花植株百分数 =0.72和和p=0.75的相差的相差系随机误差。系随机误差。p 以上资料亦可直接用次数进行假设检验。当二项资料以次以上资料亦可直接用次数进行假设检验。当二项资料以次数表示时,数表示时, , npnpqnp故检验计算:故检验计算: 于是于是 19136775216208.nppnunp结果同上

23、结果同上 )(75216750289株株.np)(367250750289株株.np二、两个样本频率相比较的假设检验二、两个样本频率相比较的假设检验 检验两个样本频率和所属总体频率检验两个样本频率和所属总体频率p1和和p2的差异显著性的差异显著性. 一般假定两个样本的总体方差是相等的,即一般假定两个样本的总体方差是相等的,即 ,设,设两个样本某种属性个体的观察频率分别为两个样本某种属性个体的观察频率分别为 和和 ,而两样本总体该种属性的个体频率分别为,而两样本总体该种属性的个体频率分别为p1和和 p2,则两样本频率的差数标准误,则两样本频率的差数标准误 为:为:2221pp111nyp 222

24、nyp 21pp 22211121nqpnqppp 上式中的上式中的q1=(1p1), q2=(1p2)。这是两总体频率为已。这是两总体频率为已知时的差数标准误公式。知时的差数标准误公式。 如果假定两总体的频率相同,即如果假定两总体的频率相同,即 p1= p2 = p , q1 = q2 = q,则:,则:)11(2121nnpqpp p1 和和 p2 未知时,则在未知时,则在 的假定下,可用两样本频的假定下,可用两样本频率的加权平均值率的加权平均值 作为作为 p1 和和 p2 的估计。的估计。2221ppppqnnyyp1 2121)11(21 21nnqppp因而两样本频率的差数标准误为:

25、因而两样本频率的差数标准误为:故由故由2121ppppu即可对即可对 h0 : p1 = p2 作出假设检验。作出假设检验。 例例 调查低洼地小麦调查低洼地小麦378株株(n1),其中有锈病株,其中有锈病株355株株( y1),锈病率,锈病率93.92%( );调查高坡地小麦;调查高坡地小麦396株株(n2),其中有锈病其中有锈病346株株( y2),锈病率,锈病率87.31%( )。试检验两块。试检验两块麦田的锈病率有无显著差异?麦田的锈病率有无显著差异? 1 p2 p 假设假设h0:两块麦田的总体锈病率无差别,即:两块麦田的总体锈病率无差别,即 h0 : p1 = p2 ;对;对 ha :

26、 p1 p2 。 显著水平取显著水平取 ,作两尾检验,作两尾检验,u0.05=1.96。050. 检验计算:检验计算:9060396378346355.p094. 0906. 01q02100396137810940906021.)(.pp163021008731093940.u实得实得|u|u0.05,故,故p0.05, 推断:否定推断:否定h0 : p1 = p2 接受接受ha : p1 p2 ,即两块麦田,即两块麦田的锈病率有显著差异。的锈病率有显著差异。 例例 原杀虫剂原杀虫剂a在在1000头虫子中杀死头虫子中杀死657头,新杀虫剂头,新杀虫剂b在在1000头虫子中杀死头虫子中杀死72

27、8头,问新杀虫剂头,问新杀虫剂b的杀虫率是否高的杀虫率是否高于原杀虫剂于原杀虫剂a? 假设新杀虫剂假设新杀虫剂b的杀虫率并不高于原杀虫剂的杀虫率并不高于原杀虫剂a,即,即 h0 : p2p1 ;对;对 ha : p2p1 。 显著水平显著水平 ,作一尾检验,作一尾检验, u0.01=2.326(一尾概率一尾概率)。010. 检验计算:检验计算: 657010006571./p728010007282./p6925010001000728657.p30750692501.q0206301000110001307506925021.)(.pp44302063072806570.u 实得实得uu0.

28、01=2.326,故,故p0.01, 推断:否定推断:否定h0 : p2p1 ,接受,接受ha : p2p1 ,即新杀虫剂,即新杀虫剂的杀虫率极显著地高于原杀虫剂的杀虫率极显著地高于原杀虫剂a。三、二项样本假设检验时的连续性矫正三、二项样本假设检验时的连续性矫正 二项总体的频率的分布是间断性的二项分布。把它当作二项总体的频率的分布是间断性的二项分布。把它当作连续性的正态分布或连续性的正态分布或t分布处理,结果会有些出入,一般容易分布处理,结果会有些出入,一般容易发生第一类错误。发生第一类错误。 因此因此,在假设检验时需进行连续性矫正。在假设检验时需进行连续性矫正。 (1)在在n30,而,而 5

29、时这种矫正是必须的;经过连续性时这种矫正是必须的;经过连续性矫正的正态离差矫正的正态离差u值或值或t 值,分别以值,分别以uc 或或 tc 表示。表示。 (2)如果样本大,试验结果符合前表条件,则可以不作矫如果样本大,试验结果符合前表条件,则可以不作矫正,用正,用u检验。检验。 pn(一一) 单个样本频率假设检验的连续性矫正单个样本频率假设检验的连续性矫正单个样本频率的连续性矫正公式为:单个样本频率的连续性矫正公式为:pncs.np|p|nt50它具有它具有 v =n1。式中。式中qpnspn是是 的估计值的估计值 (523) (524) npqnp 例例 用基因型纯合的糯玉米和非糯玉米杂交,

30、按遗传用基因型纯合的糯玉米和非糯玉米杂交,按遗传学原理,预期学原理,预期f1植株上糯性花粉粒的植株上糯性花粉粒的p0=0.5,现在一视野,现在一视野中检视中检视20粒花粉,得糯性花粉粒花粉,得糯性花粉8粒,试问此结果和理论百粒,试问此结果和理论百分数分数p0=0.5是否相符?是否相符? 假设系假设系p=p0=0.5的一个随机样本,即的一个随机样本,即h0:p=0.5 对对ha:p0.5 显著水平取显著水平取 ,用两尾检验。用两尾检验。 050. 检验计算:检验计算: 6 . 04 . 011pqnp=nq=200.5=10 推断认为实得频率推断认为实得频率0.4与理论百分数与理论百分数0.5没

31、有显著差没有显著差异。异。 查附表查附表4,v = 201=19,t0.05=2.093,现实得,现实得|t |0.05 )(192604020粒粒.spn68019250108.|tc =200.4=8粒粒(糯糯), =20-8=12粒粒(非糯非糯) pnqn(二二) 两个样本频率相比较的假设检验的连续性矫正两个样本频率相比较的假设检验的连续性矫正 设两个样本频率中,取较大值的具有设两个样本频率中,取较大值的具有 y1 和和 n1 ,取较小值,取较小值的具有的具有 y2 和和 n2 ,则经矫正的,则经矫正的 tc 公式为:公式为: (525) 它具有它具有 v =n1+n22 。 21pps

32、21pp 2122115050ppcsn.yn.yt2121ppppu其中其中 为为 中中 的估计值。的估计值。 例例 用新配方农药处理用新配方农药处理25头棉铃虫,结果死亡头棉铃虫,结果死亡15头,头,存活存活10头;用乐果处理头;用乐果处理24头,结果死亡头,结果死亡9头,存活头,存活15头。问头。问两种处理的杀虫效果是否有显著差异?两种处理的杀虫效果是否有显著差异? 本例不符合表本例不符合表5.6条件,故需要进行连续性矫正。条件,故需要进行连续性矫正。 假设两种处理的杀虫效果没有差异,即假设两种处理的杀虫效果没有差异,即h0 : p1 = p2 ;对对ha : p1 p2 。 显著水平显

33、著水平 ,作两尾检验。,作两尾检验。 050. 检验计算:检验计算: 4902425915.p5104901.q143025124151049021.)(.spp29. 1143024509255015.tc 查附表,查附表,v =24+252=4745时,时,t0.05=2.014。现实。现实得得|tc| 0.05。 推断:接受推断:接受h0 : p1 = p2 ,否定,否定ha : p1 p2 ,即承认两,即承认两种杀虫剂的杀虫效果没有显著差异。种杀虫剂的杀虫效果没有显著差异。 本例如不作连续性矫正,本例如不作连续性矫正,t =(0.600.375)/0.143,大,大于于1.29,增加了

34、否定,增加了否定h0 发生第一类错误的可能性。发生第一类错误的可能性。 第四节第四节 参数的区间估计与点估计参数的区间估计与点估计 参数估计(参数估计(estimation of parameter),是统计是统计推断的另一个方面,它是指由样本统计结果对总体参推断的另一个方面,它是指由样本统计结果对总体参数在一定概率水平下所作出的估计。参数估计包括区数在一定概率水平下所作出的估计。参数估计包括区间估计(间估计(interval estimation)和点估计()和点估计(point estimation)。)。 所谓所谓参数的区间估计参数的区间估计,是指在一定的概率保证之是指在一定的概率保证之

35、下下,估计出一个范围或区间以能够覆盖参数。估计出一个范围或区间以能够覆盖参数。一、一、 参数区间估计与点估计的原理参数区间估计与点估计的原理 参数估计和点估计是建立在一定理论分布基础上的一参数估计和点估计是建立在一定理论分布基础上的一种方法。由中心极限定理和大数定律得知,只要抽样为大种方法。由中心极限定理和大数定律得知,只要抽样为大样本,不论其总体是否为正态分布,其样本平均值都近似样本,不论其总体是否为正态分布,其样本平均值都近似地服从地服从 正态分布,因而,当概率水平正态分布,因而,当概率水平=0.05或或0.01时,即置信度为时,即置信度为p=1-=0.95或或0.99的条件下,有:的条件

36、下,有:),(2xn95. 0)96. 196. 1yyyp(99. 0)58. 258. 2yyyp(95. 0)96. 196. 1yyyyp(99. 0)58. 258. 2yyyyp(则:则:临界值的时为正态分布下置信度其中(upuuyuypyyaaaaa11)因此对于某一概率标准因此对于某一概率标准,则有通式:则有通式:二、一个总体平均数区间估计与点估计二、一个总体平均数区间估计与点估计 (一一) 在总体方差在总体方差 为已知时,服从正态分布为已知时,服从正态分布2 的区间估计为:的区间估计为: )()(yyuyuyaa并有并有 yuyla1;yuyla2以上式中的以上式中的 为正态

37、分布下置信度为正态分布下置信度1 时的时的u临界值。临界值。 aua(二二) 在总体方差在总体方差 为未知时为未知时 ,服从,服从t分布分布2 )()(yystystyaa需由样本均方需由样本均方s2 估计,于是区间估计为:估计,于是区间估计为: 2并有并有 ystyla1ystyla2上式中的上式中的 为置信度为置信度p=(1 )时时 t 分布的分布的 t 临界值。临界值。atayuyla点估计:ystyla点估计: 例例 某棉花株行圃某棉花株行圃36个单行的皮棉平均产量为个单行的皮棉平均产量为 kg,已知已知 =0.3kg,求,求99%置信度下该株行圃单行皮棉产量的置置信度下该株行圃单行皮

38、棉产量的置信区间。信区间。 14.y 在置信度在置信度p=(1 )=99%下,由附表下,由附表3查得查得 u0.01=2.58;并算得并算得 ;故;故99%置信区间为置信区间为 即即 a05. 03630/.y)05. 058. 21 . 4()05. 058. 21 . 4( 推断:估计该株行圃单行皮棉平均产量在推断:估计该株行圃单行皮棉平均产量在4.04.2kg之间,之间,此估计值的可靠度有此估计值的可靠度有99%。 2 . 40 . 4 例例 上例已算得某春小麦良种在上例已算得某春小麦良种在8个小区的千粒重平均个小区的千粒重平均数数 , 。试估计在置信度为。试估计在置信度为95%时该品种

39、的时该品种的千粒重范围。千粒重范围。g235.y g580.sy 由附表由附表4查得查得 v =7时时 t0.05=2.365,故代入前面,故代入前面通式有有 , 即即 )58. 0365. 22 .35()58. 0365. 22 .35( 推断:该品种总体千粒重在推断:该品种总体千粒重在33.836.6g之间的置信度为之间的置信度为95%。在表达时亦可写作。在表达时亦可写作 形式,即该品种总体千粒形式,即该品种总体千粒重重95%置信度的区间是置信度的区间是35.2(2.3650.58)=35.21.4(g) ,即即33.836.6g。 6 .368 .33ystya 三三 、两个总体平均数

40、差数、两个总体平均数差数( )的区间估计的区间估计21 在一定的置信度下,估计两总体平均数在一定的置信度下,估计两总体平均数 至少能差至少能差多少。多少。 估计方法依两总体方差是否已知或是否相等而有不同。估计方法依两总体方差是否已知或是否相等而有不同。21和(一一) 在两总体方差为已知或两总体方差虽未知但为大样本时在两总体方差为已知或两总体方差虽未知但为大样本时 对对 的的1 置信区间应为:置信区间应为:21a2121212121yyyyuyyuyyaa)()(并且并且 21211yyu)yy (l21212yyu)yy (l 上式中的上式中的 为平均数差数标准误,为平均数差数标准误, 为正态

41、分布下置为正态分布下置信度为信度为1 时的时的u临界值。临界值。21yy aua 例例 测得高农选测得高农选1号甘薯号甘薯332株的单株平均产量,株的单株平均产量, 1550(g), 5.350(g),白皮白心甘薯,白皮白心甘薯282株,株, 1250(g), 3.750(g)。试估计两品种单株平均产。试估计两品种单株平均产量的相差在量的相差在95%置信度下的置信区间。置信度下的置信区间。1y1s2y2s由附表查得置信度为由附表查得置信度为0.95时,时,u0.05 =1.96;并可算得:;并可算得:18503605028273332352221.yy 因而,因而,95%的置信限为:的置信限为

42、: l1=(750-600)1.9618=114.7(g) l2=(750-600)+1.9618=185.3(g) 故高农选故高农选1号甘薯的单株平均产量比白皮白心甘薯多号甘薯的单株平均产量比白皮白心甘薯多114.7185.7(g),这个估计有,这个估计有95%的把握。的把握。(二二) 在两个总体方差为未知时在两个总体方差为未知时, 有两种情况:有两种情况: 1. 假设两总体方差相等,即假设两总体方差相等,即 : 的的1-置信区间为:置信区间为: 2222121a2121212121yyyystyystyyaa)()(并有并有 21)(211yystyyl21)(212yystyyl 以上的

43、以上的 为平均数差数标准误,为平均数差数标准误, 是置信度为是置信度为1 ,自由度为自由度为 v =n1+n22 时时 t 分布的临界值。分布的临界值。21yysata 例例 试估计试估计右边表中右边表中资料两种密资料两种密度亩产量差数在置信度为度亩产量差数在置信度为99%时的置时的置信区间。信区间。 计算得:计算得: 4281y4402y136112212.snsyye由附表由附表3查得查得 v =8 时,时,t0.01=3.355 故有故有 l1=(428440)(3.35511.136)= 49.4, l2=(428440)+(3.35511.136)=25.4(kg)。 y1(每亩每亩

44、30万苗万苗)400420435460425y2(每亩每亩35万苗万苗)450440445445420 当当 被接受时,意味着两总体平均数相等,即被接受时,意味着两总体平均数相等,即 。因此,可用两样本平均数的加权平均数。因此,可用两样本平均数的加权平均数 作作为对为对 的估计:的估计: 210:h21py212211nnynynyp2121nnyy或或 1)-(1)-()()(22122211nnyyyyspy因而对因而对 的置信区间为:的置信区间为:)()(ppypypstystyaa 2. 两总体方差不相等,即两总体方差不相等,即 , 这时由两样本的这时由两样本的 和和 作为作为 和和

45、估计而算得的估计而算得的 t ,已不是,已不是 v = v1 + v2 的的 t 分布,分布,而是近似于自由度为而是近似于自由度为 的的 t 分布。分布。 222121s22s212222212121nsnsyyt)(可得对的可得对的1 的置信区间为:的置信区间为:故根据故根据a21212121yyyystyystyyaa,)()(并有并有 21211yystyyla,)(21212yystyyla,)( 为置信度为置信度1 时自由度时自由度 的的 t 分布临界值分布临界值 a,ta22212121nsnssyy221222222212121)()()(yyyyssssv其中其中 例例 测定冬小麦品种东方红测定冬小麦品种东方红3号的蛋白质含量号的蛋白质含量(%)10次,次,得得 y1=14.3, s12=1.621;测定农大;测定农大139号的蛋白质含量号的蛋白质含量5次,次,得得y2 =11.7,s22 =0.135。试求东方红。试求东方红3号小麦的蛋白质含号小麦的蛋白质含量与农大量与农大139号小麦蛋白

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论