第三章统计推断_第1页
第三章统计推断_第2页
第三章统计推断_第3页
第三章统计推断_第4页
第三章统计推断_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、无公害蔬菜无公害蔬菜番茄:允许残留量 乐果 1.0mg/kgn=25 抽样测得 乐果残留量 0.99mg/kg出售?销毁?统计推断的过程统计推断的过程样本统计量例如:样本均值、方差总体均值、方差总体样本统计推断统计推断假设测验假设测验区间估计区间估计统计推断的内容统计推断的内容点估计点估计参数估计参数估计第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 单个平均数的假设测验和单个平均数的假设测验和区间估计区间估计第四节第四节 百分数的假设测验和百分数的假设测验和区间估计区间估计第三节第三节 两个平均数的假设测验和两个平均数的假设测验和区间估计区间估计学习目标学习目标n理解

2、统计假设测验的基本原理n掌握假设测验步骤n能对实际问题进行假设测验n掌握参数的区间估计方法第一节第一节 统计假设测验的基本原理统计假设测验的基本原理 统计假设测验的实例统计假设测验的实例 假设测验的基本步骤假设测验的基本步骤 一尾测验和两尾测验一尾测验和两尾测验 假设测验的两类错误假设测验的两类错误 统计假设测验的实例统计假设测验的实例有一个小麦品种亩产量总体是正态分布,总体平均亩产360kg,标准差40kg。此品种经过多年种植后出现退化,必须对其进行改良,改良后的品种种植了16个小区,获得其平均亩产为380kg,试问改良后品种在产量性状上是否和原品种有显著差异? 0 =360kg , 40

3、= 0 ?在研究中,往往首先要提出一个有关某一总体参数的假设,在研究中,往往首先要提出一个有关某一总体参数的假设,这种假设称为这种假设称为统计假设统计假设。原品种原品种x=380kg, n=16改良后改良后二、统计假设测验的基本步骤二、统计假设测验的基本步骤(一)提出假设(一)提出假设 v 无效假设无效假设(null hypothesis) (null hypothesis) H0v 备择假设备择假设(alternate hypothesis) (alternate hypothesis) HA无效假设和备择假设是两种彼此对立的假设,接无效假设和备择假设是两种彼此对立的假设,接受了其中的一种,

4、那么就要否定另一种。受了其中的一种,那么就要否定另一种。假设改良后产量的总体平均数假设改良后产量的总体平均数,与原品种总体平均数,与原品种总体平均数 0 0相相等,等, , , 即表面差异即表面差异( -( -0 0=20=20) )全为试验全为试验误差,改良后的产量与原产量没有差异。这个假设就叫误差,改良后的产量与原产量没有差异。这个假设就叫无效无效假设假设,记为,记为H H0 0: = = 0 0。x( - 0)=(- 0 )+i= i x与无效假设对立的统计假设称与无效假设对立的统计假设称备择假设备择假设, 记为记为H HA A: 0 0。无效假设的形式是多种多样的,随研究的内容不同而不

5、同:无效假设的形式是多种多样的,随研究的内容不同而不同:A. A. 对单个平均数的假设对单个平均数的假设无效假设无效假设H H0 0: = = 0 0备择假设备择假设H HA A: 0 0B. B. 两个平均数相比较的假设两个平均数相比较的假设无效假设无效假设H H0 0: 1 1 = = 2 2备择假设备择假设H HA A: 1 1 2 2C. C. 对单个样本百分数的假设对单个样本百分数的假设无效假设无效假设H H0 0:p=p= p p0 0备择假设备择假设H HA A: p pp p0 0D. D. 两个样本百分数相比较的假设两个样本百分数相比较的假设无效假设无效假设H H0 0: p

6、 p1 1 = p= p2 2备择假设备择假设H HA A: p p1 1 p p2 2无效假设是有意义的无效假设是有意义的据之可计算出因抽样误差而获得样本结果的概率据之可计算出因抽样误差而获得样本结果的概率但必须遵循两个原则但必须遵循两个原则: H0是直接测验的假设是直接测验的假设 HA不是直接测验的假设,是在无效假设被不是直接测验的假设,是在无效假设被否定的情况下而必须接受的假设。否定的情况下而必须接受的假设。(二)计算概率(二)计算概率u=标准正态离差标准正态离差 0_x-x-=38036040/16=2(x-=n ) 0 =360kg , 40 x=380kg, n=16原品种原品种改

7、良后改良后无效假设无效假设H H0 0: = = 0 0 , ,备择假设备择假设H HA A: 0 0查附表查附表2,P(|u|2)=20.0227=0.0454,表明,表明20Kg差异属于试验误差的概率为差异属于试验误差的概率为0.0454。(三)确定显著水平(三)确定显著水平否定否定H H0 0的概率标准叫的概率标准叫显著水平显著水平(significant level)(significant level),一般以一般以表示表示。农业试验研究中常取农业试验研究中常取 =0.05 =0.05和和 = 0.01 = 0.01。显著水平的选择应根据试验要求和试验结论的重显著水平的选择应根据试验

8、要求和试验结论的重要性而定。要性而定。(四)推断(四)推断H0的正误的正误否定无效假设否定无效假设H0,接受备择假设,接受备择假设HA,即表面差异不全为即表面差异不全为试验误差,改良后的品种与原品种之间存在真实差异。试验误差,改良后的品种与原品种之间存在真实差异。根据根据小概率原理小概率原理来作出接受或否定来作出接受或否定H H0 0的结论。的结论。一个事件发生的概率很小时(一个事件发生的概率很小时(PP2|u|2)=0.0454=0.04540.050.05,表明,表明20Kg20Kg差异属于试验差异属于试验误差的概率小于误差的概率小于5%5%。统计假设测验的基本步骤为:统计假设测验的基本步

9、骤为:1. 1. 对样本所属总体提出假设(包括对样本所属总体提出假设(包括H H0 0和和H HA A)。)。2. 2. 确定显著水平确定显著水平 。3. 3. 在在 H H0 0正确的前提下,依统计数的抽样分布,计算正确的前提下,依统计数的抽样分布,计算实际差异由误差造成的概率。实际差异由误差造成的概率。4. 4. 将算得的概率与将算得的概率与相比较,根据小概率事件实际相比较,根据小概率事件实际不可能性原理作出是接受还是否定不可能性原理作出是接受还是否定H H0 0的推断。的推断。 先假设真实差异不存在,表面差异全为试验误差。然后先假设真实差异不存在,表面差异全为试验误差。然后计算这一假设出

10、现的概率,根据小概率事件实际不可能性计算这一假设出现的概率,根据小概率事件实际不可能性原理,判断假设是否正确。这是对样本所属总体所做假设原理,判断假设是否正确。这是对样本所属总体所做假设是否正确的统计证明,称为是否正确的统计证明,称为统计假设测验统计假设测验。三、一尾测验和两尾测验三、一尾测验和两尾测验(一)接受区和否定区(一)接受区和否定区接受区接受区否定区否定区否定区否定区x 00.0250.0250.95=0.05时时, 否定区域(否定区域(negation region)x-( 01.96x- )x-x-( 0+1.96)和和H0: = 0接受区域接受区域(acceptance reg

11、ion)x-0-1.96 x-()0+1.96x-()x96. 10 x96. 10同理,同理,=0.01时,则时,则 H0: = 0的接受区域为的接受区域为x-02.58x-()02.58x-()否定区域为否定区域为-x( 02.58x- )x-x ( 02.58)或或-接受区接受区否定区否定区否定区否定区x 00.0050.0050.99x58. 20 x58. 20(二)一尾测验和两尾测验(二)一尾测验和两尾测验统计假设测验中统计假设测验中H0: =0具有两个否定区,具有两个否定区,HA: 0,这类测验称这类测验称两尾测验两尾测验(two-tailed test),在假,在假设测验中所考

12、虑的概率为左右两尾概率之和。设测验中所考虑的概率为左右两尾概率之和。否定区否定区否定区否定区x 0 x96. 10 x96. 10H0: 0, HA: 0,则否定区在则否定区在 分布的右尾。分布的右尾。x-例如:研究农药的残留问题,喷有例如:研究农药的残留问题,喷有机砷的蔬菜上有机砷的含量机砷的蔬菜上有机砷的含量为为,未,未喷的蔬菜上有机砷喷的蔬菜上有机砷的含量为的含量为0。测验蔬菜上有测验蔬菜上有机砷的含量是否显著提高。机砷的含量是否显著提高。0.05x 0否定区否定区0.05x 0否定区否定区x64. 10 x-H0: 0, HA: 0,则否定区在则否定区在 分布的左尾。分布的左尾。象这种

13、在假设测验中所考虑的概率只用一尾概率的测验称象这种在假设测验中所考虑的概率只用一尾概率的测验称为一尾测验为一尾测验(one-tailed test)选用一尾测验还是两尾测验,应根据专业知识而定。选用一尾测验还是两尾测验,应根据专业知识而定。例如:研究矮壮素使玉米矮化的结果,例如:研究矮壮素使玉米矮化的结果,喷矮壮素的玉米平均株高是喷矮壮素的玉米平均株高是,未未喷矮壮素的平均株高是喷矮壮素的平均株高是0。对矮壮素对矮壮素是否能使玉米株高降是否能使玉米株高降低做假设测验。低做假设测验。否定区否定区 00.05x64. 10 x四、假设测验的两类错误四、假设测验的两类错误第一类错误第一类错误正确正确

14、正确正确第二类错误第二类错误检验结果有四种情况:检验结果有四种情况: 检验结果检验结果真实情况真实情况否定否定H0接受接受H0H0正确正确H0错误错误f( )2201xx2xx(一)第一类错误(一)第一类错误如果无效假设是正确的,通过假设测验却否定了它,如果无效假设是正确的,通过假设测验却否定了它,所犯的错误称所犯的错误称第一类或第一类或型错误,型错误,也称弃真错误。也称弃真错误。接受区间接受区间否定区间否定区间由于犯由于犯型错误的型错误的概率不会超过显著概率不会超过显著水平水平 ,故又称为,故又称为 错误错误。如果无效假设是错误的,通过假设测验却接受了它,如果无效假设是错误的,通过假设测验却

15、接受了它,所犯的错误称所犯的错误称第二类或第二类或型错误,也称纳伪错误型错误,也称纳伪错误。(二)第二类错误(二)第二类错误由于犯由于犯型错误的概率常记为型错误的概率常记为 ,故又称为,故又称为 错误错误。1x2xx接受区间接受区间否定区间否定区间0 0由图可见,由图可见,的大小与的大小与 有反比关系。有反比关系。1x2xx接受区间接受区间否定区间否定区间0 01x2xx接受区间接受区间0 0 在样本容量在样本容量n n一定时,提高显著水平,可以减少犯第一一定时,提高显著水平,可以减少犯第一类错误的概率,但同时增大了犯第二类错误的概率。类错误的概率,但同时增大了犯第二类错误的概率。0 01x2

16、xx接受区间接受区间否定区间否定区间由图可见,由图可见,的大小与的大小与0 0有反比关系。有反比关系。1x2xx接受区间接受区间否定区间否定区间0 0在在n n和显著水平相同的条件下,真正的总体平均数和显著水平相同的条件下,真正的总体平均数 和假和假设的平均数设的平均数 0 0的相差越大,则犯第二类错误的概率越小。的相差越大,则犯第二类错误的概率越小。由图可见,由图可见,的大小与标准误的大小与标准误 有正比关系。有正比关系。nx = =x10 0b2x1x2xx接受区间接受区间0 0为了降低犯为了降低犯错误的概率,应适当增加样本容量。错误的概率,应适当增加样本容量。 b b 与与 b b 间的

17、关系间的关系减少(增加)减少(增加)I型错型错误误,将会增加(减,将会增加(减少)少)II型错误型错误(三)降低两类错误的措施(三)降低两类错误的措施1 1、为了降低犯两类错误的概率,需采用一个较低的显、为了降低犯两类错误的概率,需采用一个较低的显著水平,如著水平,如=0.05=0.05。2 2、显著水平一定,则改进试验技术和增加样本容量可以、显著水平一定,则改进试验技术和增加样本容量可以有效的降低犯两类错误的概率。有效的降低犯两类错误的概率。第三章第三章 统计推断统计推断第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 单个平均数的假设测验和单个平均数的假设测验和区间估

18、计区间估计第四节第四节 百分数的假设测验和百分数的假设测验和区间估计区间估计第三节第三节 两个平均数的假设测验和两个平均数的假设测验和区间估计区间估计第二节第二节 单个平均数的假设测验和单个平均数的假设测验和区间估计区间估计v 单个样本平均数的假设测验单个样本平均数的假设测验v 总体平均数的区间估计总体平均数的区间估计v 影响估计误差范围的因素影响估计误差范围的因素一、单个样本平均数的假设测验一、单个样本平均数的假设测验x由 0 推断 00? 0 =360kg , 40kgx=380kg, n=16 = 0 ?原品种原品种新品系新品系v从从 2 2已知的已知的总体抽样,无论样本容量的大小,其样

19、本平均数总体抽样,无论样本容量的大小,其样本平均数 的抽样的抽样 分布必做正态分布,具有平均数分布必做正态分布,具有平均数 和方差和方差 。x=x n22 = = xv从从 2 2未知的未知的总体抽样,当样本容量足够大时(总体抽样,当样本容量足够大时(n30) n30) ,其样本平均数,其样本平均数 的的抽样分布趋于近正态分布,具有平均数抽样分布趋于近正态分布,具有平均数 和方差和方差 。n22S = =Sx=x x由抽样分布可知:由抽样分布可知: xxt s /0)( =x0=uxx0=uxSv当当 2 2未知的未知的总体抽样,样本容量总体抽样,样本容量n30n30时时 ,其样本平均数,其样

20、本平均数 的抽样分布的抽样分布服从服从t t分布分布, , S S2 2代替代替2 2所得到的统计量记为所得到的统计量记为t t 。xU U测验:测验: 2 2已知(无论已知(无论n30 n30 ,还是,还是 n n30 30 );); 2 2未知,但未知,但n30n30(大样本)(大样本) 。t t 测验测验:从:从 2 2未知的未知的总体抽样,样本容量总体抽样,样本容量n30n30时。时。 由抽样分布知识可得:由抽样分布知识可得:(一)(一) 测验方法测验方法(二)(二) 测验步骤测验步骤第一步第一步 建立假设建立假设H0:0HA:0第二步第二步 确定显著水平确定显著水平0.05、0.01

21、第三步第三步 计算统计量计算统计量 u (t)值值x0=uxx0=uxSx0=txS第四步第四步 查表求临界值查表求临界值u( t ),并作统计推断,并作统计推断例例3.1 3.1 有一玉米杂交种亩产量总体为正态分布,其总体平均产量有一玉米杂交种亩产量总体为正态分布,其总体平均产量0 0= = 430 430, 30 30 ,为提高制种产量进行反交制种,对反交杂交种进行了,为提高制种产量进行反交制种,对反交杂交种进行了9 9个小区试验,个小区试验,平均产量为平均产量为415(415(/ /亩亩) )。问反交种在产量上是否与正交种有显著差异?。问反交种在产量上是否与正交种有显著差异?H0: =0

22、=430 , 即反交种与正交种在产量上没有差异。即反交种与正交种在产量上没有差异。HA: 0,=0.05=1.5930415-430=0=nx0=xux=0.05时,时, u=1.96=1.96,而实得,而实得 u =1.5=1.5,即,即 u t0.05,16,故否定,故否定H0,接受,接受HA 。认为滴灌对大豆的百粒重有显著影响。认为滴灌对大豆的百粒重有显著影响。)g(99. 0117175 .3074 .16.3 .17191n)xx(s22222=)g(24. 01799. 0nssx= 参数的区间估计概念参数的区间估计概念n根据一个样本的观察值给出总体参数的根据一个样本的观察值给出总

23、体参数的估计范围估计范围n给出总体未知参数落在这一区间的给出总体未知参数落在这一区间的概率概率置信区间样本统计量(点估计)置信上限置信下限二、总体平均数的区间估计二、总体平均数的区间估计 参数的区间估计原理参数的区间估计原理1.96x0.025-1.960.025P(-1.96x) x (+1.96x ) =0.95P(-ux) x (+ux )= 1-P(-ux) x (+ux )= 1-P(- ux) x - (ux )= 1-P(-ux -x) - (ux -x) = 1-P(x -ux) (x+ux )= 1-置信下限置信上限L2L1置信区间置信系数或置信度置信限:置信限:L1和和L2

24、置信区间置信区间 L1、L2置信度:概率水平置信度:概率水平PP=1- 否定区否定区否定区否定区x接受区接受区xauxxauxL1L2L1xux =L2xux= , Lxux =点估计:点估计:接受区域接受区域 1- 否定区域否定区域 /2否定区域否定区域 /2L1L2x置信限:置信限: 0的置信区间为的置信区间为xux、xuxL1xux =L2xux=(一)(一) 符合符合u分布的区间估计分布的区间估计1. 1. 2 2已知已知实实 例例例:在某棉花试验田例:在某棉花试验田中,随机抽取中,随机抽取3636个小个小区,测得小区的皮棉区,测得小区的皮棉平均产量为平均产量为4.1kg4.1kg,已

25、,已知总体方差知总体方差2 2=0.09=0.09。求求99%99%的置信度下该试的置信度下该试验田中小区皮棉产量验田中小区皮棉产量的置信区间。的置信区间。该试验田中小区皮棉产量该试验田中小区皮棉产量在在3.9714.229kg 之间,此估计的可靠度为之间,此估计的可靠度为99%.(x -u x) (x+u x )4.1 2.580.09 36,3.971,4.2294.1+ 2.580.09 36接受区域接受区域 1- 否定区域否定区域 /2否定区域否定区域 /2L1L2x2. 2. 2 2未知,但未知,但n30n30(大样本)(大样本)置信限:置信限:L1xux S =L2xux S= 0

26、的置信区间为的置信区间为xux s、xux s例例3.4 3.4 为估计某块麦田里的小麦平均株高,随机抽取为估计某块麦田里的小麦平均株高,随机抽取5050株作为一个样本,株作为一个样本,得到样本平均株高得到样本平均株高x=90cmx=90cm,s=3.8cms=3.8cm,试用,试用95%95%的可靠度估计小的可靠度估计小麦的总体平均株高。麦的总体平均株高。50,8 . 3,90=ncmscmx96. 105. 095. 0105. 0=unssx=54. 0=508 . 3=cm94.8854. 096. 190=cmsxLx06.9154. 096. 19096. 12=xsxL96. 1

27、1=(二)(二) 符合符合 t 分布的区间估计分布的区间估计xxStxLStxL=21置信限:置信限: 0的置信区间为的置信区间为xtxs、xtxs例例3.5 3.5 某一引进的小麦品种,在某一引进的小麦品种,在8 8个小区种植的千粒重克数为:个小区种植的千粒重克数为:35.635.6、37.637.6、33.433.4、35.135.1、32.732.7、36.836.8、35.935.9和和34.634.6,试用,试用95%95%的置信度估的置信度估计该品种的总体平均千粒重。计该品种的总体平均千粒重。nxxi=86 .34.6 .376 .35=g2 .3587 .281=122=nnxx

28、s18872.218)6 .34.6 .376 .35(222=g64. 1783.18=nssx=g58. 0864. 1=查附表4得,当df=7时,t0.05=2.365xstxL=157.3658. 0365. 22 .352=xstxL83.3358. 0365. 22 .35=所以,该小麦品种总体千粒重在所以,该小麦品种总体千粒重在33.8336.57之间,之间,估计的可靠度为估计的可靠度为95%。三三. 影响估计误差范围的因素影响估计误差范围的因素1. 样本容量样本容量 n,n越大,误差范围越小。越大,误差范围越小。2. 显著水平显著水平 , 越小,越小,ua(ta) 越大,越大,

29、误差范围越大。误差范围越大。3. 样本标准差样本标准差S,S越大,误差范围越大。越大,误差范围越大。第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 单个平均数的假设测验和区间估计单个平均数的假设测验和区间估计第四节第四节 百分数的假设测验和百分数的假设测验和区间估计区间估计第三节第三节 两个平均数的假设测验和两个平均数的假设测验和区间估计区间估计品种甲品种甲品种乙品种乙 甲甲 乙乙=?X甲甲=500kgX乙乙=525kg第三节第三节 两个样本平均数的假设测验和两个样本平均数的假设测验和区间估计区间估计由两个样本平均数之差来测验这两个样本所属总体平均数是由两个样本平均数之

30、差来测验这两个样本所属总体平均数是否存在显著差异,即测验两个处理的效果是否一样。否存在显著差异,即测验两个处理的效果是否一样。品种甲品种甲品种乙品种乙x甲甲=500kgX乙乙=525kg推断推断120?21xx 由由 甲甲 乙乙=?x甲甲-x乙乙推断推断通过通过 成组数据的假设测验和区间估计成组数据的假设测验和区间估计 成对数据的假设测验和区间估计成对数据的假设测验和区间估计按数据资料的来源按数据资料的来源一、一、成组数据的假设测验和区间估计成组数据的假设测验和区间估计将试验单位完全随机分为两组,再随机各实施将试验单位完全随机分为两组,再随机各实施一处理,这样得到的数据称为成组数据,以组的平一

31、处理,这样得到的数据称为成组数据,以组的平均数作为比较的标准。均数作为比较的标准。(一)成组数据的假设测验(一)成组数据的假设测验用用 t 测验测验用用u 测验测验用近似用近似 t 测验测验1. 两个样本所属的总体方差两个样本所属的总体方差 12 和和 22 已知,已知,或总体方差未知,但两个样本都是大样本时。或总体方差未知,但两个样本都是大样本时。 12 22= 且两个样本为小样本,但可假定且两个样本为小样本,但可假定2. 两个样本所属的总体方差两个样本所属的总体方差 12 和和 22 未知,未知,两样本为小样本,且两样本为小样本,且 12 22 3. 两个样本所属的总体方差两个样本所属的总

32、体方差 12 和和 22 未知,未知, 12 22已知,已知,和和1. 两个样本的总体方差两个样本的总体方差或或总体方差未知,但两个样本都是大样本总体方差未知,但两个样本都是大样本时。时。样本样本1:平均数:平均数x1,方差,方差s12,容量,容量n1样本样本2:平均数:平均数x2,方差,方差s22,容量,容量n2H0: 1=2 , HA: 12 =0.05-x2)(x1 _u=sx1-x2-u = (x1- x2)-( 1- 2) x1-x2u = (x1- x2)-( 1- 2)sx1-x2-x2)(x1 _u= x1-x2-sx1-x2-=s12n1s22n2+ 第三步第三步: 推断推断

33、 当当2.58 | |1.96时,推断时,推断u1和和u2的差异显著;的差异显著;当当| |2.58时,推断时,推断u1和和u2的差异极显著;的差异极显著;当当| |u0.01 ,所以否定,所以否定H0,接受,接受HA。认为两个插秧期对水稻每穗结实数有极显著影响。认为两个插秧期对水稻每穗结实数有极显著影响。062. 3)5031.174505 .294(=54. 3062. 326.4310.54=212121xxsxxt=由于假定由于假定 ,所以,所以 和和 都可用来作为都可用来作为 的估计值。的估计值。22221=21s22s2用用 t 测验测验21s22s用两个方差用两个方差 和和 的加

34、权平均数来估计。的加权平均数来估计。 12 22= 且两个样本为小样本,但可假定且两个样本为小样本,但可假定2. 两个样本所属的总体方差两个样本所属的总体方差 12 和和 22 未知,未知,2es 111121222121=nnnsns 112121=nnSSSS 1121222211=nnxxxxii)11(21221nnssexx=nssexx2221=当n1=n2=n时,212121xxsxxt=1121=nndf2121xxsxx=221=nn例例 3.8 为比较水稻田两种氮肥浅施的效果,用完全随机为比较水稻田两种氮肥浅施的效果,用完全随机排列进行试验,产量结果列于下表,试测验两种排列

35、进行试验,产量结果列于下表,试测验两种氮肥浅施对水稻产量的差异显著性氮肥浅施对水稻产量的差异显著性 。x1(浅施硝酸铵浅施硝酸铵)X2(浅施氯化铵浅施氯化铵)239.50248.15240.60255.85247.50261.20232.50257.40237.50255.40第一步:设立无效假设第一步:设立无效假设H0,备择假设,备择假设HA, 确定显著水平。确定显著水平。)(6 .2554 .255.85.25515.248512kgx= H0: 1= 2即两种氮肥浅施水稻的产量无差异。即两种氮肥浅施水稻的产量无差异。 HA: 1 2 =0.05 两尾测验。两尾测验。第二步:计算各个样本平

36、均数,平方和,两个样本的第二步:计算各个样本平均数,平方和,两个样本的合并均方,差数标准差和合并均方,差数标准差和t值。值。)(5 .2395 .237.6 .2405 .239511kgx=2222=xxSSi21.118=2225 .237.6 .2405 .239=55 .237.6 .2405 .239254 .255.85.25515.2482205.90=) 1() 1(21212=nnSSSSse052.26=) 15() 15(205.902 .118=2111=xxSSi2224 .255.85.25515.248=2121xxxxst=查附表查附表4,当,当df=5+5-2

37、=8时,时,t0.05=2.306,实得,实得|t|=4.98 |t|t0.05 ,所以否定,所以否定H0,接受,接受HA 。认为水田浅施氯化铵与浅施硝酸铵产量有显著差异。认为水田浅施氯化铵与浅施硝酸铵产量有显著差异。=21xxs)(23. 35052.262kg=nse2298. 423. 36 .2555 .239=第三步:推断第三步:推断例例 3.10 从前茬作物喷洒过有机砷杀虫剂的麦田随机采取从前茬作物喷洒过有机砷杀虫剂的麦田随机采取4样株,测样株,测定砷在植株体内的残留量分别为定砷在植株体内的残留量分别为7.5、9.7、6.8和和6.4mg,又,又从前作未喷洒过有机砷杀虫剂的对照田随

38、机从前作未喷洒过有机砷杀虫剂的对照田随机3株,测得砷株,测得砷含量为含量为 4.2、7.0和和4. 6 mg 。试测定喷洒有机砷杀虫剂是否。试测定喷洒有机砷杀虫剂是否使后作植株体内砷含量显著地提高?使后作植株体内砷含量显著地提高?喷洒有机砷杀虫剂只能使后作植株体内砷含量提高,没有降低喷洒有机砷杀虫剂只能使后作植株体内砷含量提高,没有降低的可能,所以用一尾测验。的可能,所以用一尾测验。 H0: 1 2 即喷洒有机砷杀虫剂不会使后作植株体内砷含量提高即喷洒有机砷杀虫剂不会使后作植株体内砷含量提高 HA: 1 2 =0.05 mgx6 . 744 . 68 . 67 . 95 . 71=mgx3 .

39、 536 . 40 . 72 . 42=50. 62111=xxSS59. 42222=xxSS) 1() 1(212222112=nnxxxxse218. 2=) 13() 14(59. 450. 6=2121121nnssexxmg14. 1)3141(218. 2=018. 214. 13 . 56 . 7=2121xxxxst=查附表查附表4,当,当df=4+3-2=5, 一尾概率一尾概率=0.05时,时,0.95=0.05当当df=5, 一尾概率一尾概率=0.05时时t0.05=2.015,实得,实得|t|=2.018,|t|t0.05 ,所以否定,所以否定H0,接受,接受HA,即前

40、作喷洒过有机砷农,即前作喷洒过有机砷农药会显著提高后作植株体内药会显著提高后作植株体内有机砷含量。有机砷含量。2.015=0.0250.95=0.025-2.5712.571当当df=5, 两尾概率两尾概率=0.05时时查附表查附表4,当,当df=4+3-2=5, 两尾概率两尾概率=0.05时,时,t0.05=2.571,实得实得|t|=2.018, |t|t0.05 ,所以否定所以否定H0,接受,接受HA,推断玉米去雄与不去雄产量差,推断玉米去雄与不去雄产量差异显著。异显著。) 1(22=nnnddsiid42. 0) 110(10102.112.112222=07. 3423. 03 .

41、1=dsdt (二)、(二)、成对数据的区间估计成对数据的区间估计dstdL=1dstdL=2在1-a概率保证下d置信区间的下限和上限为:名称名称成组数据成组数据成对数据成对数据依据条件依据条件样本容量样本容量 12和和 22标准差标准差测验方法测验方法ds21xxs21xx 两个处理为完全随机两个处理为完全随机设计,处理间供试的设计,处理间供试的单位相互独立单位相互独立两个样本观察值因某种两个样本观察值因某种联系而一一对立,彼此联系而一一对立,彼此相关相关可以相等,也可以不等可以相等,也可以不等必须相等必须相等已知或未知(假设已知或未知(假设 12= 22、 12 22)不受不受 12和和

42、22的影响的影响用用u测验、测验、t测验测验 或近似或近似t测验测验用用t测验测验第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 单个平均数的假设测验和单个平均数的假设测验和区间估计区间估计第四节第四节 百分数的假设测验和百分数的假设测验和区间估计区间估计第三节第三节 两个平均数的假设测验和两个平均数的假设测验和区间估计区间估计第三章第三章 统计推断统计推断由非此即彼事件所构成的总体叫由非此即彼事件所构成的总体叫二项总体二项总体,也叫,也叫0,1总体。总体。 当每次独立的从二项总体抽取当每次独立的从二项总体抽取n个个体,这个个体,这n个个体:个个体:“此此”事件出现的次

43、数事件出现的次数X可能有可能有0、1、2、.n,共有共有n+1种种,这这n+1种可能性有它各自的概率,组成一个分布种可能性有它各自的概率,组成一个分布,这个这个分布叫分布叫二项概率分布二项概率分布或简称或简称二项分布二项分布。 )()(xnxxnqpCxp=A. n相同时相同时二项分布的形状二项分布的形状二项分布的形状决定于二项分布的形状决定于n和和p的大小的大小00.050.10.150.20.250.30.350123456p=q= 0.5 n=600.050.10.150.20.250.30.35012345600.050.10.150.20.250.30.350123456p=0.7

44、q=0.3 n=6p=0.3 q=0.7 n=6B. 当当n增大时增大时.00.050.10.150.20.250.30.350.40.45123456700.020.040.060.080.10.120.140.160.180.212345678910 11 12 13 1400.020.040.060.080.10.120.140.16123456789 10 11 12 13 14 15 16 17 18 19 20p=0.1 n=10p=0.1 n=50p=0.1 n=100由图可见,由图可见, p一定,图形随一定,图形随n而变化,而变化,n大,图形顶点向中间移;大,图形顶点向中间移;

45、n小,图形偏度大。小,图形偏度大。n,不论,不论p为何值,图形都对称。为何值,图形都对称。数统可证数统可证,当,当n,p不过小,二项分布不过小,二项分布正态分布正态分布 当当n,而,而p又相当小时,二项分布又相当小时,二项分布泊松分布泊松分布二项成数总体标准差二项成数总体标准差以以成数成数(百分数)百分数)表示表示:二项成数总体平均数二项成数总体平均数p=ppnpq=二项总体平均数二项总体平均数=npx以以次数次数表示表示:二项总体标准差二项总体标准差npqx= 二项分布属间断性变数资料,但是,当二项分布属间断性变数资料,但是,当n 较大,较大,p不过小,不过小,而而np和和nq又不小于又不小

46、于5 时时,二项分布接近正态,二项分布接近正态分布,因而可将百分数资料作正态分布处理,从而作分布,因而可将百分数资料作正态分布处理,从而作出近似的测验。出近似的测验。第四节第四节 样本百分数的假设测验和区间估计样本百分数的假设测验和区间估计单个样本百分数的假设测验和区间估计单个样本百分数的假设测验和区间估计两个样本百分数的假设测验和区间估计两个样本百分数的假设测验和区间估计一一. .单个样本百分数的假设测验和区间估计单个样本百分数的假设测验和区间估计(一)单个样本百分数的假设测验(一)单个样本百分数的假设测验 np,nq小于小于5时,通过二项展开式计算概率;时,通过二项展开式计算概率; np,

47、nq大于大于5,小于,小于30时,可以进行时,可以进行 u测验,但要测验,但要作连续性矫正;作连续性矫正; np,nq大于大于30时,进行时,进行u测验,无需作连续矫正。测验,无需作连续矫正。测验某一样本百分数测验某一样本百分数 p所在总体的百分数所在总体的百分数P是否与是否与某一理论值某一理论值P0相同。相同。若满足正态接近法的条件若满足正态接近法的条件, 则可对则可对H0:P=P0作作u测验测验无需连续矫正无需连续矫正需要连续矫正需要连续矫正pppu0 =pcnppu5 . 0)(0=pnpp5 . 00=百分数的标准误百分数的标准误npqp=例例3.16 某种子站引进一批小麦种子,平均发

48、芽率是某种子站引进一批小麦种子,平均发芽率是90%,为,为了防止种子带菌,对这批种子进行药物处理,并从处了防止种子带菌,对这批种子进行药物处理,并从处理后的种子中,随机抽出理后的种子中,随机抽出400粒进行发芽试验,结果发粒进行发芽试验,结果发芽种子数芽种子数356粒,不发芽粒,不发芽44粒,问药物处理对种子发芽粒,问药物处理对种子发芽率是否有影响。率是否有影响。这里这里n=400,p0=0.90, np,nq大于大于30时,可进行时,可进行u测验,测验,无需作连续矫正无需作连续矫正.H0: p=p0=0.90 即处理后的小麦种子平均发芽率仍为即处理后的小麦种子平均发芽率仍为90%;对对HA:

49、 p p0,显著水平,显著水平=0.05第二步:计算样本百分数,标准误,正态标准离差第二步:计算样本百分数,标准误,正态标准离差 89. 0400356=p已知已知 p=0.90 q=1-p=1-0.90=0.10ppp0 =015. 040010. 090. 0=u0.05=1.96,实得,实得|u| =0.667 , |u| u0.05 故否定故否定H0,接受,接受HA,推断新农药的杀虫效果与原农药有显著不同。推断新农药的杀虫效果与原农药有显著不同。069.0504 .06 .0=估计新农药总体平均杀虫率的估计新农药总体平均杀虫率的95%的置信区间。的置信区间。pupL=1pupL=2由于

50、由于H0被否定,被否定,新农药的杀虫效果显著不同于原农药。新农药的杀虫效果显著不同于原农药。ppspp0,psupL=1psupL=20604. 050)76. 01 (76. 0=nqpsppsupL=16420. 00604. 096. 176. 0=psupL=2878. 00604. 096. 176. 0=nsupLp5 . 01=nsupLp5 . 02=632. 0505 . 00604. 096. 176. 01=L888. 0505 . 00604. 096. 176. 02=L当当np,nq小于小于30时,对总体百分数的区间估计也要作连续性矫正。时,对总体百分数的区间估计也

51、要作连续性矫正。二二. . 两个样本百分数的假设测验和区间估计两个样本百分数的假设测验和区间估计(一)两个样本百分数的假设测验(一)两个样本百分数的假设测验 np,nq小于小于5时,按二项分布直接进行检验;时,按二项分布直接进行检验; np,nq大于大于5,小于,小于30时,可以进行时,可以进行 u测验测验 (t测验测验) ,但要作连续性矫正;但要作连续性矫正; np,nq大于大于30时,进行时,进行u测验,无需作连续矫正。测验,无需作连续矫正。测验两个样本百分数测验两个样本百分数p1和和p2的差异显著性,即由两样本的差异显著性,即由两样本百分数百分数p1和和p2之差推断两样本所属总体之差推断

52、两样本所属总体P1和和P2是否相同。是否相同。2121ppppu= np,nq大于大于30,进行,进行 u测验,无需作连续矫正。测验,无需作连续矫正。在在H0:P1=P2下下,21pp 分别从两个总体抽出的两个样本百分数的差数为分别从两个总体抽出的两个样本百分数的差数为 ,它服从平均数为它服从平均数为0,标准差为,标准差为 的正态分布。的正态分布。21pp 设设p1= x1/n1, p2= x2/n2,两样本百分数的差数标准误为两样本百分数的差数标准误为22211121nqpnqppp=)11()1 ()11(212121nnppnnqpspp=在两总体的百分数为未知时,在在两总体的百分数为未

53、知时,在 的假设下,的假设下,可用样本百分数的加权平均值作为估计值可用样本百分数的加权平均值作为估计值2221pp=两总体百分两总体百分数已知数已知p_x1+x2n1+n2=例例3.20 现研究一种新型杀虫剂,试验现研究一种新型杀虫剂,试验1000头虫子中杀死头虫子中杀死728头,头,原类似杀虫剂,在原类似杀虫剂,在1000头虫子中杀死头虫子中杀死657头,问新型杀虫剂的杀虫头,问新型杀虫剂的杀虫率是否高于原杀虫剂?率是否高于原杀虫剂?对对HA: p1 p23075. 06925. 011=pqH0: p1p2 即新型杀虫剂的杀虫率并不高于原杀虫剂即新型杀虫剂的杀虫率并不高于原杀虫剂显著水平显

54、著水平=0.056925. 0100010006577282121=nnxxp728. 010007281=p657. 010006572=p02063. 0)1000110001(3075. 06259. 021=pps44. 302063. 0657. 0728. 02121=ppsppuu0.05,所以否定,所以否定H0,接受,接受HA,一尾测验一尾测验=0.05时,时, u0.05=1.64,实得实得u=3.44,认为新型杀虫剂的杀虫效果显著高于原杀虫剂。认为新型杀虫剂的杀虫效果显著高于原杀虫剂。例例3.19 调查高肥水地某小麦品种调查高肥水地某小麦品种251株(株(n1),发现感白粉病的,发现感白粉病的238株(株(x1),感病率,感病率 为为0.948,同时调查中肥地该品种,同时调查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论