版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章统计推断第一节
统计推断的基本概念第二节平均数的假设测验第三节二项资料的百分数假设检验
1精选PPT第四章统计推断1精选PPT
研究总体和样本的关系可从两个方向进行分析:一是从总体到样本方向──抽样分布问题,可称为第Ⅰ方向;二是从样本到总体方向──统计推断(statisticalinference)问题,可称为第Ⅱ方向,两者互为逆命题.
2精选PPT研究总体和样本的关系可从两个方向进行分
本章主要讲述第Ⅱ方向。用样本平均数可以估计总体平均数,但样本平均数有误差,所以推断结论并非绝对正确。之间的差异来自两方面:真实差异和抽样误差。需要对其进行判断。3精选PPT本章主要讲述第Ⅱ方向。用样本平均数可以估计总
第一节
统计推断的基本概念
一、统计推断
统计推断就是根据抽样分布律和概率理论,用样本统计数推断总体参数。
4精选PPT第一节统计推断的基本概念一、统计推断4精选PPT统计推断包括参数估计(parametricestimate)和统计假设测验(hypothesistest)两个方面的内容。统计推断的前提条件:资料来自随机样本、统计数分布律已知。5精选PPT统计推断包括参数估计(parametric二、参数估计
指用样本统计数对总体参数作点估计(pointestimate)和区间估计(intervalestimate)。1、点估计就是用样本统计数直接估计相应的总体参数,例如用估计μ;用s2估计σ2等。6精选PPT二、参数估计6精选PPT2、根据抽样分布试验,样本统计数亦是一个随机变数,所以不同的样本会有不同的估计值,即点估计具有一定的偏差,因此有必要估算一个取值范围,使总体参数能够以很高的置信度落在这个区间内,这种用样本统计数在一定的概率保证下估计总体参数所在范围的方法,称为参数的区间估计。7精选PPT2、根据抽样分布试验,样本统计数亦是一个随机变数,所以不同的总体参数可能所在的区间称为置信区间(confidenceinterval)。置信区间的上下限称为置信限(confidencelimits)。保证参数在该区间内的概率称为置信系数或置信度(confidencecoefficient),以P=1-α表示。第一节统计推断的基本概念
8精选PPT总体参数可能所在的区间称为置信区间(confidencei其中α称为显著水平(significancelevel):是指用于测验假设的概率标准。农业试验中,一般取α=0.05和α=0.01,达到0.05显著水平称为检验对象间差异显著,用*表示;达到0.01显著水平称为检验对象间差异极显著,用**表示9精选PPT其中α称为显著水平(significancelevel):10精选PPT10精选PPT以式表示为:
P(L1≤θ≤L2)=1-α
式中θ指总体参数,如:μ、σ2、μ1-μ2等。L1和L2称为置信限,其中L1称为置信下限;L2称为置信上限。
第一节统计推断的基本概念
11精选PPT以式表示为:第一节统计推断的基本概念11精选PPT第一节统计推断的基本概念
三、假设测验
假设检验就是用样本统计数对总体假设的真伪做出检验的概率方法。
12精选PPT第一节统计推断的基本概念三、假设测验第一节统计推断的基本概念
四、无效假设和备择假设统计假设分为两类:1、无效假设(nullhypothesis):用于检验的假设,以其为前提可以计算试验结果出现的概率。指总体参数与其假设值之间无实质性差异,其差异由抽样误差造成。记作:H0。13精选PPT第一节统计推断的基本概念四、无效假设和备择假设统计假无效假设的目的:可以从假设的总体里推断其随机抽样平均数的分布,从而可以计算出某一样本平均数指定值出现的概率,即研究总体和样本的关系,进行假设检验。14精选PPT无效假设的目的:14精选PPT2、备择假设(alternativehypothesis):无效假设被否定后必须接受的后备假设。记作:HA
注:H0和HA为对立事件,即:P(H0+HA)=1
15精选PPT2、备择假设(alternativehypothesis)第一节统计推断的基本概念
五、小概率原理(小概率事件的实际不可能原理)
凡是概率很小的事件在一次试验中实际上是不可能出现的。
统计推断是以小概率原理为基础而进行的。小概率的标准即为显著性水平。
16精选PPT第一节统计推断的基本概念五、小概率原理(小概率事件的第一节统计推断的基本概念
六、接受区间与否定区间
在假设检验中,抽样分布曲线下接受Ho的区域称为接受区域(regionofacceptance),等于总体参数的置信区间,其置信概率为1-α。
否定Ho的区域称为否定区域(regionofrejection),等于总体参数置信区间以外的区域;其概率为显著水平α
17精选PPT第一节统计推断的基本概念六、接受区间与否定区间μμ+1.96δμ-1.96δ0.950.0250.025接受区域否定区域否定区域18精选PPTμμ+1.96δμ-1.96δ0.950.0250.025第一节统计推断的基本概念
七、假设检验的基本步骤
(1)对样本所属的总体参数提出假设,包括无效假设Ho和备择假设HA。(2)确定显著水平α.(3)计算。在Ho正确的前提下,根据统计数的抽样分布计算出所得样本统计数的概率p。(4)统计推断,将实得样本统计数的概率p与确定的显著水平α相比较,依据概率大小作出应接受哪种参数假设的检验。(5)对结果进行解释。19精选PPT第一节统计推断的基本概念七、假设检验的基本步骤第一节统计推断的基本概念
例4.1:当地小麦品种亩产μ0=300公斤,多年种植的标准差75公斤;新引进品种经25个小区试验,亩产量330Kg,问两者是否有显著差异?解:1、Ho:μ=300Kg;HA:μ0≠300Kg;α.=0.05
2、计算u值
20精选PPT第一节统计推断的基本概念例4.1:当地小麦品种亩产μ03、根据α.=0.05,查表得临界值u0.05=1.9621精选PPT3、根据α.=0.05,查表得临界值u0.05=1.9621第一节统计推断的基本概念
所以,|u|>u0.05,330Kg在抽样分布中的概率p<0.05,故否定Ho:μ=300Kg;接受HA:μ≠300Kg。4、差异显著,即330Kg所属的总体平均数μ与μ0=300的总体均数间有显著差异,或者说330Kg不属于μ0=300的总体。说明引进品种产量明显高于当地品种。
22精选PPT第一节统计推断的基本概念所以,|u|>u0.第一节统计推断的基本概念
八、
两尾检验和一尾检验
如果否定区域位于抽样分布曲线的两尾,左尾的概率为α/2,右尾的概率亦为α/2,则称这种假设检验为两尾检验(two-tailedtest)。如果否定区域仅在抽样分布曲线的一尾,其概率为α,则称这种假设检验为一尾检验(one-tailedtest)。
23精选PPT第一节统计推断的基本概念八、两尾检验和一尾检验当显著性水平α相同时,一尾检验比两尾检验容易否定Ho,对鉴定差异的显著性较灵敏
其中,否定区域在左尾的称为左尾检验。否定区域在右尾的称为右尾检验24精选PPT当显著性水平α相同时,一尾检验比两尾检验容易否定Ho实得u值与临界值uα直接比较否定Ho的标准━━━━━━━━━━━━━━━━━━检验方法显著水平显著水平(α=0.05)(α=0.01)──────────────────两尾检验│u│>1.96│u│>2.576左尾检验u<-1.645u<-2.326右尾检验u>1.645u>2.326━━━━━━━━━━━━━━━━━━第一节统计推断的基本概念25精选PPT实得u值与临界值uα直接比较否定Ho的标准第一节统计推断两尾检验和一尾检验的主要区别:(1)两尾检验和一尾检验的的假设不同。(2)两尾检验和一尾检验用以划分两个总体的临界值不同。(3)一尾检验比两尾检验容易否定Ho,鉴定差异显著性的灵敏度较高。
第一节统计推断的基本概念26精选PPT两尾检验和一尾检验的主要区别:第一节统计推断的基本概念2九、假设检验的两类错误
第一类错误:如果无效假设Ho为真,但通过检验却否定了它,这种错误称为弃真错误,又称统计错误的第Ⅰ类错误(typeIerror),其概率为显著水平α。
第一节统计推断的基本概念27精选PPT九、假设检验的两类错误第一类错误:如果无效第二类错误:如果无效假设Ho为伪,但通过检验确接受了它,这种错误称为取伪错误,又称为统计推断的第二类错误(typeIIerror),其概率以β记。28精选PPT第二类错误:如果无效假设Ho为伪,但通过检验确接受了它,这种第一节统计推断的基本概念29精选PPT第一节统计推断的基本概念29精选PPT第一节统计推断的基本概念30精选PPT第一节统计推断的基本概念30精选PPT31精选PPT31精选PPT
当用样本平均数总体均数作统计推断时,可能会发生第一类错误或第二类错误,但是两类错误不可能同时发生。
第一类错误α会对第二类错误β产生影响,当显著水平从α=0.05减少到α=0.01时,则会增大第二类错误的概率
第一节统计推断的基本概念32精选PPT当用样本平均数总体均数作统计推断时,可能会发
在假设检验中犯第一类错误的概率,其最大值为α。
在假设检验中犯第二类错误的概率,其最大值为β=1-α。
33精选PPT在假设检验中犯第一类错误的概率,其最大值为α。关于两类错误:1、样本容量n固定的条件下,提高显著水平α(取较小的α值),将增大第二类错误的概率β值。2、在n和α相同的条件下,真总体平均值μ与假设总体平均值μ0的相差(以标准差为单位)愈大,则犯第二类错误的概率越小。第一节统计推断的基本概念34精选PPT关于两类错误:第一节统计推断的基本概念34精选PPT3、为了降低犯两类错误的概率,需采用一个较低的显著水平,如α=0.05;同时适当增加样本容量,或适当减小总体方差σ2,或两者兼有之。4、如果α已固定,则改进试验技术和增加样本容量可有效降低犯第二类错误的概率。
35精选PPT3、为了降低犯两类错误的概率,需采用一个较低的显著水平,如α第二节平均数的假设测验一、单个样本平均数的统计推断(一)单个样本平均数的假设检验
这是检验样本均数所属的总体均数μ与假设的总体均数μ0是否相等的假设检验。无效假设Ho:μ=μ0,μ≠μ0(或者Ho:μ≥μ0,HA:μ<μ0Ho:μ≤μ0,HA:μ>μ0)。36精选PPT第二节平均数的假设测验一、单个样本平均数的统计推断1、u测验
当总体方差σ2已知或σ2未知但n≥30时,用u检验。例4.2:如引进品种与原地方品种比较,因σ2已知时,故用u检验:
第二节平均数的假设测验37精选PPT1、u测验第二节平均数的假设测验37精选PPT第二节平均数的假设测验例4.3:抽检了80包方便面,计得净重平均数=65.05(g),s=2.54(g),试检验该方便面净重的总体均数μ是否显著高于标准μ0=65(g)?假设H0:μ≤65(g)对HA:μ>65(g)显著水平α=0.05
检验计算
虽然总体方差σ2未知,但是n>30为大样本,故可用u检验。
38精选PPT第二节平均数的假设测验例4.3:抽检了80包方便面,计得净实得u<uα=1.645,故接受Ho:μ≤65(g)否定HA:μ>65(g),即该方便面净重的总体均数μ与标准重量μ0=65(g)之间无显著差异,因而可以确定包装机工作正常。39精选PPT实得u<uα=1.645,故接受Ho:μ≤65(g)否定H第二节平均数的假设测验2、
当总体方差σ2未知,且n<30为小样本时,用t检验。
例4.4:随机抽样测定了某小麦品种的千粒重,n=8,观察值为32.7、36.8、35.9、34.6、35.6、37.6、33.4、35.1(g),试检验该小麦品种千粒重的总体均数μ与假设总体均数μ0=34(g)之间的差异显著性?
40精选PPT第二节平均数的假设测验2、当总体方差σ2未知,且n<30参数假设Ho:μ=34g;HA:μ≠34g显著水平α=0.05
检验计算
由于总体方差σ2未知,且n<30为小样本,故需用t检验。
41精选PPT参数假设Ho:μ=34g;HA:μ≠34g41精选PPTdf=n-1=8-1=7两尾临界值t0.05=2.364642精选PPTdf=n-1=8-1=742精选PPT统计推断:因p(│t│>2.3646)=0.05,实得t值的概率p(│t│>2.087)>0.05,故接受Ho:μ=34(g),否定HA:μ≠34(g),
即该小麦品种千粒重总体均数μ与假设总体均数μ0=34(g)之间无显著差异。
43精选PPT统计推断:因p(│t│>2.3646)=0.05,实得t值的(二)总体均数μ的区间估计当总体方差σ2已知或σ2未知但n≥30时,μ的1-α的置信区间为:44精选PPT(二)总体均数μ的区间估计44精选PPT(三)推断总体均数μ所需的样本容量
由样本均数的抽样分布可知,当n趋近∞时,必趋近μ,但是n的增大必将使人力物力消耗增多,故n不可能很大。
45精选PPT(三)推断总体均数μ所需的样本容量45精选PPT用uα替换上式中的u值,即可得推断总体平均数所需的样本容量。
若为t分布,则:46精选PPT用uα替换上式中的u值,即可得推断总体平均数所需的样本容量二、两个样本平均数差数的统计推断(一)假设测验1、成组数据的比较(两个独立总体均数差数(μ1-μ2)的假设检验)
两个处理完全随机设计,各供试单位彼此独立,不论两处理的样本容量是否相同,所得数据为成组数据
47精选PPT二、两个样本平均数差数的统计推断1、成组数据的比较(两个独立(1)u测验:当两个总体方差σ12和σ22已知时,用u测验:48精选PPT(1)u测验:48精选PPT例4.5:某小麦平方米产量的σ2=0.4(Kg)2,在其地块内用A、B两法抽样:A法12样点,(1=1.2Kg,B法8样点,2=1.4Kg。比较两法每平方米产量是否相等。49精选PPT例4.5:某小麦平方米产量的σ2=0.4(Kg)2,在其地解:Ho:μ1=μ2,HA:μ1≠μ2,α=0.05σ12=σ22=σ2=0.4,n1=12,n2=850精选PPT解:Ho:μ1=μ2,HA:μ1≠μ2,α=0.0550精
|u|<U0.05=1.96,所以接受Ho:μ1=μ2,两法所取每平方米产量相同,1-2=-0.2属于抽样误差
51精选PPT|u|<U0.05=1.96,所以接受Ho(2)t测验
当两个总体方差σ12和σ22未知,但可假定σ12=σ22,,用t检验首先计算两样本均方的加权平均数:52精选PPT(2)t测验首先计算两样本均方的加权平均数:5然后计算两样本平均数差数的标准误:53精选PPT然后计算两样本平均数差数的标准误:53精选PPT最后计算t值:df=(n1-1)+(n2-1)例4.6研究矮状素使玉米矮化的效果,测定使用矮壮素小区8株,对照区9株,试作假设测验。54精选PPT最后计算t值:例4.6研究矮状素使玉米矮化的效果,测定使用______________________重复x1(CK)x2(处理)______________________117016022701603180200425016052702006290170727015082302109170________________________n98233.3176.3
55精选PPT______________________55精选PP解:由于用矮状素处理的玉米株高不可能大于对照的玉米株高,故作一尾检验。参数假设:Ho:μ2≥μ1对HA:μ2<μ1显著水平α=0.01检验计算:SS1=18400SS2=3787.5
56精选PPT解:由于用矮状素处理的玉米株高不可能大于对照的玉米株高57精选PPT57精选PPT
df=n1+n2-2=9+8-2=15查t分布表得一尾检验的临界值t0.05=1.753,t0.01=2.6025
58精选PPTdf=n1+n2-2=9+8-2=155统计推断:因为p(t<-2.6025)=0.01,实得t值的概率p(t<3.05)<0.01,
故否定Ho:μ2≥μ1,接受HA:μ2<μ1,即喷矮状素的玉米株高极显著地矮于对照。
59精选PPT统计推断:因为p(t<-2.6025)=0.01,实得t值的近似t测验:当两个总体方差σ12和σ22未知,且σ12≠σ22,用近似t检验因为σ12≠σ22,差数标准误需用两个样本的S12、S22均方分别估计σ12、σ2260精选PPT近似t测验:60精选PPT但所得t值不作准确的t分布,故仅能进行近似的t测验:需计算k和61精选PPT但所得t值不作准确的t分布,故仅能进行近似的t测具有自由度62精选PPT具有自由度62精选PPT2、成对数据的比较
将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给与不同处理,所得的观察值为成对数据63精选PPT2、成对数据的比较将性质相同的两个供试单位配成一对,并设两个样本的观察值分别为:x11,x12,x13,……,x1nx21,x22,x23,……,x2nn对观察值为:(x11,x21),(x12,x22),(x13,x23),……,(x1n,x2n)每对的差数:di=x2i-x1i64精选PPT设两个样本的观察值分别为:64精选PPT差数的平均数和方差为:65精选PPT差数的平均数和方差为:65精选PPT差数平均数的标准误:
所以:具有df=n-166精选PPT差数平均数的标准误:具有df=n-166精选PPT若H0:μd=0,则:例4.7:同一番茄叶片分别接种A、B两种病毒,得病癍数如下。试测验两种处理方法的差异显著性。67精选PPT若H0:μd=0,则:例4.7:同一番茄叶片分别接种A、B两组别x1(A)x2(B)d11025-152131213814-64315-125512-762027-77618-1268精选PPT组别x1(A)x2(B)d11025:Ho:μd=0,HA:μd≠0α=0.01
=[(-15)+1+……+(-12)]/7=-58/7=-8.3(个)
=(-15)2+12+……+(-12)2=167.43
=-8.3/1.997=-4.16
69精选PPT解:Ho:μd=0,HA:μd≠0α=0.01df=n-1=7-1=6时,t0.01=3.707,|t|>t0.01,推断:否定Ho:μd=0,接受HA:μd≠0,即:A、B两法病毒斑数有极显著差异。(二)区间估计1、两个总体均数差数(μ1-μ2)的区间估计70精选PPTdf=n-1=7-1=6时,t0.01=3.707,(1)两个总体方差σ12和σ22已知或虽未知但为大样本时(μ1-μ2)的1-α置信区间为:
71精选PPT(1)两个总体方差σ12和σ22已知或虽未知但为大样本时(μ(2)当两个总体方差σ12和σ22未知,但可假定σ12=σ22,且两个样本又为小样本时(μ1-μ2)的1-α置信区间为:72精选PPT(2)当两个总体方差σ12和σ22未知,但可假定σ12=σ2(3)当两个总体方差σ12和σ22未知,且σ12≠σ22时(μ1-μ2)的1-α置信区间为:73精选PPT(3)当两个总体方差σ12和σ22未知,且σ12≠σ22时72、成对数据总体差数μd的置信限74精选PPT2、成对数据总体差数μd的置信限74精选PPT(三)推断两个总体均数差数所需的样本容量1、推断两个独立总体均数差数(μ1-μ2)所需的样本容量75精选PPT(三)推断两个总体均数差数所需的样本容量75精选PPT2、推断两个配对总体差数均数μd所需的样本容量
用替换上式中的t值,即可得到假设检验用于推断两个配对总体差数均数μd所需的样本容量:
76精选PPT2、推断两个配对总体差数均数μd所需的样本容量第三节二项资料的百分数假设测验
一、单个样本百分数(成数)的假设测验目的:测验某一样本百分数所属总体百分数与某一理论值或期望值p0的差异显著性。77精选PPT第三节二项资料的百分数假设测验一、单个样本百分数(成数)例4.13:紫花与白花大豆杂交,F2共得289株:紫花208,白花81,测验是否符合一对等位基因的遗传规律?78精选PPT例4.13:紫花与白花大豆杂交,F2共得289株:紫花208解:对紫花H0:p=0.75;HA:p≠0.75,u0.05=1.96=208/289=0.7197|u|<u0.05,所以接受H0:p=0.75,即符合一对等位基因的遗传规律,与p之间的差异属随机误差。79精选PPT解:对紫花H0:p=0.75;HA:p≠0.75,u0.05也可用次数资料进行测验:np=289×0.75=216.75所以:结果同上。80精选PPT也可用次数资料进行测验:80精选PPT二、两个样本百分数相比较的假设测验目的:测验两个样本百分数和所属总体百分数p1和p2的差异显著性。总体百分数已知时,样本差数标准误:81精选PPT二、两个样本百分数相比较的假设测验81精选PPT若p1=p2=p;q1=q2=q:总体百分数p1、p2未知,在假设下:82精选PPT若p1=p2=p;q1=q2=q:82精选PPT
差数标准误:
由可测验Ho.83精选PPT83精选PPT例4.14:调查两地块小麦锈病,测验锈病率有无差异。n1=378株,x1=355株,=93.92%n2=396株,x2=346株,=87.31%解:H0:p1=p2;HA:p1≠p2,u0.05=1.96
84精选PPT例4.14:调查两地块小麦锈病,测验锈病率有无差异。84精选所以:否定H0:p1=p2,接受HA:p1≠p285精选PPT所以:否定H0:p1=p2,接受HA:p1≠p285精选P三、二项样本假设测验时的连续性校正
二项资料是间断性变数,用连续型分布进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年村社高价彩礼治理知识问答库
- 2026年患者隐私权保护知识竞赛
- 2026年经济预测与市场趋势分析能力测验题目库
- 心理专业进阶2026年心理测试与问答
- 2026年退役军人事务系统优抚社工与志愿服务队伍建设题库
- 2026年驾考科目二场地驾驶技能考试指南
- 2026年高考英语十校联考全真模拟试卷及答案(一)
- 2026年初中地理毕业会考全真模拟试卷及答案(共十八套)
- 西藏高考:地理重点基础知识点归纳
- 2026年河北工业职业技术大学教师招聘考试备考试题及答案解析
- 市政道路改造管网施工组织设计
- 药融云-甾体类药物行业产业链白皮书
- 幼儿园课程开发与教学课件
- 人教A版高中数学选择性必修第二册《导数在研究函数中的应用》评课稿
- 浮头式换热器课程设计说明书
- 脊柱侧弯三维矫正
- 轧钢厂安全检查表
- YY/T 0299-2022医用超声耦合剂
- JJG 968-2002烟气分析仪
- 尿素-化学品安全技术说明书(MSDS)
- GB 16357-1996工业X射线探伤放射卫生防护标准
评论
0/150
提交评论