




已阅读5页,还剩108页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节统计假设检验的基本原理和方法第二节单个平均数的假设检验第三节两个平均数相比较的假设检验第四节百分数的假设检验第五节参数的区间估计,第六章统计假设测验(显著性检验),第一节统计假设检验的基本原理和方法,一、统计推断的概念,统计推断:是指用一个或一系列样本的结果去估计总体可能的结果的过程。统计推断基本上包括两大部分的内容,一是假设测验,二是参数估计。,统计推断,参数估计,假设测验,点估计,区间估计,统计推断的前提条件:,资料必须来自随机样本;,统计数的分布规律必须已知。,二、统计假设测验的意义,例有一水稻施肥试验,甲乙两种施肥方法的水稻产量如下,能否仅凭这两个平数的差值-=1.77,立即得出甲与乙两种施肥方法的水稻产量不同的结论呢?,统计学认为,这样得出的结论是不可靠的。因为如果我们再做一次甲乙两种施肥方法试验,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是8.88和10.65,其差值也不一定是1.77。造成这种差异可能有两种原因,一是两种施肥方法不同造成的差异,即是两种施肥方法本质不同所致,另一可能是试验误差(或抽样误差)。,二、统计假设测验的意义,对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。,二、统计假设测验的意义,二、统计假设测验的意义,两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。,二、统计假设测验的意义,设甲施肥方法的总体平均数为,乙施肥方法的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。,观测值由两部分组成,即若样本含量为n,则可得到n个观测值:样本平均数:对于接受不同处理的两个样本来说,则有:,二、统计假设测验的意义,处理效应,试验误差,表面效应,虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。,二、统计假设测验的意义,先假设真实差异不存在,表面差异全为试验误差。然后计算这一假设出现的概率,根据小概率事件实际不可能性原理,判断假设是否正确。这是对样本所属总体所做假设是否正确的统计证明,称为统计假设测验(statisticalhypothesistest)。,二、统计假设测验的意义,三、显著性检验的基本步骤,(一)首先对试验样本所在的总体作假设,无效假设:=或-=0或无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出H0的同时相应地提出一对应假设,备择假设:或或备择假设是在无效假设被否定时准备接受的假设。,如何才能判断Ho是否正确?就需要一个界限和标准。统计区间:在统计假设检验中“接受”或“否定”所提出的“无效假设”Ho的概率范围,称为统计区间。显著水平:统计推断时,衡量差异显著性程度的概率标准,称为显著性水平,以表示。常用显著水平=0.05称为5%的显著水平=0.01称为1%的显著水平也有用=0.25称为25%的显著水平=0.10称为10%的显著水平,(一)首先对试验样本所在的总体作假设,0=360kg,=40kg,0,?,原品种,新品系,(二)在无效假设成立的前提下,计算无效假设正确的概率,在H0:=0(360kg)为正确的前提下,样本平均数=380kg则是此分布总体中的一个随机变量,据此,就可以根据正态分布求概率的方法算出在平均数=360kg的总体中,抽到一个样本平均数和相差20kg的概率,从而确定是接受或否定H0。,(二)在无效假设成立的前提下,计算无效假设正确的概率,(二)在无效假设成立的前提下,计算无效假设正确的概率,0,f(),查附表2,即得u值对应的概率p0.05。表明20Kg差异属于试验误差的概率小于5%。根据小概率事件实际不可能性原理,这个假设应被否定,即表面差异不全为试验误差,新品系与原品种之间存在真实差异。,统计上,当1%p5%称所测差异显著,p1%称差异极显著,p5%称差异不显著,所以,统计假设测验又叫差异显著性测验(differencesignificancetest),判定是否属小概率事件的概率值叫显著水平(significantlevel),一般以表示。农业上常取0.05和0.01。凡计算出的概率p小于的事件即为小概率事件。,从H0正确出发,根据的抽样分布划出一个区间,如-的差数在这一区间则接受H0,简称为接受区间,则该差数应解释为随机误差;如-的差数在这一区间外则否定H0,简称为否定区间,则该差数应解释为本质上不同的真实差异。区间的确定:接受区间与否定区间的两个,(二)在无效假设成立的前提下,计算无效假设正确的概率,(二)在无效假设成立的前提下,计算无效假设正确的概率,若要在0.05水平上接受H0:=0,=0.05时,由附表2得u=1.96,假设接受区域(acceptanceregion),假设否定区域(negationregion),接受区域95%,360,=0.05时H0:=0的接受区和否定区,01.96,(,),01.96,(,),=360-1.9610=340.4kg,=360+1.9610=379.5kg,同理,=0.01时,由附表2得u=2.58,则H0:=0的接受区域为,否定区域为,(二)在无效假设成立的前提下,计算无效假设正确的概率,在实际检验时,计算概率可以简化,因为在标准正态分布下:P(|u|1.96)=0.05,P(|u|2.58)=0.01,因此,在用u分布作检验时,|u|1.96,表明概率P0.05,可在0.05水平上否定H0;|u|2.58,表明概率P0.01,可在0.01水平上否定H0|u|30时,t分布与标准正态分布的区别很小;n100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致。,t分布的主要特性:,u分布,t分布(df=1),t分布及其与标准正态曲线的比较,4、P(atb)面积A,t分布的主要特性:,表3为学生氏t值表(两尾),表达式子P(tt)=中t与之间的关系,由查找t。如图,有P(|t|t)=P(tt+tt)=P(tt)+P(tt)查t表时所用参数为自由度df。,例如,当df=3时,查附表3得两尾概率为0.05的临界t值为t0.05,3=3.182。这表明从3.182的概率和从-3.182-的概率各为0.025。而两尾概率为0.01的临界t值为t0.01,3=5.841,由此可见,df不变时,P越大,t越小;P越小,t越大。,一尾测验,H0:0tt2(df),否定H0,反之接受H0。,若H0:0t-t2(df),否定H0,反之接受H0。,这种用t分布计算所作假设的概率,进行的假设测验叫t测验(t-test),0,f(t),t,-t(df)=-3.182,t(df)=3.182,-,df=3,0.025,0.025,t分布的两尾测验和一尾测验临界t值,应用条件:总体参数0和2为已知或未知,样本平均数来自小样本(nt0.01(9)3.250否定H0,认为差异极显著,即受污染地区极显著地影响了小麦千粒重。,二、单个平均数t检验,单个平均数的统计假设检验,第三节两个平均数相比较的假设检验,由推断120?,一成组数据的平均数比较成组数据其中n1、n2可等可不等。,将试验单位完全随机分为两组,再随机各实施一处理,这样得到的数据称为成组数据,以组的平均数作为比较的标准。,(一)u检验,1、应用条件两个样本总体方差12和22已知,总体方差未知,但n130、n230一般情况下,两个总体的方差是未知的,因此这里着重讨论两个大样本的比较。,2、方法步骤假定甲、乙两总体所属的总体平均数分别为1和2,分别从甲、乙两总体各随机抽取一个大样本,其中:样本I;S1n1样本:S2n2,(一)u检验,统计假设H0:1=2,HA:12,计算样平均数差数标准误和u值,在无效假设H0:1=2时,1-2=0,故上式为:,根据u值的大小推断差异显著性。,例3不同季度监测某工厂排污水中某污染物含量(mg/L)。结果列于表5.3.2,试检验两个季度排污水中污染物含量有无显著差异?,统计假设H:1=2,HA:12计算各样本平均数,方差S2,样本平均数差数标准误和u值,统计推断uu0.01=2.58,差异极显著,表明第一季度排污水中污染物含量极显著高于第二季度。,(二)t检验,1、应用条件两个样本总体方差12和22未知,但两个样本所在总体都服从正态分布,并且,可证:在满足上述条件时,H0:下,有t(n1n22)具有自由度df=n1n22其中差异标准误,(二)t检验,2、方法步骤,(二)t检验,例4对某地污灌区和非污灌区水稻产量进行调查,各测定5个点,每个点30m2,结果见表5.3.3,试检验污灌区和非污灌区水稻产量有无显著差异?,解:第一步建立假设H0:12(两种灌区的水稻产量无显著差异)HA:12第二步确定显著水准0.05、0.01(两尾),第三步计算统计量t值和自由度df,dfn1n22=5+5-28,第四步查表找临界t值t,并作统计推断:查表3得,t0.05(8)2.306t0.01(8)3.55t7.544t0.01(8)3.55,否定H0,差异极显著,表明污灌区由于有毒物质危害,其水稻产量极显著地低于污灌区。,(二)近似t检验,1、应用条件两个样本总体方差12和22未知,并且,当,则此时的不再准确地服从t分布。因此Cochran和Con提出近似t测验法,用t与t相比较,,(二)近似t检验,在进行检验时,如果两个样本的样本容量相等,即n1=n2=n,可直接取df=n-1进行检验;如果n1n2,则需采用转换自由度的方法进行,即先计算k值和,(二)近似t检验,例5调查某地受某重金属污染区5个点的水稻产量,非污染区10个点的水稻产量,试检验两者有无显著差异?,(二)近似t检验,统计假设:H0:1=2,HA:12,计算K及df:,计算平均数差数标准误及,统计推断:由df=9查t值表得t0.01=3.25,t0.01=3.25,差异极显著,表明重金属污染造成水稻严重减产。,二成对数据的平均数比较,当试验单元间差异较大,用完全随机试验将对试验指标有明显影响。可把条件一致的两个供试单元配成一对,并设多个配对,再对每一配对两个单元随机独立实施一处理,这就是配对试验,实为处理数为2的随机区组试验,这样得到的数据称为成对数据。,配对设计试验资料的一般形式例如,半叶法试验资料不同土层养分测定资料同一供试单元上单因素两水平随机区组作处理前后的对试验资料比资料,二成对数据的平均数比较,方法步骤:,(一)提出无效假设与备择假设其中为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数与之差,即。所设无效假设、备择假设相当于,二成对数据的平均数比较,方法步骤:,(二)计算t值,式中,为差数标准误,计算公式为:,d为两样本各对数据之差Sd为d的标准差;n为配对的对子数,即试验的重复数。,(三)查临界t值,作出统计推断根据df=n-1查临界t值:t0.05(n-1)和t0.01(n-1),将计算所得t值的绝对值与其比较,作出推断。,二成对数据的平均数比较,方法步骤:,例6某地在同一地点采集不同土壤深度的土样,共采10个点,分别测定镉含量,测定结果见表5.3.4。试检验不同深度土壤中镉元素垂直分布有无显著差异?,1、提出无效假设与备择假设,,即假定不同深度土壤中镉含量无差异,即假定有不同深度土壤中镉含量差异,2、计算t值,3、查临界t值,作出统计推断,由df=9,查t值表得:t0.05(9)=2.262,因为|t|t0.05(9),接受,表明表明0-20cm与20-40cm两层土壤镉含量无显著差异。,成对数据的比较是假定各个配对的差数的分布为正态分布,具有N(0,2);而每一配对的两个供试单位是彼此相关的。,成组数据的比较是假定两个样本皆来自于各自的正态总体,两个样本的各个供试单位都是彼此独立的,两个样本平均数的差数服从平均数为(1-2),方差为的正态分布。,成对数据由于加强了试验控制,使其可比性提高,因而提高了试验精确度。,成对比较不受两样本的总体方差的干扰,分析时不需考虑是否相等的问题,但成组数据要考虑是否相等的问题。,第四节百分数的假设检验,在第四章介绍二项分布时曾指出:由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分数资料,如成活率、死亡率、孵化率、感染率、阳性率等是服从二项分布的。这类百分数的假设检验应按二项分布进行。即从二项式(p+q)n的展开式中求出某项属性个体的百分数的概率,然后根据概率的大小作出推断。,第四节百分数的假设检验,但是,当样本容量n较大,P不过分小,np和nq又均不小于5时,二项分布接近正态分布,因而可将百分数资料作正态分布处理,从而作出近似的测验。,np,nq小于5时,通过二项展开式计算概率;,np,nq大于5,小于30时,可以进行u测验,但要作连续性矫正;,np,nq大于30时,可进行u测验,无需作连续矫正。,一、单个样本百分数的假设检验,需要检验一个服从二项分布的样本百分数与已知的二项总体百分数差异是否显著,其目的在于检验一个样本百分数所在二项总体百分数p是否与已知二项总体百分数p0相同,换句话说,检验该样本百分数是否来自总体百分数为p0的二项总体。,方法步骤:,(一)提出无效假设与备择假设,(二)计算u值或uc,对于二项成数,总体平均数,总体方差,总体标准差,当n,p不是很小,np、nq5时,二项分布正态分布。此时有N(,)。标准化后有N(0,12)其中差异标准误。在H0:pp0下,N(0,12)应用条件:n30,np、nq5,如果np或nq小于30,需进行连续性矫正。经矫正的正态离差用uc表示:,若(或)1.96,接受,表明样本百分数与总体百分数差异不显著;若,否定,接受,表明样本百分数与总体百分数PO差异显著;若,否定,接受,表明样本百分数与总体百分数PO差异极显著。,方法步骤:,(三)将计算所得的u或uc的绝对值与1.96、2.58比较,作出统计推断,例7按规定,某工厂排污水中含某种污染物的超标率应低于8%(P)时即为合格,现采样210次,超标23次,问抽样结果与超标率低于8%有无显著差别?,1、提出无效假设与备择假设H0:P=P0=0.08,HA:PP0,2、计算u值,3、作出统计推断,因为,接受H0,差异不显著,表明抽样结果与超标率低于8%,无显著差别。,检验服从二项分布的两个样本百分数差异是否显著。其目的在于检验两个样本百分数、所在的两个二项总体百分数P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用u检验法进行检验,但在np和(或)nq小于或等于30时,需作连续性矫正。检验的基本步骤是:,二、两个样本百分数的假设检验,二、两个样本百分数的假设检验,(一)提出无效假设与备择假设,二、两个样本百分数的假设检验,(二)计算u值或uc值,其中,为两个样本百分数,为样本百分数差异标准误,为合并样本百分数:,(三)将u或uc的绝对值与1.96、2.58比较,作出统计推断,二、两个样本百分数的假设检验,若(或)0.05,接受,表明两个样本百分数、差异不显著;,若(或)u0.012.58否定H0,认为该品种在高肥力地和中肥力地种植感白粉病率差异极显著。高肥力地感病率高于中肥力地。,例5.4.3有一批种子,采用两种不同的保存方法,然后在相同的条件下进行发芽试验。从第一种保存方法中取150粒,发芽141粒,发芽率。第二种保存方法中取190粒,发芽175粒,发芽率。问保存方法对种子发芽率是否有影响?,本例为服从二项分布的百分率资料,样本容量n1=150,n2=190,且,即、均大于5,和但小于30,可利用u检验法,需作连续矫正。,第一步建立假设H0:p1p2(两种不同保存方法种子的发芽发芽率无显著差异)HA:p1p2第二步确定显著水准0.05、0.01(两尾),第三步计算统计量u值,第四步作统计推断uc0.504u0.051.96接受H0,认为差异不显著,即两种不同保存方法种子的发芽率无显著差异,区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间(confi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东官洲街道环监所招聘模拟试卷及答案详解(网校专用)
- 2025黑龙江齐齐哈尔市红十字中心血站人员招聘1人模拟试卷及答案详解1套
- 2025安徽蚌埠市怀远县教育局所属事业单位紧缺专业人才引进(校园招聘)15人模拟试卷及答案详解(名师系列)
- 2025内蒙古呼和浩特市新城区中医蒙医医院(新城区保合少镇卫生院)招聘1人考前自测高频考点模拟试题完整答案详解
- 2025春季中国东航北京分公司校园招聘考前自测高频考点模拟试题含答案详解
- 2025年山东出版集团有限公司山东出版传媒股份有限公司招聘(192名)考前自测高频考点模拟试题及答案详解1套
- 2025年返聘人员重新签订的劳动合同
- 2025股权分配合同协议书范本
- 2025广东广州市中山大学孙逸仙纪念医院超声科医教研岗位招聘考前自测高频考点模拟试题及1套完整答案详解
- 2025江苏南京大学医院事业编制和校聘岗位招聘考前自测高频考点模拟试题及完整答案详解1套
- 2025影视演出经纪居间合同正规范本
- 对外投资管理知识培训
- 《早读是需要激情的!》主题班会课件
- 道闸操作安全培训课件
- 普惠金融赋能乡村振兴的实践探索和政策建议-福建省安溪县为例
- 2025年质量月知识竞赛题库(附答案)
- 酒店电气使用安全培训课件
- 生猪订购合同书范本3篇
- 2025年妇产科学科宫颈癌筛查常见问题考试答案及解析
- 耕地占用税培训课件
- 110kV变电站及110kV输电线路运维投标技术方案
评论
0/150
提交评论