统计假设测验_第1页
统计假设测验_第2页
统计假设测验_第3页
统计假设测验_第4页
统计假设测验_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 上章主要讨论了从总体到样本的问题,本章将讨论从样本到总体的问题,即统计推断统计推断问题。 统计推断统计推断:根据效应是误差的概率而作出推论的方法 。统计推断包括统计假设测验统计假设测验和参数估计参数估计两个方面。 统计假设测验统计假设测验:先作无效假设(处理的效应是由误差造成),再依据该假设概率大小来判断接受或否定该假设的过程 。参数估计参数估计:由样本结果对总体参数作出点估计点估计或区间估计区间估计。一、统计假设 由于总体多是无限的,往往需要用样本推断总体,因此首先需要提出一个有关其总体参数的假设。例如假设某小麦新品种的产量和原品种的产量一样。下面是一些统计假设的例子:(一)单个平均数的假

2、设(一)单个平均数的假设 一个样本是从平均数为0的总体中随机抽出的,记作h0:=0。 例如:某一小麦新品种的产量具有原地方品种的产量,其平均产量等于某一指定值0,记为: h0:= 0(二)两个样本平均数相比较的假设(二)两个样本平均数相比较的假设 两个样本是从两个具有相同的总体中随机抽出的,记为h0:1= 2 例如:(1)两个小麦品种的产量是相同的。(2)两种杀虫剂对于某种害虫的药效是相等的。 上述假设称为无效假设无效假设。假设效应是抽样误差。 备择假设:备择假设:和无效假设相对应的一个假设。记作ha: 0或ha:1 2。意思是说,如果否定了无效假设,则必须接受备择假设,反之亦然。二、统计假设

3、测验的基本方法 设某地区的当地小麦品种667m2产300kg,即当地品种的总体平均数0=300kg,并从多年种植结果获得其标准差=75kg,而现有某新品种通过25个小区的试验,样本平均产量为每667m2产330kg,即 =330,那么新品种样本所属总体与原总体是否有显著差异呢?_y(一)提出统计假设。提出统计假设。 h0:=0(二)确定显著水平=0.05 _y与0 之间的差数330-300=30kg属随机误差。即新品种与老品种之间不存在真实的差异,样本平均数显著水平还可以是=0.01(三)计算抽样误差出现的概率。计算抽样误差出现的概率。 据题意,可求u值值25/75300330_yyu|u|

4、1.96 ,两尾概率小于0.05。用来测验假设的概率标准5%或1%等,称为显著水显著水平平,以表示。= 0.05为显著, =0.01为极显著(四)作出接受或否定无效假设的统计推断。当一事件的概率很小时,可认为该事件在一次试验中几乎是不可能发生的事件。故当 -由随机误差造成的概率小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设,接受备择假设,样本平均数不是原总体中的一个样本。_y三、两尾测验与一尾测验三、两尾测验与一尾测验 在提出一个统计假设时,必有一个相对应的备择假设。例如上述单个平均数测验,若h0:= 0 ,则备择假设为ha:0 。后者即指该新品种的总体平均产量不是300kg,这

5、包括大于300kg和小于300kg两种可能性。因而在假设测验时所考虑的概率为正态曲线左边一尾概率(小于300kg)和右边一尾概率(大于300kg)的总和。这类测验称为两尾两尾测验,测验,它具有两个否定区域。 两尾测验示意图0.000.010.02285300270255y0.03315330345fn (y)接受区域95%否定区域2.5%否定区域2.5%270.6329.4但在某些情况一下,两尾测验不一定符合实际需要。例如,某型计算机的使用时数要求 0 。如果进行抽样测验,则在_y 0 时,不需要否定h0;但如果_y 0 ,即可能是一批不合格产品。因此,测验的假设应为h0: 0(产品合格);

6、ha:0 (产品不合格)。这样否定区在左尾。反之,如果h0: 0 ; ha:0 。这时否定区就只有右尾。_y接受区否定区_y左尾测验否定区接受区右尾测验0.950.95四、统计假设的两类错误 统计假设测验是根据一定的概率标准对总体特征作出推断。否定了h0,并不等于已证明h0不真实;接受了h0 ,也不等于已证明h0是真实的。 如果h0是正确的,通过测验却否定了它,就犯了一个否定真实假设的错误。这叫第一类错误第一类错误或i i型错型错误误或错误错误。如果h0是错误的,通过测验没有发现其不真实而接受了它,即犯了一个接受不真实的h0的错误。这叫第二类错误或iiii型错误型错误或错误错误。 现以p79上

7、的例子说明值的计算。83. 00015. 08315. 0)96. 2()96. 0(96. 0153154 .32996. 2153156 .27021upupuuc1c22552702853003153303453600270.6329.4329.4c1c2255270285300315330345360037539015%2552702853003153303453600两类错误的要点:1、在样本容量n固定的条件下,提高显著水平的值,将增大犯错误的概率。2、在n和显著水平相同的条件下,总体平均数和假设平均数0 相差愈大,则犯第二类错误的概率愈小。3、为了降低犯两类错误的概率,需要采用一个

8、较低的显著水平,如=0.05;同时适当增加样本容量,或适当减小总体方差,或两者兼有之。4、如果显著水平已经确定,则改进试验技术和增加样本容量,可以有效地降低犯第二类错误的概率。一、 t 分布 以前讲过,在和2为已知或样本容量n30时,用s2估计2 ,则从总体中抽样所得样本平均数 的分布为正态分布,具有n(,2 /n)。所进行的测验为u测验。_y当2为未知,而样本容量n30时,如以样本方差s2估计2,则_)(_ysy的分布不呈u分布,而作t分布:_ysytnssy_ t-分布:一组对称曲线,以自由度确定某一特定的分布。自由度用和df表示。当大于30时,t-分布接近于正态分布。 t-分布与正态分布

9、曲线比较:t-分布曲线稍扁平,峰顶略低,尾部稍高。 t 测验:按t 分布进行的假设测验。0.000.100.150.200.2502-2-440.300.350.400.45正态分布标准化正态分布与自由度为4的t分布曲线二、单个样本平均数的假设测验 这是测验某一样本所属的总体平均数是否和某一指定的总体平均数相同。例5.1某春小麦良种的千粒重0 =34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异?测验步骤为:h0: =0 ;ha: 0显著水平。=0.05测

10、验计算: _y=(35.6+37.6+34.6)/8=35.2g83.1887 .2816 .34.6 .376 .35)(2222222_nyyyyssgnsss64. 11883.181gnssy58. 0864. 1_069.258.0342.35_ysyt 查t值表,=7时,t0.05=2.365。现实得 |t| t0.05,故p0.05。 推断:接受h0,即新引入品种千粒重与当地良种千粒重指定值无显著差异。三、两个样本平均数的假设测验 这是由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。测验的方法分为:成组数据成组数据的平均数比较和成对数据成对数据的比较。(一)

11、成组数据的平均数比较(一)成组数据的平均数比较 如果两个处理彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据成组数据,以平均数平均数作为相互比较的标准。 1、在两个样本的总体方差已知时或样本容量大于30时,用u测验。222121_2_1nnyy_2_1)()(21_2_1yyyyu例5.2 据以往资料,已知某小麦品种每平方米产量的2=0.4。今在该品种的一块地上用a、b两法取样,a法取了12个样点,得每平方米 =1.2kg;b法取得8个样点,得 =1.4kg。试比较a、b两法的每平方米产量是否有显著差异?_1y_2y_2_1_2_1yyyyuh0 : ;ha:12 =0.05k

12、gnnyy2887. 084 . 0124 . 0, 8,12, 4 . 0; 4 . 0_2_121222169. 02887. 04 . 12 . 1u接受h0:测验计算:推断: |u|u0.05,故p0.05。) 1() 1()()(212222112nnyyyyse22212、在两个样本的总体方差和为未知,首先,从样本算出平均数差数的方差,作为对2的估计。而两个样本容量小于30,用t 测验。自由度为df=n1-1+n2-1=n1+n2-22se2212_2_1nsnsseeyy_2_1)()(21_2_1yysyyt_2_1_2_1yysyyty1(喷施矮壮素)160160200160

13、200170150210y2(对照)170270180250270290270230170 从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高。h0:喷施矮壮素的株高与未喷的相同或更高ha:例5.4研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:184005.37873.233,3.17621_2_1ssssyy688.18917.1479817.147917.1479875 .378718400_2_12yyess05. 3688.183 .2333 .176t按=7+8=15,查t值表得一尾t0.05=1.753(左尾测验t0.05等于两尾

14、测验的t0.10), |t|t0.05,p0.05。推断:否定h0:12,接受ha:12,即认为玉米喷施矮壮素后,其株高显著地矮于对照。(二)成对数据的比较(二)成对数据的比较 如果试验设计是将性质相同性质相同的两个处理配对,并有多个配对,然后对每一配对的两个处理进行调查所得观察值为成对数据成对数据。 设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为:_2_1_yyd,则差数平均数的标准差为: =n-1) 1()(2_nnddsd_ddsdt_dsdt 例5.6 选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株

15、接种a处理病毒,另一株接种b处理病毒,以研究不同处理方法的病毒效果,表中结果为组别y1(a法)y2(b法)d11025-152131213814-64315-1252027-762020-77618-12病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。两种处理方法对病毒无不同效果;两种处理方法对病毒有不同效果测验计算: 3 . 87/587/)12(.1)15(_d16. 4997. 13 . 8997. 16743.167_tsd查t值表, 在一定概率保证下,估计出一个区间,以能够覆盖参数。这个区间称置信区间置信区间,区间的上、下限称为置信限置信限,区间的长度称为置信距置信距。

16、l1和l2分别表示置信下限下限和上限上限。保证该区间能覆盖参数的概率以p=(1-)表示,称为置信置信度度。0.000.010.02285300270255y0.03315 330345fn (y)接受区域95%否定区域2.5%否定区域2.5%y96. 1y96. 1从图中看出,将有95%的样本 值将落在 至 的范围内,即:yy96. 1y96. 195. 0)96. 1()96. 1(yyyp推广到一般有:1)()(yyuyup1)()(yyuyuyp变换公式:置信度p=(1-)时,的置信区间为:)()(yyuyuy)(),(21yyuyluyl结论:一、总体平均数的置信限(一)在总体方差2为已知或2未知但样本容量大于30时的置信限)()(yyuyuyyyuyluyl21,(二)在总体方差2为未知时,样本容量小于30时的置信限)()(yystystyyystylstyl21,二、两个总体平均数差数的置信限(一)两总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论