环境参数的统计推断(ppt 160页).ppt_第1页
环境参数的统计推断(ppt 160页).ppt_第2页
环境参数的统计推断(ppt 160页).ppt_第3页
环境参数的统计推断(ppt 160页).ppt_第4页
环境参数的统计推断(ppt 160页).ppt_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、环境参数的统计推断(statistical inference),第四章,第四章 环境参数的统计推断,统 计 推 断,由一个样 本或一糸 列样本所 得的结果 来推断总 体的特征,假设检验,参数估计,第四章,第一节,第二节,第三节,第四节,第五节,假设检验的原理与方法,样本平均数的假设检验,样本频率的假设检验,参数的区间估计与点估计,方差的同质性检验,第一节,假设检验的原理与方法,一 概念 : 假设检验(hypothesis test)又称显著性检验(significance test),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经

2、过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。,第一节 假设检验,小概率原理,概率很小的事件在一次抽样试验 中实际是几乎不可能发生的。, =0.05/0.01,如果假设一些条件,并在假设的条件下能够准确地算出事件出现的概率 为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。,假 设 检 验,参数检验,非参数检验,平均数的检验,频率的检验,方差的检验,秩和检验,符号检验,游程检验,秩相关检验,二 、假设检验的步骤,治疗前 0 126 2 240,N ( 126,240 ),治疗后 n 6 x 136 未知 那么 0 ? 即克矽平对

3、治疗矽肺是否有效?,例:设矽肺病患者的血红蛋白含量具平均数0126(mg/L), 2 240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。,1 、提出假设,对 立,无效假设 /零假设 /检验假设,备择假设 /对应假设,0 ,0 ,误差 效应,处理 效应,H0,HA,例:克矽平治疗矽肺病是否能提高血红蛋白含量?,检验治疗后的总体平均数是否还是治疗前的126(mg/L)?,本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。,而相对立的备择假设表示拒绝H0,治疗后的血红蛋

4、白平均数和治疗前的平均数来自不同总体,即克矽平有疗效。,H0:=0 =126(mg/L),HA:0,2 、 确定显著水平,0.05,显著水平*,极显著水平*,能否定H0的人为规定的概率标准称为显著水平,记作。,统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平 。,P ,0.01,0.05,3 、选定检验方法,计算检验统计量,确定概率值,P( u 1.581)=20.0571=0.1142,根据研究设计的类型和统计推断的目的选择使用不同的检验方法。,例:,4、作出推断结论:是否接受假设,P,P ,小 概

5、率 原 理,接受H0 否定HA,否定H0 接受HA,可能正确,可能错误,例:上例中 P0.11420.05 所以接受H0,从而得出结论:使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。,P( u 1.96) =0.05,P( u 2.58) =0.01,已知:,0.95,0.025,0.025,u 1.96,u 2.58,P( u ) 0.05,P( u ) 0.01,差异达显著水平,差异达极显著水平,0,-1.96x,+1.96x,0.95,0.025,0.025,临界值: + ux,左尾,右尾,否定区,否定区,接受区,u,三 、双尾检验与单尾检验,0,-2.58x

6、,+2.58x,0.99,0.005,0.005,临界值: + 2.58x,左尾,右尾,双尾检验 (two-sided test),否定区,否定区,接受区,0.95,0.95,0.05,0.05,1.64,-1.64,H0 : 0 HA : 0,假设:,否定区,H0 : 0 HA : 0,左尾检验,右尾检验,单尾检验 (one-sided test),接受区,接受区,u 0.05=1.64 u 0.01=2.33,单尾 检验 分位数,双尾 检验 分位数,u 0.05/2=1.96 u 0.01/2=2.58,查表时,单尾概率等于双尾概率乘以2,四 、两类错误,第一类错误(type I erro

7、r),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误,0.025,和重合,错误,犯第一类错误的概率等于显著水平值,C1,C2,2,2,0,u,-u,和不重合,犯第二类错误的概率记为值,、 两类错误既有联系又有区别,错误只在否定H0时发生 错误只在接受H0时发生,错误增加 错误减小 错误增加 错误减小,结论,2、 还依赖于 - 0 的距离,结论,3、n , 2 可使两类错误的概率都减小.,单尾检验,左尾检验,右尾检验,否定区只在一侧,分 析 题 意,提 出 假 设,确 定 显 著 水 平,计 算 检 验 统 计 量,作 出 推 断,假设检验的步骤:,

8、第二节,样本平均数的假设检验,大样本平均数的假设检验 u检验,小样本平均数的假设检验 t检验,单样本,双样本,一、一个样本平均数 的假设检验,样本平均数 的假设检验,适用范围:检验某一样本平均数x所属的总体平均数是否和某一指定的总体平均数0相同。若相同,则说明该样本属于这个以0为平均数的指定总体;若不相同,则说明该样本所属的总体与这个指定总体( 0 )不同,即有显著或极显著差异。,1、总体方差2已知,无论n是否大于30都可采用u检验法,这里所要讲的内容在前面已经讲过了,这里只是简单地做个小结,给出检验的基本程序,并举出例子说明检验过程。检验的基本程序如下: 1)假设从已知的正态总体,或近似正态

9、总体中,随机抽取含量为的 n 样本。,2) 零假设 H0:mm0。 备择假设可有以下三种情况: (1)HA:0 ,若已知不可能小于0 。 (2)HA:0 ,若已知不可能大于0 。 (3)HA:0 ,包括0 和0 3) 在a0.05水平上,拒绝H0称为“差异显著”。在a0.01水平上,拒绝H0称为“差异极其显著”。 4) 检验的统计量:,5) 相应于2) 中的3个备择假设的H0的拒绝域分别为: (1)uu a (2)uu a (3)uu a/2 ,或表示为uu a(双侧) 正态分布的分位数,可以从附表中查出。 6) 根据以上所做的分析,进行统计推断,得出结论。,例:已知某工厂排污水中石油分布属正

10、态分布N(45,2.12),现经过水样处理,随机采样8次,得样本平均值为42.5ppm,样本标准差为2.1。问经过处理后水质含油量是否有明显降低。,分析,()这是一个样本平均数的假设检验,因总体2已知 ,采用u检验;,()处理后水质含油量是否降低,只需作进行单尾检验即可。,()假设,(2)水平,(3)检验,(4)推断,H0:=0=45(ppm), 即处理前后水质含油量保持不变 ; HA: 0,选取显著水平0.05,u0.05 1.645 u3.4,u落在拒绝域内,否定H0,接受HA;,说明水质处理后得到改善。,2、总体方差2未知,但n30时,可用样本方差s2来代替 总体方差2 ,仍用u检验法,

11、总体 (0),s2,2,例:抽取某地区粮食样品36个,测得粮食中六六六的平均值为0.325mgkg,标准差为0.068mgkg,国家食品卫生标准规定,粮食中六六六残留量0.3mgkg。问该地区粮食中六六六残留量是否超标?,分析,()这是一个样本平均数的假设检验,因总体2未知, n=36 30,可用s2代替2进行u检验;,()该地区粮食中六六六残留量0.3mgkg才符合食品卫生标准,因此进行单尾检验。,()假设,(2)水平,(3)检验,(4)推断,H0:0= 0.3mgkg , 即该地区粮食中六六六残留量符合食品卫生标准。 HA:0,选取显著水平0.05,u u0.051.645,拒绝H0,接受

12、HA;,认为该地区粮食中六六六残留量超标。,3、总体方差2未知,且n30时,可用样本方差s2来代替 总体方差2 ,采用df=n-1的t检验法,总体 (0),s2,2,对于一个正态总体,若s未知且n30 ,则 x 服从 n1自由度的 t 分布。因此,在s未知时可用 t检验做平均数的显著性检验。t 检验的程序与 u检验一样,只要用 t 分布的分位数 ta代替标准正态分布的分位数 ua 就可以了。t 检验的程序这里不再赘述。下面只指出这两种检验的不同点。t 检验的统计假设是: 零假设H0:0 。 备择假设有以下三种情况: (1)HA:0 ,若已知不可能小于0。 (2)HA:0 ,若已知不可能大于0。

13、 (3)HA:0 ,包括0 和0。,检验的统计量:,具n1自由度。不同自由度下t 分布的分位数见附表。三种备择假设的拒绝域为: (1) t t a 。 (2) t t a 。 (3) tt a(双侧) 。,例:某鱼塘水中的含氧量,多年平均为4.5(mg/L),该鱼塘设10个点采集水样,测定含氧量为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L),试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。,分析,()这是一个样本平均数的假设检验,因总体2未知,n=10 30,可用s2代替2进行 t 检验;,()该次测定的水中含氧量可能

14、或多年平均值,用双 尾检验。,()假设,(2)水平,(3)检验,(4)推断,H0: 0=4.5(mg/L),即认为该次测定与多年平均值没有显著差别。 HA: 0,选取显著水平0.05,在0.05显著水平上,接受H0,否定HA;,认为该次抽样所测结果与多年平均值无显著差别,属于随机误差。,tt 0.05(9) =2.262,P0.05,二、两个样本平均数 的假设检验,样本平均数 的假设检验,适用范围:检验两个样本平均数x1和x2所属的总体平均数1和2是否来自同一总体。,总体1 1,总体2 2,两个样本平均数的假设检验步骤,1、提出假设,无效假设H0: 1=2 ,两个平均数的差值 是随机误差所引起

15、的;,备择假设HA: 1=2 ,两个平均数的差值 除随机误差外 还包含其真实的差异,即由处理引起的.,2、确定显著水平:0.05或0.01,3、检验统计量,(1)样本平均数差数的平均数 = 总体平均数的差数.,两个样本平均数的差数,(2)样本平均数差数的方差 = 两样本平均数方差之和.,样本平均数差数的标准误,12=22=,n1=n2=n,12=22= n1=n2=n,当12 和22已知,H0:1=2=时,当12 和22未知,两样本都为大样本时,H0: 1=2=时,当12 和22未知,两样本都为小样本时,H0: 1=2=时,4、作出推断,并解释之,两 个 样 本 平 均 数,成组数据平均数的比

16、较,成对数据平均数的比较,成组数据平均数的比较,如果两个样本的各个变量是从各自总体中随机抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立,则不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准,来检验其差异的显著性。 根据两样本所属的总体方差是否已知和样本大小不同而采用不同的检验方法。,1、两个总体方差12 和22已知,或12 和22未知,但两个样本都是大样本,即n130且n230时,用u检验法。,例:已知放射强度遵从正态分布。对甲、乙两个放射污染区作放射强度测定。从甲地取得样本数为n163,均值为62.38,乙地取得样本数为n274,均值为66.

17、78,甲、乙两地方差分别是1210.8,2213.3。问两地受放射污染程度是否相同。,分析,()这是两个样本(成组数据)平均数比较的假设检验,因12和22已知,用u检验。,()因事先不知甲、乙两地受放射污染程度孰高孰低,用双尾检验。,()假设,(2)水平,(3)检验,(4)推断,H0:1 2,即认为两地受放射污染程度相同。 HA: 1 2,选取显著水平0.05,在0.05显著水平上,拒绝H0,接受HA;,认为两地受放射污染程度不相同。,uu0.0251.96,P0.05,2、两个总体方差12 和22未知,且两个样本都是小样本,即n130且n230时,用t检验法。,(1) 如果12=22=2,S

18、e2,2,平均数差数的标准误,H0: 12= ,df=(n1-1)+(n2-1)=n1+n2-2,例:用甲、乙两种方法同时测定某废水样品中铝含量。其中甲法测定10次,平均测定结果为5.28gL,标准差为1.11gL;乙法测定9次,平均测定结果为4.03gL,标准差为1.04gL。问两种方法测定结果有无显著性差别?,分析,()这是两个样本平均数的检验,12和22未知,且为小样本,用t检验。,()事先不知两种方法测定结果孰高孰低,用双尾检验。,()假设,(2)水平,(3)检验,H0:12=22=2 HA: 12 22,选取显著水平0.05,(4)推断,两样本方差相等。,第一步 F 检验,(3)检验

19、,()假设,(2)水平,H0:1 2, 即认为两种方法测定结果无差异。 HA: 1 2,选取显著水平0.05,第二步 t 检验,(4)推断,在0.05显著水平上,否定H0,接受HA;,可认为这两种方法测定结果有显著性差别,即至少有一种方法存在系统误差。,tt 0.05(17) =2.110,df=(n1-1)+(n2-1)=17,(2)1222,n1=n2=n,Se2,2,df=n-1,平均数差数的标准误,当n1=n2=n时,例:调查污染程度不同的甲、乙两农田中黄豆千粒重(g),调查结果如下:,甲农田:50,47,42,43,39,51,43,38,44,37 乙农田:36,38,37,38,

20、36,39,37,35,33,37,检验两农田中黄豆千粒重有无差异。,两样本方差不相等。,第一步 F 检验,分析,()12和22未知,且不相等,都小样本, 且n1=n2 ,用df=n-1的t检验。,()事先不知道两地黄豆千粒重孰高孰低, 故而用双尾检验。,第二步 t 检验,()假设,(2)水平,(3)检验,H0:1 2,即认为两农田中黄豆千粒重无显著差异。 HA: 1 2,选取显著水平0.05,(4)推断,在0.05显著水平上,否定H0,接受HA;,认为两农田中黄豆千粒重存在明显差异,即甲农田的千粒重显著高于乙农田。,tt 0.05(9) =2.262,P0.05,df=n-19,(3)122

21、2,n1 n2,采用近似地t检验,即 Aspin-Welch检验法。,检验两排污口中含油量是否有极显著差异?,分析,n1 n2 ,用近似的t分布,使用双尾检验。,()假设,(2)水平,(3)检验,H0:12=22=2 HA: 12 22,(4)推断,两样本方差有显著不同。,选取显著水平0.05,例:,第一步 F 检验,()假设,(2)水平,(3)检验,H0:12,即两排污口中含油量没有极显著差别。 HA: 1 2,选取显著水平0.01,第二步 近似t 检验,(4)推断,在0.01显著水平上,否定H0,接受HA;,认为两排污口中含油量有极显著差异,A排污口中含油量极显著的高于B排污口。,t 0.

22、01(12) = 3.056,P0.01,成对数据平均数的比较,将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,以检验处理的效果,所得的观测值称为成对数据。,x1,x2,样本1,样本2,n对,样本差数的平均数等于样本平均数的差数,H0: d=0,df = n-1,样本差数的方差,样本差数平均数的标准误,t 值,例:某地对10个采样点不同深度的土壤进行采样测定土壤中镉的含量,结果如右表。 问不同深度土壤中镉元素垂直分布有无显著性差异?,分析,此题为成对数据,事先不知不同土壤深度镉含量孰高孰低,用双尾。,某地不同深度土壤中镉含量(ppm),()假设,

23、(2)水平,(3)检验,H0:d0 HA: d 0,0.05,(4)推断,在0.05显著水平上,接受 H0;,即020cm和20一40cm两土壤层的镉含量相同。,tt 0.025(9) = 2.262,已知,第三节,样本频率的假设检验,二 项 分 布,频 率 分 布,二项成数,环境指标,频率的假设检验,当 np 或 nq5,由二项式 (p+q)n 展开式直接检验,频率的假设检验,当 np 和 nq 30,中心极限定理,正态分布 ( u 检 验 ),近似,频率的假设检验,当 5np 或 nq30,一、一个样本频率 的假设检验,样本频率 假设检验,适用范围:检验一个样本频率(记为 )和某一理论值或

24、期望值p的差异显著性。,在二项分布中,事件A发生的频率 x/n称为二项成数,即百分数或频率。则二项成数的平均数和标准差分别为: 也称为二项总体成数的标准误,当 p 未知时,常以样本百分数 来估计。此时上式改写为: = 称为样本成数标准误。,样本频率的标准误,其中 q = 1-p,1、当 np 或nq 30,不需连续性矫正,则u值为:,2、当 5np 或 nq30时,需要进行连续性矫正,uc值为:,如果np30,且n30,,例:按规定,某工厂排出的污水超标率不超过8时即认为合格。现对该厂排出的污水随机取样210次,测定结果有23次超标。问抽样测定结果是否达到合格规定要求?,(3)排出的污水超标率

25、不超过8时即认为合格,用单尾检验。,分析,(1)一个样本频率的假设检验;,(2) nq 30 ,无需连续矫正,用u检验;,()假设,(2)水平,(3)检验,(4)推断,H0:p=8% 即某工厂排出的污水超标率8%; HA:p8%,选取显著水平0.05,u u0.051.645,P0.05,在0.05显著水平上,接受H0;,认为抽样测定结果达到合格规定要求。,例:某地区受有毒气体污染,按照相关规定,中毒0.80为重污染,现随机检查了100人,结果有78人中毒,问某地区是否受到有毒气体的严重污染?,(3)只有中毒率 0.80,才认为是非重污染,故采用单尾检验。,分析,(1)一个样本频率的假设检验;

26、,(2) np 和 nq 5 ,但nq 30,用u检验;,()假设,(2)水平,(3)检验,(4)推断,H0:p 0.80,即该地区没受到有毒气体的严重污染。 HA:p0.80,选取显著水平0.05,uc 0.05,在0.05显著水平上,接受H0,否定HA;,认为该地区没受到有毒气体的严重污染。,二、两个样本频率 的假设检验,样本频率 假设检验,适用范围:检验两个样本频率 和 差异的显著性。,一般假定两个样本的方差是相等的,即,两个样本频率差数的标准误,H0: p1 = p2= p,q1=q2=q,当n1= n2=n时,在总体p1和p2未知,假定 条件下,可用两样本频率的加权平均值 作为对p1

27、和p2的估计,即:,1、当 np 或nq 30,不需连续性矫正,用u检验:,在H0: p1 = p2下,,2、当 5 30 ,用u检验:,在H0: p1 = p2下,,2、当 5 np 或 nq 30,需进行连续性矫正, 如果n 30 ,用t检验:,在H0: p1 = p2下,,例:研究地势对小麦锈病发病的影响,比较两块麦田锈病发病率是否有显著性差异。,低洼地麦田378株,其中锈病株342株,高坡地麦田396株,其中锈病株313株,(3)事先不知两块麦田的锈病发病率孰高孰低, 用双尾检验。,分析,(1)2个样本频率的假设检验;,(2) np 和 nq 30 ,无需连续矫正,用u检验;,()假设

28、,(2)水平,(3)检验,H0: p1=p2即两块麦田锈病发病率没有显著差异。 HA: p1 p2,选取显著水平0.01,在0.01显著水平上,否定H0,接受HA;,认为两块麦田锈病发病率有极显著差异,即地势对小麦锈病的发生有极显著影响作用,低洼地小麦锈病的发病率极显著高于高坡地。,(4)推断,u2.58,P0.01,例:某鱼场发生了药物中毒,,检验甲、乙两池发生药物中毒以后,鱼的死亡率是否有显著性差异。,抽查甲池中的29尾鱼,有20尾死亡,抽查乙池中的28尾鱼,有21尾死亡,(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。,分析,(1)2个样本频率的假设检验;,(2) 5 np 和 nq

29、30 ,需进行连续矫正, 因n130,n230,用t检验;,()假设,(2)水平,(3)检验,H0: p1=p2即甲乙两池鱼的死亡率没有显著差异 HA: p1 p2,选取显著水平0.05,df=29+28-2=55,在0.05显著水平上,接受H0,否定HA;,认为发生药物中毒后,甲、乙两鱼池鱼的死亡率没有显著差异。,(4)推断,t 0.05(55) = 2.004, t c t 0.05(55),参数估计:用样本统计量来估计总体的参数,点估计:,区间估计:,用由样本数据所计算出来的单个数值对总体参数直接估计,例如利用样本平均数的值估计总体平均数参数。,所谓的区间估计就是在一定的概率保证下指出总

30、体参数的可能范围,这个可能的范围称为置信区间,相应的概率保证称为置信水平或置信度。如:某一研究发现猪仔出生重平均数的置信水平为95%的置信区间为(1.02kg,1.38kg),一、点估计(Point Estimation),点估计就是用样本特征数来估计相应的总体特征数,如用样本平均数,中位数或众数来估计总体平均数。 估计同一个参数的样本统计量(常称为估计量estimator)可能有好几个,如何决定哪个最好?,一个好的估计量应满足三个条件:,3.相容(consistent),1.无偏(unbiased),2.有效(efficient),1.无偏估计量(unbiased estimator),如果

31、一个统计量的理论平均数等于总体参数,这个统计量就被称为无偏估计量。,(1) 是的无偏估计值。 (2)s2是2的无偏估计值。,2.有效估计量(efficient estimator),在样本含量相同的情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个统计量是更有效的估计量。 从一个整体总体中,抽取含量为n的样本,样本平均数的方差为 当n充分大时,中位数m的方差为,3.相容估计量(consistent estimator),若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而趋于1,则该统计量称为参数的相容估计量。(样本越大,估计量越好) 样本平均数是总体平均数的相容估计量。

32、样本方差也是总体方差的相容估计量。,二、 区间估计 (Interval Estimation),1.区间估计的基本方法,定义:根据样本统计量,以一定的可靠程度推断总体参数所在的区间范围。1-就是区间(置信区间)估计的可靠程度。,一般求法:依据样本统计量的分布来求,这里,我们首先讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限定理,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似服从正态分布N(,2/n),于是也可以近似求得参数的区间估计。,u落在任意一个区间内的概率可以从正态分布表中查出。,当n30或虽然n30,但XN,且 为已知,就有 对于N(0,12

33、),有 对应地有,N(0,12),以标准正态分布进行的区间估计为例:,u落在(-1.96,1.96)内的概率可以从正态分布表中查出,P(-1.96u1.96)=0.95,1- :置信水平,区间估计的图示,无论区间估计还是点估计,都与概率显著水平的大小联系在一起。,越小,则相应的置信区间就越大,也就是说用样本平均数对总体平均数估计的可靠程度越高,但这时估计的精度就降低了。,在实际应用中,应合理选取概率显著水平的大小,不能认为取值越小越好。,2. 平均数 的置信区间,(1 )已知时, 的置信区间,所以 的 1 的置信区间为,或写成,例,抽取35份水样来测定某河口区水中氯离子量(mg/L),得其 =

34、1922.3mg/L,标准差s=367.9mg/L。试求其95%和99%置信度下该水中氯离子量的置信区间。 已知: n35, 1922.3, s367.9 求:置信度1 0.95时的置信区间 L1, L2。 置信度1 0.99时的置信区间 L1, L2。,解:1 0.95时, 则该水中氯离子量的95置信度下的置信区间为1800.4,2044.2。,1 0.99时, 则该水中氯离子量的99置信度下的置信区间为1761.9,2082.7。 由上可见,置信度大(小),区间就宽(窄),精确度就低(高)。解决这一矛盾的唯一办法是增加 n。,说明:,(1)置信区间不唯一,在置信度固定的条件下,置信区间越短

35、,估计精度越高.,(2)在置信度固定的条件下,n 越大,置信区间越短,估计精度越高.,(3)在样本量n固定时,置信度越大,置信区间越长,估计精度越低.,例2,与北京“全聚德”烤鸭店订立的合同上要求鸭子2.00.2公斤/只,按只付钱。养鸭户送来100只,平均1.88公斤/只,烤鸭店说太轻了。带回去又养了几天,平均2.12公斤/只。烤鸭店又说太肥了。鸭子合格的平均重量范围应该是多少?显著性水平为0.05,样本含量不同,要求范围不同,每次送4只鸭子,要求的重量范围是 多少 kg/只? 每次送16只鸭子,要求的重量范围是1.902.10kg/只 每次送100只鸭子,要求的重量范围是1.962.04kg

36、/只 每次送400只鸭子,要求的重量范围是1.982.02kg/只,(2) 未知时, 的置信区间,所以 的 1的置信区间为,或写成,例:为检查某湖泊中鱼受汞污染情况,捕得某种鱼龄相近的9条鱼,测得鱼胸中汞含量如下(单位:ppm),1.85,1.86,1.93, 2.0l,2.03,2.05,2.07,2.12,2.15,当置信水平取0.99时,求鱼胸肌中汞的含量变化置信区间。已知鱼胸肌中汞的含量是正态分布。,本例中,由于总体方差2未知,需用s2估计2,当df918时,t0.013.355。具体计算如下,于是鱼胸肌中汞含量变化的上、下限估计为,这样,当10.99时,汞含量置信区间为1.89,2.

37、13,换句话说,有99把握汞含量变化区间在2.13ppm到1.89ppm间。,例3,晚稻良种汕优63的千粒重027.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5, 28.6, 28.4, 24.7, 29.1, 27.2, 29.8, 33.3, 29.7(g) (1)试问新育成品种的千粒重与汕优63有无显著差异? (2)求置信水平为95的新育成品种千粒重的置信区间?,解:(1)H0:027.5;HA: 27.5,0.05,计算检验统计量,查表得t(8,0.05双侧)2.306,所以H0的拒绝域为:,所以,接受H0,即新品种的千粒重与汕优63无显著差异。,注意:

38、(a) 置信区间也可以用来进行假设检验。以上述例子为例,因为95的置信区间是(27.266, 31.244),它包含了零假设中待检验的27.5,所以我们没有理由拒绝 H0:27.5。,(b) 利用置信区间进行假设检验的基本方法:如果置信区间包含了H0中的数值,则不拒绝H0;如果置信区间不包含H0中的数值,则拒绝H0。,(c) 置信区间和假设检验的结论是一致的。,(2)置信水平951,所以0.05,所以新品种千粒重95的置信区间为(27.266,31.244)。,对参数所进行的假设如果落在该区间之外,就说明这个假设与真实情况有本质的不同,因而就否定零假设,接受备择假设。,置信区间是在一定置信度P

39、=1-下总体参数的所在范围,故对参数所进行的假设如果落在该区间内,就说明这个假设与真实情况没有不同,因而就可以接受零假设。,3. 方差2 和标准差的置信区间,研究2所采用的统计量是,研究2的置信区间是,相应地,的置信区间是,4. 平均数差1 2 的置信区间,(1)标准差i已知,(2)标准差i未知,但12时,(3)标准差i未知,但1 2时,(1)标准差i已知,样本统计量,变形得:,1-2的1-的置信区间为:,自由度为 n1n22的t分布,(2)标准差i未知,但12时,样本统计量,利用和前面类似的推导得到1-2的1-的置信区间为:,当n1n2n时,上式可简化为:,(3)标准差i未知,但1 2时,样

40、本统计量,其中,利用和前面类似的推导得到1-2的1-的置信区间为:,解:查表得u(双侧)1.96,把各值代入,得:,即:L1=0.042,L2=0.072,例:甲乙两地空气中某元素含量服从正态分布,120.013,220.012,从两地取样测试结果如下:n甲30,平均数为0.03ppmm;n乙28,平均数为0.016ppm,求当置信度为0.95时,两地平均数差甲乙的置信区间(0.05)。,所以甲,乙两地空气中该元素含量平均数差甲乙的置信区间为(0.042,0.072)。,当两个样本为小样本,总体方差12和22未知,且两总体方差不相等,即12 22时,可由两样本方差s12和s22对总体方差12和

41、22的估计而算出的t值,已不是自由度dfn1+n2-2的t分布,而是近似的服从自由度df 的t分布,在置信度为P1-下,两总体平均数差数1-2的区间估计为:,其置信区间的下限1和上限L2为:,两个总体平均数差数1-2的区间估计也可表示为:,上面三式中,t,df 为置信度为P=1- 时自由度为df 的t临界值。,例 已知某城市两污水渠酚分布属正态分布,数据如下 (单位,mgL): I明渠:0.615 0.556 0.378 0.544 0.811 0.841 0.605 0.655 0.655 0.756 0.655 0.706 0.607 0.388 0.655 0.630 0.605 0.5

42、04 0.577 0.655 0.500 0.605 0.524 0.454 0.484 0.360 0.480 0.680 0.555 0.557 0.484 0.660 0.494 0.585 0.550 0.549 0.557 0.549 0.585 II明渠:0.1000 0.1328 0.1184 0.1148 0.1388 0.2303 0.2196 0.1652 0.1456 0.1304 0.1336 0.1176 0.1784 0.1328 0.0209 0.1868 0.1884 0.3028 0.1600 0.1108 0.1156 0.1414 0.1216 0.139

43、0 0.4644 0.2412 0.0868 0.1272 0.1484 0.2160 0.1352 0.1924 0.1652 0.2580 0.2660 0.4232 0.1284 0.2368 0.1556 0.1508 0.2028 0.2436 0.1488 两总体方差不等。试求在置信概率为95情况下12的置信区间。,从所给数据知:n139,n243,t0.025(73)1.991,其置信度为95时,两污水渠酚分布 的差数区间估计为:,0.36120.44,当两样本为成对资料时,在置信度为P1- 时,两总体平均数差数1-2的置信区间可估计为:,其置信区间的下限1和上限L2为:,例:比较两种装置处理油污效果,有6个样品,不同装置处理后含油量如下:(单位ppm) 甲装置:4.0 5.0 6.0 1.0 5.4 4.1 乙装置,3.3 7.0 4.4 2.2 3.5 0.7 试求该成对数据差的置信区间(0.05)。,解 考察例中6对数据差:0.7,2.0,1.6,1.2,1.9,3.4,自由度 n16

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论