《汇总讲义二》PPT课件.ppt_第1页
《汇总讲义二》PPT课件.ppt_第2页
《汇总讲义二》PPT课件.ppt_第3页
《汇总讲义二》PPT课件.ppt_第4页
《汇总讲义二》PPT课件.ppt_第5页
已阅读5页,还剩417页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,数据的推断 Inferential Statistics,一、一个总体平均数的估计二、一个总体平均数的假设检验 三、两个总体平均数的推断统计 四、总体比率的推断统计五、总体标准差的推断统计六、2检验 七、单因子方差分析 八、随机分组设计 九、双因子方差分析,2,一、一个总体平均数的估计Confidence Intervals for One Population Mean,1、估计总体平均数 2、当已知时,一个总体平均数的置信区间3、误差幅度、置信度和样本大小 4、当未知时,一个总体平均数的置信区间,3,1 .估计总体平均数,Estimating a Population Mean,4,点

2、估计(Point Estimate) 参数的点估计值,指用来估计参数的统计值的值。 置信区间估计;置信度 (Confidence-Interval Estimate;Confidence Level) 参数的置信区间估计,是由参数的点估计获得的区段数值与一个代表我们对该参数落入该区段的信心百分比所构成。该信心百分称之为置信度。 注:我们可以将置信区间简写为CI。,5,仿真研究:20个n=36的样本,真实的 =44 =1.2 P( - 2.4 -2.4)=.9544 P -2.4 +2.4=.9544 所计算出的置信区间会因样本而异,置信区间的解释,6,仿真研究:20个n=36的样本,真实 =4

3、4,7,2 .当已知时,一个总体平均数的置信区间,Confidence Intervals for one Population Mean When is Know,8,总体平均数的单一样本Z分数区间法(大样本空间)(The One-Sample z-Interval Procedure for a Population Mean) 假设: 正态总体或大样本。 已知。 步骤一:使用附录A-1,依据(1-)的置信度找出Z/2 步骤二:的置信区间即介于 到此处的Z/2由步骤一所得,n是样本大小, 是由样本资料计算而得。,9,总体平均数的单一样本Z分数区间法(The One-Sample z-Int

4、erval Procedure for a Population Mean) 步骤三:解释此置信区间。,10,资料分析的基本原则 (A Fundamental Principle of Analysis) 在执行统计推论程序前,检查样本数据。若有违反使用推论统计方法条件的情形,则不应进行该推论统计程序。,11,对正态总体而言,置信区间是准确的; 而对于非正态总体的大样本来说,置信区间则趋近于正确的。即便非正态总体的中小样本,只要偏离正态的情况不严重,置信区间趋近正确,表示z-置信区间相当robust 。 Robust,指的是偏离假设时没有严重影响;虽然不完全符合条件,但仍能以此法计算。,12,

5、何种情況能使用Z区间(How to Use the Z-Interval Procedure) 对于小样本而言(样本小于15), Z区间只使用在总体为正态分布或非常接近正态分布时。 对于中型样本而言(样本大小介于15-30) ,Z区间原则上可使用,除非样本资料中有离散值(outliers)或总体分布与正态分布相去甚多。 对于大样本(样本等于30或以上),可以无条件用Z区间估计。然而,若离散值存在且没有正当理由将之移除,则应检验其影响-应该与除去离散值后的置信区间做对照比较,若有明显差异,则使用不同的方式或另取样本较佳。 显示应先进行探索性的资料分析,13,3 .误差幅度、置信度和样本大小,Ma

6、rgin of Error,14,估计时的误差幅度(Margin of Error for the Estimate of ) 的误差幅度: 误差幅度等于置信区间一半长度。,15,信心与准确(Confidence and Precision) 若样本大小固定,对准确度要求越高,则置信度越低,反之亦然。 缩短置信区间宽度则减少置信度,16,置信度为(1- ) 的置信区间估计时所需的样本大小为 E代表估计的准确度(或置信区间长度)。因此,增加样本大小即增加准确度,反亦然。,17,4 .未知,一个总体平均数的信赖区间,Confidence Interval for One Population Me

7、an When is Unknown,18,样本平均数t-分布 (未知,小样本空间) 假设变量x是来自于总体平均数为的正态分布,因此,当样本大小为n时, 的Studendized Version:为一个自由度为(n-1)的t分布。 Students t-distribution (W. Gosset),19,自由度的简单概念,自由度(degree of freedom, df)是在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。 在总体平均数未知时,要计算标准差就必须先知道样本平均数,而样本平均数和n都知道时,样本总和就是常数,所以最后一个样本数据

8、就不能变化,自由度就是n-1。 通常,自由度为n-k,n表示“处理”的数量,k表示实际需要计算的参数的数量。如需要计算2个参数,则数据里只有n-2个数据可以自由变化。 df=n-k的得出需要大量的数理统计证明。,20,A simulation 5000 samples of n=4,21,T-分布特性 特性1:t曲线下的面积总和为1。 特性2:t曲线延伸出去的两边,只会逼近水平轴,永远不会接触。 特性3:t曲线是对称于0。 特性4:当自由度变大时,t曲线看起来就会越来越像标准正态分布曲线。,22,总体平均数的单一样本t分数区间法(The One-Sample t-Interval Proced

9、ure for a Population Mean) 假设 正态总体 (t is robust to moderate violation of this assumption)或大样本 (If the pop is non-normal, but the sample is large) 未知。 步骤一:置信度为(1-),使用附录A-6,依据df=n-1找出t/2,此处的n为样本大小。 步骤二:的置信区间为 到t/2由步骤一所得, 及s是由样本资料计算而得。 步骤三:解释此置信区间。,23,对正态总体而言,不管样本大小,此信赖区间是精确的,而对于一个非正态总体的大样本来说,则是趋近于正确的。

10、,24,Choosing a CI procedure,Normal pop, known, small sample Normal pop, known, large sample Normal pop, unknown, small sample Normal pop, unknown, large sample Non-normal pop, known, small sample Non-normal pop, known, large sample Non-normal pop, unknown, small sample Non-normal pop, unknown, large

11、 sample (*The presence of outliers also affects the choice),25,二、一个总体平均数的假设检验Hypothesis Test for One Population Mean,1、假设检验的本质2、专有名词,误差及假设3、当已知时,一个总体平均数的假设检验4、犯第类型错误的机率;统计检验力5、P值6、当未知时,一个总体平均数的假设检验7、Wilcoxon Signed-Rank检验8、应该选用哪种方法?,26,1 .假设检验的本质,The Nature of Hypothesis Testing,27,假设(hypothesis) 一些

12、涉及判断和决策的陈述: 饼干的实际重量与标准重量454 g 是否不同 排课时间影响选修统计学同学的成绩表现 一种新药的临床实验表现要好到什么程度才能说它不是安慰剂,28,统计假设包含:零与备择假设 (Null and Alternative Hypotheses) 零假设(Null Hypotheses):被检验的假设。我们使用符号H0来表示零假设。 H0: = 0 备择假设(Alternative Hypotheses):与零假设形成对立的假设,使用符号 H0 或 H1 来表示对立假设。 Ha : 0,双侧,双尾检验(two-tailed test) Ha : 0 ,右侧(right-tai

13、led test),单侧或单尾检验(one-tailed test) Ha : 0 ,左侧(left-tailed test),单侧或单尾检验(one-tailed test),29,从未婚证明难开看假设检验之逻辑The Logic of Hypothesis Testing,先假设零假设为真,自总体取一随机样本,倘若样本资料与零假设不一致(且其方向与备择假设一致),则拒绝零假设,并结论备择假设为真;倘若根据样本资料无法拒绝零假设,则不拒绝零假设; 有时我们也说接受零假设,但这并不准确。就像打官司的时候,我们说某人无罪,只是因为没有足够多的证明其有罪的证据。所以,准确的说法是无法拒绝零假设。

14、何谓与零假设(不)一致?-需订出具体标准。,30,如样本为25袋脆饼,则大约有95.44%的样本的平均重量将落在的2个标准差(3.12g)之间。,31,(a)拒绝零假设的诀策准则;(b) 若零假设为真,将拒绝零假设的诀策准则套上 的正态曲线。,32,图示样本平均数(450g)距离零假设中的总体平均数(454g)的相对位置(以标准差为单位)。,33,2 .假设检验的专有名词和概念,34,检验统计量,拒绝区,非拒绝区,临界值(Test Statistic, Rejection Region, Nonrejection Region, Critical Values) 检验统计量(Test Stat

15、istic):为了检验是否拒绝零假设时所计算的统计数。 拒绝区(Rejection Region):可以拒绝零假设的检验统计量之区间。 非拒绝区(Nonrejection Region):无法拒绝零假设的检验统计量之区间。 临界值(Critical Values):区隔拒绝区与非拒绝区的检验统计量之值。临界值被视为拒绝区的一部分。,35,36,图示双尾拒绝区、左尾拒绝区及右尾拒绝区。,37,第一型错误及第二型错误(Type and Type Errors) 第一类型错误(Type Error):当零假设为真时,错误地拒绝零假设。佘祥林案 第二类型错误(Type Error):当零假设为伪时,错

16、误地沒有拒绝零假设。辛普森案,P223,38,显著水平(Significance Level) 发生第类型错误的机率为,即在零假设正确时拒绝零假设的机率。也是假设检验时的显著水平(Significance Level)。 发生第类型错误的机率,则为。,39,第与第类型错误机率之间的关系(Relation Between Type and Type Error Probabilities) 理想上,假设检验时第一类型与第二类型错误的机率都应越低越好,但是. 样本大小固定时,当显著水平越小时,(虚无假设为伪时,未拒绝虚无假设的机率)越大。为什么? 令可错杀三千,不可放走一人?,40,假设检验可能的

17、结论(Possible Conclusion for a Hypothesis Test) 若零假设被拒绝,我们下结论:备择假设是正确的。 若零假设不被拒绝,我们下结论:这些资料无法提供足够的证据来支持备择假设。,41,3 .当已知,一个总体平均数的假设检验,Hypotheses Tests for One Population Mean When is Known,42,取得临界值(Obtaining Critical Values) 若假设检验依照显著性水平来进行,则所选取的临界值应可满足,若零假设为真,检验统计量落入拒绝区的机率为。,43,当该检验为:(a)双尾,(b)左尾,(c)右尾,

18、则假设检验在显著性水平下的临界值位置。 常用的 z:,44,总体平均数的单一样本Z检验(临界值法)(The One-Sample z-Test for a Population Mean (Critical-Value Approach ) 假设: 正态总体或大样本。 已知。 步驟一:零假设为H0 : = 0 ,备择假设为或 或(双侧) (左侧) (右侧) 步驟二:决定显著性水平。,45,步驟三:计算检验统计量 步驟四:临界值为 或 或 (双尾) (左尾) (右尾)使用表A-1找出临界值。,46,步驟五:若此统计检验量的值落在拒绝区內,则拒绝H0;反之,则无法拒绝H0 。 步驟六:解释此假设检

19、验的结果。 此假设检验在正态总体是精确的,在非正态总体中的大样本中则是趋近于正确的。 Statistical vs. practical significance,47,使用z检验的时机(When to Use the z-Test) 小型样本(样本小于15):z检验只能用于当总体为正态分布或非常趋近正态时。 中型样本(样本介于1530):除了资料当中有离散值或者总体分布严重偏离正态分布之外,可以使用z检验。 大型样本(样本大于30):在z检验的基本使用上并无限制。然而,若离散值存在且无正当理由将之移除,则应检验离散值的影响。我们需各做一次包含与不含离散值的假设检验,若这两者的结论相同,则可以

20、接受此一结论;否则应采用不同的统计方法或取另一个样本。若有正当理由移除离散值,则可以使用此z检验法。,48,P值,P-Values,49,P值代表观测到的显著性水平(observed significance level) 假设检验的P值等于可以拒绝零假设的最小显著性水平。,50,P值越小,越支持备择假设,也就是备择假设成立的证据越強。,51,当检验为(a)双尾;(b)左尾;(c)右尾时,Z检验的P值。,52,使用P值作为假设检验的临界值(Decision Criterion for a Hypothesis Test Using the P-Value) 若P值小于或等于显著性水平时,拒绝零

21、假设;反之,则不拒绝零假设。,53,总体平均数的单一样本Z检验(P值法)(The One-Sample z-Test for a Population Mean (P-Value Approach ) 假设: 正态总体或大样本。 已知。 步驟一:零假设为H0 : = 0 ,备择假设为或 或(双侧) (左侧) (右侧) 步驟二:确定显著水平。,54,步驟三:计算检验统计量并标记为z0。 步驟四:临界值为 或 或 (双尾) (左尾) (右尾)使用表A-1找出临界值。,55,步驟五:若P,则拒绝H0;反之,无法拒绝H0 。 步驟六:解释此假设检验的结果。 此假设检验在正态总体是精确的,在非正态总体中

22、的大样本里则是趋近于正确的。,56,临界值法 vs. p值法,57,4 .犯第类型错误的机率;统计功效,Type Error Probabilities; Power,58,小问题: 真实的和假设的的差距和是什么关系? 和的关系? 样本大小和的关系?,59,假设发动机每加仑里程数=26 图示油量里程表的临界值(=0.05,n=30) 。,检测某型号发动机油耗指标是否达标,60,当每加仑里程数=25.8时,检验犯第类型错误的机率。,61,=25.8、25.6、25.3及25.0时第类型错误的机率。,62,统计检验力(Power) 假设检验中的统计功效是不犯第类型错误的机率,那也就是說,拒绝错误的

23、零假设的机率。我们可以表示为: Power=1-P( Typeerror )=1- 假设检验的功效介于0至1之间,它能测量出假设检验察觉错误零假设的能力。若功效近似于0,则此假设检验察觉出错误零假设的能力不佳;若功效近似于1,则假设检验察觉错误零假设的能力极佳。,63,实际上,由于的值是未知的,power其实无法计算,可作功效曲线(power curve)以对假设检验的功效有所评估。 油量里程表的功效曲线(=0.05,n=30)。,64,固定样本大小,降低显著性水平,则增加,power降低。固定显著性水平下,增加样本大小,则可增加统计检验力。,65,6 . 当未知,一个总体平均数的假设检验,H

24、ypotheses Tests for One Population Mean When is Unknown,66,总体平均数的单一样本t检验(临界值法)(The One-Sample t-Test for a Population Mean (Critical-Value Approach ) 假设: 正态总体/大样本。 未知。 步驟一:零假设为H0 : = 0 ,备择假设为或 或(双侧) (左侧) (右侧) 步驟二:确定显著水平。,67,步驟三:计算检验统计量 步驟四:临界值为 或 或 (双尾) (左尾) (右尾)使用表A-6找出临界值。,68,步驟五:若此统计检验量的值落在拒绝区內,则

25、拒绝H0;反之,则无法拒绝H0 。 步驟六:解释此假设检验的结果。 此假设检验在正态总体是精确的,在非正态总体中的大样本里则是趋近于正确的。,69,6 .应该选用何种方法?Which Procedure Should be Used?,70,71,72,对称总体?,73,三、两个总体平均数的推论统计 Inferences for Two Population Means,1 两个总体平均数之差的假设检验:标准差已知2 独立样本:假设标准差相等, 两个总体平均数的推论统计3 独立样本:假设标准差不相等, 两个总体平均数的推论统计4 配对样本,两个总体平均数的推论统计5 应该选用何种方法?,74,

26、两个总体平均数之差的假设检验:总体标准差已知,The Sampling Distribution of the Difference Between Two Sample Means for Independent Samples,75,如何用独立样本比较两个总体平均数的差异?,何谓独立样本? 如何比较? 胃冷冻实验,76,两个总体标准差已知,比较其平均数的假设检验称做两个样本平均数的z检验,或统称为两个样本的z值法。 当总体标准差未知时,则改用两个样本的t值法。接下来,将分別讨论合并t值法及非合并t值法。,77,2 独立样本:假设标准差相等, 两个总体平均数的推论统计,Inference f

27、or Two Population Means, Using Independent Samples: Standard Deviations Assumed Equal,78,二个独立样本平均数差异的比较 若二个总体标准差已知,但假设相等 独立样本: 但1=2= (两个总体共同的标准差),我们将代入,会得到:,79,若我们并不知道总体的标准差 ,因此只能合 并两个样本的变异数 与 来估计2 : Sp - 合并样本标准差(pooled sample standard deviation) Note that, as we pool the two estimates of 2 (i.e., s

28、12 and s22), they are each weighted by their respective sample sizes. The sp always lies between s1 and s2.,80,因此, 而将公式中的替换为sp得到:,81,合并 t 检验量的分布(Distribution of the Pooled t-Statistic) 假设x在两个总体中,都是正态分布变量,而且总体的标准差相同。从两个总体中取得大小为n1及n2的独立样本,则变量为t分布,自由度为(n1+n2-2),82,两个总体平均数的合并 t 检验(临界值法)(The Pooled t-Tes

29、t for Two Population Means (Critical-Value Approach ) 假设 独立样本。 正态总体或大样本。 总体标准差相等。 步驟一:虚无假设为H0:1=2,对立假设为 或 或 (双侧) (左侧) (右侧),83,步驟二:诀定显著水平。 步驟三:计算检验统计量的值此处的sp为,84,步驟四:临界值为 或 或 (双侧) (左侧) (右侧)以自由度(n1+n2-2),使用表找出临界值。,85,步驟五:若此统计检验值落于拒绝区,则拒绝H0;反之,则无法拒绝。 步驟六:解释此假设检验的结果。 对正态总体而言,假设检验是准确的;而对于非正态总体的大样本来說,假设检验

30、则趋近于正确的。 t 检验其实相当robust只要总体不是严重偏离正态,即使小样本也适用; 只要两个样本大小差不多,即使实际上总体标准差不相等也适用。 如何检验假设是否违背? Normal probability plot - normality s1/s2是否2 or - equal variance,变异同质性。,86,3 独立样本:假设标准差不相等, 两个总体平均数的推论统计,Inference for Two Population Means, Using Independent Samples: Standard Deviations Not Assumed Equal,87,非合并

31、t检验的分布(Distribution of the Nonpooled t-Statistic) 假设x在两个总体中,皆是正态分布变量。从两个总体中取得的独立样本n1及n2,则变量趋近于t分布:其自由度是来自于样本资料。记为,其算法为:四舍五入,取整数。,88,两个总体平均数的非合并 t 检验(临界值法)(The Nonpooled t-Test for Two Population Means (Critical-Value Approach ) 假设 独立样本。 正态总体或大样本。(The nonpooled t-test is robust to moderate violation

32、of the normality assumption) 步驟一:虚无假设为H0:1=2,对立假设为 或 或 (双侧) (左侧) (右侧),89,步驟二:诀定显著水平。 步驟三:计算检验统计量的值,90,步驟四:临界值为 或 或 (双侧) (左侧) (右侧)以自由度,其算法:四舍五入,取整数,并使用表找出临界值。,91,步驟五:若此统计检验值落于拒绝区,则拒绝H0;反之,则无法拒绝。 步驟六:解释此假设检验的结果。,92,4 配对样本 两个相关总体平均数的推论统计,Inference for Two Population Means, Using Paired Samples,93,分组设计,

33、94,配对设计,95,当所配对的是同一测量单位时,又称重复测量(repeated measure)设计 利用配对差异(paired difference, )显示是否有差异(若无差异则 ,若有差异则 ),96,配对t检验的分布(Distribution of the Paired t-Statistic) 假设:两个总体的变量是正态分布的,样本的组成也是成对的个体。 假设:“配对差异变量d”是正态分布的。成对样本大小为n。用分布来检验“配对差异变量d”:为自由度(n-1)的t分布。,97,两个总体平均数的配对 t 检验(临界值法)(The Paired t-Test for Two Popul

34、ation Means (Critical-Value Approach ) 假设 成对样本。 正态性差异或大样本。 步驟一:虚无假设为H0:1=2,对立假设为 或 或 (双侧) (左侧) (右侧),98,步驟二:诀定显著水平。 步驟三:计算配对样本的配对差异d。 步驟四:计算检验统计量的值,99,步驟五:临界值为 或 或 (双侧) (左侧) (右侧)以自由度(n1-1),使用表找出临界值。,100,步驟六:若此统计检验值落于拒绝区,则拒绝H0;反之,则无法拒绝。 步驟七:解释此假设检验的结果。 当成对差异变量是正态分布时,假设检验是精确的;当大样本的成对差异变量不是正态分布(正态性差异)时,

35、则假设检验是趋近于正确的。,101,用独立样本t检验法去分析配对样本的 后果是什么? What happens if one analyzes the paired- sample data using the independent-sample t?,102,这说明什么?,103,请看:使用独立样本的方法会导致功效的损失,增大犯第二类错误的概率。,104,5 应该选用何种方法?,Which Procedure Should be Used?,105,+,*,106,107,四、总体比率的推断统计 Inferences for Population Proportions,1 一个总体比率的

36、信赖区间2 一个总体比率的假设检验3 独立样本,二个总体比率的推论统计,108,1 一个总体比率的信赖区间,Confidence Intervals for One Population Proportion,109,总体比率与样本比率,考查总体內每个成员是否擁有某个特质,则我们使用以下的符号及专有名词: 总体比率, :总体裡擁有某特质的比率(百分比)。 样本比率, :自总体中取出的样本裡,擁有某特质的比率(百分比)。 样本比率 样本比率, ,是使用以下公式计算出来的:此处的x是样本中有某特质的成员数,依慣例n即为样本大小。,110,平均数及标准差的符号相似处对照表,111,样本比率的抽样分布

37、 若样本大小为n: 的平均等于总体比率,或 的标准差等于总体比率乘上1減此比率,再除以样本大小后再开根号,或 当n很大时, 是趋近正态分布。 当n很大,样本n的样本比率,会趋近于一个平均数为 且标准差为 的正态分布。 何谓n够大? np 及n(1-p)皆 5 ,112,总体比率的单一样本z区间法 假设: 成功数x,及失敗数n-x,皆大于5。 步驟一:以(1-)的信赖水平使用表找出z/2。 步驟二: 的信赖区间为 到 此处的z/2是由步驟一算出,n是样本大小, 是样本比率。 步驟三:解释此信赖区间。,113,估计 的误差幅度 估计 的误差幅度为:此误差幅度等于信赖区间一半長度。它表示在某特定信赖

38、水平时,以样本比率 来估计总体比率 的精确性。,114,估计 时所使用的样本大小 未知 为获得误差幅度不超过E的(1-)信赖区间,有两种方法:()将n四舍五入,取整数。()若依经验猜测 ,应该以 (g即代表猜测)取代至下列公式:将n四舍五入,取整数。,115,2 一个总体比率的假设检验,Hypothesis Tests for One Population Proportion,116,总体比率的单一样本z区间法(临界值法)(The One-Sample z-Test for a Population Proportion(Critical-Value Approach ) 假设: 与 皆大于

39、5。 步驟一:虚无假设为 ,对立假设为 或 或 (双尾) (左尾) (右尾) 步驟二:诀定显著水平。,117,步驟三:计算检验统计量 步驟四:临界值为 或 或 (双尾) (左尾) (右尾)使用表找出临界值。,118,步驟五:若此统计检验量的值落在拒绝区內,则拒绝H0;反之,则无法拒绝H0 。 步驟六:解释此假设检验的结果。,119,3 使用独立样本推论二个总体的比率,Inference for Two Population Proportion, Using Independent Sample,120,考慮到两个总体比率时,参数与统计数的符号,案例:胃冷冻实验,121,两个独立样本比率之差的

40、抽样分布 自总体得到独立样本n1及n2: 当n1与n2为大样本时, 趋近正态分布。 特別的是,当n很大,两个样本的比率之差,会趋近于一个平均数为 且标准差为 的正态分布。,122,但p为未知,須以样本比率加以估计 The pooled sample proportion (合并样本比率),123,总体比率的两个样本z检验法(临界值法)(The Two-Sample z-Test for a Population Proportion(Critical-Value Approach ) 假设: 独立样本 , 与 皆大于5。 步驟一:虚无假设为 ,对立假设为 或 或 (双尾) (左尾) (右尾)

41、步驟二:诀定显著水平。,124,步驟三:计算检验统计量此处的 步驟四:临界值为 或 或 (双尾) (左尾) (右尾)使用表找出临界值。,125,步驟五:若此统计检验量的值落在拒绝区內,则拒绝H0;反之,则无法拒绝H0 。 步驟六:解释此假设检验的结果。,126,五、总体标准差的推论统计Inferences for Population Standard Deviations,127,比较两个总体标准差的F统计数的分布 假设每个总体为正态分布。则各来自这两个总体的独立样本大小分別为n1与n2,标准差之比符合:为自由度(n1-1 , n2-1)的F分布。,128,F曲线的基本特性 特性一:F曲线下

42、的面积总和等于1。 特性二:F曲线自水平轴的零点起始,并往右侧无限延伸出去,只会逼近水平轴,永远不会接触。 特性三:F曲线皆为右偏。 查表,129,F曲线的自由度由分子(numerator)与分母(denominator)所组成的,表示方式如下:,130,F曲线的互補特性 当F曲线的自由度为(1 , 2)时,左侧的面积为的F值,剛好等于F曲线的自由度为( 2 , 1)时,右侧的面积为的F值之倒数。,131,两个总体标准差的F检验(临界值法)(The F-Test for Two Population Standard Deviation(Critical-Value Approach ) 假设

43、: 独立样本 正态总体 步驟一:虚无假设为H0:1=2,对立假设为 或 或 (双侧) (左侧) (右侧),132,步驟二:诀定显著水平。 步驟三:计算检验统计量的值。,133,步驟四:临界值为 及 或 或 (双侧) (左侧)(右侧)以自由度(n1-1, n2-1),使用表找出临界值。,134,步驟五:若此统计检验值落于拒绝区,则拒绝H0;反之,则无法拒绝。 步驟六:解释此假设检验的结果。,135,Robustness F检验并不robust,应该有充分证据支持总体为正态分布时才用,136,六、卡方检验法Chi-Square Procedures,1 2分布2 2适合度检验一个多项分布的类别变量

44、3 列联表;关联性4 2独立性检验两个类别变量是否独立,137,1 2分布,The Chi-Square Distribution,138,2的基本特性 特性一:2曲线下的面积总和等于1。 特性二:2曲线自水平轴的零点起始,并往右侧无限延伸出去,只会逼近水平轴,永远不会接触。 特性三:2曲线皆为右偏。 特性四:随自由度增加,2曲线会接近正态曲线。,139,2 2适合度检验,Chi-Square Goodness-of-Fit Test,140,2适合度检验适用于:当总体变量为多项分布时,它的实际频数分布和期望频数分布之间是否存在差异。,141,犯罪形势变化了吗?,期望频数分布 实际频数分布,1

45、42,观测次数vs.期望次数(observed frequency vs. expected frequency) E=np,143,144,2适合度检验裡,2值的分布 2适合度检验的检验统计量 当虚无假设为真时,趋近于2分布。自由度为k-1-c。 P319: 1 期望频数总数等于观察频数总数 c 确定期望分布时需要从样本数据中估计的参数个数。,145,2适合度检验(临界值法)(The Chi-Square Goodness-of-Fit Test(Critical-Value Approach ) 假设: 所有的期望次数大于或等于1。 最多有20%的期望次数小于5。 步驟一:虚无假设及对立假

46、设为 H0:所关注的变量为某特定分布。 Ha:所关注的变量并非为某特定分布。,146,步驟二:以 E=np 计算,所关注变量各可能值之期望次数。此处的n是指样本大小,p则是在虚无假设中所提供的相对次数(或机率)。 步驟三:判定期望次数是否符合假设1与假设2。若不是,则这个方法不能使用。 步驟四:诀定显著水平。,147,步驟五:计算出检验统计量的值:此处的O及E,分別指观察次数与期望次数。 步驟六:临界值是当自由度df为k-1-c的 ,此处的k是所关注变量可取的值数量(组数)。使用表8找出临界值。,148,步驟七:若检验统计量的值落在拒绝区內,则拒绝H0;反之,则否。 步驟八:解释假设检验的结果

47、。,149,3 列联表;关联性,Contingency Tables; Association,150,列联表(contingency table) 列联表即为整理bivariate data的次数分布,151,152,关联性(Association) 当两个变量有关联性时,其中一个变量固定时另一变量的条件分布(conditional distribution)不相同。 Conditional distribution vs. marginal distribution) 两个变量无关联表示它们在统计上独立(statistically independent),153,Expected fre

48、quencyP90 如果两个变量独立,154,2独立性检验中,2值的分布 2独立性检验的检验统计数为: 当虚无假设为真时,趋近于2分布。自由度的值为(r-1)(c-1),此处的r与c的值,是所关注的两个变量中,可能的值之数量。,155,2独立性检验(临界值法)(The Chi-Square Independence Test(Critical-Value Approach ) 假设: 所有的期望次数大于或等于1。 最多有20%的期望次数小于5。 步驟一:虚无假设及对立假设为 H0:所关注的两个变量沒有关联性。 Ha:所关注的两个变量有关联性。,156,步驟二: 以 的公式,计算出期望次数。此处

49、的R为行的总和,C是列的总和,n则是指样本大小。 在列联表裡,在每个观察次数下面,填入它所对应的期望次数。 步驟三:判定期望次数是否符合假设1与假设2。若不是,则这个方法不能使用。 步驟四:诀定显著水平。,157,步驟五:计算出检验统计量的值:此处的O及E,分別指观察次数与期望次数。 步驟六:临界值是当自由度为(r-1)(c-1)的 ,此处的r与c是关注的两个变量可能的值。使用表找出临界值。,158,步驟七:若检验统计量的值落在拒绝区內,则拒绝H0;反之,则否。 步驟八:解释假设检验的结果。,159,七、单因子方差分析,Analysis of Variance (ANOVA),1 F分布2 单

50、因子方差分析的逻辑3 单因子方差分析的方法4 多重比较,160,1 F分布,The F-Distribution,161,F曲线的基本特性(Basic Properties of F-Curves) 特性一:F曲线下的面积总和等于1。 特性二:F曲线自水平轴的零点起始,并往右侧无限延伸出去,只会逼近水平轴,永远不会接触。 特性三:F曲线皆为右偏。,162,2 单因子方差分析的逻辑,One-Way ANOVA : The Logic,163,方差分析可以用来分析检验三个或三个以上总体均值的问题。 方差分析的数据可以来自于实验性数据和观测性数据。 实验性数据又来自于三种类型的实验研究:完全随机化设

51、计、随机化分组设计以及析因设计。 一组关键词:试验设计、自变量(处理变量、分类变量)、因素,164,为什么不用多个检验解决问题? 比较方式的第一类错误概率; 实验方式的第一类错误概率。,165,单因子方差分析的假设(Assumptions for One-Way ANOVA) 独立样本(Independent Samples)对于所关注的变量,样本是独立的。 正态总体(Normal Populations)在每个总体中,所关注的变量为正态分布。稍微违反正态假设并不影响ANOVA之结果。 标准差相等(Equal Standard Deviations) 所关注的变量在各总体中标准差相等。只要各样

52、本大小大略相等,那么稍微违背标准差之假设并不影响ANOVA之结果。 Rule of 2最大与最小的样本标准差比值只要不大于2,视为本假设已满足。,166,单因子方差分析的逻辑 操作工与阀门口径 如果三个总体均值是相等的,可以期望三个样本均值很接近。所以,三个样本均值的变异性可以作为总体均值是否相等的证据。 如果总体均值相等,利用样本均值的变异性可以对进行估计。,167,因为每个样本都来自均值为,方差为的同一正态分布。中心极限定理:对来自正态总体的容量为的一个简单随机样本的样本的均值的抽样分布仍然服从正态分布,其均值为,方差为 。 的处理间估计: 当总体均值不相等时,处理间估计将高估总体方差。,

53、168,另一方面,每个样本内部的变异,即样本的方差也会给出的一个无偏估计。我们可以把的个别估计组合或合并成一个总的估计,我们可以称之为的合并或处理内估计: 因为每个样本方差给出的的估计仅和每个样本内部的变异有关,所以的处理内估计不受总体均值是否相等的影响。,169,当零假设为真时,两个估计量应该很接近,并且它们的比值接近于;如果零假设为假,则处理间估计将大于处理内估计。所以当这一比值大到一定程度时我们就可以拒绝零假设。 总的来说,背后的逻辑是以总体方差的两个独立的估计量为基础,一个估计量是基于不同的处理组之间的变异,另一个估计是基于每个处理组内部的差异。,170,比较MSTR与MSE 是否够大

54、,可以拒绝H0?H0:1=2=3=4Ha:至少有一组平均数不相等,171,2 单因子方差分析的方法,One-Way ANOVA : The Procedure,172,单因子方差分析检验的统计值F之分布(Distribution of the F-Statistic for One-Way ANOVA) 假设所关注的变量在k个总体中是正态分布且标准差皆相等。那么,来自k个总体的独立样本,变量:当虚无假设总体均值相等的假设为真时,此为一个自由度(k-1, n-k)的F分布。,173,单因子方差分析的特性(One-Way ANOVA Identity) 整体平方和(Total Sum of Squ

55、are)等于组间平方和(Treatment Sum of Square)加上误差平方和(Error Sum of Square),即SST=SSTR+SSE。,174,175,单因子方差分析表(One-way ANOVA Table),176,单因子方差分析中的平方和关系(Sum of Squares in One-Way ANOVA) k个总体平均数的单因子方差分析;下表为三种平方和的定义及计算公式。,177,承上表,符号的意义: =观察值的总数 =所有n个观察值的平均 而j=1,2,k的意义为: =来自总体j的样本大小 =来自总体j的样本平均数 =来自总体j的样本变异数 =来自总体j的样本

56、资料总和,178,k个总体平均数的单因子方差检验(临界值法)(The One-way ANOVA Test for k Population Means(Critical-Value Approach) 假设: 独立样本 正态总体 总体标准差相等 步驟一:虚无假设及对立假设H0:1=2=kHa:至少一组平均数不相等 步驟二:诀定显著水平。,179,步驟三:算出三种平方和,SST、SSTR、SSE。 步驟四:建构出单因子变异数分析的表格以求出统计值F。,180,步驟五:临界值为F,自由度为(k-1, n-k),此处的n为观察值的总数。使用表找出临界值。 步驟六:若统计值F落入拒绝区,则拒绝H0;

57、反之,则不拒绝H0。 步驟七:解释此假设检验的结果。,181,八、隨机化分组设计 Randomized Block Design,182,隨机化分组设计-特性与逻辑,与双因子方差分析结构相近,但对分组因子的效果不感兴趣,每个Treatment Condition在每个分组只有一个实验单元,183,分组因子(Blocking Factor) 造成实验单元彼此间的差异,而影响Treatment Effect 的解释 隨机化分组设计将分组因子的影响(自误差中) 独立出來,有助于Treatment Effect的显著 多为与实验单元或实验执行当时状況有关的因子,如性別,体重,受试,实验日期,实验地点等

58、。 最极端的分组实验:以受试者本身为分组时又称重复测量(Repeated Measure)设计,可以去除因人而造成的差异 配对实验的极端情形也是对受试者本人进行重复测量实验。,184,185,Response=overall mean+treatment effect+block effect+error SST=SSTR+SSBL+SSE SSBL:分组平方和(Block Sum of Squares) df(SST)=df(SSTR)+df(SSBL)+df(SSE)(n-1)=(k-1)+(b-1)+(k-1)(b-1),186,187,188,如果分组变量带来的差异不够大,使用随机分组设计还不如使用完全随机设计。因此,要使用随机分组设计,必须找到对因变量的方差有贡献的分组变量。 当分组部分对分析贡献不大时,如果把分组效果SSBL加入SSE中去后,除以自由度后,MSE可能会减少,从而导致F值增加。也就是说,在初始分析中纳入不显著的分组因素可能会减弱分析效果,可能会增加犯第二类错误的概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论