版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 方差分析案例案例 对于大学新生的入学成绩,可以通过对于大学新生的入学成绩,可以通过t t检验来考察检验来考察男女学生间的入学成绩是否有差异?但要是想知道来自男女学生间的入学成绩是否有差异?但要是想知道来自于江苏、浙江、上海、安徽等省份的学生,其入学成绩于江苏、浙江、上海、安徽等省份的学生,其入学成绩是否有差异,那么是否可以用是否有差异,那么是否可以用6 6次次t t 检验来达成目的?检验来达成目的?在以上例子中,涉及的问题其实就是在单一处理因素之下,在以上例子中,涉及的问题其实就是在单一处理因素之下,多个不同水平(多组)之间的连续性观察值的比较,目的多个不同水平(多组)之间的连续性观察值的比
2、较,目的是通过对多个样本的研究,来推断这些样本是否来自于同是通过对多个样本的研究,来推断这些样本是否来自于同一个总体。一个总体。那么能否使用两两那么能否使用两两t t 检验,例如做三组比较,则分别进行检验,例如做三组比较,则分别进行三次三次t t 检验检验来解决此问题呢?这样做在统计上是不妥的。来解决此问题呢?这样做在统计上是不妥的。因为统计学的结论都是概率性的,存在犯错误的可能。因为统计学的结论都是概率性的,存在犯错误的可能。 分析分析:用:用6 6次次t t 检验来考察检验来考察4 4个省份的大学生新生入学成绩是否个省份的大学生新生入学成绩是否相同,对于某一次比较,其犯相同,对于某一次比较
3、,其犯I I类错误的概率为类错误的概率为 ,那么连续,那么连续进行进行6 6次比较,其犯次比较,其犯I I类错误的概率是多少呢?不是类错误的概率是多少呢?不是 6 6,而是,而是1- 1-(1- 1- )6 6。也就是说,如果检验水准取。也就是说,如果检验水准取0.050.05,那么连续进行,那么连续进行6 6次次t t 检验,犯检验,犯I I类错误的概率将上升为类错误的概率将上升为0.26490.2649!这是一个令人!这是一个令人震惊的数字!震惊的数字! 结论结论:多个均数比较不宜采用:多个均数比较不宜采用t t 检验作两两比较;而应该采检验作两两比较;而应该采用方差分析!用方差分析!v
4、R.A.Fisher R.A.Fisher 提出的方差分析的理论基础:提出的方差分析的理论基础: 将总变异分解为由研究因素所造成的部分和由抽样误差将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助所造成的部分,通过比较来自于不同部分的变异,借助F F分布作出统计推断。后人又将线性模型的思想引入方差分布作出统计推断。后人又将线性模型的思想引入方差分析,为这一方法提供了近乎无穷的发展空间。分析,为这一方法提供了近乎无穷的发展空间。总变异总变异 随机变异随机变异 处理因素导致的变异处理因素导致的变异总变异总变异 组内变异组内变异 组间变异组间变异SSSS
5、总总 SSSS组内组内 SSSS组间组间这样,我们就可以采用一定的方法来比较组内变异和组间变这样,我们就可以采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的确存异的大小,如果后者远远大于前者,则说明处理因素的确存在,如果两者相差无几,则说明该影响不存在,以上即方差在,如果两者相差无几,则说明该影响不存在,以上即方差分析的基本思想。分析的基本思想。 例例1 1 假定某型号的电子管的使用寿命服从正态分假定某型号的电子管的使用寿命服从正态分布,并且原料差异只影响平均寿命,不影响方差布,并且原料差异只影响平均寿命,不影响方差 。现用现用三种不同来源的材料三种不同来源
6、的材料各试生产了一批电子管。各试生产了一批电子管。从每批中各抽取若干只做寿命实验,得数据如下表。从每批中各抽取若干只做寿命实验,得数据如下表。2试问测试结果是否说明这批电子管的寿命有明显差异?试问测试结果是否说明这批电子管的寿命有明显差异?材料批号材料批号寿命测定值(单位:小时)寿命测定值(单位:小时)1231600 1610 1650 1680 1700 1700 18001580 1640 1640 1700 17501460 1550 1600 1620 1640 1660 1740 18201.引例例例2 2 设对四种玉米品种进行对比实验,每个品设对四种玉米品种进行对比实验,每个品种都
7、在同一块田的五个小区各做一次实验,实种都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的平验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?均产量是否有显著影响?品种品种产量(斤产量(斤/小区)小区)32.3 34.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.81A2A3A4A 29.3 26.0 29.8 28.0 29.8类似问题类似问题高等数学、线性代数、数理统计等许多基础课实行选课制,高等数学、线性代数、数理统计等许多基础课实行选课制,如何认定主讲教师对学生成绩有一
8、定影响?如何认定主讲教师对学生成绩有一定影响?假定:张老师的学生平均假定:张老师的学生平均72.5,李老师的学生平均成绩李老师的学生平均成绩71.8,王老师的学生平均成绩王老师的学生平均成绩70.9,能否说明三位老师的教学水平有差异能否说明三位老师的教学水平有差异? ?根据假设检验的原理,即检验根据假设检验的原理,即检验123 ?解决此类问题:解决此类问题:1是重复检验,是重复检验,2是方差分析是方差分析在实践中,在实践中,人们总是要通过试验,观察各种因素的影响,例如,人们总是要通过试验,观察各种因素的影响,例如,不同型号的机器,不同的原材料、不同的技术人员不同型号的机器,不同的原材料、不同的
9、技术人员以及不同的操作方法等等,对产品的产量、性能都会有以及不同的操作方法等等,对产品的产量、性能都会有影响。当然,有的因素影响大,有的因素影响小,影响。当然,有的因素影响大,有的因素影响小,有的因素可以控制,有的因素不能控制。如果从多种有的因素可以控制,有的因素不能控制。如果从多种可控制因素中找出主要因素,通过对主要因素的控制,可控制因素中找出主要因素,通过对主要因素的控制,调整,提高产品的产量、性能,这是人们所希望的,解调整,提高产品的产量、性能,这是人们所希望的,解决这个问题的有效方法之一就是方差分析。决这个问题的有效方法之一就是方差分析。影响一个事物的因素往往是很多的,影响一个事物的因
10、素往往是很多的,前面提到的产品的产量、性能等称为试验指标,前面提到的产品的产量、性能等称为试验指标,他们受因素的影响,因素的不同状态称为水平,一个因素他们受因素的影响,因素的不同状态称为水平,一个因素可采取多个水平。可采取多个水平。通过观察可以得到试验指标的数据,这些数据可以看成通过观察可以得到试验指标的数据,这些数据可以看成从不同的总体中得到的样本数值。从不同的总体中得到的样本数值。统计学上,统计学上,不同的因素,不同的水平不同的因素,不同的水平可以看作是不同的总体。可以看作是不同的总体。二、统计分析二、统计分析一一 、总平方和的分解、总平方和的分解单因素试验的方差分析单因素试验的方差分析设
11、在试验中,因素设在试验中,因素A有有S个不同水平个不同水平12,.,sA AA在水平下的试验结果在水平下的试验结果2(,)(1,2,., )jjXNjs 。其中其中 和和 是未知参数。在水平是未知参数。在水平 下作下作 次独立实验,次独立实验,其结果如表其结果如表1所示所示。j2jAjn 数学模型数学模型123jn11121sXXX21222 sXXX31323sXXX11nXsn sX样本均值样本均值 jX22nX.1X.sX.2X序号序号样样本本水平水平1A2AsA 是来自总体是来自总体 的容量为的容量为 的的 一个一个 样本,其观察值为样本,其观察值为 12jjjn jXXX, ,jXj
12、n012:sH112:,sH 不全相等(1)由于由于 相互独立,且相互独立,且ijX2(,)ijjXN 1,2,.,;1,2,jinjs若记若记则则(1,2,;1,2, )ijijjjXinjs2(0,),ijN且相互独立且相互独立 要判断因素的各水平间是否有显著差异,也就是要判断因素的各水平间是否有显著差异,也就是要要 判断各正态总体的均值是否相等,即检验假设判断各正态总体的均值是否相等,即检验假设12jjjn jxxx, ,2(0,) 1,2,1,2,ijjijijijjXNinjs相互独立其中(2)其中其中 与与 均为未知参数。均为未知参数。式(式(2)称为)称为单因素方差分析的数学模型
13、单因素方差分析的数学模型。j2则则是各水平下总体均值的加权平均,称为是各水平下总体均值的加权平均,称为总平均值总平均值; 代表了第代表了第j水平下的总体均值与平均值的差异,水平下的总体均值与平均值的差异,这个差异称为这个差异称为 的效应的效应,jjA10sjjjn(4)由式由式(2),(3)可以得到单因素方差分析的可以得到单因素方差分析的等价数学模型等价数学模型它满足它满足11sjjjjjnn(1,2,)im(3)再令再令1sjjnn式式(5)表明:样本由表明:样本由总平均值总平均值 因素的因素的水平效应水平效应 随机误差随机误差三部分叠加而成。三部分叠加而成。因而式因而式(5)也称为也称为线
14、性可加模型线性可加模型。(5)1201,2, ;1,2,(0,)ijjijmjjjiijXnjsinN且相互独立方差分析的任务:方差分析的任务:检验线性统计模型(检验线性统计模型(1.11.1)中的)中的s s个总体个总体2(,)jN j 中中的的各各的的相相等等性性,即即有有0121:1.2 ,sijHHi j ()至至少少有有一一对对0121 :=01.2 :0sjHHj 等等价价假假设设:()至至少少检验此假设检验此假设的问题就是的问题就是方差分析方差分析 jj jA记记在在水水平平下下的的样样本本看看作作一一组组,记记组组内内平平均均为为.11jnjijijXXn .111111, j
15、njjijjjjijsjjXXn Xnnnn 其其中中样本总平均样本总平均A1(X1)A2(X2)A3A4(X4).1XX.2X.4X 14X 14.4XX .4XX 总离差平方和为总离差平方和为211() jnsTijjiSXX 全部数据与总平均之全部数据与总平均之间的差异,又叫总变差间的差异,又叫总变差2.11()()jnsijjjjiXXXX 分分解解22.1111()()jjnnssijjjjijiXXXX .11 2()()jnsijjjjiXXXX 交叉项为交叉项为0 0,因为,因为.112()()jnsjijjjiXXXX.112()()0jnsjijjjjiXXXn X.11
16、2()()jnsijjjjiXXXX 总离差平方和分解为总离差平方和分解为ESAS (组内离差)(组内离差)(组间离差)(组间离差)EASS22.1111()()jjnnssijjjjijiXXXX 211() jnsTijjiSXX 2E.11S()jnsijjjiXX 组组内内差差 反映反映A Aj j水平水平下下的样的样本本均值均值与样本值之间的差异,与样本值之间的差异,则有总平方和的分解则有总平方和的分解TS (1.3)AESS22.111()() jnsSAjjjjiJSXXnXX 组组间间差差 反映反映 A Aj j水平水平下的子样均值与总平均值之间的差异,下的子样均值与总平均值之
17、间的差异,叫水平叫水平A Aj j效应效应的平方和的平方和它是由随机误差引起的,叫误差平方和它是由随机误差引起的,叫误差平方和SE, SA的统计特性2E.11S()jnsijjjiXX 2.212()1jnijjijXXn () 22.21E2211()S(1)jnijjssijjjXXn 由由分分布布的的可可加加性性,有有 2E2S () (1.4) ns 即即2()EESns 2EE22EE2S () S, SS , nsnsEnsEns ,知知:的的自自由由度度为为并并且且有有即即2222.11(. ) SsAjjjjjjESEn XnXn E XnEX 22221()() sjjjjn
18、nnn 2222111(1)2 sssjjjjjjjjsnnnn221(1) sjjjsn 2221(1) sjjjsnn 2.1() SAjjJSnXX 221(1)sAjjjESns 11 0 sjjjjjjsjjjAnnn 第第 个个水水平平的的效效应应221 (1)(1.5)sAjjjESsn 即即2(,)ijjXN 且且独独立立: 222211/() )/( -1) jnsTijjiSXXn 012 :sH若若 S SA A的自由度为的自由度为S-1S-12222222(1), (),TAETESSSSnSns 022(1) HASs 222222 (1),(),(1)TEASnSn
19、sSs 即即0:0 iH 在在成成立立的的条条件件下下, F取取统统计计量量(1,) FF sns22/(1) /()AESsSns F F 分布的分位点回顾分布的分位点回顾对于给定的正数对于给定的正数10,称满足条件称满足条件1212(,)(,)( )Fn nP FFn ny dya的点的点为为分位点。分位点。分布的上分布的上),(21nnF),(21nnF),(21nnF查出查出给定给定(1,)Fsns 的的值值,,1.5AESSF由由样样本本值值算算出出从从而而算算出出 的的值值,由由()221(1)(1.5)sAjjjESsn 0:0 jAHSF 知知:若若不不成成立立 ,偏偏大大,导
20、导致致 偏偏大大,因因此此00(1,);(1,);FFsnsHFFsnsH 若若,则则拒拒绝绝若若,则则接接受受即认为因素对试验结果无显著影响。即认为因素对试验结果无显著影响。方差来方差来源源平平方方和和自自由由度度均方均方F值值因素因素ASAs-1误差误差ESEn-s总和总和TSTn-11AASSs EESSns AESFS 一元方差分析表一元方差分析表(1,)AESFF snsS111, 1 2s, jjnjijinsijjiTxjTx ,为了计算的方便,常采用下面的简便计算方式,记为了计算的方便,常采用下面的简便计算方式,记222.111122.2.11()() jjnnssTijijj
21、ijissjAjjjjjETATSXXXnTTSnXXnnSSS 22211111122112222.1111()()() jjjjjjnnssTijijjijinsnijsjjijjinnssijijjijiSXXXnXXXnnTTXnXnn 例例2 2 设对设对四种玉米品种四种玉米品种进行对比实验,每个品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?平均产量是否有显著影响?(=0.01)品种品种产量(斤产量(斤/小区)小区)32.3 34
22、.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.81A2A3A4A 29.3 26.0 29.8 28.0 29.8解解 分别以分别以 表示不同品种玉米平均表示不同品种玉米平均产量总体的均值,按题意需检验假设产量总体的均值,按题意需检验假设1234, 01234:H11234:,H 不全相等1234nnnn=5,1234nnnnn=20656.4,ijx 221677.50ijx 4S 品种地块产量1A2A4A3A1 32.3 33.3 30.8 29.3 172.1 173.9 168.5 141.9 656.
23、45 36.5 34.5 35.8 28.84 35.0 36.8 32.3 28.03 34.3 36.3 35.3 29.82 34.0 33.0 34.3 26.0. jT521ijjx 5923.682 6048.242 5678.45 4027.122 21677.5029618.41 30241.21 28392.25 20135.61 5933.03 6060.07 5696.15 4035.97 21725.22表表347.72ETASSS134.452注意到注意到4,m 12345,nnnn可得方差分析表可得方差分析表656.421725.22182.172202656.42
24、1677.520表表4方差来源方差来源误差误差E因素因素A总和总和均均 方方自由度自由度平方和平方和显著性显著性F 比比47.72ES 2.98ES 15.04F 44.817AS 182.172TS 134.452AS 当当 时时,0.01由由F分布表可查得分布表可查得0.01(3,16)(3,16)5.29FF由于由于0.0115.045.29(3,16),FF故拒绝故拒绝0,H即认为即认为这四个品种对玉米平均产量的影响高度显著。这四个品种对玉米平均产量的影响高度显著。31916由上面讨论,可得未知参数由上面讨论,可得未知参数2,jj 的的估计估计2ESns均为无偏估计均为无偏估计。.1111jjnnjijjjjjjjE XE Xnn11111jnssijiijijE XE Xnnn.()jjjE XX4.4.未知参数的估计未知参数的估计X .j
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冲压工诚信考核试卷含答案
- 钟表设计师岗前内部考核试卷含答案
- 2026年新科教版初中九年级美术下册第一单元美术探究性学习卷含答案
- 重力勘探工诚信道德能力考核试卷含答案
- 湿法纺纺丝操作工岗前实操知识考核试卷含答案
- 2026年新科教版初中八年级地理下册第三单元西北地区青藏地区卷含答案
- 耐火制品加工工安全操作强化考核试卷含答案
- 质检员安全意识强化竞赛考核试卷含答案
- 刻瓷工安全规程评优考核试卷含答案
- 日间手术麻醉后恢复室管理效率优化
- 南京市2025东南大学管理和其他专技岗位招聘36人(第一批)笔试历年参考题库典型考点附带答案详解
- 2026年中国铁路上海局铁路局招聘行测试题
- 【中考数学冲刺】2026届黑龙江省绥化市中考仿真数学试卷3 附解析
- 2025-2026学年广东省深圳市蛇口育才教育集团七年级(下)期中地理试卷
- 2026《药品管理法实施条例》解读课件
- 历届全国初中数学联赛真题和答案
- 国家义务教育监测八年级模拟试题(音乐)
- GB/T 8685-2008纺织品维护标签规范符号法
- GB/T 5269-2008传动与输送用双节距精密滚子链、附件和链轮
- GB/T 22882-2008排球
- GB/T 20933-2021热轧钢板桩
评论
0/150
提交评论