单因子设计.doc_第1页
单因子设计.doc_第2页
单因子设计.doc_第3页
单因子设计.doc_第4页
单因子设计.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单因子设计1. 以下所有讨论既适用于试验室也可用于野外或现场试验2. 首先给出几个关键名词定义. 处理指在人工控制条件下对不同被试者施加的有系统差异的影响.根据设计不同, 一个处理可能对应于一个单一因子水平(单因子设计时)或若干因子水平的组合(多因子设计时). 重复是指为了减少和测验试验误差而把试验处理施加于多个被试者身上. 所谓一元或多元设计是根据设计中因变量的数目划分的如果只有一个因变量就是一元设计, 多个因变量则多元设计. 试验设计中更重要的是试验因子的数目. 根据这个把所有试验分成单因子和多因子设计. 单因子是指仅含一个试验因子的设计, 而多因子则含有两个以上试验因子. 顺便说一下, 试验设计和统计模型分析有些不同. 统计分析时根据因变量的性质(连续或分类)不同会导致完全不同的模型. 而试验设计中的因子数目及其相互关系更为重要, 不同的设计主要由因子数目和彼此关系来界定. 这主要是因为在设计中的因变量方差分析要求都是连续的. 因变量就是那些在试验中被测量的变量, 也是我们的假设检验要比较的对象. 其内容可以很灵活, 既有个体主观的报告也有客观的测量. 有些是对试验因子的直接反应, 有些则和试验因子表面看没有直接关系. 自变量决定被试在实验中是否分组,分多少组,因变量决定实验中每个被试至少应作多少次测试,而无关变量则决定实验中应采取哪些实验控制的方法. 考虑四种情况如下表单一因变量多个因变量单个试验因子一元单因子设计多元单因子设计多个试验因子一元多因子设计多元多因子设计一般来说单一因变量的试验在市场研究中比较多见多元因变量相对较少但有一种例外即重复测量设计,此时是把每次测量值作为一个因变量(当然这些因变量彼此是相关的,见后讨论),故有多少次测量就有多少个因变量思考题: 下列例子各属于那种设计? 从麦当劳附近抽样100名顾客, 分成两组(每组50人, 此时两组个体数目相等, 称平衡设计). 对其中一组显示麦当劳薯条致癌的消息, 另外一组不显示. 然后搜集两组对麦当劳的满意度打分(从1到10, 10为高, 1为低). 同上题, 但是现要求每人评价麦当劳的产品质量, 服务态度, 清洁程度,和价值. 同第一题, 但现在把100人分成四组, 即是否显示致癌消息(显示, 不显示), 以及是否在本月光顾过麦当劳(去过, 没有去过). 同第一题, 但现在除了显示和不显示致癌消息以外还考虑性别. 同第二题, 分组标准同第三题. 从乐购和大润发分别拦截100人, 分别对每个大卖场的总体满意度打分. 从乐购和大润发分别拦截100人, 分别对每个大卖场的QSCV打分. 从乐购和大润发分别拦截100人, 要求每人对两个大卖场的满意度打分. 从乐购和大润发分别拦截100人, 要求每人对两个大卖场的QSCV打分.3. 单因子时一般采完全随机设计,记为CR-g, 其中g是处理组数4. 一个单因子完全随机设计的例子如下考虑价格对一种玩具销售额的影响价格分高,中,偏低和低四水平,则该试验共有四种处理,对应于四个价格水平如下表高价中等价偏低价低价5366365532663557上表含有四次重复即每种价格含有四个试验个体5. 单因子设计时其因子水平数即为处理数也就是有几个水平即有几个处理.6. 单一因子设计不分固定效应还是随机效应,其检验的分子分母都是一样的关于什么是固定和随机效应以及它们如何影响检验等见后7. 单因子设计往往过于简单,不能控制其它可能的干扰因子另外它只用随机化来控制个体之间差别(或消除个体间原有差异, 仅留下试验处理引起的差异),未能采用局部控制原理,其效率常常比较低需要比较大的样本. 这一方面是因为大样本时方可减少小样本时的偶然性随机误差; 另一方面也因为在单因子设计时每个个体仅仅用于比较一个因子内各个水平8. 思考题:完全随机设计有没有用到试验三原则即随机,对照,和重复?9. 完全随机设计的符号表示为S(A), 其中A=处理单因子,S=试验个体;括号内是嵌套因子,括号外是被嵌套因子注意这个和直观猜想正相反10. “嵌套”的意思是一个因子各水平和另一因子的各水平不完全碰头而是一个因子的某些水平(如价格)只和另一因子(如促销)的某些水平见面,和其它的不见面这是识别阶乘设计和嵌套设计关键!如下例中供应商和分销商,嵌套设计例子供应商供应商分销商分销商分销商分销商分销商上述分销商和只和供应商打交道,分销商和则只和供应商打交道等11. 与之相反, 交叉(或阶乘或因子)设计中是每个因子的所有水平和另一因子的所有水平都相遇! 如上面例子如果是交叉设计就有每个分销商和每个供应商都打交道.供应商供应商分销商分销商分销商分销商1分销商212. 一般而言被试个体即S都是嵌套在试验因子水平内的,因为同一个体不会经历所有处理水平. 后者意味着一种交叉或阶乘关系唯一例外是重复测量设计,此时同一个体和所有处理水平见面从而出现多个测量值!这就是为什么重复测量设计中的个体内和个体间因子是一种阶乘,交叉,或互作关系我们后面再详细讨论这个问题记住重复测量设计时被试个体等于一个因子, 其中每个人就对应于一个水平!单因子设计的分析1. 首先要记住并不是每个设计都需要方差分析或测验的许多试验的结果往往是通过描述性手段直接比较不同处理的结果,后者往往可以表示为单纯的计数有多少人出现某种结果,多少人出现另一种结果所以设计占了大头,分析是小头后者常常只用描述性方法2. 方差分析之所以重要乃因为组数大于时你犯I类错误的概率增加很快看下列公式:, 其中的alpha是指I类错误概率也就是显著水平,一般定为0.05; 而指数c则是成对比较的数目注意c不等于组数例如有组处理,则成对比较数目是3*(3-1)/23, 但是如果有4组则c=4*(4-1)/2=6. 应用上述公式有 Risk=1-(1-0.05)6=0.26. 3. 方差分析假定设计中各组个体数目一样另外还要测验组内方差是否一样即所谓方差同质性检验这个假设的精神就是要求各组个体是来自方差相似的群体而不是方差不等的群体只有这样才能用各个组的平均组内方差作检验的分母否则就是拿平果和桔子去比较了4. 有一个很便利的方差同质性比较公式即:5. 合格的检验一定是分子分母只差一项而其它都相同换句话说检验的分母含有分子中除了待测项的所有其它各项如果不是这样就不是合格的检验6. 要看模型的处理对因变量的影响可以用两个测量值一个是, 另一个是后者比较好用前者可能出现负值如果值小于此外它只适用于固定效应一般而言,其值大于0.15就是效应大,0.06左右是中等效应,而0.01左右是小效应7. 多重比较有两类,一是事前比较或计划内比较即A Priori Comparisons, 一是事后比较或计划外比较即Posteriori Comparisons. 前者是设计过程的一个部分,而后者则是分析过程中想到的多数情况下是因为F总体测验出现显著.这时往往是逐對進行所有可能的比較,因此總共需要比較k*(k-1)/2 次,这些比较大大超出了正交比较的个数即k-1,通常产生许多非正交比較8. 无论事前或事后,比较都可能是正交比较Orthogonal Comparisons或非正交比较正交比较的特点是两两独立,无论比较数目再多(当然正交比较的数目不可能太多,见下条)也不会使得I类错误概率高的离谱非正交比较则正相反9. 正交性成对比较的数目是组数的函数即(g-1). 例如有组时则正交比较只能有个,其它都是非正交的10. 如何决定那些比较是正交,那些是非正交呢?这个可以容易看出来办法是把成对比较的双方挂上系数(0, 1),再把系数相乘后相加凡是其总数为即属于合法比较要决定比较是否正交,则需要把两两比较的系数相乘如果其结果是就是正交比较,反之则是非正交比较具体见下表,此例假定有四组成对比较组组组组C1: 1 vs.4100-10C2: 2 vs. 301-100C3:1,4 vs. 2,3-1/2-1/21/20C1 x C200000C1 x C300-1/20C2 x C30-1/21/20011. 上表中前三行(即从第二到第四行)不表示正交性,只是表示比较是否合法只有当系数和时的比较才是合法的而后面三行则决定正交性例如C1和C2, C1和C3,以及C2和C3. 12. 如果你需要更多比较,其数目大于正交比较的允许范围,则要求助于Bonferroni Inequality来对于显著水平作出调整其基本精神是分出全试验显著水平和成对比较显著水平例如把整个试验对比较总的I类错误概率设为0.05,再将其除以就得到每对比较应该有的显著水平13. 注意这类调整测验要尽量控制成对比较的对数如果后者太大则势必使得I类错误概率即Alpha太小(例如0.001), 后者会使得II类错误加大14. 试验因变量要求是连续变量(也包括分类值比较多的分类变量, 例如从1到10的量表等),而因子水平间可能有定序关系即从高到低或从低到高. 这时有可能出现某些趋势例如可能有线性,二次函数,或三次函数具体趋势的测验可以用计算机软件包进行对试验者来说重要的是知道有多少可能的趋势项一个快速可靠的计算方法是看试验组数趋势项数目等于组数减一例如你的数据分成四组则最多可以有三项趋势,即线性,平方项,和立方项线性趋势表示直线无打折平方项表示有一次打折即改变方向一次,立方项有两次打折即改变方向两次15. 如果方差分析的检验结果显著就要作多重比较其方法讨论见下.16. 在各種常用事後比較方法中,可以從保守性(conservative)與統計強韌性(powerful)二個向度加以區分,就保守性言(即顯著的標準較嚴苛,因此較不易達到顯著),Tukey法最為保守,其次為LSD法及Newman-Keuls法,最後為Duncan 法;但若就統計強韌性(即較容易達到顯著)來看,則以Duncan法最高,其次為LSD 法及Newman-Keuls法,最低為Tukey 法。在二個向度的比較上,四種方法之順序恰好相反(一定如此,否则不合逻辑)17. 當我們在選擇事後比較方法時,應該考慮研究的性質再作決定。若研究屬於初步的探索性研究,則應該考慮強調統計的強韌性,盡量找出可能的差異出來;若是較接近驗證性研究,則應該考慮強調保守性,除非二組間平均數差異真的是非常顯著,否則寧可接受虛無假設。至於Scheffe法最適用於多組平均數間的比較,對二組的比較因其敏銳度(sensitivity)較低較不適用。18. 有些方法受设计特征直接影响例如Tukey氏方法适用于各组个体相等的简单比较,而Scheffe法则适用于复杂的,各组个体数目不等的情况随机区组设计1. 先从一个半因子开始讲起,此时有随机区组设计;特点是区组所控制的实为半个因子,或者叫做干扰因子后者不是试验者真正关心或感兴趣的东西如前面麦当劳例子中的是否本月内去过麦当劳等.2. 注意有时同样因子可以当干扰因子也可以当试验因子, 视情况, 时间, 地点等而不同. 例如性别一般是干扰因子, 但是在麦当劳例子中因其直接影响态度并可能和薯条新闻(该新闻说麦当劳薯条影响男性生育)有互作, 一定把它当成试验因子才对.3. 不论你心目中如何看待它, 统计上是把它们同等看待的. 即区组因子和试验因子统计上是等同的. 在求方差分析时两者并无不同. 和试验因子一样, 区组也可能是固定或随机的, 也有不同水平即区组数目, 也要用显著性试验决定是否显著.4. 随机区组设计只能处理一个干扰因子如果要对付两个就要用拉丁方设计,后者不常用故不会详细讨论例如我真正关心的是价格对销售额的影响,但是又恐怕手里的四个店铺不具有代表性或者更精确的说担心来自四个店铺的数据有系统差异此时可以把店铺作为一个因子. 设立四个区组,每个对应于一个店铺5. 虽然随机区组设计含有一个半因子,这个设计用符号表示时和双因子阶乘设计完全相同,即S(AB).意思是说试验个体嵌套在处理因子和区组因子内部而且和前面单因子设计相同,试验个体一般总是定为随机因子具体见后6. 每个区组都含有处理因子的各个水平,所以是交叉或阶乘关系7. 区组因子可以是随机或固定的两者的分析模型不同8. 随机区组设计中的处理数目等于处理因子和区组的乘积例如处理因子四水平,分三个区组,则共有个格子即个处理或叫做个萝卜坑每个坑里面可以是一个萝卜或多个萝卜,即单次重复或多次重复9. 首先看一个单次重复随机区组的例子,描述了牙膏品牌和货架位置对于销量的影响见下表品牌品牌品牌品牌货架销量销量销量销量货架销量销量销量销量货架销量销量销量销量货架销量销量销量销量此处怀疑不同货架位置可能对销量有系统影响但又并不真正关心货架位置. 故把不同货架位置设为不同区组,牙膏品牌是唯一因子,其在各个货架上的次序是随机决定的此外上例还有一个特点是单次重复,即每个货架和品牌组合仅含有一个试验个体这是因为仅考虑牙膏品牌时,一个品牌不论有多少支牙膏,都仅看作是一个个体10. 上例可否改成多次重复呢?一种可能是下降到口味水平,即同一品牌下不同口味(茶香, 盐香, 留兰香, 水果香等)的销量但是这样一来你很难把口味看成是随机的不同品牌可能发展不同的口味,而同一品牌不太可能发展无穷多的口味实际上因为每一品牌都可能有自身的特殊口味品种我们可以说口味是嵌套在品牌内的11. 类似这种随机区组加嵌套可以用B(A)T表示, 其中B=Block即区组, A=保健品品牌, T=Taste即口味. 此处表示B是和T交叉但是A和T有嵌套关系.12. 另外一种修改是引入个体即消费者即让不同消费者到模拟货架上选购不同品牌的牙膏此时销量不是一个好的因变量,因为一个消费者不会买很多支牙膏可以改成对不同品牌牙膏的评价后者接近连续变量(如果用1-10的量表作评价),不影响方差分析13. 随机区组设计优点是可以控制可能的干扰因素,使得试验结论更加可靠缺点是只能控制一个因子如果要同时控制两个可以用拉丁方设计三个干扰因子可以用Graeco-Latin Square设计14. 见下例一个五水平拉丁方访员访员访员访员访员地点(收入)B(收入)C(收入)D(收入)E(收入)地点2B(收入)C(收入)D(收入)E(收入)(收入)地点3C(收入)D(收入)E(收入)(收入)B(收入)地点4D(收入)E(收入)(收入)B(收入)C(收入)地点5E(收入)(收入)B(收入)C(收入)D(收入)此处行和列代表两个可能的干扰因子-访员和地点,格子内字母代表处理因子的不同水平(例如在职训练的时间长短),而收入是作为因变量来测量的15. 拉丁方特点如上例所示,其行数等于列数,故它永远呈方块状每个方格内只有一个个体,等于单次重复16. 拉丁方在市场研究中用的不多不再详细讨论17. 最后注意两个问题第一,随机区组设计并不永远比完全随机设计好从理论上说前者从误差项中把可能的干扰因子效应分离出来了,从而减少了误差方差,也就使得检验更加易于显著;但另一方面,要把区组效应分离要用掉个自由度(k=区组数减一)而误差自由度小则使得误差平均方差增大,从而又使得检验趋于不显著所以应该权衡利弊,只有当区组间变异很大时才值得分离出该因子否则就仍可用完全随机设计18. 第二在随机区组设计中需要检验区组和处理因子之间是否有互作也就是检验效应的可加性(Additivity assumption). 这个和方差的球形检验有关系显然如果处理因子和区组有互作则不能期望各组内方差同质?19. 如果每个区组处理组合内有若干个被试个体则区组和处理的互作项可以名正言顺的进入模型一部分也不必再对加性假设作测验20. 关于随机区组设计的分析留待后面和双因子交叉或阶乘设计一起讲. 两者的分析是相同的.双因子阶乘设计21. 现在我们转到双因子完全随机阶乘设计或简称双因子阶乘设计或完全阶乘设计该设计不是严格意义上的新设计,因为它来自两个单因子完全随机设计的交叉,即把两个单因子完全随机设计交叉相乘即有双因子阶乘设计22. 为简单起见下列讨论假定为一元双因子阶乘设计该设计的符号表示为S(AB), 其中是试验个体,后者还是嵌套在不同处理组合内不论一元多元不影响设计的符号表示, 后者完全取决于试验因子及其相互关系, 不受因变量个数及其关系的影响.23. 如其名称所示,这类设计都有两个独立因子,各自有本身的主效应加上可能的互作效应其处理组合数目与随机区组设计一样,是两个因子水平数目的乘积例如一个价格因子三水平,另一个促销因子两水平,则共有个处理组合24. 每个处理组合可以有单个观察值或多个为了估计试验误差当然需要有多个观察值下例是不同价格和促销水平下的玩具销量表格高价中价低价强促销销量销量销量低促销销量销量销量此处还是只有一个观察值在现实中当然可以很容易的变成多个观察值例如每种价格和促销组合内考察两个或多个店即可或者更进一步以个体消费者为单位, 用1到10的量表考察他们在不同价格和促销水平下的购物意愿等.25. 这个设计的优点在于经济因为每个个体都被利用了两次,一次测量因子效应,一次因子. 个体数目不变即和完全随机设计同样数目的个体现在却可以用来测验两个因子其原因并不是在此设计下每人会贡献更多数据, 而是因为同样数据可以用两次, 一次用来检验A因子一次B因子(靠计算各自对其平均数离均差的平方和). 26. 现在我们正式引入固定效应和随机效应的概念首先必须分开三组概念: 固定和随机变量,固定和随机效应,以及固定和随机系数27. 固定变量是指那些不含有测量误差的变量. 而且固定变量(例如渠道结构)的水平值假定在不同研究中是固定不变的. 相反, 随机变量的水平值则假定来自一个大群体, 其中含有许多不同水平值. 我们在研究中所看到的只是一个样本而已. 正因为如此, 研究结果可以推论到该变量的所有其他水平值. 28. 大多数情况下我们都假定反差分析中的因子是固定的.29. 固定效应方差分析假定研究者只对那些研究中所包括的水平值感兴趣. 例如一个药物试验设计包括0 mg, 5 mg, 和10 mg 剂量. 这时剂量可以是固定或随机效应就看你的结论是否需要推广到其他剂量水平. 如果就事论事的限定这几个剂量要用固定效应, 反之用随机效应. 30. 随机效应模型有时称为II型模型或方差成分模型. 而凡是含有固定和随机效应者是混合模型.31. 随机效应一般假定服从正态分布且观察值相互独立32. 随机效应时有人建议每个处理组不能少于个人33. 下列规则可以帮助我们决定效应类型.a. 一般而言,凡是试验个体基本上都是随机的,因为我们会随机抽取即使不是随机抽样,也会随机配置到不同的处理组中另外,试验者通常也不愿意把自己的结论局限于本次样本,而是想推广到整个群体b. 另外如果任何因子和一个随机因子有互作则该互作项也一定是随机的c. 最后凡是在群体中其水平值有限的分类变量(例如性别,种族,教育,职业等)都应该是固定效应d. 除了上述规则以外,几乎没有其它固定的规则要根据你的具体情况决定相信大家看了上面的表格中的总结应该有了基本的了解34. 无论固定或随机,其均方都是一样计算的但相应的测验的分母会有不同,从而其测验的结论会不同35. 对双因子阶乘设计不同效应的自由度可以用下列简单规则计算a. 每个效应的自由度等于其水平数减一例如b-1, a-1等;b. 每个复合项(例如互作)的自由度等于其组成成分自由度的乘积例如AB互作的自由度是(a-1)*(b-1);c. 对含有嵌套项的自由度如果是套别人者(即在括号内者)不必减一,而被套者则要减一例如S(AB)的自由度是ab(n-1), 此处ab是套别人者,而n是被套者36. 上述自由度的分解有个好处即可以据此看出相应平方和的内容见附表其基本精神是利用自由度找出所需要的平方和以及校正平方和, 为下一步方差分析作准备. 而从自由度到平方和非常方便, 有下列三部曲:a. 所有自由度都要减1. 后者只要把它化成校正因子CF即可;b. 如有必要, 先把自由度各项展开. 这特指那些复合自由度例如(a-1)(b-1)等, 要把它化成ab-b-a+1的形式;c. 各个自由度相对应的平方和只要在自由度字母后加上SS两个字即可. 例如A因子的自由度是a-1, 那么其平方和就是ASS CF; B因子自由度是b 1, 则其平方和是BSS-CF; AB互作项自由度是(a-1)(b-1) = ab-a-b+1 =ABSS-ASS-BSS+CF;最后ab(n-1) = abn-ab = ABNSS ABSS=TSS-ABSS (注意ABNSS就是总自由度, 可以写成TSS.)37. 有了上面那些平方和符号, 下步如何求平方和呢. 例如ASS怎么求呢? 这有下列法则:a. 先对所考虑的平方和项加上积加号. 例如求ASS就在a前面加总和号成为. 这个表示要对a求和;b. 凡是第一步中没有包括的项, 例如b, n等, 把它们放入括号内, 前面也放积加号, 例如, 并把它们平方求得平方和;c. 把第二步里的平方和用其相应符号去除, 例如, 这就完成了全部求平方和的过程.38. 上述法则的应用见附表”DOE表格”中”交叉设计方差分析例子”.39. 例如我从我班上学生中抽取了名志愿者(注意不是随机抽取的), 把他们随机分成两组,一组评价大润发,另一组评价乐购这两个大卖场其评价内容包括质量,服务,清洁,和价值(即QSCV)这四个指标这时被试个体是嵌套在大卖场因子内部的,因为每个大卖场只被人评价那四个评价指标有双重意义. 一方面, 它们代表了一个四水平的个体内(Within Subject)设计因子; 另一方面, 它们也对应于四个因变量, 即QSCV四个指标每个都是一个因变量. 在SPSS中要求把它列出来, 但是在教科书中一般仅仅称它为单因子重复测量设计, 并不把四个指标另外作为因子. 有鉴于此, 我们此处记为S50(A2), 把它归为多元单因子设计, 其中个体仍嵌套于两水平的大卖场个体间因子内.40. 一般而言嵌套设计对于被嵌套的因子比较有利因为它们比嵌套因子有更多自由度比如一个三水平(高,中,低)的价格因子在高价格时有专卖店和百货店两个业态,中位价格时有便利店和网上销售两个渠道,低价时有大卖场和折扣店这时价格只有两个自由度,而业态有个所以后者的分析更有力量13. 把上述例子稍作改变,让人也分成两组但其根据是是否接受了训练一个组未接受业态评价训练而另一组接受了然后让每组都既评价大润发也评价乐购,评价内容同前这时就是一个双因子(大卖场,是否训练)阶乘设计,记为S50(A2B2)14. 关于如何分析双因子阶乘设计见SPSS命令文件. 裂区设计1. 裂区设计的名字来自农业田间试验最初是把一块地(称为全区或主区)分成几个小区或裂区分别种不同品种不同全区或主区可以控制不同肥力水平2. 在社会研究中一般把这种设计称为混合设计(Mixed Design),因为这类设计都含有重复测量因子整个设计是完全随机设计和重复测量设计的综合其中裂区水平上的因子是重复因子亦即个体内因子,用的是重复测量设计;主区是非重复因子亦即个体间因子,用的是完全随机设计3. 重复测量因子之所以是个体内因子乃因为它们是对同一个体进行重复测量,或者说重复测量都来自同一个体4. 裂区设计的优点是a. 裂区因子的变异一般小于主区因子. 因为裂区彼此相邻, 而且由于重复出现于不同主区内, 主区因子自由度比较小,裂区因子自由度较大分析时裂区因子占优势. 这有利于对裂区因子及其互作的显著性测定, 即比主区的显著性来的更有力量;b. 某些处理因子需要更多信息或更大量测试单位, 另外一些则不需要那么多. 此时裂区设计可以满足这种要求;c. 第三点和交叉设计一样即可以增加一个因子的研究而无需增加太多成本;d. 允许重复测量因子加入设计中, 后者具有重复测量设计的所有优点如被试个体充当本身的对照, 减少由不同个体引起的误差; 以及经济性.5. 裂区设计的缺点是a. 分析时有两个误差项, 增加了复杂性;b. 主区因子变异程度高从而显著性测验比较不灵敏;6. 最简单的裂区设计只有两个因子,一个主区因子一个裂区因子7. 裂区设计最容易和嵌套设计混淆, 后者最大特点是裂区因子不会和主区因子所有水平完全相遇, 而前者会! 两因子裂区设计都是交叉关系而非嵌套关系因为每个主区都含有裂区因子的全部水平8. 一个裂区设计可以进一步分裂每个裂区,结果造成裂区的裂区9. 只要有重复测量因子就一定会有个体内 (Within subject) 因子这是由重复测量设计的性质决定的至于是否有个体间因子则要看设计类型如果是裂区设计一定会有个体间因子这也是裂区设计被称为混合设计(既有个体间也有个体内因子) 的原因10. 现在可以引入一种符号系统:用代表个体,代表因子,括号代表嵌套,则有S10(A2B4)C5, 这代表有个被试个体,嵌套在A, B两个因子内,A有两水平,B有四水平,C有水平个体和是交叉关系 重复测量设计1. 前面已经多处提到此设计. 现在对它作出正式定义: 2.3.4. 重复测量设计指将一组或多组被试者先后重复地施加不同的实验处理, 或在不同场合和时间点被测量至少两次的情况.2. 重复测量设计优点是A. 每一个体作为自身的对照,克服了个体间的变异。分析时可更好地集中于处理效应, 同时被试者间自身差异的问题不再存在. 也就是减少了一个差异来源B. 重复测量设计的每一个体作为自身的对照,研究所需的个体相对较少,因此更加经济.3. 重复测量设计优点是滞留效应(Carry-over effect) 前面的处理效应有可能滞留到下一次的处理潜隐效应(Latent effect) 前面的处理效应有可能激活原本以前不活跃的效应学习效应(Learning effect) 由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高.4. 面对这些问题也有办法.主要的是反向平衡(Counterbalancing)即变动不同因子水平出现次序使得它们以同等机会以不同次序出现.5. 反向平衡法则决定第一次排序的公式是 1, 2, n, 3, n-1, 4, n-2, 其中每个数字对应一个处理水平. 例如有四个水平,则上式化为1, 2, 4, 3. 有了第一次排序则第二次排序只要在第一次基础上加1. 故第二次出现次序为2,3,1,4; 第三次是3,4,2,1等等.如果令1=A, 2=B, 3=C, 4=D则有四次排序如下第一次测量ABDC第二次测量BCAD第三次测量CDBA第四次测量DACB6. 每个被试须作几次测试取决于试验需要和课题性质.一旦决定下来则会决定组内变量水平数。如果实验中没有组内变量,则每个被试只需作一次测试;如果实验中有一个组内变量,则测试的次数就是该组内变量的水平数;如果实验中的组内变量不只一个,则测试次数就是实验中几个组内变量水平数的乘积.7. 重复测量设计方差分析的统计前提1) 每个处理条件内的观察都是独立的;2) 每个处理条件内的总体分布是正态分布或多元正态分布;3) 每个处理条件内方差同质;4) 每个被试者的多元观测值之间有相关.8. 本质上只有1个指标,为何要把测自不同时间点上的数据看成是多元的呢? 因为同1个体的数据重复测自同1个受试对象,它们之间往往有较高的相关性。这种相关性通常会减少误差项变异, 从而使得F测验的分母变小, 其后果是F测验更易于到达显著即使无效假设是正确的. 换句话说, 犯一类错误的概率加大了.9. 重复测量方差分析要满足几个假设条件. Fisher指出了这些条件但是直到Box(1954)才证明了这些条件的必要性并指出,若这些假设不能满足,则方差分析的F值是有偏的,这会造成过多的拒绝本来是真的无效假设(即增加了I型错误的概率)11. 第一条件是所谓复合对称性(Compound Symmetry). 后者意思是各对测量值之间的协方差要相等. 这个具体见下表J1J2J3J4J1S2SijSijSijJ2SijS2SijSijJ3SijSijS2SijJ4SijSijSijS212. 类似上述方差-协方差矩阵具有复合对称性, 也被称为S型矩阵. 该矩阵只能当加性条件满足时才能成立. 如果个体和处理有互作则不太可能出现各个处理间协方差相等的情况.13. Box 在1954年证明在重复测量情况下F检验不具有理论自由度而是有分子分母自由度各为和.其中的上限=1. 其具体值取决于相关矩阵的性质是否有复合对称性. 如果没有复合对称性则(J-1) 且(J-1)(n-1). 这时如果用通常F检验临界值势必偏小,导致I类错误增加. 14. Geisser和Greenhouse在1958年发展了Box的发现,在裂区设计中证明下限是1/(J-1), 故当不等于1时有分子自由度为1/(J-1)*(J-1)=1, 分母自由度为1/(J-1)*(J-1)(n-1)=n-1. 15. 后来证明复合对称性是充分条件但不是必要条件. 在1970年Huynh和Feldt证明重复测量分析的一个必要和充分条件是所有成对测量值的差数方差相等. 这个就是所谓的球形假设或循环假设(Circularity). 如该假设成立则无必要再对自由度进行调整. 16. 注意复合对称性是指各个测量值各自围绕本身平均数的方差, 而球形假设则是对成对测量值的差数方差而言的. 球形假设下的方差-协方差矩阵称为H矩阵. S矩阵可以视为H矩阵的特例. 凡是有复合对称性的方差-协方差必定也是球形的. 17. 为了有效地处理重复测量数据间的相关性, GLM程序既可以用特定模型的多元方法又可以用一元分析方法,后者资料必须满足特定类型的协方差矩阵,称为H型协方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论