




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章方差分析,方差分析概述,一、问题的提出通过参数检验可以解决两两总体均值的比较多个总体均值的检验如何作?(如:钻卡、金卡和银卡客户的平均移动话费的比较)可以多次采用两样本t检验方法实现产生的问题:犯第一类错误的概率明显增大例如:K个变量两两进行t检验,需要作N=k!(2!(k-2)!)次,如果为0.05,那么每次比较不犯第一类错误的概率为0.95。N次检验均不犯第一类错误的概率为0.95N,而犯第一类错误的概率为1-0.95N,远远大于设定的0.05可以利用方差分析的方法来实现多个总体的均值比较,方差分析概述,(二)分析目的:方差分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素;以及影响因素之间的交互作用。例如:影响移动话费大小的因素(客户年龄、性别、职业、收入、类型等)影响学生成绩高低的因素(区域、性别、班级等),方差分析概述,(三)涉及的概念(1)观察因素:作为观测的对象,称为观测变量(如:移动话费、学生成绩等).(2)影响因素:两类人为可以控制的因素(如:资费、促销策略、投入学习的时间等),在方差分析中称为控制因素.将控制因素的不同情况称为控制因素的不同水平.人为很难控制的因素(如:消费习惯、个体智力差异、抽样误差等),在方差分析中称为随机因素.应灵活运用概念,方差分析概述,控制因素,观测变量,三个水平,方差分析概述,(四)核心问题(1)从数据差异角度看:观测变量的数据差异=控制因素造成+随机因素造成当控制因素对实验结果有显著影响时,和随机因素共同作用必然使观测变量产生显著变动;反之,观测变量的变动较小,将归结为随机性造成的(这里指抽样误差造成的).,方差分析概述,观察三组数据(2)方差分析正是要分析观测变量的变动主要是由控制因素造成的还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的,方差分析概述,(五)方差分析的类型单因素方差分析:只考虑一个控制因素的影响多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响(引入协变量),单因素方差分析,(一)目的检验某一个控制因素的改变是否会给观察变量带来显著影响.例如:考察不同促销手段对发展客户数量是否有显著影响.考察不同学历是否对工资收入产生显著影响.考察不同的激励方法下员工的业绩提高是否有显著差异应用面很广(科学试验,管理及经济问题),单因素方差分析,(二)基本思路(1)入手点:检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响.(2)前提:不同水平下各总体服从方差相等的正态分布.(3)H0:不同水平下,各总体均值无显著差异.即:不同水平下控制因素的影响不显著.,单因素方差分析,(二)基本思路(4)构造F统计量因为:总变差=组间差异+组内差异可证明:SST=SSA+SSE(设:k个水平,每个水平有ni个数据)考察平均的组间差异与平均的组内差异的比值,于是:,F(k-1,n-k),单因素方差分析,(二)基本思路(5)结论:F值较大,F值的相伴概率小于或等于用户给定的显著性水平a,则拒绝H0,认为不同水平下各总体均值有显著差异;F值较小,F值的相伴概率大于用户给定的显著性水平a,则不能拒绝H0,可以认为不同水平下各总体均值无显著差异.,单因素方差分析,(三)数学模型设控制变量A有k个水平,每个水平均有r个数据(r次试验),在水平Ai下第j次试验的数据xij可以分解为:xij=i+iji为水平Ai下的理论指标值,ij为试验误差,独立随机变量,单因素方差分析,i为水平Ai对试验结果产生的影响,称为水平Ai的效应。如果A对观测变量没有影响,则各水平的效应全为0,否则不全为0。于是有:H0:a1=a2=a3=ak=0,单因素方差分析,(四)基本操作步骤(1)菜单选项:analyze-comparemeans-one-wayANOVA(2)选择一个或多个变量作为观察变量到dependentlist框(3)选择一个变量作为控制变量到factor框(4)option中的statistics项:descriptive:输出观察变量不同水平下的描述统计量,单因素方差分析,(五)应用举例不同的客户类型(或通话时段)是否对移动话费产生了显著影响控制变量可以定义成定类或定序变量(但必须是数值型)观察方差分析表不同班级的学生成绩是否有显著差异观察方差分析表,单因素方差分析,(六)进一步的分析前提的检验:各水平下方差齐性检验实现方法:option中的statistics:Homogeneity-of-variance,检验各水平下各总体方差是否齐性.H0:各水平下各总体方差无显著差异.,单因素方差分析中的多重比较,(一)目的如果各总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异.多重比较将对每个水平的均值逐对进行比较检验(二)几种常用的多重比较方法LSD(LeastsignificantDifference)最小显著性差异法Bonferroni方法T(Tukey)方法S(Scheffe)方法SNK(Student-Newman-Keul)方法,几种常用的多重比较方法,LSD(LeastsignificantDifference)最小显著性差异法MSE-观测变量的组内方差当ni=nj(ij)时:,LSD法的特点:利用了全部样本数据,而不仅是所比较的两组的数据,且认为各水平均是等方差的与其他方法相比,其检验敏感度最高(即P值较小)仍然存在放大犯一类错误的问题适用于各总体方差相等,几种常用的多重比较方法,几种常用的多重比较方法,T(Tukey)法特点:利用了全部样本数据,而不仅是所比较的两组的数据,且认为各水平均是等方差的q检验拒绝原假设的可能性较t检验低,克服了扩大犯一类错误的可能性,但不如LSD方法敏感仅适用于各水平下样本数均相同的情况,几种常用的多重比较方法,几种常用的多重比较方法,S(Scheffe歇费)法特点:利用了全部样本数据,而不仅是所比较的两组的数据与T法类似,但可以处理各水平样本数不相同的情况,且不如T法敏感,几种常用的多重比较方法,SNK(Student-Newman-Keul)方法:划分相似性子集,对各水平进行重新分组首先计算dt计算各水平下的样本均值的差,大于dt为一组,小于dt为另一组,几种常用的多重比较方法,继续分组计算dl,依据一统计量,考察这个最大距离是否足够远。是则将其分出,否则留在本组内适合各水平样本数相同的情况运用最广,适用于两两比较次数较少的情况,否则也会大大放大一类错误。,常用的多重比较方法的适用性,LSD(LeastsignificantDifference):存在明确对照组,进行验证性研究Bonferroni方法:同前T(Tukey)方法:多个均值间的比较,且各组样本数相同S(Scheffe)方法:多个均值间的比较,且各组样本数不相同SNK(Student-Newman-Keul)方法:两两比较次数不多,单因素方差分析中的多重比较,(三)实现方式posthoc选项(四)应用举例哪两个班级的高等数学成绩显著不同LSD*表示在0.05的显著性水平下I和J水平之间的均值存在显著差异.哪两种类型的客户移动话费有显著差异Games-Howell法(EqualvarianceNotAssumed),单因素方差分析中的先验对比,(一)目的先凭经验确定各水平均值之间的对比系数,以正负符号分别代表两组,然后判定这两组均值的线性组合是否存在显著差异.如:1/3(k1+k2+k3)=1/2(k4+k5)H0:两组均值的线性组合无显著差异.(二)实现方式Contrasts选项,在Coefficients框中输入每个水平均值的系数值和正负符号.注意:输入系数的顺序与控制变量水平值的升序一一对应系数的和为0,(三)应用举例7班与1、2、3、4、5、6班的高等数学成绩有显著差异吗?6班与1、2、3、4、5、7班的高等数学成绩有显著差异吗?,单因素方差分析中的先验对比,单因素方差分析中的趋势检验,(一)目的将组间平方和分解成线性、二次、三次或更高次的多项式,检验观测变量是否随控制变量呈不同次幂变化。(二)实现方式Contrasts选项,polynomial框(三)应用举例不同客户类型对移动话费的影响呈线性变化趋势吗?,多因素方差分析,(一)目的测试若干个控制因素的不同水平的交叉变化是否给观察变量带来了显著影响.例如:,多因素方差分析,(二)基本思路认为观测变量的变动是由各控制变量独立作用、它们的交互作用、以及随机因素造成的。以两个控制变量的方差分析为例:S总=S控1+S控2+S控1控2+S随(maineffects)(N-way交互)(Residual)(explained)其中:S控1控2表示两个控制变量的交互影响,多因素方差分析,(二)基本思路交互作用,即:两个或多个控制变量各水平之间搭配时对观察变量的影响.例如:饮食习惯、适量运动对减肥的作用;排球队的二传手和主攻手对赢球的作用;城市规模和广告类型对广告效果的影响交互作用的图形观察:A1A2B2A1A2B2B1B125B1B125B2710A1A2B273A1A2当A从A1变化到A2时,A对观测变量值的影响与B取什么观测变量值均增加,与水平有关B1或B2无关;,多因素方差分析,(二)基本思路多因素方差分析中因素的划分固定效应因素:人为能够准确控制其各个不同的水平值(该因素在样本中所有可能的水平都出现了,结果无需外推);如:资费、客户类型、漫游类型等随机效应因素:人为无法对其水平值进行准确控制,只是能够直观观测到(该因素在样本中所有可能的水平没有或不可能都出现,结果需要推论总体)。如:话费水平、收入水平等。固定效应和随机效应通常较难区分,多因素方差分析,(三)基本思路多因素方差分析的核心内容:检验在不同控制变量的不同交叉水平下,各交叉分组下样本数据所代表的总体均值,有无显著差异。进而判断多个因素是否对观测变量产生了显著影响H0:各交叉水平下的总体均值均无显著差异.数学模型:以双因素为例H0:a1=a2=a3=0;b1=b2=b3=0;(ab)11=(ab)12j=0前提条件:等方差一般不再非常强调,多因素方差分析,(三)基本思路检验方法SST=SSA+SSB+SSAB+SSEA有p个水平,B有q个水平,每组有r个样本,多因素方差分析,(三)基本思路统计量(F检验)固定效应模型:随机效应模型:,多因素方差分析,(三)基本思路结论依次查看各F值的相伴概率.如果其相伴概率大于a,则不能拒绝H0,可以认为相应不同水平的控制变量或交互影响没有造成均值的显著差异;相反,多因素方差分析,(四)基本操作步骤A.菜单选项:analyze-GeneralLinearmodel-UnivariateB.选择观察变量到dependent框C.选择固定效应因素fixfactor框D.选择随机效应因素randomfactor框E.模型的定义Model选项饱和模型:分析所有主效应和交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省宣城市郎溪县2024-2025学年高二上学期期末考试化学试题及答案
- 小区农业生产合作合同
- 行政文件归档与资料管理系统
- 工程项目管理计划执行与监控工具
- 高中现代文阅读方法指导与训练教案
- 商业场所监控设备安装合同书
- 时间作息课件
- 时钟认识任意时间课件
- 写劳动最光荣作文(14篇)
- 绿色简约国际礼仪培训
- 法律知识培训课件
- 2024年安康社区工作者考试真题及答案
- 业财融合与价值创造课件
- 长沙市名校小升初分班考试数学试卷(含答案)
- 肺动脉栓塞护理查房
- 学院 军训协议书
- 农村房地产转让合同协议
- 拉链专业工艺讲解
- 快速康复在泌尿外科的应用
- (标准)按摩店转让合同协议书
- 《死亡医学证明(推断)书》培训试题(附答案)
评论
0/150
提交评论