spss第九章方差分析_第1页
spss第九章方差分析_第2页
spss第九章方差分析_第3页
spss第九章方差分析_第4页
spss第九章方差分析_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 Part Seven Part Seven 方差分析方差分析n一,问题的提出一,问题的提出n通过参数检验可以解决两两总体均值的比较通过参数检验可以解决两两总体均值的比较n多个总体均值的检验如何作?多个总体均值的检验如何作?(如:北京、上海、如:北京、上海、广州周岁儿童平均身高的比较)广州周岁儿童平均身高的比较)1.可多次采用两样本可多次采用两样本t检验方法实现,但弃真概检验方法实现,但弃真概率会增大。如果率会增大。如果t检验的显著性水平是检验的显著性水平是0.05,则则N次次t检验则为检验则为1-0.95N2.可以利用方差分析的方法来实现可以利用方差分析的方法来实现n二,分析目的二,分析目的

2、n方差分析是从数据间的差异入手,分析哪些因素方差分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素是影响数据差异的众多因素中的主要因素.n例如:例如:n影响某农作物亩产量的因素影响某农作物亩产量的因素(品种、施肥量、气候品种、施肥量、气候等等)n影响推销某种商品的推销额影响推销某种商品的推销额(不同的推销策略、价不同的推销策略、价格、包装方式、推销人员的形象等格、包装方式、推销人员的形象等)n三,涉及的概念三,涉及的概念n(1)观察因素观察因素: 观测变量观测变量n(2)影响因素:影响因素:n控制因素控制因素(控制变量控制变量)将控制因素的不将控制因素的不同情况称为控制

3、因素的不同水平同情况称为控制因素的不同水平.n随机因素随机因素.n四,核心问题四,核心问题n(1)从数据差异角度看从数据差异角度看: 观测变量的数据差异观测变量的数据差异=控制因素造成控制因素造成+随机因素造成随机因素造成n(2) 方差分析正是要分析观测变量的变方差分析正是要分析观测变量的变动是否主要是由控制因素造成还是由动是否主要是由控制因素造成还是由随机因素造成的,以及控制变量的各随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的个水平是如何对观测变量造成影响的.n五,方差分析的类型五,方差分析的类型n单因素方差分析单因素方差分析n多因素方差分析多因素方差分析n协方差分析协方

4、差分析n多元方差分析多元方差分析 Part Seven 1 Part Seven 1 单因方差分析单因方差分析n 一一 相关统计知识相关统计知识n 1单因方差:单因方差:n分析分析一个一个定类变量(定类变量(X变量)和变量)和一个一个定距变定距变量(量(Y 变量)的相关性。变量)的相关性。n x定类(至少定类(至少3种分类)种分类)n 相关系数:相关系数:E/E2n二基本思路二基本思路n(1)入手点入手点: 检验控制变量的不同水平下,各总体的分布是否检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变存在显著差异,进而判断控制变量是否对观测变量产生了显著影响量产

5、生了显著影响.n(2)前提前提: 不同水平下各总体服从方差相等的正态分布不同水平下各总体服从方差相等的正态分布.n(3) H0:不同水平下不同水平下,各总体均值无显著差异各总体均值无显著差异.即即:不不同水平下控制因素的影响不显著同水平下控制因素的影响不显著.n(4) 构造构造F统计量统计量因为因为:总变差总变差=组间差异组间差异+组内差异组内差异可证明可证明:SST= SSA+SSE(设设:k个水平个水平)考察平均的组间差异与平均的组内差异的考察平均的组间差异与平均的组内差异的比值比值,于是于是n(5)结论结论:nF值较大值较大,F值的相伴概率小于或等于用户值的相伴概率小于或等于用户给定的显

6、著性水平给定的显著性水平a,则拒绝则拒绝H0,认为不同认为不同水平下各总体均值有显著差异水平下各总体均值有显著差异;nF值较小值较小,F值的相伴概率大于用户给定的值的相伴概率大于用户给定的显著性水平显著性水平a,则不能拒绝则不能拒绝H0,可以认为不可以认为不同水平下各总体均值无显著差异同水平下各总体均值无显著差异. 应用案例应用案例n 不同地区妇女的生育率是否存在差异不同地区妇女的生育率是否存在差异 单因方差单因方差n 学历是否对工资收入产生影响学历是否对工资收入产生影响 单因方差单因方差n不同性别是否在生育子女数量的认知上存在差不同性别是否在生育子女数量的认知上存在差异异 独立样本独立样本T

7、 T检验检验消费者对四个行业的投诉次数消费者对四个行业的投诉次数 观察值观察值( (y) y)行业行业( ( x x) )零售业零售业旅游业旅游业航空公司航空公司 家电制造业家电制造业1 12 23 34 45 55757555546464545545462624949606054545656515149494848555547 47 707068686363696960 60 Part Seven Part Seven 单因方差分析单因方差分析 四个行业被投诉次数均值为:四个行业被投诉次数均值为:1 1、2 2 、3 3、4 4 H H0 0 : : 1 1 = = 2 2 = = 3 3

8、= = 4 4 ( (服务质量无显著差异服务质量无显著差异) ) H H1 1: : 1 1 ,2 2 ,3 3,4 4 不完全相等不完全相等 ( (有显著差异有显著差异) ) Part Seven Part Seven 单因方差分析单因方差分析计算计算F值值 2xS组间方差组间方差2pS组内方差组内方差22pxSnSF Part Seven Part Seven 单因方差分析单因方差分析 若若F对应概值对应概值P(sig), 拒绝拒绝H0 ,接受,接受H1 若若F对应概值对应概值P (sig), 拒绝拒绝H1 ,接受,接受H0Sum of Squares dfMean SquareFSig.

9、 Between Groups785.8003 261.933 12.326 .00Within Groups3401621.250Total1125.80019组间组间组内组内n2xnS2pS离差平方和离差平方和均方差均方差四四 进一步的分析进一步的分析n前提的检验:各水平下方差齐性检验前提的检验:各水平下方差齐性检验n实现方法:实现方法: option中的中的statistics:Homogeneity-of-variance,检验检验各水平下各总体方差是否齐性各水平下各总体方差是否齐性. H0:各水平下各总体方差无显著差异各水平下各总体方差无显著差异.n单因素方差分析中的多重比较单因素方

10、差分析中的多重比较 n目的目的 如果总体均值存在差异如果总体均值存在差异,F检验不能说检验不能说明哪个水平造成了观察变量的显著差明哪个水平造成了观察变量的显著差异异.多重比较将对每个水平的均值逐多重比较将对每个水平的均值逐对进行比较检验对进行比较检验.n多重比较方法多重比较方法nLSD法:实际上就是法:实际上就是t检验的变形,只是在变异检验的变形,只是在变异和自由度的计算上利用了整个样本信息,因此仍和自由度的计算上利用了整个样本信息,因此仍然存在放大一类错误的问题然存在放大一类错误的问题nScheffe法:当各水平个案数不相等,或者想进法:当各水平个案数不相等,或者想进行复杂的比较时,用此法较

11、为稳妥。但它相对比行复杂的比较时,用此法较为稳妥。但它相对比较保守较保守nS-N-K法:是运用最广泛的一种两两比较方法。法:是运用最广泛的一种两两比较方法。它采用它采用Student Range 分布进行所有各组均值分布进行所有各组均值间的配对比较。该方法保证在间的配对比较。该方法保证在H0真正成立时总真正成立时总的的水准等于实际设定值,即控制了一类错误。水准等于实际设定值,即控制了一类错误。n方法选择策略方法选择策略 一般可以参照如下标准:如果存在明确一般可以参照如下标准:如果存在明确的对照组,要进行的是验证性研究,的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对即计划好的某

12、两个或几个组间(和对照组)的比较,宜用照组)的比较,宜用Bonferroni(LSD)法;若需要进行的是多个均数)法;若需要进行的是多个均数间的两两比较(探索性研究),且各间的两两比较(探索性研究),且各组个案数相等,适宜用组个案数相等,适宜用Tukey法;其法;其它情况宜用它情况宜用Scheffe法。法。 Part Seven Part Seven 单因方差分析单因方差分析n 五五 SPSSSPSS运算过程运算过程n 1 AnalysisCompare Means One-Way ANOVA n单因方差分析,两两选项间的独立样本单因方差分析,两两选项间的独立样本T T检验检验n eg:不同文

13、化程度的被访者家庭人口规模间是:不同文化程度的被访者家庭人口规模间是否存在差异?(否存在差异?(0.05) 教育程度:教育程度:1 小学及以下,小学及以下,2 初中文化程度,初中文化程度,3 高中及以上文化程度高中及以上文化程度n H0 : 1 = 2 = 3 (无显著差异无显著差异) n H1: 1 , 2,3 不完全相等不完全相等,存在存在因变量因变量自变量自变量均值的多项均值的多项式比较式比较均值多重比较均值多重比较统计输统计输出量的出量的选择选择对两两类别的均值进行比较对两两类别的均值进行比较方差齐次(相等)方差齐次(相等)方差非齐次方差非齐次(不不相等相等)显著性水平显著性水平描述性

14、统计量描述性统计量方差齐次性分析方差齐次性分析方差齐次性分析方差齐次性分析0.0050.05 ,0.0050.05 ,显著差显著差异异, ,方差不相等方差不相等16.809/2.0240.0000.05 ,0.0000.05 ,存在存在差异差异0.090.09:选项:选项1 1和和2 2间人口规模均值差为间人口规模均值差为0.09,0.09,不存在显著不存在显著差异差异; ;0.410.41:选项:选项1 1和和3 3间人口规模均值差为间人口规模均值差为0.41,0.41,存在存在显著显著差异差异. .0.32:0.32: 选项选项2 2和和3 3间人口规模均值差为间人口规模均值差为0.32,

15、0.32,存在存在显著显著差异差异. .文化程度与人口规模的差异主要以高中为分界点文化程度与人口规模的差异主要以高中为分界点 Part Seven Part Seven 单因方差分析单因方差分析n2 2 Analysis Compare Means Meansneg eg 数据数据2,sav 2,sav 反映反映4 4种饲料对猪体重增加情况种饲料对猪体重增加情况的统计值,进行的统计值,进行F F检验检验因变量因变量自变量自变量相关统计相关统计量的选择量的选择进行进行F F检验检验不同饲料喂养的猪体重的均值,不同饲料喂养的猪体重的均值,标准差,样本量。标准差,样本量。0.0050.05,0.00

16、50.05,存存在差异在差异 E E相关系数相关系数(crosstabs)(crosstabs) E E2 2, ,削减削减误差比例误差比例课堂练习课堂练习n按要求完成按要求完成“课堂练习课堂练习.doc.doc”中的练习。中的练习。 Part Seven 2 Part Seven 2 多因素方差分析多因素方差分析 n(1)目的目的:测试若干个控制因素的改变是测试若干个控制因素的改变是否造成观察变量的显著变动否造成观察变量的显著变动.多因素方差分析模型多因素方差分析模型n控制因素的种类控制因素的种类固定效应因素(固定效应因素(Fixed Factor):指的是该因素):指的是该因素在样本中所有

17、可能的水平都出现了。在样本中所有可能的水平都出现了。随机效应因素(随机效应因素(Random Factor):该因素所有):该因素所有可能的取值在样本中没有都出现,因此要用样本可能的取值在样本中没有都出现,因此要用样本来推论总体情况,包括未出现的水平。这不可避来推论总体情况,包括未出现的水平。这不可避免的存在误差(即随机效应),需要估计该误差免的存在误差(即随机效应),需要估计该误差的大小,因此被称为随机因素。的大小,因此被称为随机因素。n模型条件模型条件正态、方差齐性正态、方差齐性n(2)基本思路基本思路:以两个控制变量的方差分析为例以两个控制变量的方差分析为例:S总总=SA+SB+SAB+

18、SESAB表示两个控制变量的交互影响表示两个控制变量的交互影响,即即:两个控制变量各水平之间搭配时对两个控制变量各水平之间搭配时对观察变量的影响观察变量的影响.n(3)实质实质: 对不同交叉分组下的样本数据所代表的总体均值对不同交叉分组下的样本数据所代表的总体均值有无显著差异进行有无显著差异进行F检验检验,即即:检验不同控制变量在检验不同控制变量在不同交叉水平下的总体均值是否存在显著差异不同交叉水平下的总体均值是否存在显著差异.H0:各交叉分组下观测变量的均值无显著差异各交叉分组下观测变量的均值无显著差异.检验统计量检验统计量固定效应模型:固定效应模型:随机效应模型:随机效应模型:nSPSS调

19、用程序:调用程序:nAnalyze - General Linear Model - Univariate Part Seven 3 Part Seven 3 协方差分析协方差分析n(1)目的目的:将无法或很难控制的因素作为协将无法或很难控制的因素作为协变量变量,在排除协变量影响的条件下更精确在排除协变量影响的条件下更精确地分析控制变量对观察变量的影响地分析控制变量对观察变量的影响.n(2)基本思路基本思路:n协变量是数值型的协变量是数值型的;与观测变量的线性关系在各与观测变量的线性关系在各水平均成立,且斜率大致相同。水平均成立,且斜率大致相同。nH0:各交叉分组下观测变量的均值无显著差异各交叉分组下观测变量的均值无显著差异.F= MSA/MSE F= MSB/ MSEF= MSAB/ MSE F= MS协协/ MSEn(3)应用应用n不同饲料是否会对小猪体重的增加产生显著差异不同饲料是否会对小猪体重的增加产生显著差异初始体重与喂养后体重的在各组的线性关系分析(初始体重与喂养后体重的在各组的线性关系分析(散点图)散点图)分析初始体重和饲料的作用分析初始体重和饲料的作用 Part

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论