SPSS数据的参数检验和方差分析.ppt_第1页
SPSS数据的参数检验和方差分析.ppt_第2页
SPSS数据的参数检验和方差分析.ppt_第3页
SPSS数据的参数检验和方差分析.ppt_第4页
SPSS数据的参数检验和方差分析.ppt_第5页
免费预览已结束,剩余96页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

zf,参数检验单样本t检验两独立样本t检验两配对样本t检验方差分析单因素方差分析多因素方差分析,参数检验和方差分析,2020/5/22,2zf,参数检验是推断统计的重要组成部分。推断统计是根据样本数据推断总体特征的方法,它在对样本数据描述的基础上,以概率的形式对统计总体的未知数量特征(如均值、方差等)进行表述。一是当总体分布已知(如总体为正态分布)的情况下,根据样本数据对总体分布的统计参数(如均值、方差)等进行推断;(参数检验)二是当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断。(非参数检验),2020/5/22,3zf,假设检验的基本问题,假设检验的基本原理小概率事件原理,小概率思想是指小概率事件(P0.01或P160cm或者u160cm为右尾检定(Upper-tailedTest);u2或12,即两样本来自的总体均数不相等.,1.2两样本的t检验根据来自两个总体的独立样本对其总体均值的检验,观测样本独立且是服从正态分布的随机样本,2020/5/22,29zf,与已知时构造统计量与未知但相等时构造统计量,计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误,2020/5/22,30zf,2020/5/22,31zf,例4:为检测某种药物对攻击性情绪的影响,对100名服药者和150名非服药者进行心理测试,得到相应的某指标。相应的假设检验问题为:H0:1=2H1:1大于21为第一组的总体均值,而2为第二组的总体均值。用SPSS处理数据:分析(Analyze)比较均值(Comparemean)两独立样本t检验(Independent-SamplesTTest),2020/5/22,32zf,SPSS输出结果:,注意:这个输出的前面三列(LevenesTestforEqualityofVariances)为检验这两个样本所代表的总体之方差是否相等(零假设为相等)。如果显著,即在Sig列中的该Levene检验p-值很小(这里是0.008),说明两总体的方差相等被拒绝。就应该看两总体方差不等的结果,即最后一行的t检验输出(p-值0.347/2);否则看上面一行的结果。,因为总体方差相同时使用的检验统计量与方差不同时使用的不一样,2020/5/22,33zf,结论:通过计算,t统计量等于0.942,p值为0.1735(输出中的双尾检验p值0.347的一半)。因此无法拒绝零假设,即服药与未服药的攻击性情绪无差异。,2020/5/22,34zf,例5:某商场的营销部拟对某种信用卡购物促销方式及效果进行评估。随机抽取了500名持卡消费者。信用卡购物促销方式之一:过去三个月消费实施降低利率的方式;方式之二:采取标准的信用卡购物方式。(两种方式各有250名消费者)。(见数据文件:creditpromo.sav),2020/5/22,35zf,(1)分析的下拉菜单中选择:分析(Analyze)比较均值(Comparemean)两独立样本t检验(Independent-SamplesTTest),弹出对话框,SPSS操作过程:,2020/5/22,36zf,选择检测变量,分组变量选择,分组取值定义,选择检测变量:$spentduringpromotionalperiod.选择分组变量:Typeofmailinsertreceived.点击DefineGroups对分组变量的取值进行定义.,2020/5/22,37zf,第一组的分组取值,第二组的分组取值,运用分界点进行分组,2020/5/22,38zf,(2)输出结果及分析:independent-samplesstatistic,该表是描述性统计表:不同消费方式下样本大小、消费金额的均值、标准差、均值的标准误.该表可看出从样本平均值来看,接受利率优惠的消费者的平均消费要高出接受标准方式的消费者有71美元.,2020/5/22,39zf,结论:因计算的T统计量为-2.26,sig值为0.0240.05;所以,可得出新药对triglyceridelevel无影响。而实验前后weight的t统计量为11.2;sig值0.0000.05;所以,可认为体重下降8.06绝非偶然,而是新药起了作用。,2020/5/22,50zf,如何解决多元多总体的均值检验?,2020/5/22,51zf,不同型号的计算机的平均维修时间是相同?,2方差分析,2020/5/22,52zf,首先计算各样本平均数若按两个总体平均值比较的检验法,把样本平均数两两组成对:,2020/5/22,53zf,将这15对平均数一一进行比较检验计算工作量太大即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等这一结论的置信度仅是估计的精确性和检验的灵敏度降低其他方法?,2020/5/22,54zf,方差分析(analysisofvariance,ANOVA):又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。方差分析中几个重要概念:1)观测因素或称为观测变量如:考察农作物产量的影响因素。农作物产量就是观测变量。2)控制因素或称控制变量:进行试验(实验)时,我们称可控制的试验条件为因素(Factor)。其中因素变化的各个等级为水平(Level)。影响农作物产量的因素,如品种、施肥量、土壤等。,2020/5/22,55zf,如果在试验中只有一个因素在变化,其他可控制的条件不变,称它为单因素试验;若试验中变化的因素有两个或两个以上,则称为双因素或多因素试验。,方差分析就是从观测变量的方差入手,研究诸多控制变量(因素)中哪些变量是对观测变量有显著影响的变量,2020/5/22,56zf,方差分析的基本原理设有r个总体,各总体分别服从,假定各总体方差相等。现从各总体随机抽取样本。透过各总体的样本数据推断r个总体的均值是否相等?:至少有一组数据的平均值与其它组的平均值有显著性差异。,2020/5/22,57zf,分析的思路:用离差平方和(SS)描述所有样本总的变异情况,将总变异分为两个来源:(1)组内变动(withingroups),代表本组内各样本与该组平均值的离散程度,即水平内部(组内)方差(2)组间变动(betweengroups),代表各组平均值关于总平均值的离散程度。即水平之间(组间)方差即:SS总=SS组间+SS组内,2020/5/22,58zf,消除各组样本数不同的影响-离差平方和除以自由度(即均方差)。从而构造统计量:方差分析的基本思想就是通过组内方差与组间方差的比值构造的F统计量,将其与给定显著性水平、自由度下的F值相对比,判定各组均数间的差异有无统计学意义。零假设否定域:,2020/5/22,59zf,方差分析的应用条件(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。(2)正态性,各组的观察数据,是从服从正态分布的总体中随机抽取的样本。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。即若组间方差不齐则不适用方差分析。,2020/5/22,60zf,一元单因素方差分析:分析某一个因素A的不同水平是否对某一个观测变量Y产生了显著影响。一元多因素方差分析:分析某两个或多个因素的不同水平是否对某一个观测变量Y产生了显著影响。,2.1一元方差分析,2020/5/22,61zf,例1:某饮料生产企业研制出一种新型饮料.饮料的颜色共有四种:橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收集了该种饮料的销售情况。,2.1.1一元单因素方差分析,2020/5/22,62zf,问题:饮料的颜色是否对销售量产生影响?,2020/5/22,63zf,其中:饮料的颜色即是影响因素(控制因素、变量)销售量是观测变量。在其他条件相同的情况下,上述问题就归结为一个检验问题,即:,2020/5/22,64zf,差异的产生来自两个方面:一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了影响。用组间方差表示另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误差,如相同颜色的饮料在不同的商场销售量也不同。用组内方差表示。一元单因素方差分析Spss选项:分析(Analyze)比较均值(CompareMean)单因素ANOVA(One-WayANOVA),2020/5/22,65zf,SPSS输出结果:可看出F值为10.486,P值是0.000。推断零假设不成立。表明颜色不同饮料的销量也不同。,2020/5/22,66zf,如何用SPSS对方差分析的方差相等要求进行判定?(因正态分布的要求不是很严格,分析忽略)Spss选项:在One-WayANOVA中选择Option,选定Homogeneity-ofvariance,2020/5/22,67zf,进一步考察:究竟是哪一个水平对观察变量产生了显著影响,即那种颜色的饮料对销售量有显著影响?运用单因素方差分析的多重比较检验SPSS窗口中PostHoc选项进行选择。,2020/5/22,68zf,2020/5/22,69zf,例2:为了迎合消费者的需求,某音像公司拟推出一张新的DVD专辑.市场营销部分收集不同年龄的消费者群体对新的DVD专辑的评价等相关数据信息。(见数据文件dvdplayer.sav)从该数据文件我们想知道:是否不同消费者群体对DVD的评价不一样呢?32-38岁与39-45岁两个年龄段的消费者全体对DVD的评价是否一样呢?32岁以下与45岁以上的消费者群体对DVD的评价是否一样呢?,2020/5/22,70zf,SPSS的处理过程:(1)一元单因素方差分析的菜单选择:分析(Analyze)比较均值(CompareMean)单因素方差分析(One-WayANOVA),弹出One-wayANOVA对话框,2020/5/22,71zf,选择TotalDVDassessment作为因变量.选择AgeGroup作为影响因素.点击选项Options按钮.,多重比较检验:两两比较看哪些水平之间存在均值差异.,先验比较检验:事先设定因变量在因素的不同不平下是否有差异.,描述性统计量、均值图、缺失值的处理,观测变量(因变量)输入框,影响因素(自变量)输入框,弹出Option对话框,2020/5/22,72zf,统计量选择,描述性统计.如:均值、方差等,固定效应、随机效应模型的标准差、标准误、置信区间等,方差同质性(相等)检验,当F检验方差相等不成立时,用Brown-Forsythe统计量或Welch统计量检验组间均值是否相等,比F检验更可取。,选择均值图Meansplot.点击继续Continue.点击一元单因素对话框中的两两比较PostHoc.,均值示意图可直观看出组间均值差异,弹出双重比较检验对话框,组均值示意图,缺失值处理,2020/5/22,73zf,假设组间方差相等时的多重比较检验,假设组间方差不等时的多重比较检验,确定显著性水平,选择方差不等时的TamhanesT2.点击继续Continue.点击一元单因素方差分析中的对比Contrasts按钮.,弹出Contrasts对话框,2020/5/22,74zf,第1组系数赋值为0,点击Add.第二组系数赋值为0,点击Add.紧接着,给第3和第4组系数赋值,要使两系数和为0.给第3组赋值-1,点击Add.给第4组系数赋值为1.给第5和第6组赋值为0.点击Next进入下一组先验对比检验.,首先,比较第3和第4个年龄段的消费者群体;其他年龄段的忽略不考虑,赋值为0.,零假设为:两组无差异,2020/5/22,75zf,其次,对第1、2两个年龄段的消费者与第5、6两个年龄段的消费者进行先验对比。第3和4两个年龄段的消费者不考虑。,给第1组赋值.5,点击Add.给第2组赋值.5,点击Add.分别给第3和第4组赋值为0,点击Add.分别给第5和第6组赋值-.5,点击Add.点击Continue.点击一元单因素对话框中的OK,输出分析结果output.,2020/5/22,76zf,(2)结果分析:,方差齐性(相等)检验,从上表可看出:各总体方差相等的零假设成立。因为统计量Levenestatistic为0.574,该统计量实现的可能性sig.值为0.720,说明零假设发生可能性是很大的,我们没有充分的理由拒绝它,由此接受零假设。,2020/5/22,77zf,差异表现如何,究竟来自哪儿?,由此表可看出,对DVD的评价的差异主要来自不同年龄的消费者群体的组间差异,因为F统计量为4.601;同时依据sig值0.001,也可说明我们最初的零假设不同年龄群体对DVD的评价无差异发生的可能性为0.001,我们没有充分理由接受它.,方差分析表,2020/5/22,78zf,组均值示意图,该图给我们较为直观的印象:32-45岁的消费者对DVD的评价高于其他消费者群体.若要作更细致和精确的分析,可通过一元方差分析中的先验比较和多重比较来完成。,2020/5/22,79zf,对比系数表,检验32-38和39-45两个群体对DVD的评价是否有差异,零假设认为:二者无差异。其他年龄段的消费者群体忽略不考虑,所以分别赋值为0;而32-38和39-45两个群体分别赋值-1和1,类似地,若想对比32岁以下和45岁以上的消费者群体对DVD的评价是否有差异,零假设认为二者无差异,所以,分别给18-24、25-31赋值为.5,分别给46-52、53-59赋值为-.5,其他群体不考虑赋值为0。,Thesignificancevaluesforthetestsofthefirstcontrastarebothlargerthan0.10.Thisindicatesthattheage39-45groupisnotsignificantlymorefavorabletowardtheDVDplayerthantheage32-38group.Likewise,thesignificancevaluesforthetestsofthesecondcontrastarelargerthan0.10.Participantsunder32andover45havestatisticallyequivalentassessmentscores.,假设方差不等时的检验结果,假设方差相等时的检验结果,2020/5/22,80zf,PostHocTests,双重假设检验,2020/5/22,81zf,2.1.2一元多因素方差分析,基本思想:研究两个或两个以上因素(控制变量)是否对某个观测变量产生显著性影响。如:饮料销售,除了关心饮料颜色之外,还想了解销售地区、销售策略是否影响销售量?若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B,销售策略看作影响因素C。对因素A和因素B同时进行分析,就属于双因素方差分析。对因素A、B以及C(或更多因素)同时进行分析,就属多因素方差分析。,2020/5/22,82zf,双(多)因素方差分析有两种类型:1、无交互作用的双(多)因素方差分析,它假定因素A和因素B的效应是相互独立的,不存在相互关系;2、有交互作用的双(多)因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应(相互影响)。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。,2020/5/22,83zf,案例分析:广告城市与销售额数据,目标:企业对不同广告形式在不同地区的广告效果(销售额)进行评估;,2020/5/22,84zf,例2:某杂货店对其消费者的购买习惯作了一项问卷调查。重要想关注:不同性别、不同的购买习惯是否会影响到其在一个月内的消费金额。(数据见:grocery_1month.sav)因变量dependentvariable:Amountspent自变量Independentvariables:gendershoppingstyle,一元双因素问题,2020/5/22,85zf,(1)建立假设:对于因素:gender零假设H0:备择假设H1:对于因素:shoppingstyle零假设H0:备择假设H1:交互影响因素:零假设H0:备择假设H1:,2020/5/22,86zf,(2)一元多因素的SPSS处理过程:菜单选择:分析(Analyze)一般线性模型(GeneralLinearModel)单变量(Univariate),弹出univariate对话框,2020/5/22,87zf,因变量选择,固定因素,随机因素,(协方差分析时)协变量选择,(协方差分析时)权数变量选择,模型选择按钮,实现先验对比检验和趋势检验,图形分析,双重比较检验,将分析结果以变量的形式存入SPSS数据编辑窗口中,置信水平和描述性统计等,选择Amountspentas作为因变量.选择GenderandShoppingstyle进入固定因素框.点击Model按钮.,2020/5/22,88zf,GenderShoppingstyle,GenderShoppingstyle,饱和模型(考虑交互效应gender*Shoppingstyle),非饱和模型(不考虑交互效应,系统默认模型),若选择非饱和模型,则点击custom.点击作图Plots进入形象分析对话框.,2020/5/22,89zf,选择style作为横坐标变量.选择gender作为纵坐标变量.点击Add按钮.点击Continue.按钮再点击PostHoc按钮进入双重比较对话框.,形象分析:用图形直观分析控制变量间是否存在交互作用,2020/5/22,90zf,假设方差相等,双重假设检验,假设方差不等,选择style作为双重比较检验的因素.选择方差相等中的Tukey统计量选项.选择方差不等中的TamhanesT2统计量选项.点击Continue.再点击Options.,2020/5/22,91zf,选择gender*style显示其均值情况.选择Descriptivestatistics,Homogeneitytests,Estimatesofeffectsize,andSpreadvs.levelplot等选项.点击Continue.点击Ok.,(3)theresultsanalysis(结果分析,略),2020/5/22,92zf,多元单因素方差分析:分析某一个因素的不同水平是否对某个观测向量Y产生了显著影响多元多因素方差分析:分析某两个或多个因素的不同水平是否对某个观测向量Y产生了显著影响,2.2多元方差分析,2020/5/22,93zf,例1:考察汉族、藏族、蒙古族三个民族的人均收入水平INC、15岁及以上人口上学或毕业比例EDU是否有差异。(多元单因素分析问题)需考察的影响因素为:民族观测变量为:INC和EDUSPSS处理:分析(Analyze)一般线性模型(GeneralLinearModel)多变量(Multivariate),多元单因素分析,2020/5/22,94zf,人均收入、教育比例DependentVariables民族FixedFactors结果:,三个民族的人均收入、受教育比例有显著差异。,2020/5/22,95zf,例2:调查某中学同年级22名男女生,测量其身高(cm)、体重(kg)和胸围(cm),数据见表。试检验该中学全体男女生的身体发育状况有无差别。,2020/5/22,9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论