Spss实用统计分析课件.ppt_第1页
Spss实用统计分析课件.ppt_第2页
Spss实用统计分析课件.ppt_第3页
Spss实用统计分析课件.ppt_第4页
Spss实用统计分析课件.ppt_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS实用统计分析,SPSS是StatisticalPackagefortheSocialScience的缩写,即社会科学统计软件包,是世界上最著名的统计分析软件之一.SPSS名为社会科学统计软件包,是为了强调其社会科学应用的一面,而实际上它在自然科学、经济管理、商业金融、医疗卫生、体育运动等各个领域中都能发挥巨大的作用,是计划、统计、管理部门实现科学管理决策的有力工具.,第1章SPSS综述,1.1Startup对话框,运行指南,数据录入,运行已存在的查询,用数据库捕获向导建立新的查询,打开现有文件,打开其他类型的文件,标题栏,主菜单栏,工具栏,数据显示区域,状态栏,1.2SPSS窗口介绍,数据编辑栏,主菜单栏:排列spss的所有菜单命令,标题栏:显示当前工作文件名称,工具栏:排列系统默认的标准工具图标按钮,状态栏:显示当前工作状态,数据编辑栏:显示用户录入的数据信息,数据显示区域:显示用户编辑确认的数据,1.2.2File菜单,文件菜单提供了数据文件的新建、打开、保存、打印、退出等命令。SPSS不仅能调用SPSS不同版本生成的数据文件,还能调用Excel、Lotus、dBASE、SYLK、Tabdelimited等应用程序生成的数据文件。下面,我们将介绍File菜单包含的具体菜单项。,1.2.3Edit菜单,1.2.4View菜单,1.2.5Data菜单(一),1.2.6Transform菜单,1.2.7Analyze菜单,SPSS提供了强大的、完备的统计分析方法,标准版的Spss11.0仅提供了部分常用的统计分析功能,这些功能与普通统计学、数理统计、多元统计分析教材的主要内容相一致。下面我们将列出所有的统计分析功能:,第2章数据文件的建立及整理,由于经过统计工作得来的数据不能直接应用于统计分析,需要对数据进行归纳和整理,才能用于统计分析。SPSS能够读取的数据文件见以下表格。,2.1.1变量的概念,SPSS中的变量与统计学中的变量概念一致,对总体单位而言,它表示统计指标。对总体而言,则表示统计指标。SPSS具有以下属性:变量名、变量类型、变量长度、变量标签、缺失值、单元格宽度、对齐格式、测度水平等。具体见下表。,2.1.2观测量的概念,SPSS中用Case()表示观测量、案例或事件。数据窗口的二维表格中的每一个横行用来存储一组观测值。因此,把数据窗口的每一个横行就当作为一个Case,表中第m行第n列交叉点处的单元格(cell)中的数值视为第m个单位的第n个变量的变量值。,2.1.3定义变量,单击数据窗口下面的VariablesView(变量视图),出现下面的选项卡,按要求给各个变量属性赋值,2.2数据文件的整理,通常情况下,刚刚建立的数据文件不能立即供统计分析使用,还需要进行进一步的加工、整理,使之更加科学、系统、合理。这项工作在统计学中称之为统计整理。统计整理是统计工作中的一个非常重要的环节,直接关系到统计分析的结果。下面将介绍SPSS提供的数据整理方面的一些基本功能。,执行DataSortCase(观测量分类),出现下面的对话框,从源变量列表中选中一个或多个变量,单击中间的箭头移入SortBy框中,2.2.1观测量分类整理,执行DataSplitFile(文件拆分),打开SplitFile对话框,2.2.2文件的拆分,执行DataTranspose,打开Transpose对话框,从源变量框中选择要进行转置的变量,移入Variable对话框,再从源变量框中选择一个变量应用它作为转置后新的变量名,一般选择具有相异观测值或命名变量,如果选择的是数值型变量,转置后的变量名以字母V开头,后面接上原数值。对字符型变量不能转置。如果不选择变量移入NameVariable对话框,系统将自动给转置后的新变量赋予Var001、Var002、的变量名。,2.2.3数据文件的转置,2.2.4数据的分类汇总,执行DataAggregate,打开Aggregate对话框,将在生成的汇总文件中建立一个变量保存各分组中的观测量数,建立新数据文件,替代工作文件,单击Function(函数)功能按钮,打开如下图的对话框,第3章统计分析报告,3.1分层报告过程3.2观测量的概述3.3观测量按行概述报告,执行AnalyzeReportsOLAPCubes命令,打开OLAPCubes对话框,从源变量清单中选择一个或多个需要分析的变量移至SummaryVariable概述变量框,选择一个或多个分组变量移至GroupingVariable分组变量栏,3.1分层报告过程,单击Statistics按钮,打开OLAPCubes:Statistics对话框,对话框左边的统计量清单框中,列出供选择使用的各种统计量。右边CellStatistics框,接纳用户选择的统计量,凡选入的统计量在输出的分层报告表的单元格里显示他们的值。,单击Title按钮,打开OLAPCubes:Title话框,此对话框用于设置标题(title)及标题说明(capital)选项。,3.2观测量的概述,执行AnalyzeReportsCaseSummarize(个案综合分析)命令,打开对话框,从源变量清单中选择一个或几个概述变量移至Variables框,选择分组变量移至GroupingVariables框中。,打开数据文件,执行AnalyzeReportsReportSummariesinRows(按行综合统计报表)命令,打开ReportSummariesinRows对话框。,3.3观测量按行概述报告,激活DataColumns栏中的一个变量,单击Format按钮,打开变量数据列对话框。,指定列内变量的位置,标题对齐方式,在BreakColumn中选择一个变量,单击Summary,打开分组变量行概述对话框。对话框中列出了每组变量的概述统计量。,在BreakColumn中选择一个变量,单击Options按钮,打开分组变量选项对话框:,页面控制,在空白出输入020之间的一个数k,输出时在各分组的标签值和概述报告之间插入k个空行。,主对话框右下侧有一个Report栏,里面有四个按钮,分别为:Summary,Options,Layout和Titles。Summary与主对话框中相同,单击Options按钮,打开如下对话框:,Excludecaseswithmisssingvalueslistwie:将有缺失值的观测量全部排除。,单击report中的Layout按钮,打开如下对话框:,PageLayout:页面布局设置栏PageTitlesandMargins:页标题和脚注设置栏,单击Report下的Titles按钮,打开如下对话框:,第4章描述统计过程,在描述性统计中,观察者可以对变量的分布特征以及内部结构获得一个感性的直观认识,以便决定采用何种方式做进一步的分析,揭示统计规律。这一部分包括:1.频数分析过程2.描述统计量过程3.数据探索过程4.多维交叉表过程5.比率统计过程,4.1频数分析过程,建立或打开一个数据文件,执行AnalyzeDescriptiveStatisticsFrequencies对话框,从源变量清单中选择一个或多个待分析的变量,移至Variables框中,选择Displayfrequencytables确定是否输出频数分布表,单击Statistics按钮,打开统计量选择对话框,Quartiles显示25,50,75的四分位数值。Cutpointsfor.输入k,将所选变量的数值范围k等分,输出各等分点的变量值在Percentile框内,输入0100间一个数,单击Add,加入到下面的框中,可重复。,输出变量的百分位值,离差栏,集中趋势,分布特征,2019/12/16,43,可编辑,选择完毕,单击Continue返回主对话框,单击Chart按钮:,不显示图形,显示条行图,显示饼行图,显示直方图,当选择BarCharts,在ChartValues栏里选Frequencies,图的纵轴代表频数,选择Percentages,纵轴代表频率,即百分数当选择PieCharts,在ChartValues栏里选Frequencies,图的扇行分隔片代表频数,选择Percentages,扇行分隔片代表频率,即百分数,各项选定后,单击Continue返回主对话框,单击Format,打开格式对话框,Ascendingvalues:统计表中变量值按升序排列,是默认选项Descendingvalues:变量值按降序排列Ascendingcounts:按频数的升序排列Descendingcounts:按频数的降序排列Comparevariables:统计表中变量的各项分析结果在一张表中并列显示Organizeoutputbyvariables:按各个变量组织输出,输出结果降按每个变量一张表的形式显示,4.2描述统计量过程,执行AnalyzeDescriptiveStatisticsDescriptive命令,打开Descriptive对话框。从源变量清单中选择一个或多个分析变量移至Variable(s)栏中,将标准化值作为新变量保存,系统将根据选定变量的观测值产生一个相应的标准化变量,称为原始变量的Z得分值,并在数据窗中产生相应的新变量,新变量名是在原变量名前加Z而成,如原变量为age,相应的新变量名为Zage.,Z得分数值计算公式:,Variablelist:按选入分析变量栏中的各个变量的排序顺序显示输出结果Alphabetic:按变量名起头字母的顺序显示输出结果Ascendingmeans:按平均值升序显示输出结果Descendingmeans:按平均值降序显示输出结果,单击Option按钮,打开Options对话框:,4.3数据探索过程,执行AnalyzeDescriptiveStatisticsExplore,打开数据探索对话框:,因变量框,因素框,观测量标记,Display栏中有3个选项,选择Statistics时,Statistics功能按钮处于激活状态(Plots按钮关闭),输出时仅显示描述统计量表;选择Plots时,Plots功能处于激活状态(Statistics按钮关闭)输出时只显示图形;选择Both时,则二者同时显示.,Descriptives:输出结果显示均值,中位数,5%调整平均数等描述统计量值M-estimators:输出结果显示4种描述集中趋势的稳健极大似然估计量Outliers:输出结果将分别显示5个最大的和最小的观测值Percentiles:输出结果将显示5%,10%,25%,50%,75%,90%,95%的百分数,单击Statistics按钮,激活如下对话框。,Factorlevelstogether:将每个因变量对于不同分组的箱图并列显示Dependentstogether:对每个分组变量,将不同因变量的箱图并列显示None:不显示箱图Stem-and-leaf:显示茎叶图Histogram:显示直方图Normalityplotswithtest:显示附检验的正态概率图和无趋势概率图,单击Plots按钮,激活如下对话框:,箱图,在主对话框中,单击Options按钮打开选项对话框:,Excludecaseslistwise:剔出分析的因变量观测值中的缺失值Excludecasespairwise:凡有缺失值的观测量全部剔出Reportvalues:将分组变量中的缺失值归结为一组,输出时作为附加组列出,4.4多维交叉表过程,打开一个数据文件,执行AnalyzeDescriptiveStatisticsCrosstabs,打开如下对话框:,对每个层变量分类中每一个行变量和列变量的组合输出一张分簇的条形图,不输出多维分布表,单击Statistics按钮,打开Statistics对话框:,Chi-square:对行变量和列变量的独立性进行卡方检验Correlations:计算Pearson相关系数,用于检验两个变量的线性相关程度;计算Spearman相关系数,用于检验秩排序之间的关联度。,对定类测度或名义测度的数据资料,可选择此栏选项。,若数据属于定序测度的数据资料,可选择此栏选项。,选项Eta系数反映行列变量的关联程度,取值在01之间。,单击Cell按钮,打开CellDisplay(单元格显示)对话框:,Counts栏:用于选择交叉表单元格中频数显示格式Percentages栏:用于选择交叉表单元格中百分比显示格式Residuals栏:用于选择交叉表单元格中参差显示格式,单击Format按钮,打开表格格式对话框:,Ascending:以升序显示Descending:以降序显示,4.5比率统计过程,打开一个数据文件,执行AnalyzeDescriptiveStatisticsratio,打开如下对话框:,显示统计结果,选择此项,单击File按钮,指定文件名和路径将统计结果保存到一个外部文件上去,单击Statistics按钮,打开如下对话框:,CentralTendency栏:设置反映比率集中趋势的统计量Dispersion栏:设置反映比率的离差的统计量ConcentrationIndex栏:计算用户指定的范围或在中位数占得百分比,集中指数,第5章均值比较过程,Spss针对各组观察值计算的统计量如:均值、标准差都是基于正态分布理论的,因此认为数据资料都来源于正态总体。均值比较过程包括:1.MEANS过程2.T检验法3.单因素方差分析4.检验的显著性概率,5.2单个样本的T检验,执行AnalyzeCompareMeansOne-SampleTTest命令,打开对话框:,单样本均值与已知总体均值(一般为理论值)进行比较,例如TestValue=120,在ConfidenceInterval栏里输入199中的一个数值,即置信区间Excludecasesanalysisbyanalysis:只排除分析变量的缺失值Excludecaseslistwise:将剔除有缺失值的所有观测量.Sig(2-tailed)的值.05时,则不拒绝,单击Options按钮,打开选项对话框:,执行AnalyzeCompareMeansIndependent-SampleTTest命令,从源变量清单中选择一个或多个数值型变量移入TestVariables框选择分组变量移入GroupingVariables框,这时框内显示“变量名【?】”的形式,单击DefineGroups按钮,打开入下图所示对话框,5.3独立样本的T检验,选择Usespecifiedvalues,表示用分组变量的值进行分组,并在Group1和Group2框中分别输入指定的分组变量的不同有效值,区分两个独立样本如果选择的分组变量为连续型的数值变量,可选择Cutpoint(分割点),在其后的小栏中输入变量取值范围内的一个值,将观测量分为大于或等于该值和小于该值的两组,产生以此值为分界点的两个独立样本,单击Options按钮,打开如下对话框。设置置信概率和缺失值的处理方式,与单样本T检验相同,,在ConfidenceInterval栏里输入199中的一个数值,即置信区间Excludecasesanalysisbyanalysis:只排除分析变量的缺失值Excludecaseslistwise:将剔除有缺失值的所有观测量,5.4配对样本的T检验,执行AnalyzeCompareMeansPairedSampleTTest命令,打开如下对话框:,从源变量清单中选择一对或几对成对数值变量,移入PairedVariables(配对变量)栏,栏内显示出“甲变量乙变量”,表示这一对变量将作为比较的变量。,例如注射疫苗,在注射前进行一次抽样,在注射后再进行一次抽样,检验二者是否有显著差异,第六章方差分析过程,方差分析过程包括:1.单因素方差分析过程2.单变量多因素方差分析过程,6.1单因素方差分析,1.建立适合于单因素方差分析的数据文件,2.执行AnalyzeCompareMeansOne-WayANOVA,打开如下对话框:,从源变量清单中选择变量移入DependentList(因变量列表)栏;选择因素变量移入Factor(因素)栏。,单击Contrasts(比较或对照)按钮,打开Contrasts对话框:,选择Polynomial(多项式),在Degree(次数或阶数)框中,展开下拉式列表选择需要的次数。可供选择的多项式有Linear(线性)、Quadratic(二次)、Cubic(三次)、4nd(四次)、5nd(五次)。2.在Coefficients(系数)框里输入比较多项式的系数,在主对话框里单击PostHoc按钮,打开PostHocmultiplecomparisons(PostHoc多项式比较)对话框:,1.EqualVariancesAssured栏,提供等方差假设下多重比较检验法。2.EqualVariancesNotAssured栏,提供方差不等的假设下的多重比较检验法。3.Significancelevel栏,确定多重比较检验的显著性水平,系统默认值a0.05。,在主对话框中单击Options按钮,打开Options对话框:,均值图,缺省值,统计特征,Descriptive:输出每一个分组中因变量的有关描述统计量值Fixedandrandomeffects:不变效应和随机效应模型的标准差、标准误与95置信区间Homogeneityofvariancetest:计算Levene统计量值检验各组的方差齐性Brown-Forsythe:计算检验组均值相等的Brown-Forsythe统计量Welch:计算检验组均值相等假设的Welch统计量,6.2单变量多因素方差分析过程,线性模型(LinearModel)是研究一个因变量与一个或多个独立自变量或因素之间的关系,而且他们之间的关系通过线性形式的数学结构表现出来。线性模型的理论包括回归分析和方差分析等。,Univariate(单变量多因素方差分析过程):用于进行一个因变量受一个或多个自变量影响的多元方差分析,可以检验有关一个因变量的各种分组下受其他变量影响的零假设,研究因素之间的交互作用,协变量的影响以及协变量和因素之间的交互作用等。Univariate过程要求因变量和协变量必须是数值性变量,因素变量可以是数值型或者字符型的类型变量。,执行AnalyzeGeneralLinearModelUnivariate命令,打开如下对话框:,在主对话框中单击Model按钮,打开Model对话框:,确定模型,BuildTerm(s)栏的下拉式菜单中列置了交互效应类型选择项:Interaction:交互效应,分析变量主效应、变量之间的交互效应。Maineffect:主效应,进行各变量的主效应分析。All2All5-way:进行所有变量的所有2维5维交互效应分析。,在主对话框中单击Contrasts按钮,打开Contrasts(对照)对话框:,比较对照对话框选项用于对因素变量水平之间差异进行比较,输出结果包括对每一个比较对的F统计量值和t分布得出的比较差异的置信区间。Factors框列出主对话框里指定的因素变量,变量名之后括号里指示当前的打开方式。在下面的下拉式菜单中选择打开方式。,在主对话框中单击Plots按钮,打开ProfilePlots(轮廓图)对话框:,一个因素变量的轮廓图可以直观的显示因变量在因素变量各水平估计边际均值增减交叉变动的情况,对有两因素或多因素的情况,如果轮廓图中的线平行,则说明各因素之间没有交互效应;反之,轮廓图中的线不平行,则说明各因素之间存在交互效应。,在主对话框中单击PostHoc按钮,打开PostHocMultipleComparisonsforObservedMeans(观测量均值的PostHoc多重比较)对话框:,1.EqualVariancesAssured栏,假设方差相等2.EqualVariancesNotAssured栏,假设方差不相等,在主对话框中单击Save按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论