




已阅读5页,还剩80页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS应用软件试验指导手册SPSS工具简介统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握一两种统计分析软件的实际操作,是十分必要的。常见的统计软件有SAS,SPSS,SPLUS,MINITAB,EXCEL等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS在各类院校以及科研机构中更为流行。在本试验课程中我们选择SPSS作为统计分析应用试验活动的工具。SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows大同小异,本次试验的试验工具选择了SPSS for Windows 19.0中文版。1 SPSS的运行模式Spss主要有四种运行模式:(1) 批处理模式这种模式把已编写好的程序(语句程序)存为一个文件,提交给开始菜单上SPSS for WindowsProduction Mode Facility程序运行。(2) 完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。(3) 程序运行模式这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。(4) 混合运行模式以上各种方法的综合运行方式。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。2 SPSS的启动(1) 在windows开始所有程序IBM SPSS Statistics IBM SPSS Statistics 19,即可启动SPSS软件,进入IBM SPSS Statistics 19对话框,如图1.1所示。图1.1 IBM SPSS Statistics 19 对话框3 SPSS软件的退出SPSS软件的退出方法与其他Windows应用程序相同,有两种常用的退出方法: 按FileExist的顺序使用菜单命令退出程序。 直接单击SPSS窗口右上角的“关闭”按钮,回答系统提出的是否存盘的问题之后即可安全退出程序。4 SPSS的主要窗口介绍SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,最主要的界面有四个:数据编辑窗口、结果输出窗口、语法窗口和脚本窗口。(1) 数据编辑窗口启动SPSS后看到的第一个窗口便是数据编辑窗口,如图1.2所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。状态栏窗口切换标签观测序号变量名栏编辑栏菜单栏工具栏标题栏图1.2 数据浏览界面 标题栏:显示数据编辑的数据文件名。 菜单栏:包括SPSS的10个主菜单。通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。下面分别对这些菜单的主要功能作一个简要介绍,如表1.1所示。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。表1.1 SPSS菜单功能简介菜单项功能简介File文件的存取以及打印,外部数据的读取Edit数据的复制、剪切、粘贴等基本的数据编辑功能View数据窗口外观设置Data数据整理的部分功能,包括插入新观测和新变量、数据排序、选取、合并、拆分等Transform数据整理及数据转换功能,包括计算新变量、重新编码等AnalyzeSPSS统计分析程序汇总,包括所有的统计分析功能GraphsSPSS图表绘制程序汇总,包括所有的SPSS绘图功能Utilities包含变量信息、文件信息、定义和使用集合、菜单编辑器等WindowSPSS主窗口的呈现方式设定及窗口的转换Help提供各种类型的SPSS帮助为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的工具栏设置不满意,也可以用视图工具栏菜单命令对工具栏按钮进行定义。 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。 变量名栏:列出了数据文件中所包含变量的变量名 观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。 窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。 状态栏:用于说明显示SPSS当前的运行状态。SPSS被打开时,将会显示“SPSS Processor is ready”的提示信息。(2) 结果输出窗口在SPSS中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。结果输出窗口如图1.3所示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的SPSS输出结果文件来打开该窗口。图1.2 输出窗口界面(3) 语法窗口用户可以在语句窗口中直接编写SPSS命令程序,也可以使用Paste按钮把菜单运行方式下的各种命令和选项粘贴到命令窗口中,再进行进一步修改,然后通过运行主菜单的运行命令将编写好的程序一次性地提交给计算机执行。图1.3 语法窗口界面(4) 脚本窗口图1.4 脚本窗口界面17试验1、实验2参考一、实验目的通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等等。二、实验指导SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。观测变量数据内容表2.1 SPSS数据文件结构姓名性别年龄张三145李四223 王五245SPSS变量的属性SPSS中的变量共有11个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)、度量尺度(Measure)和角色。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击变量视图标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。图2.1 变量视窗1创建一个数据文件数据文件的创建分成三个步骤:(1)选择菜单FileNewdata新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“SPSS Data Editor”。(2)单击左下角Variable View标签进入变量视图界面,根据试验的设计定义每个变量类型。(3)变量定义完成以后,单击Data View标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。2读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按FileOpendata的顺序使用菜单命令调出Open File对话框,在文件类型下拉列表中选择“Excel(*.xls)”,如图2.2所示。图2.2 Open File对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出Open Excel Data Source对话框,如图2.3所示。Open Excel Data Source对话框中各选项的意义如下: Read variable names from the first row of data复选框:选中此项,将Excel数据表中第一行的有效字符作为SPSS变量名。 Worksheet下拉列表:选择被读取数据所在的Excel工作表。 Range输入框:用于限制被读取数据在Excel工作表中的位置。图2.3 Open Excel Data Source对话框3数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit菜单中。Edit菜单中的数据编辑功能如下表所示。表2.2 Edit菜单项功能说明Undo撤销上一步操作,快捷键为CtrlZRedo恢复上一步被撤销的操作,快捷键为Ctrl+RCut剪切选定内容,快捷键为Ctrl+XCopy复制选定内容,快捷键为CtrlCPaste将剪切或复制内容粘贴到指定位置,快捷键为CtrlVClear删除选定的变量,观测,或清楚选定区域的内容,快捷键为Delete插入变量在指定位置的左侧插入一个变量。插入个案在指定位置的上方插入一个观测转至个案用于数据的定位。定位到设定序号所指定的观测中。转向变量用于变量的定位。4SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过FileSave或者FileSave as菜单方式来执行。在数据保存对话框(如图2.5所示)中根据不同要求进行SPSS数据保存。图2.5 SPSS数据的保存 “文件名”输入框中输入适当的文件名 “保存类型”下拉列表用于选择将数据保存为不同的数据格式 “write variables names to spreadsheet”和“Save value labels where defined instead of data values”两个复选框:当保存类型为Excel文件格式时可用。前者用于选择是否将变量名写入Excel文件的第一行,后者用于选择是否用值标签代替变量值写入Excel文件。 Variables按钮用于选择需要保存的变量。单击后弹出如图2.6所示的对话框,在对话框中被选中的变量才会保存到文件中,其余的则不被保存。图2.6 选择保存的变量5. 数据整理在SPSS中,数据整理的功能主要集中在Data和Transform两个主菜单下。(1)数据排序(Sort Case)对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操作说明如下: 选择菜单DataSort Case,打开Sort Cases对话框,如图2.7所示图2.7 Sort Case 对话框 Sort by:选择排序变量。数据将按该变量的大小进行排序。 Sort Order:指定排序方式。其中,Ascending是按排序变量的升序排列,Descending是按降序排列。 选择完毕,点击ok按钮,执行排序命令。(2)抽样(Select Case)在统计分析中,有时不需要对所有的观测进行分析,而可能只对某些特定的对象有兴趣。利用SPSS的Select Case命令可以实现这种样本筛选的功能。以SPSS安装配套数据文件Employee data.sav为例,选择Salary大于30000的观测,基本操作说明如下: 打开数据文件Employee data.sav,选择DataSelect Case命令,打开对话框,如图2.8图2.8 Select Cases对话框 指定抽样的方式:All cases 不进行筛选;If condition is satisfied 按指定条件进行筛选。本例设置Salary=30000,如图2.9所示;Random sample of cases 随机抽取观测;Based on time or case range按顺序筛选;Use filter variable 用指定的过虑变量进行筛选。图2.9 Select Cases if对话框设置完成以后,点击continue,进入下一步。 确定未被选择的观测的处理方法,这里选择默认选项filtered。 单击ok进行筛选,结果如图2.10图2.10 (3)增加样品的数据合并(Merge FileAdd cases)将新数据文件中的观测合并到原数据文件中,在SPSS中实现数据文件纵向合并的方法如下: 选择菜单DataMerge FilesAdd Cases,打开将个案添加到对话框,如图2.11。 选择外部SPSS Statistics数据文件复选框,点击浏览选择外部数据,并继续,弹出如下对话框。 通过选中Indicate case source as Variable复选框,并在下面的输入框中输入想要的变量名,即可指定生成一个0-1变量来指明合并后的数据文件中观测的来源。这里选择默认设置,点击ok按钮,执行命令之后,可以发现当前数据文件的观测量比原来增加了。图2.11(4)增加变量的数据合并(Merge FileAdd variables)增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文件进行合并,收集来的数据被放置在一个新的数据文件中。在SPSS中实现数据文件横向合并的方法如下: 选择菜单DataMerge FilesAdd Variables,打开将变量添加到对话框,选择外部数据文件,单击“continue”,弹出Add Variables,如图2.12所示。图2.12 单击Ok执行合并命令。这样,两个数据文件将按观测的顺序一对一地横向合并。(5)数据拆分(Split File)在进行统计分析时,经常要对文件中的观测进行分组,然后按组分别进行分析。例如要求按性别不同分组。在SPSS中具体操作如下: 选择菜单DataSplit File,打开对话框,如图2.13所示。图2.13 Split file对话框 选择拆分数据后,输出结果的排列方式,该对话框提供了3种方式:Analyze all cases,do not create groups 对全部观测进行分析,不进行拆分;Compare groups 在输出结果种将各组的分析结果放在一起进行比较;Organize output by groups 按组排列输出结果,即单独显示每一分组的分析结果。 选择分组变量 选择数据的排序方式 单击ok按钮,执行操作(6)计算新变量在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映事务的本质,有时需要对数据文件中的变量加工产生新的变量。比如经常需要把几个变量加总或取加权平均数,SPSS中通过Compute命令来产生这样的新变量,其步骤如下: 选择菜单TransformCompute,打开Compute Variable对话框,如图2.14所示。图2.14 Compute Variable对话框 再Target Variable输入框中输入生成的新变量的变量名。单击输入框下面的Type&label按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。 在Numeric Expression输入框中输入新变量的计算表达式。例如“age10”。 单击If按钮,弹出If Cases子对话框,如图2.15所示。Include all cases:对所有的观测进行计算;Include if case satisfied condition:仅对满足条件的观测进行计算。 单击Ok按钮,执行命令,则可以在数据文件中看到一个新生成的变量。图2.15 If cases子对话框 SPSS应用软件试验指导手册实验3参考一、实验目的统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。本本试验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。二、实验指导描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。1频数分析(Frequencies)频数分析多适用于离散变量,其功能是描述离散变量的分布特征。基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。比如,在某项调查中,想要知道被调查者的性别分布状况。频数分析的第一个基本任务是编制频数分布表。SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值落在某个区间中的次数。(2)百分比(Percent)即各频数占总样本数的百分比。(3)有效百分比(Valid Percent)即各频数占有效样本数的百分比。这里有效样本数总样本缺失样本数。(4)累计百分比(Cumulative Percent)即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图等。频数分析的应用步骤在SPSS中的频数分析的实现步骤如下: 选择菜单“FileOpenData”在对话框中找到需要分析的数据文件“SPSS/Employee data”,然后选择“打开”。 选择菜单“AnalyzeDescriptive StatisticsFrequencies”。如图2.1所示 询问是否输出频数分布表图2.1 Frequencies对话框 确定所要分析的变量,例如Gender 在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图2.2所示,选择统计输出选项。图2.2 Statistics子对话框(1) Percentile Values 栏 表2.1 Percentile Values 栏选项说明选项说明Quartiles显示25%,50%,75%的四分位数值Cut points for _equal groups输入整数k 时,表示将所选变量的数值从小到大划分为k 等分,并将输出各等分点处的变量数值Percentile(s)右边的小框内,键入0100 间的1个数之后,单击Add 按钮添加到下面的方框内,此操作过程可以重复。例如输入15,55,85 时,输出结果将会显示15%,55%,85%百分位处的变量值。单击Change 和Remove 按钮可以修改或删除框内的数值 。(2) Dispersion(离中趋势)栏各统计量符号表示如下:Std deviation 标准差;Minimum 最小值;Variance 方差;Maximum 最大值;Range 极差 (3) Central Tendency(集中趋势)栏各统计量符号表示如下:Mean 均值(算术平均数);Mode 众数;Median 中位数;Sum 总和 (4)Distribution(分布特征)栏各统计量符号表示如下:Skewness 偏度;Kurtosis 峰度 单击charts按钮,弹出charts子对话框(如图2.3所示),设置生成的统计图,对话框有两个选项栏:图2.3 Charts子对话框(1)Charts Type选项栏:设置生成统计图的类型。表2.2 Charts Type选项栏选项说明选项说明None不生成任何统计图Bar charts生成条形图Pie charts生成饼图Histograms生成直方图,如果选中该选项,则下面的With normal curve复选框被激活,用户可以选择是否在直方图中加入正态曲线,这样可以直观地将变量的分布与正态分布进行比较。(2) Chart Values 选项栏:选择按频数或百分比作图。只有当Chart Type选择Bar chart或Pie charts时这个选项栏才可用。 单击Format按钮,弹出Format子对话框,对输出的频数分布表的格式进行设置,如图2.4所示。表2.3 Format子窗口选项设置说明选项栏设置说明Order by用于选择频数分布表是按变量值还是按频数排列,是按升序还是降序排列Multiple Variables仅适用于对两个以上变量作频数分析。Compare variable 表示将几个变量的频数分析结果在同一张表中显示,Organize output by variables表示将不同变量的频数分析结果在不同的表中显示。Suppress tables with more than n categories如果分类数多余n则不输出频数分布表,这通常使用于变量取值过多时。图2.4 Format子对话框 结果输出与分析点击Frequencies 对话框中的“OK”按钮,即得到下面的结果。表2.4 描述性统计量StatisticsGender NValid474 Missing0表2.4中给出了总样本量(N),其中变量Gender的有效个数(Valid)为474个、缺失值(missing)为0。表2.5 Gender频数分布表 FrequencyPercentValid PercentCumulative PercentValidFemale21645.645.645.6 Male25854.454.4100.0 Total474100.0100.0 表2.5中,Frequency是频数,Percent是按总样本量为分母计算的百分比,Valid Percent是以有效样本量为分母计算的百分比,Cumulative Percent是累计百分比。图2.5变量Gender的条形图,图2.6变量Gender的饼图。图2.5 变量gender的条形图图2.6 变量gender的饼图2描述统计(Descriptives) 描述统计主要对定距型或定比型数据的分布特征作具体分析。SPSS的Descriptives命令专门用于计算各种描述统计性统计量。本节利用某年国内上市公司的财务数据来介绍描述统计量在SPSS中的计算方法。具体操作步骤如下: 选择菜单AnalyzeDescriptive StatisticsDescriptives,如图2.7所示图2.7 Descriptives对话框 将待分析的变量移入Variables列表框,例如这里将对资产负债率lev、前两大股东持股比例之比和前5大股东持股比例之和3个变量计算描述性统计,以观察上市公司股权集中度情况和负债比率的高低。Save standardized values as variables,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀z。标准化计算公式: 单击Options按钮,如图2.8 所示,选择需要计算的描述统计量。各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。图2.8 Options子对话框 在主对话框中单击ok执行操作。 结果输出与分析在结果输出窗口中给出了所选变量的相应描述统计,如表2.6所示。从表中可以看到,我国上市公司前两大股东持股比例之比平均高达102.9,说明“一股独大”的现象比较严重;前五大股东持股比例之和平均为51.8%,资产负债率平均为46.78%。另外,从偏态和峰度指标看出,前两大股东持股比例之比的分布呈现比较明显的右偏,而且比较尖峭。为了验证这一结论,可以利用Frequencies命令画出变量z的直方图,如图2.9表2.6 描述统计量表Descriptive Statistics NMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error前两大股东持股比例之比315102.865199.1997464.168.13722.404.274前五大股东持股比例的平方和315.51836.1496003.602.137-.318.274资产负债率315.4677.16773-.165.137-.414.274Valid N (listwise)315 图2.9 变量Z的直方图3探索分析(Explore) 调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步。 探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。一般以图形方式输出,直观帮助研究者确定奇异值、影响点、还可以进行假设检验,以及确定研究者要使用的某种统计方式是否合适。 在打开的数据文件上,选择如下命令:选择菜单“AnalyzeDescriptive StatisticsExplore”,打开Explore 对话框。 确定所要计算的变量 例如选择current Salary作为待分析变量;选择Gender作为分组变量,在Display栏中,选择Both,表示输出图形及描述统计量。 选择statistics按钮,选择想要计算的描述统计量。如图所示Confidence Interval for Mean 将显示总体均值的95%置信区间,95%为系统默认的置信概率,取值范围为199;M-estimators:输出稳健极大似然估计量;Outliers:输出5个最大和最小的观测值;Percentiles:输出5%,10%,25%,50%,75%,90%,95%的百分位数。 对所要计算的变量的频数分布及其统计量值作图 打开“Plots对话框”,出现如下图。对有关的部分选项说明如下: Boxplots(箱图)选项栏 Factor levels together:将每个因变量对于不同分组的箱图并列显示,利于比较各组在因变量同一水平上的差异 ;Dependents together:所有因变量生成一个箱图,这样可以比较分组变量同一水平上各个因变量值的分布情况 ;None:表示不显示箱图 Descriptives 栏 Stem-and-leaf:显示茎叶图 Histogram:显示直方图 选中Normality plots with tests 框中输出显示正态分布图形。 结果的输出与说明 (1)Case Processing Summary 表 案例处理摘要Gender案例有效缺失合计N百分比N百分比N百分比Current SalaryFemale216100.0%0.0%216100.0%Male258100.0%0.0%258100.0%在Case Processing Summary 表中可以看出female 有216个个体,Male258个个体,均无缺失值。 (2)Descriptives 表 Descriptives描述Gender统计量标准误Current SalaryFemale均值$26,031.92$514.258均值的 95% 置信区间下限$25,018.29上限$27,045.555% 修整均值$25,248.30中值$24,300.00方差57123688.268标准差$7,558.021极小值$15,750极大值$58,125范围$42,375四分位距$7,013偏度1.863.166峰度4.641.330Male均值$41,441.78$1,213.968均值的 95% 置信区间下限$39,051.19上限$43,832.375% 修整均值$39,445.87中值$32,850.00方差3.802E8标准差$19,499.214极小值$19,650极大值$135,000范围$115,350四分位距$22,675偏度1.639.152峰度2.780.302(3)职位员工薪水直方图显示 (4)茎叶图描述 茎叶图自左向右可以分为3 大部分:频数(Frequency)、茎(Stem)和叶(Leaf)。茎表示数值的整数部分,叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽(Stem Width),即茎叶所表示的实际数值的近似值。Current Salary Stem-and-Leaf Plot forgender= Female Frequency Stem & Leaf 2.00 1 . 55 16.00 1 . 6666666666777777 14.00 1 . 88889999999999 31.00 2 . 0000000000000111111111111111111 35.00 2 . 22222222222222222222233333333333333 38.00 2 . 44444444444444444444444444555555555555 22.00 2 . 6666666666677777777777 17.00 2 . 88888899999999999 7.00 3 . 0001111 8.00 3 . 22233333 8.00 3 . 44444555 5.00 3 . 66777 2.00 3 . 88 11.00 Extremes (=40800) Stem width: 10000 Each leaf: 1 case(s)Current Salary Stem-and-Leaf Plot forgender= Male Frequency Stem & Leaf 1.00 1 . 9 18.00 2 . 111122222223344444 64.00 2 . 5555555555566666666666666667777777777777777788888888888999999999 60.00 3 . 000000000000000000000000000001111111111111122233333333344444 22.00 3 . 5555555566667778889999 16.00 4 . 0000000012223334 11.00 4 . 55556677889 9.00 5 . 001122344 10.00 5 . 5555667899 8.00 6 . 00001112 14.00 6 . 55566666788889 6.00 7 . 000233 5.00 7 . 55888 4.00 8 . 0123 10.00 Extremes (=86250) Stem width: 10000 Each leaf: 1 case(s)(5)箱图 图中灰色区域的方箱为箱图的主体,上中下3 条线分别表示变量值的第75、50、25百分位数,因此变量的50%观察值落在这一区域中。 方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线,上端截至线为变量的最大值,下端截至线为变量的最小值。 实验4 参考一、实验目的通过本试验项目,使学生了解常用的假设检验方法,能够使用SPSS对实际问题作出t检验。二、实验指导经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断,在教育统计学中称为“统计检验”。 统计检验的基本原理统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。如果现要检验实验组和对照组的平均数(1和2)有没有差异,其步骤为:1建立虚无假设,即先认为两者没有差异,用表示;2通过统计运算,确定假设成立的概率P。 根据P 的大小,判断假设是否成立。如表6-12所示。大样本平均数差异的显著性检验Z检验Z检验法适用于大样本(样本容量大于30)的两平均数之间差异显著性检验的方法。它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法。其一般步骤:第一步,建立虚无假设,即先假定两个平均数之间没有显著差异。第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。(1)如果检验一个样本平均数()与一个已知的总体平均数()的差异是否显著。其Z值计算公式为:其中是检验样本的平均数;是已知总体的平均数;S是样本的方差;n是样本容量。(2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:其中,1、2是样本1,样本2的平均数;是样本1,样本2的标准差;是样本1,样本2的容量。第三步,比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如表6-13所示。第四步,根据是以上分析,结合具体情况,作出结论。【例6-5】某项教育技术实验,对实验组和控制组的前测和后测的数据分别如表6-14所示,比较两组前测和后测是否存在差异。由于n30,属于大样本,应采用Z检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。计算前测Z的值= -0.658 =0.6581.96 前测两组差异不显著。再计算后测Z的值 = 2.16 = 2.161.96 后测两组差异显著。小样本平均差异的显著性检验t检验 t检验是用于小样本(样本容量小于30)时,两个平均值差异程度的检验方法。它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。其一般步骤如下:第一步,建立虚无假设,即先假定两个总体平均数之间没有显著差异。第二步,计算统计量t值,对于不同类型的问题选用不同的统计量计算方法。(1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量t值的计算公式为:(2)如果要评断两组样本平均数之间的差异程度,其统计量t值的计算公式为:第三步,根据自由度df= n-1,查t值表,找出规定的t理论值(见附表)并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为t (df)0.01和t (df)0.05第四步,比较计算得到的t值和理论t值,推断发生的概率,依据表6-15给出的t值与差异显著性关系表作出判断。第五步,根据是以上分析,结合具体情况,作出结论。下面通过两个实例说明如何利用SPSS进行t检验:【例6-6】 某班共有50人,随机抽取20人利用多媒体教学软件进行语文教学试验。在期终考试结束后,得知全班语文考试成绩如表6-16所示,其中前20人分数为参加试验的学生成绩。试通过检验样本平均数与总体平均数之间的差异程度判断该试验的效果。 表6-16 原始数据学好成绩学好成绩学好成绩学好成绩学好成绩17511652166316741812661283225632764280384137223783368437048014772456346544805921569257835634560674166426453664468277017812789376747838881877287838694869990197329673968496310952079306740785065操作步骤:1录入数据定义变量“学号”、“样本”和“全班”,分别录入数据,其中“样本”变量对应的是前20人的语文成绩,“全班”变量对应的是全班50人的语文成绩。2统计分析(1)选择“AnalyzeCompare MeansOne-Sample T Test”命令,弹出“One-Sample T Test”对话框,将“样本”和“全班”选入“Test”框中,对选择的变量进行t检验,如图6-26所示。(2)单击“OK”按钮,提交运行,输出结果如表6-17所示。3结果分析t检验的结果为t值(t)、自由度(df)、双尾显著性概率(Sig.)、均值差异(Mean Difference)和均值差异的95%置信区间(95% Confidence Interval of the Difference)。查t值表(见附表)可知,t(df)0.05=t(19)0.05=2.093,而样本 t = 38.544 t(19)0.05。所以样本与总体之间存在显著差异,样本平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心功能分级及护理
- GB∕T 24353-2022 《风险管理 指南》之4:“5框架”专业深度解读和实践应用培训指导材料(雷泽佳编写-2025C1升级版)
- 少儿校园足球培训
- 罪犯感恩教育专题课件
- 光伏发电运行课件
- 急性肺栓塞的护理
- 钱塘医派经典著作研读
- 14-02拉普拉斯变换的性质章节课件
- 2025年高等数学基础知识水平考核试卷及答案
- 《高等数学》上册课件05-02微积分基本公式
- 北京市2025学年高二(上)第一次普通高中学业水平合格性考试物理试题(原卷版)
- 2025年高考河北卷物理高考真题+解析(参考版)
- 中医老人保健讲座课件
- -2024-2025学年统编版语文二年级下册 期末复习练习题(含答案)
- 2025至2030中国室内滑雪场行业项目调研及市场前景预测评估报告
- 2025四川绵阳市平武县兴帮农业发展集团有限公司招聘10人笔试参考题库附带答案详解
- 西南林业大学《算法分析与设计》2023-2024学年第二学期期末试卷
- 征集和招录人员政治考核表
- 2025年中国融通农业发展有限集团有限公司招聘笔试冲刺题(带答案解析)
- 年中国鹦鹉养殖市场发展策略及投资潜力可行性预测报告
- 弱电工证考试题库及答案
评论
0/150
提交评论