




已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用统计学实验指导书20111115应用统计学实验指导书目录教学实验注意事项4实验一、统计分析软件入门511实验介绍512实验目的513实验内容514实验准备515实验步骤516实验报告要求12实验二、数据的整理与描述性统计分析1421实验介绍1422实验目的1423实验内容1424实验准备1425实验步骤1526实验报告要求19实验三、参数估计与假设检验2031实验介绍2032实验目的2033实验内容2034实验准备2035实验步骤2136实验报告要求26实验四、方差分析2741实验介绍2742实验目的2743实验内容2744实验准备2745实验步骤2746实验报告要求35实验五、相关分析3651实验介绍3652实验目的3653实验内容3654实验准备3655实验步骤3656实验报告要求38实验六、回归分析4061实验介绍4062实验目的4063实验内容4064实验准备4165实验步骤4166实验报告要求49教学实验注意事项为了确保实验顺利进行,达到预定的目的,应做到下列几点一、作好实验前的准备工作1、预习实验指导书,明确本次实验的目的、方法和步骤。2、弄清与本次实验有关的基本原理。3、必须清楚地知道本次实验需记录的数据项目及数据处理的方法,事前作好记录表格。二、遵守实验室的规章制度1、实验时应严肃认真,保持安静。2、爱护设备及仪器,并应严格遵守操作规程,如发生故障应及时报告。3、非本实验所用的设备及仪器切勿任意动用。4、实验完毕后,应将设备和仪器擦试干净,并恢复到原来正常状态。三、认真做好实验1、注意听好教师对本次实验的讲解。2、清点实验所需设备、仪器及有关器材,如发现遗缺,及时向教师提出。3、实验时应有严格的科学作风,认真细致地按照实验指导中所要求的实验方法与步骤逐步进行。4、对于带电或贵重的设备及仪器,在接线或布置后,应请教师检查通过后,才能开始实验。5、在实验过程中,应密切观察实验现象随时进行分析,若发现异常现象,应及时记录总结。6、记录下全部所需测量数据,以及所用仪器的型号及实验室对该仪器的编号及精度、试件的尺寸,量具的量程等。7、教学实验是培养学生动手能力的一个重要环节,因此学生在实验小组中虽有一定的分工,但每个学生都必须自己动手,完成所有的实验环节。8、实验记录需交教师审阅签字,若不符合要求应重做。四、写好实验报告实验报告是实验的总结,通过实验报告的书写可以提高学生的分析能力。因此报告必须由每个学生独立完成,报告要求整洁清楚,要有分析及自己的观点,并进行讨论。一般实验报告应具有下列基本内容1、实验名称,实验日期,实验者及同组人员。2、实验目的。3、实验原理、方法及步骤简述。4、实验所用的设备和仪器的名称、型号、编号、精度及量程等。5、实验数据及其处理实验数据应包括全部的测量原始数据,并注明测量单位。最好以表格的形式,列出数据的运算过程。并根据数据处理和误差分析的要求给出实验误差。6、讨论应根据实验所得的结果及实验中观察到的现象,结合基本原理进行分析讨论,如实验的对象有理论解,则希望能与理论计算结果进行比较。实验一、统计分析软件入门11实验介绍进行统计分析时,涉及到的变量和样本数据很多,计算量很大。靠手工方法进行统计计算是不现实的,不借助于计算机往往难以实现,只有计算机才能快速得到精确的结果。目前使用的统计软件有许多种,在实际工作中应用比较普遍的主要有SPSS、SAS、TSP、EVIEWS、BMDP、TPL、CENTS、DET、SP、SARP、EXCEL、LOTUS123、MATLAB、SPLUS、MINITAB等,这里我们通过实验来熟悉EXCEL和SPSS的基本操作。12实验目的掌握SPSS和EXCEL统计分析工具的启动与退出、数据的输入和保存、数据文件的管理和调用。13实验内容1EXCEL的基本操作1EXCEL的启动以及数据输入输出(包括导入导出)2EXCEL的统计函数的使用3EXCEL的数据分析宏的安装和使用2SPSS的基本操作1SPSS的启动和退出2SPSS的数据输入和修改3SPSS的数据导入4SPSS的数据保存14实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具15实验步骤151EXCEL的基本操作1)EXCEL的启动以及数据输入输出(包括导入导出)打开MICROSOFTOFFICEEXCEL先打开或新建一个EXCEL工作表,单击菜单项【数据】|【导入外部数据】|【导入数据】命令。在弹出来的【选取数据源】对话框中去找到数据所在位置,如图11所示。确定外部数据类型以及位置以后,单击【打开】按钮。以文本外部数据(TXT)导入为例,在上一步单击【打开】按钮以后,我们就能看到在EXCEL中出现了一个【文本导入向导3步骤之1】的对话框。在这里我们直接单击【下一步】按钮。在出现的【文本导入向导3步骤之2】中选择分列数据所包含的分隔符号,在本例中,原始的文本文件中的分隔符号是用“空格”分隔的,所以我们选择【空格】。这时就能在下面的数据预览中看到分列的效果了,然后,单击【下一步】按钮,完成文本文档(TXT)的外部数据导入。在上一步单击【打开】按钮以后,我们就能看到在EXCEL中出现了一个【文本导入向导3步骤之1】的对话框,如图12。在这里我们直接单击【下一步】按钮。在出现的【文本导入向导3步骤之2】中选择分列数据所包含的分隔符号,在本例中,原始的文本文件中的分隔符号是用“空格”分隔的,所以我们选择【空格】。这时就能在下面的数据预览中看到分列的效果了,然后,单击【下一步】按钮。EXCEL中的导出数据功能是通过菜单项【文件】|【另存为】来实现的。图11【选取数据源】对话框图12【文本导入向导3步骤之1】的对话框2)EXCEL的统计函数的使用EXCEL中有很丰富的各类函数,通过菜单项【插入】|【函数】来调用。统计函数是EXCEL函数库的一个组成部分,能实现绝大部分最常用的统计功能(包括描述统计、分布函数、假设检验等等),是非常实用和方便的。统计函数的调用方法是通过菜单项【插入】|【函数】来打开对话框,在对话框中的“选择类别”中选择“统计”,将在列表框中列出所有的统计函数,如图13所示。对于每个函数的功能和输入输出参数,在对话框的下方EXCEL都给出了相关的说明和帮助文档的链接。图13统计函数的调用对话框3)EXCEL的数据分析宏的安装和使用对于统计分析,EXCEL中还提供了实现统计分析的【数据分析】功能。【数据分析】中的内容基本都是与统计相关的,【数据分析】并不是EXCEL安装完后就能从EXCEL的菜单界面中直接找到,它需要加载相关的宏以后才会出现。在安装EXCEL以后,打开菜单项【工具】|【加载宏】,如图14所示,勾选上所需加载实现的功能,点击对话框中的【确定】后,就会在【工具】菜单项中出现已勾选的子菜单项,这时【数据分析】就会出现在【工具】菜单项中。图14【工具】|【加载宏】对话框152SPSS的基本操作SPSS是英文STATISTICALPACKAGEFORTHESOCIALSCIENCE(社会科学统计软件包)的缩写。20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。20世纪80年代以前,SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一个统计分析软件微机版本SPSS/PC,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。SPSS名为社会科学统计软件包,这是为了强调其在社会科学应用的一面因为社会科学研究中的许多现象都是随机的,要使用统计学来进行研究,而实际上广泛应用于经济学、社会学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域。SPSS现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、LOGISTIC回归、PROBIT回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。1)SPSS的启动和退出单击WINDOWS的开始按钮,在程序菜单项SPSSFORWINDOWS中找到SPSS100FORWINDOWS并单击。启动SPSS后,出现SPSS主界面(数据编辑器)。同大多数WINDOWS程序一样,SPSS是以菜单驱动的。多数功能通过从菜单中选择完成。主菜单包括十个菜单项(图15所示)图15SPSS主界面(数据编辑器)FILE“文件”菜单用于新建SPSS各种类型文件,打开一个已存在的文件,从文本文件或其它数据源读入数据。EDIT“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变SPSS默认设置等。VIEW运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标签和改变字体。DATA运用“数据”菜单对SPSS数据文件进行全局变化,例如定义变量,合并文件,转置变量和记录,或产生分析的观测值子集等。TRANSFORM“转换”菜单在数据文件中对所选择的变量进行变换,并在已有变量值的基础上计算新的变量。ANALYZE“分析”菜单在以前版本中为“统计(STATISTICS)”,可进行各种统计分析,包括各种统计过程PROCEDURE,如回归分析、相关分析、因子分析等等。GRAPHS“图表”菜单产生条形图、饼图、直方图、散点图和其它全颜色、高分辨率的图形,以及动态的交互式图形。有些统计过程也产生图形,所有的图形都可以编辑。UTILITIES“工具”菜单可以显示数据文件和变量的信息,定义子集,运行脚本程序,自定义SPSS菜单等。WINDOW“窗口”菜单用于选择不同窗口和最小化所有窗口。HELP“帮助”菜单包含SPSS帮助主题、SPSS教程、SPSS公司主页、统计教练等菜单项。退出SPSS选择数据编辑器的FILE菜单中的EXIT或单击标题栏上的关闭按钮退出SPSS。2)SPSS的数据输入和修改SPSS主界面(数据编辑器)的底部有两个标签DATAVIEW(数据视图)和VARIABLEVIEW(变量视图),它们提供了一种类似于电子表格的方法,用以产生和编辑SPSS数据文件。DATAVIEW用于查看、录入和修改数据,VARIABLEVIEW定义和修改变量的定义。如果使用过电子表格如MICROSOFTEXCEL等,那么数据编辑窗口的许多功能应该已经熟悉。但是,还有一些明显区别(1)列是变量,即每一列代表一个变量VARIABLE或一个被观测量的特征。例如问卷上的每一项就是一个变量。(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件CASE。例如,问卷上的每一个人就是一个观测。(3)单元包含值,即每个单包括一个观测中的单个变量值。单元CELL是观测和变量的交叉。与电子表格不同,单元只包括数据值而不能含公式。(4)数据文件是一张长方形的二维表。数据文件的范围是由观测和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS将数据长方形延长到包括那个单元和文件边界之间的任何行和列。如果要分析的数据还没有录入,可用数据编辑器来键入数据并保存为一个SPSS数据文件(其默认扩展名为SAV)。输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式,步骤如下单击数据编辑窗口中的VARIABLEVIEW标签或双击列的题头VAR,显示如所示的变量定义视图,在出现的变量视图中定义变量。每一行存放一个变量的定义信息,包括NAME、TYPE、WIDTH、DECIMAL、LABEL、VALUE、MISSING、COLUMNS、ALIGN、MEASURE等。如果有许多个变量的类型相同,可以先定义一个变量,然后把该变量的定义信息复制给新变量。具体操作为先定义一个变量,在该变量的行号上单击右钮,在弹出的快捷菜单中选择COPY;然后用鼠标右钮选择多行,弹出的快捷菜单选择PASTE;再把自动产生的新变量名称(如VAR0001、VAR0002、VAR0003、)改为所要的变量名称。定义了所有变量后,单击DATAVIEW即可在数据视图中输入数据,如图16所示。图16数据输入窗口由于各种原因,已经输入的数据往往会有错误,这就需要进行编辑。用WINDOWS的基本操作方式可实现对数据的编辑,例如,可用方向键或鼠标移动到要修改的单元,键入新值。如果数据文件较大且知道要修改的数据单元的行号,可通过选择DATAGOTOCASE打开对话框,在对话框中CASENUMBER的右框输入行号来查找特定观测(行)。如果要查找某变量中的特定值或值标签,选择该变量,再选择EDITFIND或者按CTRLF打开对话框,在SEARCHFOR右框中输入要查找的数值或标签。3)SPSS的数据导入SPSS可以直接读入许多格式的数据文件,选择菜单FILEOPENDATA或直接单击快捷工具栏上的图标,系统就会弹出OPENFILE对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式。在常用的其他类型的数据文件中,比较常用的是TEXT纯文本格式的数据文件TXT与EXCEL数据文件XLS。(注释有的EXCEL文件也可转化为TXT文件类型,再导入SPSS中)由于TXT纯文本的数据文件转换比较常见,因此在FILE的命令菜单就直接具有READTEXTDATA的命令项。选择菜单FILEREADTEXTDATA,系统就会弹出OPENFILE对话框,并自动指向(TXT)文件或者自己选择目录,打开TXT文件。与文本文件的转换相比较,电子表格的转换则方便了许多。FILEOPEN,进入OPENFILE对话框,浏览并找到需要转换的文件“XLS”,选中该文件,双击文件(或点击“打开”按钮)。在对话框的上方给出了文件的路径。“READVARIABLENAMESFROMTHEFIRSTROWOFDATA”询问是否将电子表格文件的第一行读作变量名。默认项是选择。“WORKSHEET”后面的选项,主要对需要转换的工作表格进行选择。“RANGE”则对选定表格需要转换的部分进行选择。假设我们选择首项A2与尾项D8的数据,则定义为A2D811,将A2D8包含的所有数据选择进入即将形成的数据文件。然后点击“OK”即转换完毕。还可以使用数据库查询建立新文件,SPSS可以直接打开许多类型的数据文件,也可以使用ODBCOPENDATABASECAPTURE的数据接口,以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。ODBC数据引擎是独立于各种应用软件,直接安装到WINDOWS系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MSOFFICE)。选择菜单FILEOPENDATABASENEWQUERY,系统会弹出数据库向导的第一个窗口,其中会列出所用机器上已安装的所有数据库驱动程序,选中所需的数据源单击下一步浏览原文件确定下一步一将目标文件拖放置右边的空白界面下一步(向导会一步一步的提示你如何做,直至将数据读入SPSS。4)SPSS的数据保存要保存对前面建立的数据文件进行的任何改变,选择FILESAVE或按CTRLS快捷键即可。如果要把数据文件保存为一个新文件或将数据以不同格式保存,可选择FILESAVEAS,打开对话框。主要的保存类型有SPSSSAV,SPSS100默认格式;SPSS70SAV,SPSS70格式;SPSS/PCSYS,SPSS/PC格式;EXCELXLS,MICROSOFTEXCEL格式;123REL30WK3,LOTUS123V30电子表格文件;等等。16实验报告要求1实验名称,实验日期,实验者及同组人员。2实验目的。3实验原理、方法及步骤简述。4将课程第二章的例1中的数据以文本形式保存后导入到EXCEL和SPSS中,并分别保存为XLS和SAV文件。5说明EXCEL和SPSS中对变量定义的区别。实验二、数据的整理与描述性统计分析21实验介绍统计分析工作是以通过实验或调查收集到数据为起点的,有了统计数据之后,首先要对获取的数据进行系统化、条理化地整理,以提取有用的信息。我们如何能知道其中所包含的信息它们有哪些特点呢,要回答这样的问题,就要先粗略了解数据的基本特点,考虑到数据的代表值,数据的分散程度以及数据的分布形态就需要对数据进行整理,并以恰当的方式进行呈现。方法之一就是统计分组,即根据被研究对象的特征和统计研究的目的,将所得数据进行适当的分组或分类。统计分组最常用的方式就是编制数据次数分布,它可以是任何形式的数据分组或分类;通常用图表的形式呈现出来,即次数分布表和次数分布图。面对数据可以通过基本的统计量来刻画数值结果,而通过次数分布表或次数分布图来直观地了解这些信息。22实验目的分别掌握SPSS和EXCEL进行描述统计分析的功能,能计算给定数据集的平均数等集中趋势指标和方差等变异指标;并能绘制统计图表。23实验内容1使用EXCEL进行描述统计1描述统计2频次分析2使用SPSS进行描述统计1描述统计2频次分析24实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具。实验数据文件21,如下表所示。工人编号加工零件数工人编号加工零件数1106169728417103311018106491199551092010669121857111221068107231019121241051010525961199261051294271071311928128148829111151183010125实验步骤251使用EXCEL进行描述统计1)描述统计选择EXCEL的【工具】|【数据分析】,在对话框中选择【描述统计】,可以看到如图21所示的描述统计对话框。勾选好汇总统计等选项,点击确定后出现描述统计结果。图21描述统计对话框2)频次分析选择EXCEL的【工具】|【数据分析】,在对话框中选择【直方图】,可以看到如图22所示的直方图对话框。在对话框中的【输入区域】选择需要分析的变量,【接收区域】选择设置的分组数字标志,然后根据需要选择输出的内容和位置,点击确定即可。图22直方图对话框252使用SPSS进行描述统计1)描述统计选择【ANALYZE】|【DESCRIPTIVESSTATISTICS】|【DESCRIPTIVES】,就可以打开DESCRIPTIVES对话框,使用实验数据21,如图23所示。其分析结果如表21所示,其中RANGE为全距,MEAN为均值,STDDEVIATION为标准差,SKEWNESS为偏度,KURTOSIS为峰度。图23描述统计分析(含选项)对话框表21描述统计结果DESCRIPTIVESTATISTICSNRANGEMINIMUMMAXIMUMMEANSTDDEVIATIONVARIANCESKEWNESSKURTOSISSTATISTICSTATISTICSTATISTICSTATISTICSTATISTICSTDERRORSTATISTICSTATISTICSTATISTICSTDERRORSTATISTICSTDERROR加工零件数3044008400128001035019110451092215430583VALIDNLISTWISE302)频次分析选择【ANALYZE】|【DESCRIPTIVESSTATISTICS】|【FREQUENCIES】,就可以打开FREQUENCIES对话框,在对话框中的【统计量】和【图表】进行统计量的选取和图形的设置,如图241、图242所示。观察SPSS频次分析结果的频次分布表,发现什么图241频次分析(含统计量选项)对话框图242频次分析(含图表选项)对话框26实验报告要求1实验名称,实验日期,实验者及同组人员。2实验目的。3实验原理、方法及步骤简述。4利用SPSS画出数据集的箱型图和茎叶图。5讨论SPSS在未特别指定的情形下,直方图或频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在一定数目的要求不符。若要求分成5组、加工零件数的最小起点为80、组距为10,然后再进行频次分析,利用SPSS应该如何做呢实验三、参数估计与假设检验31实验介绍统计推断就是根据样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和判断。统计推断的基本内容有参数估计和假设检验两方面。概括地说,研究一个随机变量,推断它具有什么样的数量特征,按什么样的模式来变动,这属于估计理论的内容,而推测这些随机变量的数量特征和变动模式是否符合我们事先所作的假设,这属于检验理论的内容。参数估计和假设检验的共同点是它们都对总体无知或不很了解,都是利用部分观察值所提供的信息,对总体的数量特征做出估计和判断,但两者所要解决问题的着重点的所有方法有所不同。不论社会经济活动还是科学试验,人们做出某种决策之前总是要对许多情况进行估计。例如商品推销人员要估计新式时装可能为消费者所学好的程度,自选商场经理要估计附近居民的购买能力,民意调查机构要估计竞选者的得票率,医药生产部门要推广某种药品的新配方,必须估计新药疗效的提高程度等等。这些估计通常是在信息不完全、结果不确定的情况下做出。参数估计为我们提供一套在满足一定精确度要求下根据部分信息来估计总体参数的真值,并做出同这个估计相适应的误差说明的科学方法。同时在现实生活中,由于我们通常难以完全知道所关心的总体的某些数量特征及其变化情况,因此对总体进行比较研究时,常常需要对目前总体的状况做出某种假设。例如工厂生产某种产品,经过工艺改革,使用新材料、新配方,企业管理者十分关心产品质量是否有所提高,因此可以假设经过改革以后产品质量可能提高或并没有提高。32实验目的掌握参数估计的方法及软件实现;假设检验的基本思路、检验方法及软件实现。33实验内容1使用EXCEL进行参数估计2使用EXCEL进行假设检验3使用SPSS进行假设检验4使用SPSS进行参数估计34实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具35实验步骤351使用EXCEL进行参数估计1)打开菜单项【插入】|【函数】对话框,选择统计函数,找到NORMSINV、TINV两个函数。2)NORMSINV(P)P为给定的标准正态分布的概率值,函数返回标准正态累积分布函数的反函数Z分位数说明如果PROBABILITY为非数值型,函数NORMSINV返回错误值VALUE。如果PROBABILITY1,函数NORMINV返回错误值NUM。3)TINVPROBABILITY,DEGREES_FREEDOMPROBABILITY为对应于双尾T分布的概率;DEGREES_FREEDOM为分布的自由度;函数返回给定概率和自由度下T分布的T值分位数。说明如果任一参数为非数值型,函数TINV返回错误值VALUE。如果PROBABILITY1,函数TINV返回错误值NUM。如果DEGREES_FREEDOM不是整数,将被截尾取整。如果DEGREES_FREEDOMCOMPAREMEANSMEANS(2)用于单独样本的T检验过程检验样本所在总体的均值是否与已知总体的均值相同,ANALYZECOMPAREMEANSONESAMPLETTEST(3)用于独立样本的T检验过程通过对两个来自随机样本的独立样本的均值进行比较,检验两个样本是否来自同一总体。ANALYZECOMPAREMEANSINDEPENDENTSAMPLESTTEST(4)用于配对样本的T检验过程通过对两个配对样本的均值进行比较,检验两个样本是否来自同一总体,数据之间一一对应,适用于单因素两个水平的配对设计。用于检验两个相关的样本是否来自具有相同均值的总体。ANALYZECOMPAREMEANSPAIREDSAMPLESTTEST3检验加工零件数的均值是否为0以实验数据21为例,ONESAMPLETTES对话框如图33所示,检验结果见表。图33ONESAMPLETTEST对话框表31ONESAMPLETTEST检验结果ONESAMPLESTATISTICSNMEANSTDDEVIATIONSTDERRORMEAN加工零件数3010350001045104190809ONESAMPLETESTTESTVALUE10095CONFIDENCEINTERVALOFTHEDIFFERENCETDFSIG2TAILEDMEANDIFFERENCELOWERUPPERONESAMPLESTATISTICSNMEANSTDDEVIATIONSTDERRORMEAN加工零件数183429077350000402574025354使用SPSS进行参数估计1)请仔细观察表31中的结果,我们可以发现在检验的结果中SPSS自动给出了假设检验对象的区间估计的上下限LOWER,UPPER。002)SPSS中的参数估计功能大部分都能通过假设检验来完成,ONESAMPLETTEST可以得到单个独立样本均值的置信区间,INDEPENDENTSAMPLESTTEST和PAIREDSAMPLESTTEST可以在实现两个独立样本和两个配对样本均值的假设检验的同时分别得到对应的样本均值差的置信区间,如图34,35所示。图34INDEPENDENTSAMPLESTTEST结果GROUPSTATISTICS151792743442112171212367326099413G12XNMEANSTDDEVIATIONSTDERRORMEANINDEPENDENTSAMPLESTEST5144803677250015560015123244548674637972492800155600146432543785763EQUALVARIANCESASSUMEDEQUALVARIANCESNOTASSUMEDXFSIGLEVENESTESTFOREQUALITYOFVARIANCESTDFSIG2TAILEDMEANDIFFERENCESTDERRORDIFFERENCELOWERUPPER95CONFIDENCEINTERVALOFTHEDIFFERENCETTESTFOREQUALITYOFMEANSPAIREDSAMPLESSTATISTICS215833106511854175833106801859PAIR1MEANNSTDDEVIATIONSTDERRORMEANPAIREDSAMPLESCORRELATIONS33878000在NUMERICEXPRESSION框中输入数学表达式。4单击OK。5实例31的公式输入为,计算过程如图36所示。125/9081,09508SQRTNORMALIDF图36置信区间的人工计算36实验报告要求1实验名称,实验日期,实验者及同组人员。2实验目的。3实验原理、方法及步骤简述。4用EXCEL和SPSS软件计算每种条件下的参数估计和假设检验。5讨论如何估计样本容量的大小以及如何理解标准误差的含义。实验四、方差分析41实验介绍对两个正态总体进行均值比较,即检验两个样本是否取自同一总体。如果分组样本不止两个,就必须使用方差分析(ANOVAANANALYSISOFVARIANCE)对它们所取自的总体进行均值比较。也就是说方差分析是检验两个总体或多个总体的均值间差异是否具有统计意义的一种方法。方差分析所使用的检验统计量是F统计量,它是方差估计值之比。因此方差分析不是根据用途而是根据分析方法来命名的。42实验目的掌握方差分析的作用、应用范围及软件实现。43实验内容1样本分布的正态性检验2非参数检验之KS检验3使用EXCEL进行方差分析4使用SPSS进行方差分析44实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具45实验步骤利用F统计量进行方差分析时,有几个前提条件需要满足在各个总体中因变量都服从正态分布;在各个总体中因变量的方差都相等;各个观测值之间是相互独立的。因此在方差分析之前需要进行分布的检验、方差齐次(原假设和统计量见图41)的检验。图41方差齐次检验的相关信息同时根据影响因素的多少又分为了单因素和双因素方差分析。【实例41】为了行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表41表414个行业的一年的客户投诉次数观测值零售业旅游业航空公司家电制造业15768314426639495134929216544045347753456405865351744451使用EXCEL进行方差分析1样本分布的正态性检验在EXCEL中没有直接进行非参数检验的功能,那么如何检验数据集的正态分布性呢首先可以将数据集用直方图显示出来,观察图形的大致轮廓。利用数据分析的描述统计功能得到峰度系数、偏度系数,通过这两个系数进行判断,见图42(以实例21的数据为例)。峰度为0表示与正态分布相同,峰度大于0表示比正态分布陡峭,小于0表示比正态分布平坦。偏度接近0则可认为分布是对称的,正态分布的偏度为0。图42EXCEL的【数据分析】|【描述统计】结果中的峰度、偏度系数2EXCEL中双样本方差的F检验打开EXCEL中【工具】|【数据分析】,点击选项【F检验双样本方差】出现如图43所示的对话框,根据对话框的提示和要求输入相关信息。在计算F值时,总是以样本方差大的作分子,这样就使F1。因此一般选择方差大的变量为变量1。图43EXCEL中【工具】|【数据分析】|【F检验双样本方差】以实例41中的零售业和旅游业的投诉次数为例,进行方差齐次检验,结果如图44所示。P值005,不能拒绝原假设。图44EXCEL的方差齐次检验结果3)单因素方差分析打开EXCEL中【工具】|【数据分析】,点击选项【单因素方差分析】出现如图45所示的对话框,根据对话框的提示和要求输入相关信息。使用实例41的数据进行单因素方差分析,其结果如图46所示,其中P值为00388,PF34903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;FC2100846F32592,不拒绝原假设H0,说明无证据表明销售地区对彩电的销售量有显著影响。图47EXCEL中无重复双因素方差分析结果452使用SPSS进行方差分析1)非参数检验之KS检验单样本KS检验用于检验一组样本观察结果的经验分布同某一指定的理论分布之间是否一致。目前它只能检验正态分布、均匀分布、泊松分布和指数分布,其他的分布需要采用其他的检验方法。KS检验的基本思路为将顺序分类数据的理论累积频率分布同观测的经验分布累积频率分布加以比较,求出它们最大的偏离值,然后在给定的显著性水平上检验这种偏离值是否是偶然出现的。它提出的假设如下原假设为经验分布与理论分布没有显著差异;备择假设为经验分布与理论分布有显著差异。KS检验根据Z值作出判断。打开相关数据文件,此处打开CHA6文件。选择【分析】|【非参数检验】|【1样本KS】。从左侧的变量列表框将需分析的变量选入检验变量列表。在检验分布框中选常规(正态分布)。以实例41中的变量“投诉次数”为例,检验“投诉次数”是否为正态分布,经KS检验后,结果见图48,Z0323大于005,不能拒绝原假设。DESCRIPTIVESTATISTICSNMEANSTDDEVIATIONMINIMUMMAXIMUM投诉次数234787137592177ONESAMPLEKOLMOGOROVSMIRNOVTEST投诉次数N23MEAN4787NORMALPARAMETERSA,BSTDDEVIATION13759ABSOLUTE067POSITIVE064MOSTEXTREMEDIFFERENCESNEGATIVE067KOLMOGOROVSMIRNOVZ323ASYMPSIG2TAILED1000图48SPSS中的KS检验结果2)单因素方差分析SPSS中的方差分析会自动进行方差齐次检验,所以不需单独检验方差的齐次性。选择【分析】|【比较均值】|【单因素方差分析】,以实例41为例说明,将“投诉次数”选入因变量列表,“行业”选入因子框。见图49所示。图49SPSS中的单因素方差分析对话框选择进行各组间两两比较的方法。在“假定方差齐性”下选择LSD法进行两两比较。继续。在“选项”对话框中选择“描述性”、“方差同质性检验”、“均值图”,继续。完成设置后,点击确定,执行单因素方差分析,得到输出结果,如图410所示。图410SPSS中的单因素方差分析结果3)双因素方差分析选择【分析】|【一般线性模型】|【单变量】。以教材中方差分析一章的例4进行无重复双因素方差分析为例说明,选择“销售量”作为因变量,“地区”、“品牌”作为固定因子。在“模型”中选择“设定”,类型为主效应,模型为地区、品牌。若选择“全因子”,将对所有因素的主效应及交互效应进行分析,即为可重复方差分析。在“对比”中选择“简单”方式比较,在“两两比较”中,将地区和品牌均选入两两比较检验,假定方差齐性中选择LSD法,最后在“选项”中选择“描述统计”和“方差齐性检验”,显著性水平为默认值005。完成设置后,点击确定,执行多因素方差分析,得到输出结果,如图411所示。图411SPSS中双因素方差分析结果46实验报告要求1实验名称,实验日期,实验者及同组人员。2实验目的。3实验原理、方法及步骤简述。4用EXCEL和SPSS软件完成单因素方差分析、无重复双因素方差分析、可重复双因素方差分析。5讨论EXCEL和SPSS在进行数据分析时,对于输入变量的定义是否一样在方差分析时,EXCEL和SPSS使用的数据格式是否一致6)讨论SPSS中对正态分布的检验除了非参数检验方法以外还可以使用哪些方法实验五、相关分析51实验介绍一般来说现象之间的相互关系可以分为两种,一种是函数关系,另一种是相关关系。函数关系是指变量之间存在的相互依存的关系,它们之间的关系值是确定的。相关关系是两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。两变量的相关分析就是研究两变量间线性相关程度并用适当的统计指标表示出来的一种常用统计方法。按相关的程度分,有完全相关、不完全相关和不相关;按相关的性质分,有正相关和负相关。相关系数是测定变量之间线性相关程度和相关方向的代表性指标。52实验目的掌握相关分析的原理和多种相关系数的软件计算方法。53实验内容1使用EXCEL进行相关分析2使用SPSS进行相关分析54实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具55实验步骤实例51观察国民可支配收入与储蓄存款之间的关系。数据见表51。表5120002009年国民可支配收入与储蓄存款余额国民可支配收入储蓄存款余额年份(亿元)X(亿元)Y20005228200127292002293220033232200434342005363220063533200739372008423920094542合计344338551使用EXCEL进行相关分析打开EXCEL,执行【工具】|【数据分析】|【相关系数】,出现如图51所示的对话框。图51EXCEL中的PEARSON相关系数对话框在输入区域中选中所需分析的数据区域,分组方式可采用逐列或逐行,任意指定一个输出区域,点击确定,即可计算出相关系数。点击【插入】|【图表】,选择XY散点图,完成相应设置后即可得到散点图,可以直观的观察两个变量之间的线性相关关系,以表51中的数据为例,得到散点图52。图52EXCEL所画散点图数据来自表51552使用SPSS进行相关分析打开已保存好的数据文件,以表51的数据为例,先对各组数据进行正态分布检验,判断是否满足简单线性相关分析的前提假设。选择菜单项【分析】|【相关】,点击三个选项中的“双变量”,打开相关分析对话框,如图53所示。将需要分析的变量选入右侧列表框。设定相关系数类型为PEARSON相关系数。显著性检验选择双侧检验,并标记显著性相关。对于“选项”框中勾选“均值和标准差”,将在输出中显示其数值;设置缺失值的处理方法,在分析过程中遇到缺失值时将按选择的方案处理。做完相应设置后,点击“确定”,即得到输出结果,见图54所示。图53SPSS中的相关分析对话框图54SPSS中的相关分析结果(数据来自表51)56实验报告要求1实验名称,实验日期,实验者及同组人员。2实验目的。3实验原理、方法及步骤简述。4讨论在SPSS的相关分析对话框中除了PEARSON外还有两个选项,这两个选项代表的相关系数是什么含义,其分析后的输出结果与PEARSON系数是相同的吗实验六、回归分析61实验介绍在实际问题中,我们常常要研究两个变量之间的联系,例如汽车生产数量Y与所需车轮数量X之间的关系,某产品的价格X与社会对该产品的需求Y之间的关系,人的身高X与体重Y之间的关系,家庭收入X与消费支出Y之间的关系等等。这些变量之间的关系可以分为两类函数关系(确定性关系)和相关关系(随机性关系)。如果给定解释变量X的值,被解释变量Y的值就唯一地确定了,那么Y与X的关系就是函数关系,即YFX。例如,生产一辆汽车要配四个车轮,只要知道了汽车的生产数量X,所需的车轮数量Y也就唯一地确定了,其函数关系式为Y4X。如果给定了解释变量X的值,被解释变量Y的值不是唯一的,Y与X的关系就是相关关系,例如,身高与体重的关系是很密切的,但已知某人的身高X,我们无法确切地推断出他的体重。这是因为,身高不是决定体重的唯一因素,从而身高相同的人未必体重一样。因此身高与体重的关系就是相关关系。研究变量之间相关关系密切程度的分析叫相关分析。如果在研究变量之间的相关关系时,把其中的一些因素作为所控制的变量(自变量),而另一些随机变量作为它们的因变量,这种关系分析就称为回归分析。一元线性回归主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。线性回归模型建立前的假定为1变量间存在着实质的线性关系;2误差项的期望值为0;3误差项的方差为常数;4误差项之间不存在序列相关关系;5自变量与误差项不相关;6误差项服从正态分布,因此需要对建立好的模型进行检验。对于任何的一组样本都可以用最小二乘法建立起一个线性回归模型,相应的就可以得到一条回归直线,但这样的一条回归直线并不总是有意义的。只有当变量X与Y之间确实存在某种因果关系是,其回归直线才有意义。一元回归模型回归系数的显著性检验采用T检验,回归方程的显著性检验采用F检验。多元线性回归显著性检验分两步走,一是对模型的显著性检验,二是对每个变量XI对Y影响的显著性检验,对那些影响不显著的变量应逐个剔除,重新建立新的统计模型。62实验目的掌握回归分析的方法,能够利用统计软件实现对具体问题的分析,以及正确解释回归分析结果。63实验内容1使用EXCEL进行一元线性回归分析和多元线性回归分析2使用SPSS进行一元线性回归分析和多元线性回归分析64实验准备电脑、SPSS170FORWINDOWS、EXCEL数据分析工具65实验步骤实例61请用多元回归模型分析国内旅游收入与国内旅游人数、城镇居民人均旅游支出、农村居民人均旅游支出、公路里程、铁路里程之间是否存在关系表6110年来国内旅游收入与旅游人数、旅游支出等相关因素的数据编号国内旅游收入(亿元)国内旅游人数城镇居民人均旅游支出(元)农村居民人均旅游支出(元)公路里程(万公里)铁路里程(万公里)NYX1X2X3X4X51102355240041475491117859213757629004646151157597316384639005341705118586494211276440059981457122646652391269450607197127856646283197190062482495135176747317557440067862266140276878352247840070832127169870193878487800739720911765271910344238700068492001809873651使用EXCEL进行回归分析1)一元线性回归分析打开已保存好的数据文件,以表51的国民可支配收入和储蓄存款余额的数据为例。点击菜单项【工具】栏下,选择【数据分析】|【回归】,打开一元线性回归分析对话框,如图61所示。设置自变量和因变量的输入区域,选择好输出区域,残差项中可根据需要自行选择选择,正态分布中选择正态概率图,点击【确定】即可得到相应的回归分析输出结果,输出结果(未包括拟合等图形)见图62所示。根据输出结果,判断所建立的回归模型是否通过了检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家具建材店管理制度
- 库房零库存管理制度
- 应急局资金管理制度
- 彩票站安全管理制度
- 徐州金螳螂管理制度
- 德克士餐饮管理制度
- 快递错分件管理制度
- 总公司资产管理制度
- 总经理司机管理制度
- 意大利电源管理制度
- 直播间货盘管理制度
- 2025至2030中国心脏电生理标测、导航和记录设备行业发展趋势分析与未来投资战略咨询研究报告
- 2025年重庆市中考道德与法治试卷真题(含标准答案)
- 2025年中国融通商业服务集团所属单位招聘笔试冲刺题(带答案解析)
- 妇女儿童之家管理制度
- 三门峡市县以下事业单位联考招聘考试真题2024
- 2025年上半年山东铁投集团校园招聘社会公开招聘165人笔试参考题库附带答案详解
- 2025年货运司机从业资格考试试卷及答案
- 安徽省合肥一中2025届高三5月回归教材读本 解答
- 低碳智慧建筑技术创新发展白皮书2024(运行管理篇)
- 五朵金花抗抑郁药
评论
0/150
提交评论