SPSS上机指导书.doc

上传人：过*** IP属地：江西上传时间：2020-01-17 格式：DOC 页数：36 大小：4.29MB 积分：12 举报 版权申诉

免费预览已结束，剩余31页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

SPSS软件上机指导书北京交通大学经济管理学院前言SPSS（Statistics Package for Social Science）社会科学统计软件包是世界著名的统计分析软件之一。20世纪60年代末，由美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS。20世纪80年代以前，SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一个统计分析软件微机版本到今，已推出9个语种版本，应用于自然科学、技术科学、社会科学的各个领域，如经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。世界上许多有影响的报刊杂志对SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。SPSS for Windows是一个组合式软件包，它集数据整理、分析功能于一身。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类，每类中又分好几个统计过程，比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程，而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统，可以根据数据绘制各种图形。SPSS for Windows的分析结果清晰、直观、易学易用，而且可以直接读取EXCEL及DBF数据文件，它和SAS、BMDP并称为国际上最有影响的三大统计软件。和国际上几种统计分析软件比较，它的优越性更加突出。在国际学术界有条不成文的规定，即在国际学术交流中，凡是用SPSS软件完成的计算和统计分析，可以不必说明算法，由此可见其影响之大和信誉之高。SPSS for Windows操作简单，它使用Windows的窗口方式展示各种管理和分析数据方法的功能，使用对话框展示出各种功能选择项，只要掌握一定的Windows操作技能，粗通统计分析原理，就可以使用该软件为特定的科研工作服务。目录上机1：描述统计3一、上机目的3二、上机要求3三、上机演示内容与步骤3四、上机1报告概要14上机2：统计图的绘制14一、上机目的14二、上机演示内容与步骤14三、上机2报告概要18上机3：点估计与区间估计19一、上机目的19二、上机演示内容与步骤19上机4：相关分析27一、上机目的27二、上机演示内容与步骤演示27上机5：回归分析31一、上机目标31二、上机要求31三、上机演示内容与步骤31上机1：描述统计一、上机目的1学会应用两种以上的方法完成描述统计学所学的统计量的计算程序；如列出数据的频数分布表；计算算术平均数、中位数、众数；计算全距、四分位差、标准差、方差等。2能够完成统计图的绘制（主要包括直方图、曲线图、饼形图、茎叶图）；3能够撰写出规范的描述统计分析报告。二、上机要求1前20分钟，主讲老师通过例题演示描述统计方法的应用；2中间70分钟，学生仿照演示题，独立做一个练习题目；期间老师课堂巡视，随时解决学生提出的问题；3后20分钟，每位同学将自己的计算结果，以Word形式，撰写成统计分析报告，老师给出是否合格的评价。4在完成练习题的时候，鼓励学生之间相互交流探讨；5鼓励学生尝试发现软件的新功能。三、上机演示内容与步骤下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”，该文件包含某公司员工的工资、工龄、职业等变量，我们将利用此例题给出相关的描述统计说明，本例中，我们将以员工的当前工资为例，计算该公司员工当前工资的一些描述统计量，如均值、频数、方差等描述统计量的计算。计算各项描述统计量值的程序使用步骤如下：步骤1：用SPSS打开已知的数据文件选择菜单“FileOpenData”，在对话框中找到需要分析的数据文件“SPSS/Employee data”，然后选择“打开”。打开的数据文件显示如下：步骤2：计算所要求的描述统计量值及频数分布频数就是一个变量在各个变量值上取值的个案数。如要了解公司员工的薪水情况，需要知道所有员工薪水状况，以及在每个薪酬水平上有多少个员工，这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段，它可以使人们非常清楚地了解变量取值的分布情况。1打开文件之后，选择菜单“AnalyzeDescriptive StatisticsFrequencies”。见下图。出现如下窗口之后，按后面的说明进行选项。2确定所要分析的变量本例中假设要分析的变量是雇员的当前工资（Current Salary）。此时，要在“Frequencies对话框”中选中左侧列表框中的“Current SalarySalary”，之后点击列表框中间的箭头按钮，将变量Current Salary加入到右侧Variable(s)列表框中。然后，选择位于小窗口下端的“Display frequency tables复选框”，以确定要输出频数分布表。3选择所要计算的统计量在变量选择确定之后，在同一窗口上，点击“Statistics”按钮，打开统计量对话框，如下图所示，选择统计输出选项。4选项说明（1）Percentile Values 栏Quartiles：显示25%，50%，75%的四分位数值在Cut points for _equal groups小框内，输入整数k时，表示将所选变量的数值从小到大划分为k等分，并将输出各等分点处的变量数值在Percentile(s)右边的小框内，键入0100间的一个数之后，单击Add按钮添加到下面的方框内，此操作过程可以重复。例如输入15，55，85时，输出结果将会显示15%，55%，85%百分位处的变量值。单击Change和Remove按钮可以修改或删除框内的数值（2）Dispersion（离中趋势）栏各统计量符号表示如下：Std deviation 标准差；Minimum 最小值；Variance 方差；Maximum 最大值；Range 极差（3）Central Tendency（集中趋势）栏各统计量符号表示如下：Mean 均值（算术平均数）；Mode 众数；Median 中位数；Sum 总和（4）Distribution（分布特征）栏各统计量符号表示如下：Skewness 偏度；Kurtosis 峰度步骤3：结果输出与分析点击Frequencies对话框中的“OK”按钮，即得到下面的结果。（1）Statistics（统计量）汇总表从Statistics表中可以清楚的看到当前薪水（Current Salary）的各项描述统计量的数值，这些数值是按我们上一步选定的计算统计量的要求而计算的。我们可以看出，要求计算的均值、众数、标准差、方差等都在其中，分别为$34419.6、$30750、$17075.7、$2.9E+08。（2）Frequencies（频数）分布表从Frequencies表中可以清楚的看到在不同薪酬档次上员工的人数、所占比例。例如，薪水为$15250的员工有1人，占所有员工的0.2%。本处，没有对结果进行详细说明，希望同学们要学会解释所计算的结果。到此为止，有关描述统计量与频数分布的spss计算步骤演示完毕。下面我们给出另一种计算程序，希望同学们也熟练掌握。描述统计数据探索（Explore）方法调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探索分析。它在一般描述性统计指标的基础上，增加有关数据其他特征的文字与图形描述，显得更加细致与全面，对数据分析更进一步。探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。一般以图形方式输出，直观帮助研究者确定奇异值、影响点、还可以进行假设检验，以及确定研究者要使用的某种统计方式是否合适。步骤1: 在打开的数据文件上，选择如下命令：选择菜单“AnalyzeDescriptive StatisticsExplore”，打开Explore对话框。步骤2: 确定所要计算的变量及描述统计量假定我们仍然研究的是前面给出的例题，想给出同样的计算结果。操作步骤如下：（1）选择要研究的变量。从左侧源变量清单中选择“当前工资（Current Salary）”移至Dependent List（因变量）框中，若此时单击OK，即可获得所有系统默认的选项下作出的描述统计量的结果。（2）对数据分组。若想对数据先分组，然后再计算该变量的相关描述统计量时，则应从左侧源变量清单中选择一个或几个分组变量移至Factor List（因素）框，本例中，选择的分组变量是“雇员类别（Employment Category）”，若此时单击OK，即可获得因变量按各分组变量进行的各项系统默认的分组探索结果。（3）选择想要计算的描述统计量。在出现如下小对话窗口（Explore:Statistics）后，需要进行选项，以说明对选择好的变量要计算的是哪些描述统计量值。其各项选择说明如下。Descriptives：选择该选项则一次性地输出所有的描述统计量值，如算术平均值、中位数、众数、5%调整平均数、标准差、极差、方差等。因此不必逐一选择各个描述统计量其他项目简单说明如下：Confidence Interval for Mean将显示总体均值的95%置信区间，95%为系统默认的置信概率。取值范围为199。M-estimators：输出稳健极大似然估计量Outliers：输出5个最大和最小的观测值Percentiles：输出5%,10%,25%,50%,75%,90%,95%的百分位数（4）对所要计算的变量的频数分布及其统计量值作图打开“Plots对话框”，出现如下图形。对有关的部分选项说明如下： Boxplots（箱图）选项栏Factor levels together：将每个因变量对于不同分组的箱图并列显示，利于比较各组在因变量同一水平上的差异Dependents together：所有因变量生成一个箱图，这样可以比较分组变量同一水平上各个因变量值的分布情况None：表示不显示箱图 Descriptives栏Stem-and-leaf：显示茎叶图Histogram：显示直方图选中Normality plots with tests框中输出显示正态分布图形，同时输出KolmogorovSmirnov统计量中的Lilifors显著性水平 Spread vs. Level with Levene Test框输出散布层次图，其中包括回归直线斜率以及方差齐次性的Levene检验。如果没有指定分组变量，那么此选项无效，其中：None：表示不生成散布层次图Power estimation：转换幂值估计，表示对每一组数据产生一个中位数范围的自然对数与四分位范围的自然对数的散点图Transformed：对原始数据进行转换，由用户在Power下拉框中指定幂变换使用的幂值，Power下拉框共有：三次方（Cube）、平方（Square）、平方根（1/Square root）、取对数（Logarithm）等Untransformed：不对原始数据进行转换步骤3: 结果的输出与说明（1）Case Processing Summary表在Case Processing Summary表中可以看出Clerical个案363，Custodial个案27，Manager个案84，均无缺失值。（2）Descriptives表Descriptives表是Current Salary变量的分组描述统计结果。表的第一部分是Clerical薪水的统计，其中包括均数$27838.5，均数的标准误为$397.217，均数的95%置信区间为$27057.4$29619.7，5%修正均数为$27290.5，中位数为$26550.0，方差为5.7E+07，标准差为$7567.99，最小值为$15750，最大值$80000，全距为$64250，四分位全距为$8400.00，偏度系数为1.905，偏度系数的标准误为0.128，峰度系数为7.977，峰度系数的标准误为0.255。表的下面部分分别是Custodial和Manager的统计信息。（3）不同职位员工薪水直方图显示（4）茎叶图描述茎叶图自左向右可以分为3大部分：频数（Frequency）、茎（Stem）和叶（Leaf）。茎表示数值的整数部分，叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽（Stem Width），即茎叶所表示的实际数值的近似值。上面是Clerical的茎叶图。该图最后一行表示两个个案。以第一行数据为例，频数为2，茎为1，叶为0.5，茎宽为10000，表示有两个个案的薪水为1.510000=15000。Custodial和Manager的茎叶图在此省略。（5）箱图图中红色区域的方箱为箱图的主体，上中下3条线分别表示变量值的第75、50、25百分位数，因此变量的50%观察值落在这一区域中。方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线，上端截至线为变量的最大值，下端截至线为变量的最小值。四、上机1报告概要1. 指明所计算各个结果的统计含义；2. 依据所计算的统计结果，撰写描述统计的分析报告；上机2：统计图的绘制SPSS绘图功能很强，能绘制许多统计图形，这些图形既可以在统计分析过程中产生，也可以直接由Graphs图形菜单中所包含的一系列选项来实现。一、上机目的1. 学会利用统计图把统计资料所反映的数量变化趋势、分布状态和相互关系等情况形象直观地表现出来；2. 学会对所制作的统计图进行阅读、比较和分析，从中发现数据所反映的社会经济现象与规律；3. 要求掌握制作条形图、饼图、直方图、曲线图的方法；二、上机演示内容与步骤下面采用的数据文件同前例题，它是来自SPSS软件自带的数据文件Employee.data”，该文件包含某公司员工的工资、工龄、职业等变量，我们利用该数据文件学习统计图的绘制。步骤1：用SPSS打开已有的数据文件选择菜单“FileOpenData”，在对话框中找到需要分析的数据文件“SPSS/Employee data”，并“打开”。步骤2：绘制条形图（Bar Charts）作图要求：以该数据为例，先按员工教育水平分类（教育水平是按接受教育的年限为主的），然后在分好的类别中，再按员工职业类别分类（经理、保管员、服务员），最后计算各种类别人员的平均工资水平并绘制条形图。作图步骤如下：（1）打开文件并选择绘制条形图选项。选择菜单“GraphsBar”，打开Bar Charts（条形图）选择对话框，见下图。出现下图所示之后，选择合适的命令选项，各项命令选项说明如下：（2）命令选项的选择条形图形状的选择条形图图标说明l Simple：将各类别数值用平行且等宽的条形简单地并列在一起的图形。l Clustered：有两种以上分类的数据显示方式，首先将数据分为第一类，然后各类数据再进一步细分为第二类，并用两个以上的条形图并列来分别表示。l Stacked（分段条形图）：有两种以上分类的数据显示方式，首先将数据分为第一类，然后各类数据再进一步细分为第二类。作图时，以条形的全长代表分成的第一大类别，条形内部各段的长短代表第二类别的组成部分，各段之间是用不同的线条或颜色表示。计算数据统计量的方式选择Data in Chart AreSummaries for groups of cases：先对所有数据分类，然后对每类创建条形图Summaries of separate variables：对每个变量创建条形图Values of individual cases：对每个数据创建条形图（3）条形图变量及参数选择在Bar Charts对话框中选定条形图类型后，单击Define按钮，打开条形图变量及参数选择对话框（1）Category Axis：表示坐标轴上的分组变量（第一次分类的变量）。（2）Define Clusters by：第二次分类的变量（3）Bars Represent：确定条形图所显示的数值。有如下选项可供选择： N of cases：显示总的观测值数% of cases：分组个数所占的比例Cumulative n of cases：累计频数（按个数统计）Cumulative % of cases：累计频率（按比例统计）Other summary function：其他描述统计量（4）条形图输出Graph表显示出了按照职位和教育程度分类，员工薪水的均值情况。例如，在受教育15年这个水平上，Clerical薪水均值为30000，Custodial薪水均值为25000，Manager薪水均值为48000。步骤3：绘制饼形图（Pie Charts）饼形图是以整个圆的面积代表被研究对象的总体，按各组成部分占总体比重的大小把圆面积分割成若干扇形，用以表示现象的部分对总体的比例关系的统计图。想通过饼形图（Pie Chars）来了解该公司各员工类别在公司总人数中所占的比例，员工类别构成比例。作图步骤如下：（1）打开已有数据文件并选择绘制饼形图命令选项选择菜单“GraphsPie”，打开Pie Charts选择对话框。见下图，（2）命令选项的选择选项说明Data in Chart Are（图中数据的描述）Summaries for groups of cases：根据分组变量先对所有个案进行分组，然后对分组个案创建饼形图Summaries of separate variables：对每个变量创建饼形图Values of individual cases：对每个个案创建饼形图（3）饼形图变量及参数选择 Slices Represent：确定扇形片的代表含义。有如下选项： N of cases：总观测值% of cases：分组个数所占的比例Cumulative n of cases：累计频数Cumulative % of cases：累计频率Other summary function：其他统计量 Define Slices by：确定扇形片代表的分类变量（4）输出饼形图由饼形图可以看出，Clerical占了所有员工的75%多，Manager大概占了18%，其余为Custodial。步骤4：绘制交互式条形图（Interactive Bar）作图说明，想了解该公司接受不同教育年限的人数分布情况、了解不同性别平均收入水平情况，并通过交互式条形图加以显示。（1）打开文件并调用交互式条形图绘制选项选择菜单“GraphsInteractiveBar”，打开Create Bar Chart（创建条形图）对话框。在本例中，将Count变量拉入纵坐标轴，将Educational Level变量拖入横坐标轴。（2）创建交互式条形图l Assign Variables：用于设置变量和图类型l Bar Chart Options：条形图选项l Error Bars：误差条图l Titles：标题选项l Options：选项（3）交互式条形图输出从图中可以看出，在各个教育水平上的人数。在图中可以看出女性平均收入为$28032，男性平均收入为$41442。（五）曲线图（Line Charts）曲线图又称线图，是用线段的升降来说明现象变动情况的一种统计图，主要用于表示现象在时间上的变化趋势、现象的分配情况和现象间的依存关系等。1曲线图绘制选择菜单“GraphsLine”，打开Line Charts（线图）选择对话框。2，选项说明三、上机2报告概要请作出下列图形，数据资料见下：答案标题：婴儿母乳与配方奶日摄入量日时间：2:10 5:30 9:20 12:00 15:30 19:10 21:05 23:50母乳配方摄入量：60/50 80/30 70/40 70/30 50/60 70/30 80/30 60/50资料来源：婴儿健康指南，2003年。上机3：点估计与区间估计一、上机目的1.熟悉点估计概念与操作方法；2.熟悉区间估计的概念与操作方法；3.学会进行总体均值、总体比率的区间估计。二、上机演示内容与步骤下面将学习“总体方差未知，置信度为95下的区间估计”与“两个总体均值之差的区间估计（总体方差未知且不等）”等4种情形的操作。情形1：总体方差未知，置信度为95下的总体均值的区间估计例题：为研究在黄金时段中,即每晚8:30-9:00内,电视广告所占时间的多少。美国广告协会抽样调查了20个最佳电视时段中广告所占的时间（单位：分钟）。请给出每晚8:30开始的半小时内广告所占时间区间估计，给定的置信度为95。操作程序：步骤1：打开SPSS，按如下图示格式输入原始数据，建立数据文件：“电视广告所占时间.spss”。这里，time表示电视广告所占时间的变量。步骤2：选择区间估计选项，方法如下：（1）采用“数据探索”过程选择菜单“AnalyzeDescriptive StatisticsExplore”，打开Explore对话框。（2）变量选择从源变量清单中将“time”变量移入Dependent List框中。（3）确定输出选项单击上图右下方的“Statistics”按钮打开“Explore:Statistics”对话框。在Confidence Interval for Mean:的选项中，键入95，表示计算选择的置信区间。完成后单击“Continue”按钮回到Explore窗口。（4）结果输出单击上图中“OK”按钮，输出结果如下表所示。步骤3：计算结果简单说明如上表显示。从上表“ 95 Confience Interval for Mean ”中可以得出，每晚8:30开始的半小时内广告所占时间区间估计（置信度为95）为：(6.2705，6.7795)，其中lower Bound表示置信区间的下限，Upper Bound表示置信区间的上限。点估计是：6.5250。情形2：两个总体均值之差的区间估计（总体方差未知且不等）的情形例题：The Wall Street Journal（1994,7）声称在制造业中，参加工会的妇女比未参加工会的妇女的报酬要多2.5美元。想通过统计方法，对这个观点是否正确给出检验。假设抽取了15位女性工会会员与20位非工会会员女性报酬数据。要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计，预设的置信度为95。步骤1：打开SPSS，按如下图示格式输入原始数据，建立数据文件：“工会会员工资差别.spss”。这里，“会员”表示是否为工会会员的变量，y表示是工会会员，n表示非工会会员，“报酬”表示女性员工报酬变量，单位：千美元。步骤2：计算两总体均值之差的区间估计，采用“独立样本T检验”方法。选择菜单“ Analyze Compare Means Independent-Sample T Test”，打开Independent-Sample T Test对话框。2变量选择（1）从源变量清单中将“报酬”变量移入Test Variable(s)框中。表示要求该变量的均值的区间估计。（2）从源变量清单中将“会员”变量移入Grouping Variable框中。表示总体的分类变量。步骤3：定义分组单击Grouping Variable框下面的Define Groups按钮，打开Define Groups对话框。在Group1中输入y，在Group2中输入n（y表示工会会员，n表示非工会会员）。完成后单击“Continue”按钮回到Independent-Sample T Test窗口。步骤4：计算结果单击上图中“OK”按钮，输出结果如下图所示。5输出结果分析如上图所示，一共有两个表。（1）Group Statistics（分组统计量）表分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出，参加工会的妇女平均报酬为17.5367，不参加工会的妇女平均报酬为15.3600。（2）Independent Sample Test（独立样本T检验）表Levenes Test for Equality of Variance，为方差检验，在Equal variances assumed（原假设：方差相等）下，F=0.411，因为其P-值大于显著性水平，即：Sig.=0.5260.05，说明不能拒绝方差相等的原假设，接受两个总体方差是相等的假设。T-test for Equality of Means为检验总体均值是否相等的t检验，由于在本例中，其P-值小于显著性水平，即：Sig.=0.005 Compare Means One-Sample T Test”，打开One-Sample T Test对话框。（2）变量选择从源变量清单中将“产品数量”向右移入“Test Variables”框中。在“Test Value”框里输入一个指定值（即假设检验值，本例中假设为120），T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。“One-Sample T Test”（3）结果输出单击窗口中“OK”按钮，输出结果如下图所示。3输出结果分析如上图所示，一共有两个表。（1）“One-Sample Statistics”（单个样本的统计量）表分别给出样本的容量、均值、标准差和平均标准误。本例中，产品数量均值为118.9000。（2）“One-Sample Test”（单个样本的检验）表表中的t表示所计算的T检验统计量的数值，本例中为0.705。表中的“df”，表示自由度，本例中为9。表中的“Sig”（双尾T检验），表示统计量的P-值，并与双尾T检验的显著性的大小进行比较：Sig.=0.4980.025，说明这批样本的平均产量与120无显著差异。表中的“Mean Difference”，表示均值差，即样本均值与检验值120之差，本例中为1.1000。表中的“95 Confidence Internal of the Difference”，样本均值与检验值偏差的95%置信区间为（4.628，2.428），置信区间包括数值0，说明样本数量与120无显著差异，符合要求。情形4：两总体均值相等的假设检验（两总体标准差未知但相等）例子：为节约系统分析员对某信息系统设计、开发、实现所需的时间而开发了一个计算机软件包。为评价新软件包的作用，随机地抽取24名系统分析员并平均分为两组，一组采用当前软件包，一组使用新软件包，对他们使用软件来开发某信息系统所花费的时间调查如下表。是否可以说新软件缩短了研发时间？步骤1：判断检验类型该例题属于两个正态总体标准差未知但相等时，均值的检验(双侧检验)，假设为：，：。步骤2：上机程序（1）独立样本的T检验首先打开已有数据文件，然后选择菜单。“AnalyzeCompare MeansIndependent-Sample T Test”，打开Independent-Sample T Test对话框。（2）选择所要检验的变量从源变量清单中选择数值型变量“数值”移入Test Variable(s)框。选择分组变量“类别”移入Grouping Variable框中。步骤4：计算结果说明（3）结果输出单击“OK”按钮，输出结果如下图所示。3输出结果分析如上图所示，一共有两个表。（1）Group Statistics（分组统计量）表分别给出样本的容量、均值、标准差和平均标准误。采用新软件所费平均时间为288小时，当前软件为325小时。（2）Independent Sample Test（独立样本T检验）表Levenes Test for Equality of Variance，为方差齐次性检验，在Equal variances assumed（等方差假设）下，F=0.011，显著性概率Sig.=0.9170.05，说明方差相等。T-test for Equality of Means为均值相等的t检验，t分布的双尾显著性概率Sig.=0.0420.025，因此应该不拒绝原假设，所以认为使用当前软件和新软件开发信息系统所用时间没有显著的差异。上机4：相关分析一、上机目的1.掌握相关分析的基本概念与公式；2.学会相关分析的上机操作步骤。衡量事物之间，或称变量之间线性相关程度的强弱并用适当的统计指标表示出来，这个过程就是相关分析。相关分析的方法较多，比较直接和常用的一种是绘制散点图。图形虽然能够直观展现变量之间的相关关系，但不很精确。为了能够更加准确地描述变量之间的线性相关程度，可以通过计算相关系数来进行相关分析。相关系数是衡量变量之间相关程度的一个量值。如果相关系数是根据总体全部系数计算的，称为总体相关系数，记为；如果是根据样本数据计算而来的，则称为样本相关系数，记为。在统计学中，一般用样本相关系数来推断总体相关系数。设两总体变量为（X,Y）。设为随机抽样值。它们的一组观察数据为：，。样本相关系数(Correlation coefficient)指标。定义：称为：Pearsons correlation coefficient。二、上机演示内容与步骤演示例题：道琼斯工业指数（DJIA）和标准普尔500种股票指数（S&P），都是用来衡量股票市场变动情况的。DJIA是基于30个大公司的股价变动，而S&P是基于500种股票股价的变动。有人说后者衡量股市的变动情况更合适，因为它包含的股票数量多。下面给出两者的数据表化，计算它们的相关系数。步骤1：打开相关分析命令选择菜单“AnalyzeCorrelateBivariate”，打开Bivariate Correlation对话框。步骤2：变量选择1从源变量框中将djia和sp移入Variables框中。2在Correlation Coefficients框中选择相关系数的类型，共有3种：Pearson简单相关系数、Kendalls tua-b和Spearman等级相关系数，本例选用Pearson系数。3在Test of Significance框中可选择相关系数的单侧（One-tailed）或双侧（Two-tailed）检验，本例选择双侧检验。4本例中还选中了Flag significations correlations选项，它表示相关分析结果中将不显示统计检验的相伴概

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

SPSS上机指导书.doc

文档简介

温馨提示

最新文档

评论

SPSS上机指导书.doc

文档简介

温馨提示

最新文档

评论

相关文档