SPSS使用方法培训讲座_第1页
SPSS使用方法培训讲座_第2页
SPSS使用方法培训讲座_第3页
SPSS使用方法培训讲座_第4页
SPSS使用方法培训讲座_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS使用方法培训讲座讲座:SPSS使用方法关于SPSSnSPSS原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。n随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。 社会科学研究中的统计n数据的描述性统计n频次分布n集中趋势:平均数、众数、中位数等;n离散趋势:方差和标准差、极差等;n数据分析n数据预测一、SPSS常用菜单的功能nData菜单:对数据进行排序、转置以及

2、观测记录的选择;nTransform菜单:数据转换功能,常用的有Compute、Recode以及Count。nAnalyze菜单:各种统计分析。nGraphs菜单:制图工具。二、SPSS的数据管理n常用的功能有:n数据转换;n数据聚合。1.数据转换Computen对数据进行规律性的整理和计算。n步骤:nTransform-ComputenIf条件的设置n新变量设定n示例说明2.数据转换Recoden对数据按分段模式转换,如:把数据中的年龄转换为年龄段。n步骤:nTransform-Recoden选择需要转换的变量,并设置转换后的变量;n设置旧变量转换为新变量的条件;n运行OK即可。n示例3.数

3、据聚合Aggregaten把数据按照某一变量进行分类汇总。n步骤:nData-aggregaten选定分类变量到Break Variables框n选定聚合变量到Aggregate Variables框nFunction设置聚合函数n选择创建新文件n运行OK即可n示例示例: Recode和Aggregate的组合使用三、数据的描述统计n包括:n频数分析n均值n标准差数据的集中趋势统计量n频数:各个组内含个体的个数n平均数(均值):n众数:频数出现最多的变量值n中位数:第50个百分位数点上的值XnX11.频数nSPSS操作:n打开数据文件,执行Analyze-Descriptive Statist

4、ics-Frequencies.n选择分析变量nStatistics按钮设置频数nCharts设置直方图以及正态曲线nOK即可。2.平均数与标准差nSPSS操作:n打开数据文件,执行Analyze-Descriptive Statistics- Descriptive.n选择分析变量nOption按钮设置统计量nOK即可。数据的离散趋势统计量n方差和标准差n极差:最大值与最小值之间的距离n四分位数差:第25、50、75个百分位数点之间的距离sSSXXn222;)(113.分组求均值n对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。nSPSS操作nAnalyze

5、-Compare Means-Means.n示例:求不同性别的人在各工资段上的平均值。4.数据探测(Explore)n计算描述统计量,通过各类统计图等描述数据的分布类型。nSPSS: Analyze-Descriptive Statistics- Explore。5.交互分析n目的:描述同一组样本中不同变量之间是否存在显著联系。nSPSS: Analyze-Descriptive Statistics- Crosstabs.nRows 和columnsnChi-Square, Phi and Cramers Vnrown示例:性别与工资的联系。交互分析的结果n卡方检验。P0.05,则接受假设;

6、如果Compare Means-Independent T Test.n确定T检验的变量;n确定T检验的分组变量。n Ok即可。n示例:不同性别工资差异的T检验。2.方差分析n分析变量之间是否存在相关性。n例如:人的年龄是否受到地域的影响。不同地域的人的年龄,其平均年龄是否存在差异。n要求:因变量在影响因素的各个水平上的分布必须服从正态分布。方差分析的原理以单因素分析为例n假定H0:在某一自变量下的不同水平下,总体均值没有差异。n将原始数据按照自变量的水平不同随机分成c个组,然后进行分析:n如果组内差异大而组间差异下,则说明两个变量之间没有什么关联性;n如果组间差异大而组内差异小,则说明两个变

7、量之间有某种关联性。例子:人年龄与地域之间是否存在关联性n要解决的问题:n他们之间是否存在关联性?n如果有,则:n不同地域对人年龄的影响程度如何?n哪些地域对人的年龄的影响明显?n哪些地域对人年龄的影响最不明显?解题步骤n1)原始数据按地域随机抽样。结果如下表:地域1地域2地域3828182828379808081808384838585 82 80 84X1X2X3解题步骤n2)假定:n由于三个样本取自同一总体,因而其均值相同。但各自的 有差异。因此n假设假设H0: 1 2 3n(含义:地域对人的年龄没有影响,其本身的(含义:地域对人的年龄没有影响,其本身的样本均值与总体均值不同是由于抽样的

8、波动引样本均值与总体均值不同是由于抽样的波动引起的。)起的。)X1解题步骤n3)求组间变差与联合方差82)828082(311XcX411)(22 XXcSX32) 1(.11)()(222ncccXXXXSp组间样本总平均值:组间样本总方差:联合方差:解题步骤n4). F检验:n如果Ho为真,F比值将围绕着1波动;如果Ho不真,F值将倾向于比1大很多。30324522pXSnSF1)F值:2)F的自由度分子自由度:df1=c-1=3-1=2分母自由度:df2=c(n-1)=3(5-1)=123)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。Ho的概值小于的概值小于0.05( 的

9、显著水平),拒绝的显著水平),拒绝Ho。解题步骤n5)对方差的方差齐性检验n该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。n分析过程:用t检验,首先分析p值(概值)是否大于a(=0.05),如果大于,方差无显著差异;然后,比较两个总体均值的t检验结果,如果t统计量对应的两端的概率p值大于a,无显著差异,如果小于,则有显著差异。解题步骤n6). 多重比较检验n确定自变量的不同水平对观测变量的影响程度。n这种检验比较复杂,方法也很多,其中LSD敏感性最强。结果n总体描述及95置信区间D De es sc cr ri

10、 ip pt ti iv ve es s偏向性5 82.0000.70711.3162381.122082.878081.0083.005 80.0000.70711.3162379.122080.878079.0081.005 84.00001.00000.4472182.758385.241783.0085.0015 82.00001.85164.4780980.974683.025479.0085.00com域名edu域名gov域名TotalNMean Std. DeviationStd. Error Lower Bound Upper Bound95% Confidence Inter

11、val forMeanMinimum Maximum地域1地域2地域3检验结果n1)概值趋近于0,小于0.05,拒绝Ho,不同地域下人的年龄有显著差异。n2)回归的概值为0.002,地域与人的年龄之间不是零线性相关。A AN NO OV VA A偏向性40.000220.00030.000.00010.000110.00015.000.00230.000130.00045.000.0008.00012.66748.00014(Combined)ContrastDeviationLinear TermBetweenGroupsWithin GroupsTotalSum ofSquaresdfMe

12、an SquareFSig.1). 单因素方差分析nAnalyze-Compare Means-On Way ANOVA.nDependent list选择因变量;Factor选择自变量。nposHoc选择R-E-G-W Q和Tukey。nOption选择Describtive和Homogeneity of V test.n结果:如果Post Hoc Tests检验中检验中pGeneral Linear Model-Univariate.nDependent Variable, Fixed Factors.nOptions选择Descriptive St.n例子:职务、性别与工资的方差分析。3

13、.卡方检验n目的:检验样本中自变量与应变量之间的关系在总体中是否存在。n0假设:自变量与应变量之间的关系在总体中不存在。n结论:如果p0.05,拒绝0假设。n卡方检验要求自变量与因变量都是分隔变量。卡方检验的SPSS操作nSPSS: Analyze-Descriptive Statistics- Crosstabs.nRows 和columnsnChi-SquarenOk.五、 SPSS数据的预测分析n线性回归n对数回归n关于回归分析n回归分析是社会研究中进行定量分析的基本方法,主要解决3个方面的问题:n确定几个变量间是否存在相关关系;若存在,则找出它们之间合适的数学表达式。n据一个或几个变量

14、值,预测或控制另一个或几个变量的值,且要知道这种控制或预测可达何种精确度。n进行因素分析,即在共同影响一个变量的多个变量(因素)间,找出主要和次要因素及其相互关系。变量之间的两种关系n确定性关系确定性关系n问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之之间的函数关系是间的函数关系是y = x2。确定性关系。确定性关系n非确定性关系相关关系非确定性关系相关关系n问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是之间是否有一个确定性的关系?否有一个确定性的关系?相关关系的回归分析n对具有相关关系的两个变量进行统计分对具有相关关系的两个变量进行统计分析的方

15、法叫回归分析。析的方法叫回归分析。n注:自变量取值一定时,因变量的取值带有注:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关一定随机性的两个变量之间的关系叫做相关关系。关系。现实生活中的相关关系n人的身高与年龄;人的身高与年龄;n产品的成本与生产数量;产品的成本与生产数量;n商品的销售额与广告费;商品的销售额与广告费;n家庭的支出与收入。家庭的支出与收入。回归方程n对具有相关关系的现象,选择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。n如果所择关系式是线性的,就称为线性回归分析;反之,则称为非线性回归分析

16、。n线性回归是回归分析的基本模型,很多复杂的情况都是转化为线性回归进行处理。线性回归分析最小二乘法nn(x -x )(y -y )x y -n x yiiiii= 1i= 1b =,nn222(x -x )x-n xiii= 1i= 1 a= y -b x.nn11x =x ,y =y .iinni= 1i= 1其其 中中ybxa例子:大学生身高与体重的关系n从某大学中随机选出从某大学中随机选出8名大学生,其身高和名大学生,其身高和体重数据如下表:体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求大学生的身高与体重的回归方程。求大学生的身高与体重的回归方程。结果172.85849. 0 xy回归方程:相关系数n正相关;负相关。正相关;负相关。n通常,通常,r0.75,认为两个变量有很强的相,认为两个变量有很强的相关性。关性。n本例中,由上面公式本例中,由上面公式r=0.7980.75n(x-x )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论