




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主要内容,1 SPSS基本概念 2 数据录入 3 数据预处理 4用频数做数据汇总 5多选项分析 6交互分析 7T检验的应用 8 相关分析 9 聚类分析 10 线性回归分析,1 SPSS基本知识,SPSS是Statistical Package for the Social Science的简称目前的主要功能有:样本数据的描述和预处理描述性统计均值比较相关分析回归分析聚类分析假设检验等 。已广泛用于社会学经济学政治学心理学管理学市场营销等众多领域的研究。,Spss基本知识Statistical Package for the Social Science,特点易用性统计分析解决方案结果的权威性,作用帮助人们整理大量的数据协助人们迅速的对大量数据进行统计分析把分析结果以便于理解的方式展现出来,Spss的窗口介绍,1.1 数据编辑器窗口,数据视图窗口,数据显示区,变量视图窗口,工具拦,Spss的窗口介绍,1.2 变量视图窗口,变量定义功能拦,Spss的窗口介绍,结果管理窗口,2 数据录入基本概念,变量名 可以输入变量名如var1var2 age sex等。变量名以字母为首,后跟AZ09字符(字符8)变量标签 对变量名的进一步解释说明变量值标签 对变量取值的解释说明,即题项的数据化,用于对问卷数据录入时进行编码。例如:用1表示男,2表示女,数据录入基本概念,变量类型 常用的变量类型主要有数值型、字符型和日期型缺失值 即存在明显错误、不合理数据或漏填数据。例如:年龄223岁,数据录入基本概念,度量标准统计学中,度量是指按照某种法则给现象、事物或事件分派一定的数字或符号,通过测度来看刻画事物的特征或属性。例如:可以用58公斤来度量一个人的体重、用172厘米度量他的身高等。,数据录入基本概念,按照度量的程度不同,spss将度量分为以下三种标准:定距数据(scale)度量 不仅能够区分出研究对象的不同类别不同等级,而且能确定不同等级之间的距离,即可以做加减法。如年龄变量。定序数据(Ordinal)有序 能够区分出研究对象的不同类别,而且可以区分出类别之间的强弱大小高低。例如可以将人们的态度看作一个定序变量,将态度分为:非常赞成较赞成一般较不赞成很不赞成定类数据(Nominal)名义 能区分现象事物的不同性质,而不能从规模大小等方面进行区分。如性别婚姻状况等。,数据录入,单项选择题处理:根据题项赋值多项选择题的处理分类法 估计多选项问题最多可能出现的答案个数,然后为估计的每个答案设置一个变量,变量取值为多选项问题中的可选答案二分法 一般是将题中每个选项作为一个变量处理,采取“0,1”编码,”1”表示即选择了这项,”0”表示没有选择这一项开放式问题录入 一般根据大意精简后直接输入,数据类型设为字符型 问卷.xls, 3 数据预处理,数据的合并 点击Data Merge File Add cases :出现Read file对话框找到问卷示例.sav 点击”打开” 弹出对话框 Add Case From,Read file对话框,数据预处理数据合并,当出现Add case from的对话框时,我们应观察左侧对话框与右侧对话框变量是否匹配,左侧为不能匹配的变量,右侧为可以匹配的变量。见下图。,Add case from的对话框,数据预处理数据排序,数据排序 点击Data select case 选项打开select case 对话框,出现以下界面。,排序个案,数据预处理数据排序,注意:数据排序是整行排序,而不是只对某列排序多重排序中指定排序变量的次序很关键,排序时先指定的变量优先于后指定变量,按某个变量升序的同时可以按其他变量降序数据排序后,原有数据的排列顺序必然被打乱,应注意备份原始数据,4 用频数做数据汇总,4.1 如何得到一张频次表 步骤:第一步:打开问卷示例1.sav数据界面单击Analyze Descriptive Statistics(描述统计) Frequencies 打开Frequencies(频率) 对话框 第二步:点选目前职业这一变量到variable框内单击OK按钮,Frequencies 对话框,用频数做数据汇总,SPSS频次分析的统计量选项 百分比计算 集中趋势测量 离散趋势测量 数据分布描述,5 多选项分析,对多选项做普通频数分析的困难,您一般在什么情况下送礼(选择最经常送礼的两个场合)(1)婚嫁 (2)生日 (3)搬迁新居 (5)探亲 (4)中国传统节日 (7)探病 (8)西方节日场合 (9)生子 (10)毕业 (11)其他这里采用分类法分解,只能得到两个变量,采用普通频数分析,也只能得到两个变量的相对重要性,不能全面了解调查者看重因素的整体情况,如下图:,多选项分析基本操作步骤,第一步:定义选择变量集Analyze单击multiple response(多重响应) define sets(定义变量集),多选项分析基本操作步骤,第二步:采用多选项频数分析进行数据分析单击Analyze multiple response frequencies (频率)打开如下对话框,6 交互分析,6.1 如何得到一张交互表交互分析主要用于分析多变量的联合分布特征,进而分析变量之间的相互影响和关系。例如,需要了解不同文化程度的调查对象其职业情况有什么不同,进而分析文化程度与其职业是否存在一定的关联性。 单击Analyze Descriptive Statistics(描述统计) Crosstabs (交互分析)打开Crosstabs对话框。,Crosstabs对话框,交互分析,Row (s):交互表中的行变量,一般放置因变量Column (s):交互表中的列变量,一般放置自变量 例如:以问卷示例1.sav为例,要分析不同文化程度的调查者的职业情况怎么样? 步骤:第一步:Analyze Descriptive Statistics Crosstabs 打开Crosstabs对话框。 第二步:点选目前职业到Row (s)框内,点选文化程度到Column (s)框内单击Cells 第三步:点选Percentages下面的Row Column和total continue OK,交互分析,6.2 两个变量之间是否相关 例如:检查目前职业和文化程度是否相关(定类定类) 步骤:第一步:Analyze Descriptive Statistics Crosstabs 点选目前职业到Row (s)框内,点选文化程度到Column (s)框内单击Statistics 打开Crosstabs: Statistics 对话框,见下图,Crosstabs: Statistics 对话框,交互分析,第二步:点选上图中的Chi-square单击continue 单击OK按钮。输出以下结果,结论。其显著性sig.小于.01(1-置信水平),所以,职业和文化程度之间是相关的,在置信水平中设置了为99%,7 T检验的应用,7.1 单个样本T检验 主要利用来自总体的样本数据推断该总体的均值是否与指定的检验值之间存在显著差异,它是对总体均值的假设检验。 例如:我们要根据被调查者一次的送礼花费来推断总体一次送礼的平均花费是否为200元。 步骤:第一步,单击Analyze Compare Means(比较均值) One -Sample T Test (单样本T检验)打开One -Sample T Test 主对话框,见下图,T检验的应用,第二步:点选一次送礼的花费这一变量到Test Variable(检验值)框在Test Value处输入200 单击OK按钮,输出以下结果。,结果分析:显著性检验的p值为0,小于0.05,因此拒绝原假设,认为 一次性送礼的花费与200有显著差异。,T检验的应用,独立样本T检验 主要用来检验来自两个总体的独立样本,推断两个总体的均值是否存在显著差异 例如:我们要检验不同性别的平均一次送礼花费是否存在差异 步骤:第一步,单击Analyze Compare Means Independent -Sample T Test(独立样本T检验) 打开Independent -Sample T Test 主对话框,见下图,T检验的应用,第二步:点选一次送礼的花费这一变量到Test Variable框点选性别变量到Grouping Variable框单击Define Groups 按钮打开Define Groups 对话框,见下图,Define Groups 对话框,T检验的应用,第三步:在定义好以后,单击continue返回Independent -Sample T Test 主对话框单击OK,输出以下结果。,结果分析:F统计量的概率为0.079大于显著性水平0.05,认为两总体方差无显著差异,因此,分析第一行方差相等下的t统计量,其概率为0,小于0.05,认为男女性送礼费用有显著差别。,8 相关分析,相关分析 主要用于揭示事物之间线性关系的强弱程度,包括简单相关和偏相关两种类型。基本方法:相关系数r(-1=r=1) r绝对值大于0.8,有较强的线性关系;若小于0.3,两变量间存在较弱的线性关系。 Pearson相关系数:适用定距变量 Spearman相关系数:适用定序变量 Kendall相关系数:采用非参数检验方法,度量定序变量间的线性关系,相关分析简单相关,例如,要检验年龄、文化程度和收入之间是否有显著的线性关系 单击Analyze correlste(相关) bivariate(双变量)打开对话框,见下图,相关分析简单相关,将参加计算的相关系数的变量选到variables中,选择Pearson系数,并选择双尾p值在options按钮中的statistics选项中选择输出各种方差和离差。结果如图:,结果分析:年龄和收入的相关系数为-0.078,接近于0,其线性相关性很弱,即认为年龄和收入没有很强的线性关系,文化程度和收入的相关系数为0.379,有较弱的线性关系,即认为文化程度越高收入越高。,相关分析偏相关,偏相关关系: 它是指在诸多相关的变量中,控制其中一个或若干个变量的影响后,两个变量间的相关关系。 例如:检验年龄和文化程度对收入的线性关系中,控制了年龄对收入的影响后,看文化程度对收入的影响。 步骤:,单击Analyze correlste partial(偏相关)打开对话框点选参与分析的文化程度和收入到variable框内点选年龄到controlling for(控制)框内,选择双尾p值,对话框如下:,相关分析偏相关,结果分析:在控制年龄因素下,文化程度和收入的相关系数为0.372,即文化程度与收入有较弱的正相关关系,文化程度越高,收入也越高。,偏相关分析结果:,9 聚类分析,“物以类聚,人以群分”。聚类分析(Cluster Analysis)是依据研究对象的个体的特征,对其进行分类的方法。如通过对一些大学的基本情况(如总体规模、声源、研究生比例、科研成果等)的对比分析,可以把特征相近的学校归入一个类型。聚类分析实质是建立一种分类的方法,它能够将一批样本数据(或变量)按照它们在性质上的亲疏程度在没有先验知识的情况下自动进行分类。,聚类分析,例如:要对被调查者根据婚姻状况进行分类,其步骤如下: 单击Analyze cluster(分类) mean cluster(K均值聚类) 打开对话框,见下图:,聚类分析,选择case作为分类对象,并在options中指定输出信息。其结果如下:,结果分析:将所有样本分为两类,一类为已婚,一类为未婚,其中未婚个数为154,已婚个数为28.,8 方差分析,8.1 单因素方差分析 所谓方差分析:主要用于两个及两个以上样本均值差别的显著性检验 单击Analyze Compare Means One Way ANOVA打开One Way ANOVA对话框,见下图,方差分析,Dependent list 放置因变量,要求因变量是定距变量Factor 放置自变量,要求是定类变量Contrast 用于比较和分析均值的特性,一元分析,一般不用Options 择统计量和缺失值处理方式,方差分析,POST HOC 它是方差相等或不相等情况下的检验选项 例如:检验被调查者不同的文化程度,其平均年收入是否存在差异 步骤:第一步,单击Analyze Compare Means One Way ANOVA打开One Way ANOVA对话框点选年收入到Dependent list框内点选文化程度到Factor框内 第二步:同方差性检验 点选Homogeneity of variance 单击Continue按钮,输出以下结果。,方差分析,方差分析,从上知:方差不相等且均值存在差异 第三步:检查差异到底存在哪? 点选Equal variance not assumed下面的Dunnetts 单击OK,输出以下结果。,方差分析,结论:被调查者文化程度不同,其平均年收入有显著差异,其中大专以上的与其他学历的调查者存在显著差异。,10 线性回归分析,线性回归分析是一种应用广泛的数量分析方法。它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,反映一个事物如何随其他事物的变化而变化。与相关分析相比,它具有更强的数量关系。线性回归的一般步骤:1、确定回归方程中的解释变量和被解释变量2、通过观察散点图确定回归模型3、建立回归方程4、对回归方程进行各种检验5、利用回归方程进行预测和控制,线性回归分析,例:分析被调查者年送礼花费与年收入之间的线性关系 单击Analyze Regression(回归) Linear(线性回归) 打开Linear Regression对话框,见下图:,线性回归分析,选择被解释变量进入dependent(因变量)框,多个解释变量进入indepenDent(自变量)框,并选择相应的统计量,要输出的残差分析图表,其对话框为:,线性回归分析,结果分析:调整的判定系数为0.163小于0.3,因此线性关系很弱,拟合优度不高,收入对一年送礼花费的线性影响不大。,输出结果1,线性回归分析,结果分析:统计量F的p值为0,小于显著性水平0.05,所以被解释变量与解释变量有显著的线性关系。,输出结果2,线性回归分析,结果分析:由残差直方图可以知道其总体上服从均值为0的正态分布,且由于只有一个变量,其变量间不存在多重共线性,条件索引都小于10.,输出结果3,线性回归分析,结果分析:其t检验统计量的p值为0,小于显著水平,所以拒绝原假设,认为收入和年送礼花费有线性关系,且其回归方程应为: 年送礼费用=1957.706+0.022*年收入,输出结果4,总体均值和方差的点估计,例题:某工厂随机从生产部门抽出8件电子元器件,测得使用寿命分别为:10,12,13,12,15,13,12,13年,试对该工厂电子元件的平均使用寿命和方差进行估计。,总体均值的区间估计,设X1、X2、X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高校教师资格证之《高等教育法规》考前冲刺分析带答案详解(黄金题型)
- 2024-2025学年度工程硕士经典例题及完整答案详解(历年真题)
- 应急处置程序安全培训课件
- 新生儿消化系统常见疾病临床特点与鉴别诊断
- 麦田房产合同(标准版)
- 承包的士车合同(标准版)
- NMN适合女性吗女性是否可以吃nmn从内而外的健康焕新
- 中小学安全法制教育工作计划与思路16篇
- 文化发展公司合伙协议书
- 四年级健康教育教学计划
- 财务大数据基础-全套课件
- 《金匮要略》与风湿病的研究-课件
- 电力建设土建工程施工记录填写样表
- 检修安全培训课件
- 一般毒性作用
- 操作性前提方案(OPRP)确认记录表
- GB 28235-2020紫外线消毒器卫生要求
- 固体废物采样记录
- 洁净手术室相关知识考核试题及答案
- Avaya新产品和解决方案介绍课件
- 布洛芬缓释胶囊生产工艺流程课件
评论
0/150
提交评论