




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
讲座:SPSS使用方法,吴志强 信息管理学院 ,关于SPSS,SPSS原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。 随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。,社会科学研究中的统计,数据的描述性统计 频次分布 集中趋势:平均数、众数、中位数等; 离散趋势:方差和标准差、极差等; 数据分析 数据预测,一、SPSS常用菜单的功能,Data菜单:对数据进行排序、转置以及观测记录的选择; Transform菜单:数据转换功能,常用的有Compute、Recode以及Count。 Analyze菜单:各种统计分析。 Graphs菜单:制图工具。,二、SPSS的数据管理,常用的功能有: 数据转换; 数据聚合。,1.数据转换Compute,对数据进行规律性的整理和计算。 步骤: Transform-Compute If条件的设置 新变量设定 示例说明,2.数据转换Recode,对数据按分段模式转换,如:把数据中的年龄转换为年龄段。 步骤: Transform-Recode 选择需要转换的变量,并设置转换后的变量; 设置旧变量转换为新变量的条件; 运行OK即可。 示例,3.数据聚合Aggregate,把数据按照某一变量进行分类汇总。 步骤: Data-aggregate 选定分类变量到Break Variables框 选定聚合变量到Aggregate Variables框 Function设置聚合函数 选择创建新文件 运行OK即可 示例,示例: Recode和Aggregate的组合使用,三、数据的描述统计,包括: 频数分析 均值 标准差,数据的集中趋势统计量,频数:各个组内含个体的个数 平均数(均值): 众数:频数出现最多的变量值 中位数:第50个百分位数点上的值,1.频数,SPSS操作: 打开数据文件,执行Analyze-Descriptive Statistics-Frequencies. 选择分析变量 Statistics按钮设置频数 Charts设置直方图以及正态曲线 OK即可。,2.平均数与标准差,SPSS操作: 打开数据文件,执行Analyze-Descriptive Statistics- Descriptive. 选择分析变量 Option按钮设置统计量 OK即可。,数据的离散趋势统计量,方差和标准差 极差:最大值与最小值之间的距离 四分位数差:第25、50、75个百分位数点之间的距离,3.分组求均值,对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。 SPSS操作 Analyze-Compare Means-Means. 示例:求不同性别的人在各工资段上的平均值。,4.数据探测(Explore),计算描述统计量,通过各类统计图等描述数据的分布类型。 SPSS: Analyze-Descriptive Statistics- Explore。,5.交互分析,目的:描述同一组样本中不同变量之间是否存在显著联系。 SPSS: Analyze-Descriptive Statistics- Crosstabs. Rows 和columns Chi-Square, Phi and Cramers V row 示例:性别与工资的联系。,交互分析的结果,卡方检验。P0.05,则拒绝0假设,变量之间具有显著联系。 Phi值反应变量之间的关系强度,0.5表示高,0.3表示一般,0.1表示低。,四、SPSS数据的推断性统计分析,T检验 方差分析 ,1. T检验,T检验的目的是检验两个样本中存在的差异在总体中是否也同样存在。 T检验的先决条件是: 两个样本是随机取样的; 被比较的变量属于区间或比率等级; 样本的抽样分布呈正态分布。 T检验是0假设,即两者之间不存在差异。 T检验的结果:如果在置信度为95下,显著性水平0.05,则接受假设;如果0.05,拒绝假设。,T检验的SPSS操作,Analyze-Compare Means-Independent T Test. 确定T检验的变量; 确定T检验的分组变量。 Ok即可。 示例:不同性别工资差异的T检验。,2.方差分析,分析变量之间是否存在相关性。 例如:人的年龄是否受到地域的影响。不同地域的人的年龄,其平均年龄是否存在差异。 要求:因变量在影响因素的各个水平上的分布必须服从正态分布。,方差分析的原理以单因素分析为例,假定H0:在某一自变量下的不同水平下,总体均值没有差异。 将原始数据按照自变量的水平不同随机分成c个组,然后进行分析: 如果组内差异大而组间差异下,则说明两个变量之间没有什么关联性; 如果组间差异大而组内差异小,则说明两个变量之间有某种关联性。,例子:人年龄与地域之间是否存在关联性,要解决的问题: 他们之间是否存在关联性? 如果有,则: 不同地域对人年龄的影响程度如何? 哪些地域对人的年龄的影响明显? 哪些地域对人年龄的影响最不明显?,解题步骤,1)原始数据按地域随机抽样。结果如下表:,解题步骤,2)假定: 由于三个样本取自同一总体,因而其均值相同。但各自的 有差异。因此 假设H0: 1 2 3 (含义:地域对人的年龄没有影响,其本身的样本均值与总体均值不同是由于抽样的波动引起的。),解题步骤,3)求组间变差与联合方差,组间样本总平均值:,组间样本总方差:,联合方差:,解题步骤,4). F检验: 如果Ho为真,F比值将围绕着1波动;如果Ho不真,F值将倾向于比1大很多。,1)F值:,2)F的自由度 分子自由度:df1=c-1=3-1=2 分母自由度:df2=c(n-1)=3(5-1)=12 3)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。,Ho的概值小于0.05( 的显著水平),拒绝Ho。,解题步骤,5)对方差的方差齐性检验 该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。 分析过程:用t检验,首先分析p值(概值)是否大于a(=0.05),如果大于,方差无显著差异;然后,比较两个总体均值的t检验结果,如果t统计量对应的两端的概率p值大于a,无显著差异,如果小于,则有显著差异。,解题步骤,6). 多重比较检验 确定自变量的不同水平对观测变量的影响程度。 这种检验比较复杂,方法也很多,其中LSD敏感性最强。,结果,总体描述及95置信区间,地域1 地域2 地域3,检验结果,1)概值趋近于0,小于0.05,拒绝Ho,不同地域下人的年龄有显著差异。 2)回归的概值为0.002,地域与人的年龄之间不是零线性相关。,1). 单因素方差分析,Analyze-Compare Means-On Way ANOVA. Dependent list选择因变量;Factor选择自变量。 posHoc选择R-E-G-W Q和Tukey。 Option选择Describtive和Homogeneity of V test. 结果:如果Post Hoc Tests检验中p0.05,则具有显著差异。 例子:职务与工资的方差分析。,2).多因素方差分析,SPSS: Analyze-General Linear Model-Univariate. Dependent Variable, Fixed Factors. Options选择Descriptive St. 例子:职务、性别与工资的方差分析。,3.卡方检验,目的:检验样本中自变量与应变量之间的关系在总体中是否存在。 0假设:自变量与应变量之间的关系在总体中不存在。 结论:如果p0.05,拒绝0假设。 卡方检验要求自变量与因变量都是分隔变量。,卡方检验的SPSS操作,SPSS: Analyze-Descriptive Statistics- Crosstabs. Rows 和columns Chi-Square Ok.,五、 SPSS数据的预测分析,线性回归 对数回归 ,关于回归分析,回归分析是社会研究中进行定量分析的基本方法,主要解决3个方面的问题: 确定几个变量间是否存在相关关系;若存在,则找出它们之间合适的数学表达式。 据一个或几个变量值,预测或控制另一个或几个变量的值,且要知道这种控制或预测可达何种精确度。 进行因素分析,即在共同影响一个变量的多个变量(因素)间,找出主要和次要因素及其相互关系。,变量之间的两种关系,确定性关系 问题1:正方形的面积y与正方形的边长x之间的函数关系是y = x2。确定性关系 非确定性关系相关关系 问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?,相关关系的回归分析,对具有相关关系的两个变量进行统计分析的方法叫回归分析。 注:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。,现实生活中的相关关系,人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。,回归方程,对具有相关关系的现象,选择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。 如果所择关系式是线性的,就称为线性回归分析;反之,则称为非线性回归分析。 线性回归是回归分析的基本模型,很多复杂的情况都是转化为线性回归进行处理。,线性回归分析最小二乘法,例子:大学生身高与体重的关系,从某大学中随机选出8名大学生,其身高和体重数据如下表:,求大学生的身高与体重的回归方程。,结果,回归方程:,相关系数,正相关;负相关。 通常,r0.75,认为两个变量有很强的相关性。 本例中,由上面公式r=0.7980.75,1.利用SPSS求线性回归,SPSS:Analyze-Regression-Linear. 因变量dependent和自变量Idependent OK即可。 示例:工作年限与工资水平的线性回归。,线性回归的结果,Model Summary:R方用来解释应变量中有多少可以被自变量所解释。 ANOVA方差分析:判断回归模型是否有统计学意义。如果P0.05,具有意义。 Coe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 装修公司签协议书
- 土地使用权协议书
- 钢筋借用协议书
- 农美网协议书
- 啥然撕毁协议书
- 代加工协议书范本
- 合伙协议书是由
- 抚养权变更协议书模板
- 商铺建盖协议书
- 勘察设计注册岩土工程师考试(公共基础)全真题库及答案(2025年西藏)
- 2024年-2025年《公路养护》知识考试题库与答案
- (初级)航空油料特设维修员(五级)理论考试题库-下(判断题)
- NB-T31052-2014风力发电场高处作业安全规程
- FZ-T 01158-2022 纺织品 织物刺痒感的测定 振动音频分析法
- 工程部造价管控手册
- 汽车销售三方协议
- 氧气吸入的注意事项课件
- 20以内加减法口算题(10000道)(A4直接打印-每页100题)
- 畜牧兽医职称考试题库及答案
- 天惊牌中药消毒剂专家讲座
- 中国建设工程造价管理协会《建设工程造价鉴定规程》
评论
0/150
提交评论