




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS SPSS统计软件 SPSS SPSS是软件英文名称的首字母缩写,原意为 Statistical Package for the Social Sciences ,即“社会科学统计软件包”。但是随着SPSS产品服务 领域的扩大和服务深度的增加,SPSS公司已于2000 年正式将英文全称更改为Statistical Product and Service Solutions,意为“ “统计产品与服务解决方案统计产品与服务解决方案 ” ”,标志着SPSS的战略方向正在做出重大调整。 SPSS 非专业统计人员的首选统计软件 SPSS采用类似EXCEL表格的方式输入与管 理数据,数据接口较为通用,能方便的从其他数 据库中读入数据。 其统计过程包括了常用的、较为成熟的统计 过程,完全可以满足非统计专业人士的工作需要 。 SPSS SPSS的功能 v 样本数据的描述和预处理; v 假设检验(包括参数检验、非参数检验及其他检 验); v 方差分析 v 相关分析 v 回归分析 v 聚类分析 v 判别分析 v 因子分析 v 时间序列分析 v 可靠性分析 SPSS 应用 广泛的应用于统计、应用数学、经济、市场营销 、心理、卫生统计、生物、企业管理、气象、社会学 等领域。 其分析过程包括:调查设计、数据收集、数据存 取和管理、数据分析、数据检验、数据挖掘、数据展 示等。还有一系列附加模块和独立模块产品以加强它 的分析功能。它的图形窗口界面使其非常简单易用但 却具有满足各种分析要求的数据管理、统计分析功能 及各种报表方法。 SPSS SPSS的窗口类型 v数据编辑窗口 v程序编辑窗口 v输出窗口 v简式输出窗口 SPSS 1、数据编辑窗口:(1)启动SPSS直接进入 (2)文件新建数据文件 File/New/Data SPSS 2、程序编辑窗口: 文件新建语句文件 File/New/Syntax SPSS 3、输出窗口: 现实统计方法运行输出的结果,对输出结果可以进行模块 裁剪、编辑、存档等 SPSS 第1节 描述统计 v 设变量X有一组观测数据x1,x2 ,,xn ,常 用的描述统计量有: (1)中心趋势:平均值、中位数、众数、和 (2)离中趋势:方差、标准差、最大最小值 、 极差 (3)百分位数:四分位数、 给定间距的等间距分位数 (4)分布度统计量:偏态度、峰态度 SPSS v 利用频数分析可以方便地对数据按组进行归纳整理,对变量的数据 有一个整体上的认识。 (1)建立数据文件:例1.sav (2)选择统计方法:AnalyzeDescriptive StatisticsFrequencies,送入变量,点击确定 (3)输出结果: 例1:对某大学10名学生测量他们的血压x,得到如下数据 : 120 120 120 134 128 102 130 132 126 126 第2节 频数分析 SPSS 其他:描述统计分析Descriptive等 ,图表 SPSS SPSS统计图 SPSS SPSS统计图 1 单个变量的频数统计图 例2:测量30株小麦的株高x得到如下数据(单位:cm):例2.sav (1)频数直方图(加上一条正态曲线,直观比较频数图与正态分布 的差异程度。) (2)频数连线图:简单 2 两个变量的统计图 对两个变量(x,y)的样本,作图观察两个变量的关系 例3 某研究所对200只北京鸭进行实验,得到的周龄(x)与平均 日增重(y)的数据,对(x,y)作出散点图,拟合线Smoother SPSS 条图散点图线图 直方图饼图面积图 箱式图正态Q-Q图正态P-P图 质量控制图Pareto图自回归曲线图 高低图 交互相关图序列图 频谱图误差线图 统计图汇总 SPSS 第3节节 参数检验检验 与置信区间间 提出原假设: 选择统计方法:AnalyzeMeansOne-simple T test,在底部Test value框输入检验值100 具体判断:根据t分布计算出显著性概率(在许多书中称为P值), SPSS中为sig. 对于给定的显著性水平 ,若sig.0.05,接受H0; 平均差95%的置信区间为间为(-0.954,0.910),则则均值值的95%置信区间为间为(100- 0.954,100+0.910) SPSS 均数间的比较Compare Means菜单详解 v 1 Means过程 求分类变量的综合描述统计量,目的在于比较 v 2 One-Samples T Test过程 检验单个变量的均值是否与给定的常数之间存在差异。 v 3 Independent-Samples T Test过程 检验两个不相关的样本来自具有相同均值的总体,例如想知 道购买某产品的顾客与不购买该产品的顾客的平均收入是否相 同。 v 4 Paired-Samples T Test过程 检验两个相关的样本是否来自具有相同均值的总体。常用与 被观测对象在实验前后是否有差异。 v 5 One-Way ANOVA过程 单因素方差分析,在下节介绍。 SPSS 第4节 方差分析 SPSS 方差分析概述 一个事物的变化总是某些因素影响的结果。例如,某种农作 物的收获量受到种子品种、土质、施肥量以及气候等因素的影 响。在众多因素中,有些因素影响大些,有些则小些。在现实 生活中常常要找到有显著影响的那些因素,以便更有效地组织 生产。 方差分析从分析数据的差异入手,分析哪些因素是影响数 据差异的众多因素中的主要因素. SPSS 方差分析概述 方差分析正是要分析观测变量的变动主要是由控制因 素造成的还是由随机因素造成的,以及控制变量的各 个水平是如何对观测变量造成影响的. 相关概念: (1)观测变量:作为观测的对象(如:亩产量、推销量等). (2)控制因素:人为可以控制的因素(如:施肥量、品种、推销策略、 价格、包装方式等),在方差分析中称为控制因素.将控制变量的不同 情况称为控制变量的不同水平. (3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、抽 样误差等),方差分析中主要指抽样误差。 SPSS 核心问题 v 从数据差异角度看: 观测变量的数据差异(ST)=控制因素不同水平造 成(组间差异SB)+随机因素造成(组内差异SW) 当控制因素对实验结果有显著影响时,和随机因 素共同作用必然使观测变量产生显著变动;反之 ,观测变量的变动较小,将归结为随机性造成的( 这里指抽样误差造成的). SPSS 方差分析概述方差分析概述 方差分析的类型 v 单因素方差分析: 只考虑一个控制因素的影响 v 多因素方差分析: 考虑两个以上的控制因素和它们的交互作用对观测变 量的影响 v 协方差分析: 在尽量排除其他因素的影响下,分析单个或多个控制 因素对观测变量的影响.(引入协变量) SPSS 例5 用四种饲料喂猪,共19头猪分为4组,每组用一种饲料。一 段时间后沉重,猪体重增加数据(见下表)比较四种饲料对猪 体重增加的作用有无不同。 观测变量:猪体重增加量;控制因素:饲料 该问题是考察饲料这一个控制因素的变化对猪体重增加是否有显著性 影响。通常把饲料因素A 的四个不同的变化,分别记为A1、A2、A3、 A4,成为A的4个不同水平。把观测变量记为X,而第i种饲料在第j次 试验下增加的体重记为xij,即因素的第i个水平的第j次观测(试验) 值为xij,问因素A的变化对观测变量X的变化是否有显著性影响? SPSS ni x3k x33x32x313 x2k x32x22x212 x1k x31x21观测值x11j=1 AkA3A2水平A1 SPSS 1、基本原理 v 设 表示在水平 下观测值的真实平均值,则在 下每次观测结果应 该是在真实平均值 的左右随机波动,这个随机波动量记为 ,因此 ,方差分析的数学模型为 v , ; v 其中 相互独立且, 是在每个水平 下重复进行试验的次数, 为未知。研究因素A的影响是否显著,归结不同水平下的总体 是否具有相同的均值,也即要检验统计假设: v 拒绝 则认为不同水平有显著性差异。 v 具体判断:根据F分布计算出显著性概率sig. 若sig. F, 拒绝原假设H0 P值法: P0.05,认为满足方差分析模型。 SPSS v 多重比较检验:两两不同水平进行比较,看是否有显著 差异。检验假设为无显著差异。 v 选择Post Hot按钮 v 当方差齐性检验显著时,选LSD; v 当方差齐性检验不显著时,选Tamhanes T2,用t 检验进行配对比较 表中用*标 示的组均值 在0.05水平 上有显著性 差异 SPSS v 例6 同种三叶草被接种上不同的菌种测量三叶草植物中 的含氮量。每组数据中的前面一个是菌种代码,变量名是 strain,数值型变量。后一个是含氮量nitrogen。分析 不同细菌对三叶草含氮量的影响。(数据例6.sav) SPSS SPSS 练习1 v 对6种不同的农药在相同的条件下分别进行杀虫试验,试验结果(杀 虫率)如下表: 农药 试验号 A1A2A3A4A5A6 1 879056559275 2 858862489972 3 80879581 4 9491 v 问杀虫率是否因农药的不同而有显著性的差异(显著性水平为0.01 )? SPSS v数据文件:练习1.sav v选择方法:一维方差分析,方差齐性检验,多重 比较检验LSD v结果分析:方差是齐性的,不同农药的杀虫率有 显著性差异 SPSS 单因变量多因素方差分析 温 度 B浓 度 A B1B2B3B4 A121,2322,2325,2327, 25 A223,2526,2428,2726,24 A326,2329,2724,2524,23 v 对一个独立变量是否受到多个因素或变量影响而进行的方差分析, 在这个过程中,可以分析每一个因素的作用,也可以分析因素之间 的交互作用。 v 例7 在某化工厂产品的生产过程中,对三种浓度、四种温度的每一 种搭配重复试验2次,测得产量如下表。试检验不同的浓度,不同的 温度以及它们之间的的交互作用对产量有无显著性影响.(完全随机 化设计) SPSS v 编辑数据文件:例7.sav v 选择方法: AnalyzeGeneral Linear ModelUnivariate,送入变量 v 结果分析:浓度A因素的sig.=0.0420.05, 认为温度对产量无显著性影响;A与B的交互作用a*b的 sig.=0.0160.05, age的 sig.=0.0000.05,所以没有一个变量在模型中是重要变量。因此需要对变量进行筛选。 (2)改用逐步回归法Stepwise 结果分析:第一次引进x4,第二次引进x1,引进的变量没有被剔除 第一模型为y=492.233-3.091x4, 第二模型为y=431.648-2.571x4+6.029x1 相关系数有明显提高,标准误差有明显减少。两个模型的回归检验均具 有非常高的显著性,回归系数均具有非常高的显著性,即为重要变量。没有引 进的变量均不显著。可以认为第二模型为最好模型。 SPSS 练习3 v使用数据:练习3.sav,建立一个以初始 工资、工作经验、受教育年数等为自变量 ,当前工资为因变量的回归模型。 SPSS 5.3 曲线回归模型 v 在实际中,变量与变量之间的相关关系并非一定是线性相关,非线性 相关关系的情形也会常常遇到。 v 例11 某研究所对200只鸭子进行试验,得到鸭子的周龄x与平均日 增重y的数据(前例3),从散点图看到x与y呈现出曲线的相关关系。 我们希望计算出x与y的曲线模型y=f(x),并检验该模型的显著性以及 计算它的标准误差。 SPSS 基本原理: v 解决曲线回归模型的基本方法是将曲线回归模型转化为线性回归模型 进行计算,过程如下: (1)确定模型的形式。这是根据所研究问题相关专业知识或散点图的 形状,选择f(x)的具体表达形式,如上例,可以选择f(x)为二次曲线模 型,即 y=f(x)=b0+b1x+b2x2 (2)将确定的模型作线性转换,如令u=x2,则有 y=f(x)=b0+b1x+b2u 从而y关于x,u是线性回归模型。 又如对指数模型y=aebx,先两边去对数有lny=lna+bx,然后令 y=lny,a=lna,则y=a+bx,于是y关于x是线性回归模型。 (3)对转换后的线性模型利用线性回归模型方法进行计算、检验,最 后回代还原为曲线模型。 SPSS 计算过程: (1)建立数据文件:原始数据:例1.sav (2)变量变换 需作变换u=x2.选择:TransformCompute在目标变量 框输入变量u,在右边框输入计算表达式x*x确定 (3)选择统计方法:线性回归方法 SPSS 结果分析 v 模型:y=-8.360+34.827x-3.762u v 回代为:y=-8.360+34.827x-3.762x2 v 模型非常显著,复相关系数为R=0.997,标准误差 S=2.251,回归检验的显著性概率sig.=0.0000.01 注:也可以直接使用曲线回归的方法,选择模型:平方 SPSS 练习 牙膏的销售量 问 题 建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期 其它厂家同类牙膏的平均售价 (数据:牙膏销售量.sav) 9.26 0.55 6.80 4.25 3.7030 7.930.055.803.853.8029 8.510.256.754.003.752 7.38-0.055.503.803.851 销售量 (百万支) 价格差 (元) 广告费用 (百万元) 其它厂家价 格(元) 本公司价格 (元) 销售 周期 SPSS 基本模型 y 公司牙膏销售量 x1其它厂家与本公司价格差 x2公司广告费用 x2 y x1 y x1, x2解释变量(回归变量, 自变量) y被解释变量(因变量) 0, 1 , 2 , 3 回归系数 随机误差(均值为零的正态分布随 机变量) SPSS 牙膏的销售量模型 v 选择方法:AnalyzeRgressionLinear 将销售量送入因变量框,将 x1、x2和x22送入自变量框 “Statistics”按钮选择 v 结果分析: 总:y的90.5%可由模型确定 Sig.远小于=0.05 模型从整体上看显著 分:x2对因变量y 的影响不太显著但由于x22项显著 可将x2保留在模型中 参数参数估计值置信区间 17.3245.728 28.921 1.3070.683 1.931 -3.696-7.499 0.108 0.3490.038 0.659 R2=0.905 F=82.941 p=0.0000 0 1 2 3 SPSS 回归预测的方法 如果我们要用SPSS来预测x1=0.2,x2=6.5时y的值,需要在数据 表的续后空格输入x1,x2的值,对应y的值为空值(缺失值)。在 建立模型时SPSS会进行自动调整,只使用前面30个数据建立模型 ,但可以预测第31个观测的y值。 选择Analyze RegressionLinear,将相应变量送入变量框 ,单击对话框中的“save”按钮,在弹出的对话框中,在Predicted Values栏中选中“Unstandardized”复选框(这样可以得到预测值 ),在“Prediction Intervals”栏中选中“Means”(均值预测置信区 间)和“Individual”(个值预测置信区间),单击“Continue”返 回主对话框,其它选项采用默认值,“确定”后就可以得到回归 方程和预测结果了。 SPSS SPSS SPSS 销售量预测 价格差x1=其它厂家价格x3-本公司价格x4 估计x3调整x4 控制价格差x1=0.2元,投入广告费x2=650万元 销售量预测区间为 7.82298,8.76362(置信度95% ) 上限用作库存管理的目标值 下限用来把握公司的现金流 若估计x3=3.9,设定x4=3.7,则可以95%的把握知 道销售额在 7.822983.7 29(百万元)以上 控制x1通过x1, x2预测y (百万支) SPSS 模型改进 不考虑x1和x2 的交互作用 参数参数估计值置信区间 17.32445.7282 28.9206 1.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.905 F=82.9409 p=0.000 0 1 2 3 参数参数估计值置信区间 29.11313.701 44.525 11.1341.978 20.291 -7.608-12.693 -2.523 0.6710.254 1.089 -1.478-2.852 -0.104 R2=0.921 F=72.777 p=0.000 3 0 1 2 4 考虑x1和 x2的交互 作用 所有参 数都是 显著的 SPSS 两模型销售量预测比较 (百万支) 区间 7.82298,8.76362 区间 7.88673,8.76777 (百万支) 控制价格差x1=0.2元,投入广告费x2=6.5百万元 预测区间长度更短 (精度提高) 略有增加 SPSS 交互作用影响的讨论 价格差 x1=0.1 价格差 x1=0.3 加大广告投入使销售量增加 ( x2大于6百万元) 价格差较小时增加 的速率更大 x2 价格优势会使销售量增加 价格差较小时更需要靠广告 来吸引顾客的眼球 SPSS 完全二次多项式模型 x1x2 SPSS SPSS 建模的两种思路: v加法:如牙膏的销售量模型,逐渐添加项 减法:一开始就考虑完全多项式,逐步剔除。 SPSS 第6节 时间序列分析 v 时间续写是指依时间顺序取得的观察资料的集合。在一个 时间序列里,离散样本序列可以按相等时间间隔或不等时 间间隔获取,更多的是采取前者。 v 时间序列的特点是数据资料的先后顺序不能随意改变,逐 次的观测值通常是不独立的,而且分析时必须考虑观测资 料的时间顺序,这同以前所介绍的观测资料有很大的区别 。 v Spss中进行时间序列分析:Analyzetime series 1、指数平滑 2、自回归 3、自回归综合移动平均 4、季节分解法 SPSS 数据预处理 v 三个步骤:首先,对有缺失值的数据进行修补,其次将数 据资料定义为相应的时间序列,最后对时间序列数据的平 稳性进行计算观察。 v 缺失值数据的修补:Transfo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年建筑施工安全管理信息化与施工现场安全管理文化建设报告
- 2025年学前教育信息化与幼儿艺术教育融合研究报告
- 生鲜新零售供应链优化与冷链物流绿色可持续发展分析
- 2025年绿色消费理念传播与消费者行为引导的绿色交通出行方式分析
- 科普体验馆安全管理制度
- 学校实训室安全管理制度
- 国企中高层培训管理制度
- 出租汽车公司化管理制度
- led屏幕安全管理制度
- 学校医务室设备管理制度
- JT-T-1211.1-2018公路工程水泥混凝土用快速修补材料第1部分:水泥基修补材料
- 上海市嘉定区2023-2024学年三年级下学期期末数学试卷
- DL-T5181-2017水电水利工程锚喷支护施工规范
- 走近核科学技术智慧树知到期末考试答案2024年
- 钢结构36米桁架吊装安全监理实施细则1
- 西铁城操作说明书
- 福建省泉州市晋江市2024年中考生物模试卷含解析
- 智能建造理论与实践 课件全套 第1-6章 智能建造概述- 智慧城市
- 《危险化学品重大危险源监督管理暂行规定》解读
- 陪伴教育机器人简介演示
- 年产10万吨12度葡萄酒工厂设计说明书样本
评论
0/150
提交评论