




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS的基本统计功能1、数据的预处理 2、描述性统计和探索性统计3、假设检验(包括参数检验、非参数检验等)4、方差分析(包括一般的方差分析和多元方差分析)5、相关分析6、回归分析7、多元统计分析,包括聚类分析、判别分析、因子分析、对应分析、主成分分析等8、时间序列分析9、信度分析10、数据挖掘:决策树与神经网络SPSS 统计分析的一般步骤 1、建立SPSS数据文件: 在【变量视图】定义SPSS数据文件的结构,在【数据视图】进行录入数据文件的录入。2、SPSS数据的管理数据的预处理 : 集中于【数据】和【转换】两个菜单项。3、SPSS数据的统计分析阶段 : 在【分析】菜单中选择正确的统计方法。4、SPSS分析结果的阅读和解释 : 读懂SPSS输出窗口中的分析结果5、明确其统计含义,并结合背景知识做出合理的解释。 第2章 SPSS统计分析前的准备一、SPSS数据文件的特点1、SPSS数据文件是一种有结构的数据文件(一般文本文件仅有纯数据部分,而没有关于结构的描述);2、由数据的结构和内容两部分构成;3、其中数据的结构记录数据类型、取值说明、数据缺失等必要信息(在【变量视图】,每一列大家都要明白你在定义什么,有什么用);4、数据的内容是那些待分析的具体数据;5、在【数据视图】每一列代表一个变量(variable),变量名显示在表格顶部;6、在【数据视图】的每一行代表一个记录(case)(即一个案例,或称一个对象、一个观察、一个个体) ,记录序号显示在表格的左侧;7、 在【数据视图】可以输入和编辑数据,但是不能输入数学表达式和函数 二、定义变量1、【数据视图】是进行数据输入、数据编辑的界面,对应的表格用于查看、录入和修改数据。 2、【变量视图】 是定义数据文件的变量的界面,对应的表格用于输入和修改变量的定义。3、用SPSS读取其他格式的数据:1)数据文件:*。sav 语法文件:*。sps 结果文件:*。spo 脚本文件: *。sbs2)文件-打开-数据,可打开多种文件类型(。sav、。xls、。dbf、 。txt、。dat等)注:要想顺利打开txt文档,txt文档最好有固定的分隔符,如一个空格或一个逗号等。三、 数据的编辑在SPSS中,数据文件的编辑、整理等功能被集中在了【数据】和【转换】两个菜单项中:1、 数据的增删、复制、剪切、粘贴;2、 数据的排序,Sort Cases排序便于数据的浏览,快捷找到最大值或最小值,迅速发现数据的异常值;四、文件的拆分:文件的拆分相当于统计学中的数据分组,即将数据按一个或几个分组变量分组。五、数据选取 :数据选取(个案选取)的基本方式 按指定条件选取(If condition is satisfied ) 随机抽样(Random sample of cases)选取某一区域内 (Based on time or case range) 六、 个案加权:记录加权是对观测数据赋以权重,常用于频数表资料;七、文件的合并:合并文件是指将外部数据中的记录或变量合并到当前的数据文件中去。合并数据文件包括两种方式:从外部数据文件增加记录到当前数据文件中纵向合并或称追加记录。从外部数据文件增加变量到当前数据文件中横向合并或称追加变量。八、变量的计算和变换:【转换】-【计算变量】九、数据的重新编码recode统计分组将字符型变量转换为数值型变量将几个小类别合为一个类别将数值型变量转换为字符型十、 统计结果的保存为word文件:【文件】-【导出】第3章 SPSS描述性统计1. Frequencies(频率)过程的特色是产生频数表;功能产生频数分布表;绘制条形图、饼图、直方图;计算集中趋势与离散程度、分布形状(峰度和偏度的意义)等统计量;按要求给出分位数;对数据的分布趋势进行初步分析(注:对于定性变量来说,一般来说产生频数分布表,制作条形图,饼图即可); 2. 描述分析( Descriptives过程 )适用的分析对象:定量变量,测度为scale。功能: 调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等;并可将原始数据转换成Z分数((原始值-均值)/标准差)。3. Explore(探索)过程用于对数据概况不清时的探索性分析,定量变量;在一般描述性统计分析的基础上,增加有关数据其他特征的文字与图形描述。提供茎叶图、箱线图、PP图、QQ图等;指出异常值(Outliers) ,可检查数据是否有错误,剔除异常值和错误数据;进行点估计和区间估计,计算均值的置信区间,;检验一组数据是否呈正态分布;4. 列联表分析(1)列联表分析的适用条件对一个定量变量的描述和分析,一般用频数分析(频数分布表、饼图、直方图、条形图);对两个定性变量的描述和分析,通常使用列联表、对应分析,或使用卡方检验;对两个以上定性变量的描述和分析,通常使用高维列联表。(2)期望频数的分布如果行变量和列变量是独立的,可以计算出列联表中每个格子里的频数应该是多少,称为期望频数; (3)列联表分析的基本思路 检验列联表中的行变量与列变量之间是否独立(或是否相关)。原假设为行变量与列变量之间独立(或不相关)。比较观察频数与期望频数的差。如果两者的差越大,表明实际情况与原假设相去甚远;如果差越小,表明实际情况与原假设越相近。 对于这个假设的检验,可以采用卡方分布,进行卡方检验。 (4)列联表分析的步骤检验列联表中的行变量与列变量之间是否独立(是否相关)提出假设H0:行变量与列变量独立(不相关)H1:行变量与列变量不独立(相关计算检验的统计量统计决策进行决策:P值决策P0。05,则拒绝原假设H0,否则,接收原假设。(5)Pearson卡方检验的应用条件所有单元的期望频数应该大于1,或不应有大量的期望频数小于5的单元格。如果列联表中有20%以上的单元格中的期望频数小于5,则一般不宜用卡方检验。Pearson卡方检验最普遍第4章 SPSS的均值比较过程1。 Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较,定量变量。(1)Means过程是专门计算各种平均数,并对平均数进行简单比较的;(2)虽然Descriptive Statistics(描述统计)菜单项中的几个过程也能计算均数,但Means过程的输出结果是将各组的描述指标放在一起的,便于相互比较; (3)Means过程必须设置分组变量,若没有分组变量的话,可以使用Descriptive Statistics菜单项中的几个过程。 (4)适用于测度水平为SCALE的变量。2。 单样本T检验(1)目的检验某变量的总体均值与指定的检验值之间是否存在显著差异。(2)适用条件样本来自的总体服从正态分布(3)基本步骤H0: 0H1: 0 构造检验统计量统计决策如果P值,接受原假设;3。 独立样本T 检验(1)目的 通过比较两个样本均值差的大小来确定两个总体的均值是否相等。(2)适用条件独立性:两个样本相互独立,且均为大样本;正态性:如果两个样本相互独立但都是小样本,或有一个样本是小样本,则要求总体服从正态分布;方差齐性 (3)基本步骤 a、方差齐性F检验原假设:两个总体方差相等;备则假设:两个总体方差不相等;P值0。05 时,拒绝原假设,说明方差不齐;否则两个总体方差无显著性差异。b、对两总体的均值提出假设H0: 12 H1: 12 c、统计决策在SPSS中进行两独立样本t检验时,应首先对F检验作判断。如果方差相等,观察分析结果中Equal variances assumed列的t检验相伴概率值;如果方差不相等,观察Equal variances not assumed列的t检验相伴概率值。如果P值,不能拒绝原假设;4. 配对样本的T 检验配对样本是指对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对两个完全相同的样本在不同条件下进行测试所获得的两组数据。其差别在于抽样不是相互独立的,而是互相关联的。(1)配对样本通常有两个特征:第一, 两组样本的样本数相同;第二, 两个样本记录的先后顺序一一对应,不能随意更改。(2)适用条件两样本数据必须两两配对两总体服从正态分布配对样本的录入方式是:每对数据在同一个case的两个配对的变量上(3)检验步骤a、提出假设H0: 12 H1: 12 b、统计决策如果P值,不能拒绝原假设;第5章 方差分析如何对一个或两个总体的均值进行检验,我们可以用均值比较,如果要讨论多个总体均值是否相等,我们所采用的方法是方差分析。方差分析中有以下几个重要概念。(1)因素(Factor):是指所要研究的变量,它可能对因变量产生影响。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。(2)水平(Level):水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。(3)单元(Cell):指因素水平之间的组合。(4)元素(Element):指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。(5)交互作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用。1. 单因素方差分析单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。(1)适用条件在各个水平之下观察对象是独立随机抽样,即独立性; 各个水平的因变量服从正态分布,即正态性; 各个水平下的总体具有相同的方差,即方差齐性;(2)基本原理 SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和) 如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。SPSS将自动计算检验统计量和相伴概率P值,若P0。05,方差齐,否则,方差不齐;单因素方差分析表,P值,接受H0,都则,拒绝H0,接受H1。2. 多因素方差分析多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。(2)基本原理 由于多因素方差分析中观察变量不仅要受到多个因素独立作用的影响,而且因素其交互作用和一些随机因素都会对变量产生影响。因此观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。以两个因素为例,可以表示为:其中,Q表示各部分对应的离差平方和。多因素方差分析比较 占 的比例,以此推断不同因素以及因素之间的交互作用是否给观测变量带来显著影响。 (3)基本术语a、Dependent Variable 观测变量或因变量主要指研究中的定量变量如:移动话费、学生成绩、销售量、亩产量等b、Fixed Factor 固定效应因素,固定因素,控制因素主要指研究中的定性变量 如:资费等级、客户类型、漫游类型、促销策略等c、Random Factor 随机效应因素、随机因素人为无法对其水平值进行准确控制,只是能够直观观测到 如:话费水平、收入水平、消费习惯等d、Interaction 交互作用、交互效应如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。例如:饮食习惯、适量运动对减肥的作用;e、main effect与交互效应相对应的主效应就是每个因素对因变量的单独影响(main effect)f、Covariates 协变量指对应变量可能有影响,需要在分析时对其作用加以控制的连续性定量变量当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响(3)应用条件等方差;各样本的独立性:只有各样本为相互独立的随机样本,才能保证变异的可加性(可分解性);正态性:即所有观察值系从正态总体中抽样得出;(4)基本步骤提出假设 H0:因素A中的r个水平的均值相等(因素A 对因变量无显著性影响)H1:因素A中的r个水平的均值不全相等(因素A 对因变量有显著性影响)统计决断P值检验法依次查看各F值的P值, p-值M2 2、编秩,将两组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。3、 求秩和,两组秩次分别相加。4、 确定统计量 若两组样本容量相等,则任取一组的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论