第4章 SPSS 200基本统计量的描述_第1页
第4章 SPSS 200基本统计量的描述_第2页
第4章 SPSS 200基本统计量的描述_第3页
第4章 SPSS 200基本统计量的描述_第4页
第4章 SPSS 200基本统计量的描述_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章,SPSS,基本统计分析,一,频数分析,二,计算基本描述统计量,三,探索性数据分析,四,交叉分组下的频数分析(卡方检验),五,多选项分析,六,比率分析,1,?,涉及的统计过程:,?,“描述统计”的全部,?,“比较均值”的均值过程,?,“多重响应”过程,?,用途:主要用来描述一个或多个变量的描,述性统计量以及分布特征,分析变量间的,关系。,2,统计基础:随机变量与概率分布,?,随机变量:有些变量在观察前事先不能确定,数值,但其取值又有一定规律性。,?,概率,(probability),:描述随机事件发生的规,律性、可能性。取值界于,0,和,1,之间。,?,离散性随机变量:如击中次数,常用概

2、率分,布列表示具体取值的概率。,?,连续性随机变量:如身高、体重等变量,常,用概率分布密度函数表示某取值范围的概率。,3,概率分布密度函数,4,常见的概率分布曲线,5,描述数据分布形状的特征量,?,偏度,g,1,:分布形状的左右对称性。,g,1,0,,,正偏态;,g,1,0,,负偏态,?,峰度,g,2,:以正态分布为标准,描述分布峰,态的指标。,g,2,0,,尖峭峰;,g,2,0,,平阔,峰,?,正态性检验,6,一、频数分析,?,目的:粗略把握数据的分布特征,?,功能:,?,编制频数分布表:频数、百分比、累计百分比,?,绘制频数分析中常用统计图:条图、饼图、直,方图,?,计算基本描述统计量,7

3、,?,基本操作:分析描述统计频率,?,选项按钮:,?,统计:选择输出统计量:集中、离散趋势、,分布特征、百分位数。,?,图标:选择绘制的图形:条图、饼图、直,方图(仅用于定量变量)。,?,格式:定义频数表输出格式,8,分析描述统计频率界面,9,统计,选项,?,计算分位数,?,计算常用描述统计量,10,频数分布表格式定义,11,频数分析应用举例,?,储户的户口、职业(分类数据):使用频,数、百分比描述,累计百分比无太大意义。,?,储户收入水平(定序数据):除使用频数、,百分比外,还有累计百分比。,?,取款目的排名:频数分布表输出按频数降,序输出频数,格式,降序个数,?,数据中若存在缺失值,使用有

4、效百分比。,12,?,取款金额(定量数据)的分析,?,不显示频数分析表,?,统计,?,图表:直方图,?,不同户口,(,城镇、农村,),的人群取款目的分析:,首先做数据拆分,再进行频数分析,13,收入水平,收,入,水,平,1500,元以上,8001500,元,300800,元,300,元以下,200,100,0,户口,农村户口,城镇户口,存,(,取,),款,金,额,1,0,0,0,0,0,.,0,9,0,0,0,0,.,0,8,0,0,0,0,.,0,7,0,0,0,0,.,0,6,0,0,0,0,.,0,5,0,0,0,0,.,0,4,0,0,0,0,.,0,3,0,0,0,0,.,0,2,0

5、,0,0,0,.,0,1,0,0,0,0,.,0,0,.,0,存,(,取,),款金额,F,r,e,q,u,e,n,c,y,200,100,0,Std. Dev = 10945.57,Mean = 4738.1,N = 282.00,条图,饼图,直方图,14,二、计算基本描述统计量,?,目的:精确把握变量的总体分布状况。,?,基本操作:,?,描述统计频率过程:统计,?,描述统计,描述过程,?,描述统计,探索过程,?,均值比较均值,过程(分组显示),?,用途:计算变量的集中趋势、离散趋势、偏度、,峰度等指标,绘制统计图。,15,几个过程的基本描述统计量比较,16,17,“,探索”过程可计算分组或不

6、分组的描述性统计量,18,几个过程的其他功能,19,描述统计,描述,过程的独有功能,例:你能很快找到取款数目异常(,3,)的储户吗?,标准化变换,20,均值比较均值过程的独有功能,分层输,出结果,分组,输出,结果,21,22,三、探索性数据分析,?,基本操作:分析描述统计,探索过程,?,目的:对数据进行初步考察,?,用途:,?,计算整体或分组数据的描述性统计指标,?,输出描述性统计图:茎叶图、直方图、箱,式图,?,正态性检验、方差齐性检验,?,检查数据的错误,辨认奇异值,23,24,选项:缺失值处理,1,、某观测在所选择的变量中有缺失值时,该观测不参与全,部分析,2,、仅在与该变量有关的分析中

7、视为缺失值,3,、缺失值做为一个组别输出,25,绘制:,1,、输出图形:箱式图、茎叶图、直方图,2,、正态性检验及图示,3,、,Levene,方差齐性检验,26,例:居民储蓄调查,?,描述城乡居民存取款金额的差别,?,检查存取款金额的奇异点和极端值,?,对存取款金额进行正态性检验和方差齐性,检验,以便进一步选择分析方法。,27,28,Descriptives,2687.20,384.216,1930.02,3444.38,1692.35,900.00,3.3E+07,5737.566,3,50250,50247,2300.00,4.570,.163,26.996,.324,1944.97,92

8、9.327,98.41,3791.52,666.69,500.00,7.8E+07,8816.366,1,80502,80501,902.50,8.311,.254,73.134,.503,Mean,Lower Bound,Upper Bound,95% Confidence,Interv,al for Mean,5% Trimmed Mean,Median,Variance,Std. Dev,iation,Minimum,Maximum,Range,Interquartile Range,Skewness,Kurtosis,Mean,Lower Bound,Upper Bound,95% C

9、onfidence,Interv,al for Mean,5% Trimmed Mean,Median,Variance,Std. Dev,iation,Minimum,Maximum,Range,Interquartile Range,Skewness,Kurtosis,户,口,城,镇,户,口,农,村,户,口,存,(,取,),款,金,额,Statistic,Std. Error,29,30,31,32,33,34,箱式图是在剔除了变量的极端值、奇异点后计算统计量并绘,制的。中间的黑粗线为中位数,红框为四分位间距的范围,,上下两个细线为最大、最小值。,35,四、交叉分组下的频数分析,?,目的:

10、掌握多变量的联合分布特征,分析,变量间的关系。,?,功能:,?,产生描述多变量联合分布的列联表,?,比较两个(或以上)样本率或比例差异,(卡方检验),?,变量间的关联度分析,36,1,、变量关系概述,?,变量间的关系,:,有关与无关。,?,有关,:,如果一个变量的取值发生变化,另外一个,变量的取值也相应发生变化,?,无关,:,如果一个变量的变化不引起另一个变量的,变化。,37,1,通过考试,2,未通过考试,1,男性,40%,60%,2,女性,40%,60%,总计,40%,60%,性别与四级英语考试通过率的相关统计,表述:结果显示,当性别取值不同时,通过率变量的,取值并未发生变化,因此性别与考试

11、通过率无关。,自变量的不同取值在因变量上无差异,两变量无关。,自变量的不同取值在因变量上有差异,两变量有关。,因变量,自变量,38,每月工资平均数,N,1,男性,752.40,452,2,女性,601.97,409,总计,680.95,861,表述:统计结果显示,当性别取值不同时,收入变,量的取值发生了变化,因此性别与月收入有关。,自变量,因变量,39,2,、双变量关系的统计类型,定类,定序,定距,定类,列联,列联,方差分析(分组平均数),定序,列联,积差相关,积差相关,积矩相关,定距,积矩相关,回归,40,列联表的格式,41,列联分析,行列变量间的关系,?,两变量是否相互独立。,?,两变量是

12、否有共变趋势。,?,一变量的变化多大程度上能由另一变量的,变化来解释。,42,卡方测量的原理:,卡方测量用来考察两变量是否独立,(,无关,),。,其原理是根据这一概率定理:若两变量无关,则,两变量中联合事件发生的概率应等于各自独立发,生的概率乘积。,j,i,ij,P,P,P,.,.,?,?,在列联表中,这一定理就具体转化为:,若两变量无,关,则两变量中条件概率应等于各自边缘概率的乘,积。反之,则两变量有关,或两变量不独立。,43,由此可见,,期望值与观察值的差距越大,说明两变,量越不独立,也就越相关。,因此,,Pearson,卡方的,表达式如下:,当为四格表时,,卡方的取值在,0,之间。卡方值

13、越大,行列变量的,关联性越强。,?,?,?,e,ij,e,ij,o,ij,f,f,f,2,2,),(,?,n,CT,RT,f,e,?,?,),)(,)(,)(,(,),(,2,2,d,b,c,a,d,c,b,a,n,bc,ad,?,?,?,?,?,?,?,44,列联表的产生:,分析描述统计交叉表,45,界面说明,?,【行】:用于选择行,*,列表中的行变量。,?,【列】:用于选择行,*,列表中的列变量。,?,【层】:层变量。,?,【显示复式条形图】:显示复式条图。,?,【取消表格】:不输出行,*,列表。,?,【精确】:针对,2*2,以上的行,*,列表设定计算,确切概率的方法。,注:安装,SPSS

14、,时除非特别选定,否则“精确”,模块一般不安装。,46,列联表所研究的问题,?,城镇和农村的储户收入水平状况相同吗?,?,行变量:户口,?,列变量:收入水平,?,不同班级的患病情况一致吗?,?,行变量:班级,?,列变量:患病,?,城乡储户认为存钱合算的比例是否相同?,?,行变量:户口,?,列变量:什么合算,47,回答不同班级患病是否相同的问题,需要引入卡方检验。,48,1,、卡方检验步骤,?,提出假设,H,0,:行、列变量独立(对立假设为?),?,计算检验统计量(卡方,统计量服从,(r-1)*(c-1),个自,由度的卡方分布,),?,确定检验水平与界值,?,结果判断:查界值表、看,P,值大小,

15、49,卡方检验操作:统计量选项,50,?,【单元格】:用于定义列联表单元格中需,要计算的指标:,?,计数:是否输出实际观察数和理论数;,?,百分比:是否输出行百分数、列百分数以及合,计百分数;,?,残差:选择残差的显示方式;,?,【格式】:用于选择行变量是升序还是降,序排列。,51,结果:城乡储户的收入水平没有明显差异。,52,Pearson,卡方值的影响因素,?,实际频数与期望频数之差,?,期望频数的大小,?,列联表的单元格子数,?,样本量大小,53,2,、卡方检验的校正,A.,自由度为,1,时,期望频数均大于,5,:连续,性校正,B.,20%,的单元格期望频数小于,5,:似然比卡,方检验,

16、C.,T5 and n40,或,T1,时:确切概率法,54,3,、行列变量的关联度分析,?,该关联度类似于参数检验中相关系数的含,义,取值多在(,1,,,1,)区间,?,可描述行列变量的关联强度,多数是对,Pearson,卡方测量值进行的修正。,?,为两变量相关研究中的非参数方法,卡方,检验中的关联度分析不太常用。,55,3.1,、两定类变量的关联度,?,列联系数:取值,0,1,,其,取值随着行列数的增加而,增大,?,Phi,系数:取值,-1,1,,适,用于四格表,对样本量进,行了修正,?,V,系数:取值,0,1,,对样,本量和行列数进行修正,;,四,格表时,等于,Phi,系数,n,C,?,?

17、,2,2,?,?,2,1,2,1,21,12,22,11,C,C,R,R,A,A,A,A,?,?,?,),1,)(,1,min(,2,?,?,?,?,C,R,n,V,?,56,3.2,、两定序变量的关联度,?,同序对数(,P,)、异序对数(,Q,),:当一个变量为升序排,列时,另一变量序列中有后面的一个变量值大于前面的一,个变量值,则记为一个同序对;否则为异序对。,?,Kendalls tau,-b:,行列数相等时,?,Kendalls tau,-c:,任意列联表,?,Gamma,系数:四格表检验,),)(,(,x,x,b,T,Q,P,T,Q,P,Q,P,?,?,?,?,?,?,?,Q,P,Q

18、,P,?,?,?,?,),1,(min,),(,min,2,2,?,?,?,C,R,N,Q,P,C,R,c,?,57,3.3,、其他关联度,?,一个定类变量,一个定距变量的关联度:,Eta,系数,类似方差分析的非参数检验,?,两定距变量(或定序变量)的关联度:相,关(,Correlations,):计算,Pearson,和,Spearman,相关系数,58,4,、配对计数资料的卡方检验,?,例子:海尔公司的市场调查数据:对每个,消费者调查两个问题:,1,、是否购买过海尔,冰箱,(,是、否,),?,2,、是否购买过海尔洗衣机,(,是、否,),?,?,问,1,:海尔冰箱和洗衣机的购买率是否有差,别

19、?,?,问,2,:每位消费者对海尔冰箱和洗衣机的购,买一致性程度如何?,59,4,、配对计数资料的卡方检验,?,McNemar,:配对计数资料的卡方检验。零假设,为两变量的阳性率无差别,?,Kappa,一致性检验:系数取值,1,1,。测量同,一观测对象在两变量(两变量服从二项分布),上取值的一致性程度。其绝对值越接近,1,,说明,一致性程度越高。一般来说:,?,系数,=0.7,一致性程度较高;,?,0.40.7,一致性程度一般;,?,0.4,,一致性较弱,c,b,c,b,?,?,?,?,2,2,),1,(,?,60,五、多选项分析,?,目的:解决问卷设计中的多选项问题的分,析,?,多选项分析步骤:,1.,先将多选项问题分解,分解方法(是否丢,失信息、是否易于分析):,?,二分法:把每个选项均转为二分类变量,?,有序分类法:把该问题按顺序转为多个问题,2.,再进行频数分析,61,例子:高考志愿调查,?,请按顺序选择你想报考的三所大学,北大,清华,人大,北师大,北京理工大学,北外,第一,第二,第三,。,62,二分法分解,?,你报考北大吗?,1,、是,2,、否,?,你报考清华吗?,1,、是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论