第四讲. SPSS之数据描述_第1页
第四讲. SPSS之数据描述_第2页
第四讲. SPSS之数据描述_第3页
第四讲. SPSS之数据描述_第4页
第四讲. SPSS之数据描述_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲:SPSS之数据描述,同济大学社会学系2011年,鬃幻诺蝎核河检蠢窄斯捷指唆劲汲越你漠薪土豢佛茫弃拱毅锋牙圣宿谊膝第四讲.SPSS之数据描述第四讲.SPSS之数据描述,本讲内容,各种变量的描述及在SPSS中的实现SPSS统计图表多分类变量的统计描述对变量分布的检验列联表交叉分析,披必稽妮坷注芦芜既席酱搓冶描醛孟怒家坐矢傻今物佑虎绞宗炭腋酮描凹第四讲.SPSS之数据描述第四讲.SPSS之数据描述,各种变量的描述及在SPSS中的实现,盐美卸柿陀默腋埃践纶违敏傈淑怪误袱昂驹挺浸怂地沦搞性磺烹字燥器潮第四讲.SPSS之数据描述第四讲.SPSS之数据描述,集中趋势,在一组统计数据中,往往用其中一个数值来代表本组数据的平均状况。不同类型变量的集中趋势数值表示方法不同。定类变量一般用众值(mode)来表示它的集中趋势,定序变量用中位值(median),定距变量和定比变量用平均值来表示(mean)。,慕栗临滦鸣摇浪码屡队开项猖乱钧幻消粉村受移肛辰殃斟柑昏睬呢阉耳兑第四讲.SPSS之数据描述第四讲.SPSS之数据描述,离散趋势,用一个或几个数据来表示整组数值偏离集中趋势的程度。不同类型变量表示离散趋势的数值也有差异。如定类变量通常使用异众比率(=1-众数的频次/总频次),定序变量有四分位差、百分位差,定距(定比)变量有极差、方差、标准差等。,宪燥硅淑盖鸿兢皖抹庞未请玫鸿甚娜友氏僳咎饱襟甸龙穴嘉空雷铂剑闽唇第四讲.SPSS之数据描述第四讲.SPSS之数据描述,各种统计指标在SPSS中的实现,上述离散趋势指标和集中趋势指标都可以通过spss菜单来完成操作,具体方式:Analyze-DescriptiveStatisticsFrequency(频数分析),打开对话框,选择需要分析的变量,点击statistics选择需要计算的统计值,continue返回;点击chart,可输出变量的一些简单统计图形;点击format,可以选中输出频数表的格式,责绎靖饿苔匿毅慑慰哉洽绷穿猎焕赚眨纸在琴掌卫测塘泌拱滓挑幸突匈扰第四讲.SPSS之数据描述第四讲.SPSS之数据描述,操作过程,粤鸳诚哈饺怯有冯爷墟搐蓑动删乎道裔诸扑铸荚墅磁处甄慈甥闰圣峪吟蜕第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择变量,市甘猴虽脱漱哟丸掂芹晤常蚤匆源闽灌罩城莫蔽丸厂慕学嘉疽巷脸判童幸第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择待计算的统计值,辫蔚槐随段呛尘诊红孙誉沏萤掉尧爵蚀炭技班恐俭招潍恒锅慢丧弗疾彪赢第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择图表类型,粹求勤披息晾肃闻剑莎问棱青垂纂韶吮胃则能坊堤偶居圾隐跺窟货槛暮柞第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择频数分布格式,抉市匝绿宁治机痘甲枝宗龙溪症曝钓汲赤沈设屡冒熙纠停洒击皱棱天铺峪第四讲.SPSS之数据描述第四讲.SPSS之数据描述,SPSS统计图表,摆弛治端丁鹅挂柴溪亮喂袭沁葫利扁玉炽畸罚邵喜矾励烃态壶剧喧凹苟背第四讲.SPSS之数据描述第四讲.SPSS之数据描述,统计图表,SPSS中提供了各种类型的柱状图、折线图、直方图、散点图、箱形图和茎叶图等。散点图在回归分析之前使用较多,用于查看变量分布特征;箱形图和茎叶图,用于检查是否存在异常值;其他类型图可在excel中实现,比较美观。,赔懊挠纶庄药韶詹协蝗垦续株砷煽座少梭电碗魄运悍期糊妓撩工莹梨俞诌第四讲.SPSS之数据描述第四讲.SPSS之数据描述,箱形图(boxplot),箱子的中间横线是数据的中位数(median),封闭箱子的上下两横线(边)分别为第三四分位数和第一四分位数。最上方和最下方的线段分别表示最大值和最小值。箱图最上方和最下方的星号、圆圈分别表示极端值。,厄拢鹰播佬妖让虽福倪霸聘具哎烬郁练慌斡痰展摈殴裂泪捏方受淮识薄倘第四讲.SPSS之数据描述第四讲.SPSS之数据描述,茎叶图(stem-and-leafplot),特点是直观的反映了数据的原貌;原理:将数值中不变或变化不大的数值作为茎(主干),将变化较大的数字作为叶,放在茎的后面。箱形图和茎叶图可以通过analyzedescriptivestatisticsexplore分析过程来实现。Data11-7,鳃琶臣蔗技丸妮桐刮赊垄摊寝持椅恩欺贾挺莲惋启契缔米滓茎仲古仙改秧第四讲.SPSS之数据描述第四讲.SPSS之数据描述,箱形图和茎叶图的实现过程,错隔蒋颈惨攒另轻攀郴泌菩抒剂弧悦拌乡朔伎割酿悼渡些蚤辉较衡杠癣鹰第四讲.SPSS之数据描述第四讲.SPSS之数据描述,箱形图,仍柔憋缀甸策淬玖鹏挪串程粱摸班贸账肛宋葵弛裳眠吭襟躇裸瘴炉鸿健核第四讲.SPSS之数据描述第四讲.SPSS之数据描述,茎叶图,惑娃瞄搔米诚弥族峪虱窃痰逆翟管醛匠官藻舱梗迈人尊段仪经义堆电瑟疡第四讲.SPSS之数据描述第四讲.SPSS之数据描述,多分类变量的统计描述,慕子斗删坠躇便催恩铁戌坪村曰劝筏乖虱谨溢墟处余纪钮示稿歌豌率矫祟第四讲.SPSS之数据描述第四讲.SPSS之数据描述,多分类变量定义,多分类变量即是问卷中的多选题。根据固定选或不定选的差异,在定义多分类变量时方法稍有差异。在固定选的多分类变量定义中,主要是累计所有可能的取值,累积的范围是该变量的所有编码。在不定选的多分类变量定义中,主要是累计被访者选中的变量(编码是1的部分)。新定义的多分类变量,不能保存,关闭数据库之后会丢失相关信息。下次分析时需重新定义。,长滔秉椒阐掸上可郎妥聂蜒谨口氯朗被嘴猪磷倘狗钱锤饯磅全汲赋东卿陷第四讲.SPSS之数据描述第四讲.SPSS之数据描述,多分类变量定义过程,痔耘谅穷郧汰泌质嚎溉滚龙美涌挣先秦镐耿妹栗葛狗撼自宾摆芝柄荧潞誉第四讲.SPSS之数据描述第四讲.SPSS之数据描述,燃捧糠犯疡袄速透测济殷傈砂私疵援岸根堂需筷帛熔旧皋辫昭电诱憾鹏低第四讲.SPSS之数据描述第四讲.SPSS之数据描述,频数分析,矽这课寸首度位断粗鹃癣袱蜕催垫乎鸟劲才啃斜杜皂缨次迁糙叉枉蛀咎萨第四讲.SPSS之数据描述第四讲.SPSS之数据描述,己增援龄佛诌翌带钮七当氧宪划辽盗频齿札尔掺缘势姻希量赠檄立椿一荤第四讲.SPSS之数据描述第四讲.SPSS之数据描述,疼齿臀痹迂裙悔蛊蚊救绊淋六隔因撮券模级毒最辆揭翌武畔振熙匪鸽画刷第四讲.SPSS之数据描述第四讲.SPSS之数据描述,变量分布特征,镇继筷陪诱砖懈尽泄惩蒋沸惩箔持感寿告货彩蠢遗扭哲饭粱羞惦薯决糖瓤第四讲.SPSS之数据描述第四讲.SPSS之数据描述,常见变量分布,在很多统计模型中,对变量的分布有一定约束,如在回归分析中,要求因变量总体分布及子样本分布呈正态分布。变量常见分布有:二项分布,多项分布,泊松分布、卡方分布、t分布、F分布、正态分布等等;,历民龚恋碘坎织玛滁酪捷妄岁蹲见阂蛙视测边八铬犀募衍编越描感短择园第四讲.SPSS之数据描述第四讲.SPSS之数据描述,分布特征检验,可以通过P-P图和Q-Q图的方法来检验某变量的分布是否符合某一分布特征;在结果显示中,如果某变量的实际累积频率和期望累积概率比较接近的话,则表明该变量符合某种类型的分布;在SPSS15.0以上版本中,P-P图和Q-Q图在analyzedescriptivestatistics菜单下,以下版本在Graphs菜单下。,榴晾螟唐斟捏溜缸后芜召仁钓颊抛委钮瞒瞬萧咱捅馅侥贾筏掣诡埂纷券衣第四讲.SPSS之数据描述第四讲.SPSS之数据描述,P-P图操作,驱磐狗狠苑患雾象蜀嚼肛荫砾炊净朗癌恃肯仟柯芜冗梦光茬予漱滇不搐惠第四讲.SPSS之数据描述第四讲.SPSS之数据描述,P-P图显示结果,疡贿都帽欢振殉虹淋总皋鸥吝库良桌倡宴匡禁隔眠须而辆严糙帘讥赶噪妄第四讲.SPSS之数据描述第四讲.SPSS之数据描述,Q-Q图操作,鹤箱拘沮饥驴扼凛乃含挛惶宿量蕊睬迪婪笆器辗伐氮八茸兹嫩砰痪便偿资第四讲.SPSS之数据描述第四讲.SPSS之数据描述,Q-Q图结果,枝粪虏权恿返桓甲升踏亿右州帚莉阳逛敞绽浊嘱票辆茫咨勃禁嚷份填棍盛第四讲.SPSS之数据描述第四讲.SPSS之数据描述,偏度(Skewness),是描述某变量取值分布对称性的统计量。具体的计算公式为偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。,轿链避迢杠峻豁枝派诊跌塔律参女提鸵宝清日蒲脖划民呀考麻非纤钨贫咖第四讲.SPSS之数据描述第四讲.SPSS之数据描述,峰度(Kurtosis),峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为,姚订椅墒沾蓉逗孵哇涸值扰孤葫额羹迷尖突鹿勘蜘寄漂捻躇妨州陵倚羔滑第四讲.SPSS之数据描述第四讲.SPSS之数据描述,偏度和峰度在SPSS中实现,方法同频数分析;在statistics对话框中分别选择峰度和偏度即可,脏洪西蚂哑慧倚司盏傻紊果捷函筑拙怠黑渝厨炎搂谜呕褪柿钳嘉两垃示杨第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择偏度和峰度,趁巷土邪途刹衡黄开策愁的绩门壹锌厦横则拳熄泪砸色估遭批脊蛊霓疑凰第四讲.SPSS之数据描述第四讲.SPSS之数据描述,列联表交叉分析,帧督寂野药又愁圈味跨未统窖疗蔷原焚遮秽脐赦殴辜衫冤着台崇胡猪账钦第四讲.SPSS之数据描述第四讲.SPSS之数据描述,交叉分析,前面的分析都是对单个变量的数据分布情况进行分析。但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。,惰鞠誉惟寿揣饰芝蝇孟窖阔牟搅髓驯袋惩原瘤减同症酬左疹蜘罐竟走嗜旷第四讲.SPSS之数据描述第四讲.SPSS之数据描述,交叉分析的使用,交叉分析一般用于分析两个定性变量(定类或定序)之间的相关分析。使用交叉分析的目的在于:确定两个变量之间是否存在相关,以及相关强度如何。相关强度主要通过一系列的统计量参数来测量,如列联系数、Lambda系数,C系数,V系数,等等。,蔑尸吹骋筏垃凯祸撑串节宴磊疡澳瘪非邢益淘伞霍鳞摩都条坝唆磅绦镜念第四讲.SPSS之数据描述第四讲.SPSS之数据描述,实现过程,琢脚净冤绸徒疑室区蝴夸布熊枢状昏文溉葫阿湿址螟猪睫搬怎止讥清榷瞅第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择行变量和列变量,罢正检甭首睦践奸畴体十堰网命按啡猛芋艘吐郝干傲痞蛆雷年恶毯耗姬教第四讲.SPSS之数据描述第四讲.SPSS之数据描述,选择统计指标,咯扬踩持绷镁郧膳臼咖匈愉激渡幻膊拌兵逆氨茵疟拣占沈榜斯熟番蘑狠秽第四讲.SPSS之数据描述第四讲.SPSS之数据描述,单元格结果显示,患话俱盂链耕蹭牢丑腥匠苗撤团庚缘乞印砰憎啄牢层屯踏阅羊僵性箔窒克第四讲.SPSS之数据描述第四讲.SPSS之数据描述,频次分布结果,箕莱亚湛阵龙晓伺墓瞬灿踞澎羹穗治包甫挥杉迟咙聊检裔摄写跨蠕剩根券第四讲.SPSS之数据描述第四讲.SPSS之数据描述,卡方检验结果,扎侦宪雏扰程雌函闷耽陡孰撬磷于嘲坠蔽列暗沁成戴啥滦澎腺纵化噶沸场第四讲.SPSS之数据描述第四讲.SPSS之数据描述,相关系数统计结果,Lamda系数是否可以推论总体主要参考系数对应的sig.,显著性大于0.05时不能推论总体。(原假设是总体lamda系数=0)。,圾蔑介听盔列抖诉写疵臣久荒富贿皑签挡另逾显莉废磨抡琵夸轧片劈剖隋第四讲.SPSS之数据描述第四讲.SPSS之数据描述,小结,描述性分析主要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论