1入门及使用基础_第1页
1入门及使用基础_第2页
1入门及使用基础_第3页
1入门及使用基础_第4页
1入门及使用基础_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计软件介绍和入门,前言,1、统计应用的特点2、统计学发展现状,1、统计应用特点,一、数据量和数据关系复杂性快速膨胀数据量海量,且不再以纸面的形式呈现,直接从电子化媒体化的数据库中提取,利用计算机和网络进行有效的数据组织和数据管理已经成为统计应用的基本环节和基础方式二、数据分析方法日益丰富机器学习、神经网络和生物遗传算法等已经成为处理海量数据,探索数据内在规律性,特其数据中未知知识的重要手段。,特点(续),三、统计应用需要具有可操作性的整体解决方案因为数据资料的收集困难和不完整,不定期的统计不利于长期发展需要。总之,数学是统计方法的首要工具,是理论基础,而统计应用软件就是统计应用的首要工具

2、。,2、统计学发展现状,1厦门大学2中国人民大学3上海财经大学4杭州商学院5天津财经学院6中南财经政法大学7北京大学8复旦大学9南开大学10东北财经大学11暨南大学12中央财经大学13西南财经大学14辽宁大学,附:概率论与数理统计排名,1北京大学2中国科学技术大学3中南大学4南开大学5清华大学6华中科技大学7北京师范大学8武汉大学9上海交通大学10浙江大学11北京工业大学12山东大学13南京大学14中山大学,国内概率统计牛人(2008),中国概率统计一共五位院士,王梓坤、陈木法、严加安、马志明,陈希儒。其中前两位是北师大的,严和马是中科院的,陈希儒是中科大的,也是中国唯一一位统计院士,但很可惜

3、2005年8月8日已过逝。北师大的老师有三位,王凤雨,李增沪,崔恒建中南大学的候振挺在Markov及逐段决定马氏过程做的在全国首屈一指了;武汉大学的潘迪鹤,他是许宝禄老先生的弟子,许老先生是中国概率届的鼻祖了;中山大学的梁之舜;北方的学校要首推中科院了,严加安,马志明(两位院士自不必说)还有巩馥洲等南开的概率也是相当强的,王永进,吴荣,郭军义等,河北工大(在天津)的概率在全国也有些影响!当年的牛人刘文(已逝世)带的几名牛学生都在工大。,统计方面:华师理论做的最好(茆诗松,王静龙等),中科大应用(陈老生前的弟子)方面最好,人大的(吴喜之等搞经济方面的)也不错。中科院成平、李国英;方开泰老师的在实

4、验设计方面的工作已有世界影响;北大郑忠国、陈家鼎南开张润楚老师;另外东北师大的白志东和史宁中;南京大学的王金德;复旦郑祖康;东南大学韦博成;云南大学王学仁现在国内年轻一代的有香港浸会大学朱力行教授,北大耿直教授(因果推断),北师大崔恒建(稳健统计),科学院王启华(生存分析)、陈敏(时间序列、金融统计)属于较强的牛人。,美国大学数学统计学专业排名,1斯坦福大学2加州大学伯克利分校3哈佛大学4北卡罗来纳大学教堂山分校5威斯康星大学麦迪逊分校6康奈尔大学7芝加哥大学8明尼苏达大学TwinCities分校9华盛顿大学10卡内基美隆大学,第一章、SPSS统计分析软件概述,统计学软件的发展历史和现状SPS

5、S的发展及特点参考教材SPSS使用基础SPSS数据分析的基本步骤,统计学软件,SASBMDPSPSSEVIEWSTSPEXCEL,STATAMINITABR总体经济的研究和预测销售预测;财务分析成本分析和预测;蒙地卡罗模拟经济模型的估计和仿真;利率与外汇预测,Stata,Stata统计软件由美国计算机资源中心(ComputerResourceCenter)1985年研制。特点是采用命令操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强。最新版为11版。,R&S-Plus,R是统计领域广泛使用的诞生于19

6、80年左右的S语言的一个分支。最初S语言的实现版本主要是S-PLUS。后来Auckland大学的RobertGentleman和RossIhaka及其他志愿人员开发了一个R系统。R与S-PLUS有一定的兼容性。S-PLUS的使用手册,只要经过不多的修改就能成为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。但是请不要忘了:Risfree。,Minitab,Minitab由美国宾州大学研制。其特点是简单易懂,很方便进行试验设计及质量控制功能。在国外大学统计学系开设的统计软件课程中,Minitab与SAS、BMDP并列,根本没有SPSS的份。最新版本为14.0版,SPSS的发展,Sta

7、tisticalPackagefortheSocialSciences,即“社会科学统计软件包”。2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。90年代以后,适应操作系统,诞生了spssforwindows版。,历史,1968年:斯坦福大学三位学生创建了SPSS1968年:诞生第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:推出用

8、于个人电脑的SPSS/PC+1992年:推出Windows版本,同时全球自SPSS11.0起,统计产品和服务解决方案;2009年:定位为预测统计分析软件(PredictiveAnalyticsSoftware)PASW包括四部分:统计分析;数据挖掘;数据收集;企业应用服务2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBMSPSS字样,SPSS的特点,特点:1、具有完善的数据输入、编辑、统计分析、报表、图形制作等功能;2、强大的文件转换功能;3、强大的函数库(177个)。,SAS,Stata和SPSS之间的不同,SAS适合高级用户使用。它的

9、学习过程是艰苦的,最初的阶段会使人灰心丧气。然而它还是以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐。Stata较好地实现了使用简便和功能强大两者的结合。尽管其简单易学,它在数据管理和许多前沿统计方法中的功能还是非常强大的。用户可以很容易的下载到别人已有的程序,也可以自己去编写,并使之与Stata紧密结合。SPSS致力于简便易行(其口号是“真正统计,确实简单”),并且取得了成功。但是如果你是高级用户,随着时间推移你会对它丧失兴趣。SPSS是制图方面的强手,由于缺少稳健和调查的方法,处理前沿的统计过程是其弱项。,参考教材,教材:SPSS统计分析方法及应用,薛薇编著,电子工业出版

10、社,2004年。参考书:社会统计分析方法-spss软件应用,郭志刚,人大SPSSforwindows统计分析教程(第二版),李志辉罗平主编著,电子工业出版社,2005年。SPSSforwindows统计分析教程(第二版),卢纹岱编著,电子工业出版社,2003年。SPSSforwindows统计分析(第3版),卢纹岱编著,电子工业出版社,2006年。,学习方法,读、看、思考(排名,竞争力,可靠性等)查找统计学原理上机练习,摸索快捷途径自己找数据并结合软件进行实战,SPSS使用基础,1、软件的安装和启动2、基本操作环境3、软件的退出4、三种基本使用方式,两个窗口,数据编辑窗口窗口主菜单、工具栏、数

11、据编辑区、系统状态显示区组成;结果输出窗口窗口主菜单、工具栏、分析结果显示区、系统状态显示区组成;,数据编辑窗口,菜单功能概览,数据编辑窗口主要功能,定义SPSS数据结构、录入、编辑和管理待分析的数据文件扩展名.sav,结果输出窗口功能及特点,功能是显示管理SPSS统计分析、报表及图形的窗口扩展名.spo,基本使用方式,完全窗口菜单方式程序运行方式混合运行方式,完全窗口菜单方式,通过单击菜单、按钮、输入对话框等方式完成;适用于一般的统计分析人员;关键要明确菜单项的作用、选项的统计意义和适用场合及分析结果的含义。,程序运行方式,编写程序、提交运行SPSS程序在语句窗口(syntaxeditor)

12、下编写,扩展名.sps适用于大规模的统计分析工作Paste的关系,1.3数据分析的基本步骤,数据分析的一般步骤明确数据分析目标正确收集数据数据的加工整理明确统计方法含义和适用范围正确分析结果,软件分析的一般步骤建立SPSS数据文件定义文件及录入修改和保存文件加工整理统计分析解释分析结果,第二章数据文件的建立和管理,SPSS数据文件数据的结构及定义方法结构定义的应用案例,SPSS数据文件特点,扩展名.sav有结构的数据文件两项任务描述SPSS数据的结构录入编辑SPSS数据,数据文件基本组织方式,原始数据的组织方式频数数据的组织方式经过分组汇总后,以频数数据的组织方式采用何种组织方式,主要取决于收

13、集到的数据以及今后要进行的分析,SPSS数据的结构和定义方法,变量名数据类型、宽度、列宽度变量名标签变量值标签缺失数据度量尺度,name,长度不多于8首字符以英文字母开头不区分大小写,汉字可默认变量名为VAR00001,Typewidthcolumns,数值型、字符型、日期型每种类型的数据都有默认的宽度、小数位和列宽度宽度是变量可显示的最大字符位数列宽度是数据编辑窗口中显示的每列字符位数,label,对变量名含义的进一步解释说明增强变量名的可视性和统计分析结果的可读性长度可达120个字符,Valuelabels,对变量取值含义的解释说明信息例如,性别变量和收入水平等注意理解和变量名标签的区别,missing,原因数据中存在明显错误和不合理的数据存在漏填的数据项三种缺失值得定义,measure,统计数据根据度量尺度三类定距型数据(scale)定序型数据(ordinal)定类型数据(nominal),结构定义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论