版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
stata操作介绍之基础部分(一)第1页,共62页。第一部分第2页,共62页。一、接触Stata
第3页,共62页。
Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(ComputerResourceCenter)研制。它具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。1.1Stata简介第4页,共62页。Stata主要功能:1、数据管理功能2、统计分析功能统计分析:概要统计、交互表回归分析:OLS,2SLS,Logit,Probit,Tobit,Heckman,GMMPaneldata,Timeseries,Surveydata多变量分析:Clusteranalysis抽样和模拟:Bootstrap,MonteCarloSimulation3、绘图功能4、编程和矩阵运算功能1.2Stata功能第5页,共62页。1.3Stata工作界面第6页,共62页。1.4Stata与其他软件的区别第7页,共62页。Stata工具书:1、Stata实用教程——王天夫、李博柏著(基础教程)
2、应用Stata做统计分析——汉密尔顿著;郭志刚等译(最全教程)Stata学习相关资料1、经管之家论坛:2、Stata官方论坛:1.5工具书、论坛推荐第8页,共62页。1.6Stata软件分享(百度网盘)第9页,共62页。1、首先下载文件然后解压。解压完成后双击“SetupStata14.exe”进行安装。点击“Next”继续。如下图:1.7Stata安装第10页,共62页。2、选中“Iacceptthe....”然后点击“Next”第11页,共62页。3、继续点击“NEXT”。第12页,共62页。4、接下来选择安装组件。选中“Stata/MP”.然后点击“Next”.第13页,共62页。5、选择安装路径。路径可以自行更改,可以使用默认(路径中不要含有中文即可),默认路径为:C:\ProgramFiles(x86)\Stata14\第14页,共62页。6、最后软件安装完成。第15页,共62页。7、接下来对软件进行破解,在桌面打开Stata14快捷方式,会弹出如下对话框。将序列号,授权码,激活码输入到对应框中即可。序列号:(Seri)10699393授权码:(Code)4gppmkha3yqe3o9vg1m7iu6jou5j激活码:(Auth)tsrk第16页,共62页。Stata的界面主要是由四个窗口构成:
1、结果窗口
2、命令窗口
3、命令回顾窗口
4、变量名窗口除以上四个默认打开的窗口外,在Stata中还有数据编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗口、Log窗口等,如果需要使用,可以用Window或Help菜单将其打开。1.8Stata窗口介绍第17页,共62页。结果窗口命令窗口命令回顾窗口变量名窗口第18页,共62页。结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。第19页,共62页。命令窗口:位于结果窗口下方,相当于DOS软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。第20页,共62页。命令回顾窗口:即review窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,选中某一行单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令行即可。第21页,共62页。变量名窗口:位于界面左下方,列出当前数据集中的所有变量名称,。除以上四个默认打开的窗口外,在Stata中还有数据编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗口、Log窗口等,如果需要使用,可以用Window或Help菜单将其打开。第22页,共62页。Stata菜单栏简介包含八项下拉菜单:文件、编辑、数据、绘图、统计分析、用户、窗口及帮助。第23页,共62页。Stata的命令输入方式:
1、点击菜单栏输入命令;
2、在命令窗口输入命令;
3、运行命令程序(利用.do文件);1.9Stata命令输入第24页,共62页。Stata常用的文件格式:1.10Stata文件格式文件类型扩展名说明数据文件.dtastata使用的数据命令程序文件.do一系列命令的集合运行程序文件.ado用于完成用户提交的数据处理与统计分析任务的程序文件帮助文件.hlp与相应的.ado文件有相同的文件名,形成一堆文件,并提供在线帮助第25页,共62页。
利用Stata做统计分析时,官方提供的命令包并不一定能满足需求,因此许多研究者编写了大量的非官方命令包(包括.do文件、.ado文件和帮助文件),使用此类非官方命令包之前需要对其进行安装。Stata中有两个命令对于用户寻找与安装命令包相当有用:search和findit。通过这两个命令可以找到相关搜索内容中有哪些额外的命令,点击链接后安装即可。
1.11Stata命令包安装第26页,共62页。
命令包内容图例:第27页,共62页。用法如下:
finditvar_2(searchvar_2)第28页,共62页。三种主要途径可获得Stata帮助:
Stata手册;
Stata自带帮助;
网络帮助;1.12Stata帮助第29页,共62页。Stata手册:
Stata手册(英文版)默认存在于安装目录中(可在stata官网或百度下载中文版手册),共13册,格式为PDF,可通过stata手册查阅相关帮助。Stata自带帮助:
1、直接在命令窗口中输入helpvar_1如.helpsummarize2、通过菜单窗口的点选方式获得帮助:如.help>>statacommand
在弹出的对话框中输入:summarize然后回车,得到与helpsummarize,同样的结果。网络帮助:
如
.连接stata官网)
第30页,共62页。二、Stata使用基础
第31页,共62页。
Stata的通用命令结构如下:[prefix:]command[varlist][=exp.][ifexp.
][usingfilename][inrange][weight=][,options]2.1Stata命令结构术语含义术语含义prefix命令前缀usingfilename使用的文件command命令inrange观察个案范围varlist变量串weight权重=exp.表达式options选项ifexp.条件表达式第32页,共62页。Stata常用命令及其缩写命令或选项缩写含义命令或选项缩写含义listli列出变量renameren重命名describedes描述分析generategen,g新建变量displaydi,dis展示变量graphgr绘图summarizesum统计摘要regressreg回归tabulateta,tab列表显示variablevar变量lablelab标签columncol列第33页,共62页。
数据的输入包括三种方法:1.直接从键盘输入2.打开已有数据文件3.拷贝、粘贴方式交互数据2.2输入、输出与存储第34页,共62页。1.直接键盘输入在Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。建立两个变量x、y录入相应的数值第35页,共62页。2.用STATA的数据编辑器①进入数据编辑器进入stata界面,在命令栏键入edit或在stata的window下拉菜单中单击dataeditor编辑图标(注意:是浏览图标,点击后只能浏览,不能编辑)即可进入stata数据编辑器。②数据编辑stata数据编辑器界面:此时进入了数据全屏幕编辑状态。
第36页,共62页。数据编辑器在第一列输入数据后,Stata第一列自动命名为var1(x);在第二列输入数据后,第二列自动命名为var2(y)……依次类推。在输入数据后,双击纵格顶端的变量名栏,可以更改变量名,并可以在label栏中注释变量名的含义,点击OK确认。数据输入完毕后,单击preserve键确认所输数据,按关闭键即可退出编辑器。第37页,共62页。注意:1.如果为某一变量输入的第一个值是一个数字,比如对人口、失业率和预期寿命这些变量,那么stata便会认为这一列是一个“数值变量”,从此以后只允许数字作为取值。2.如果为某一变量第一次输入的是非数值字符,比如像地名的输入(或者输入了带逗号的数字),那么stata会判断此列是字符串或文本变量。3.在数据编辑器或数据浏览器中,字符串变量值显示为红色,这将其与数值变量(黑色)或加标签的数值变量(蓝色)区分开来。第38页,共62页。3.拷贝、粘贴方式交互数据Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL等软件交互数据,在数据量不大时,这种方式操作极为方便。把excel数据导入stata方法一:拷贝和粘贴方式先做好excel数据文件,在stata数据编辑器粘贴,变量名也可以复制过来,应该是最容易的方法。只有点stata数据编辑器第一格即可复制全部数据。复制会问你是否把第一行作为变量。方法二:导入的方式先做好excel数据文件,并以“xml表格(*.xml)”的形式保存,注意不能以“xml数据(*.xml)”的形式保存。而且注意,保存时不能在第一行中输入变量名,只能全部为数据。第39页,共62页。第40页,共62页。数据的输出可通过命令直接输出和使用菜单栏输出:
1、命令输出格式
outsheet[varlist]usingfilename[if][in][,opt]2、使用菜单栏输出
File>>Export>>Excelspreadsheet(*.xls,*xlsx)>>选中要输出的,设置文件名,再点击确认即可(也可以选择其它输出格式)。第41页,共62页。数据文件的存储:
1、存储在当前工作目录的命令输出格式:
savefilename[,replace]2、更改工作目录的命令输出格式:
saved:\data\undp\filename第42页,共62页。添加标签包括给文件和变量添加标签,命令格式如下:
.labeldata"label"
.labelvariablevarname"label"2.3添加数据标签第43页,共62页。
数据处理与运算三、Stata数据处理与运算第44页,共62页。
本部分讨论的主要对象是数据内部的变量,具体内容就是介绍Stata处理数据的基础知识与基础技术,其中包括:变量的名称给定、变量与变量取值标签的设定、变量变量的类型与储存格式的给定与更改、变量的运算、生成新变量、使用运算函数等等。此外,Stata还可以用来选择数据中特定的观察个案与变量。第45页,共62页。Stata变量的命名原则:
.变量名中字符的组成部分为A~Z,a~z、0~9与下划线“_”,这些字符以外的其他符号不能出现在变量名当中;
.变量名不能以数字作为开始符号;
.变量名区分大小写字母,而且不能识别汉字;3.1变量与变量值第46页,共62页。变量的取值类型:
1、字符型变量:由特定的字符串构成,用来分辨不同的类型;
2、数值型变量:数值变量的取值由数字构成,参与数字运算;
3、日期型变量:在Stata中,1960年1月1日被认为是第0天,因此1959年12月31日为第-1天,表示形式为:jan/10/2001或者10jan2001;
4、缺失值:STATA默认的缺失值用“.”来表示;第47页,共62页。变量图例:
字符变量数值变量缺失值第48页,共62页。数据格式数据存储类型:
第49页,共62页。变量标签为变量添加标签的命令:
labelvariablevarname''text''
其中,varname是用户希望为之加上标签的变量的变量名,双引号中的内容就是用户将要加上的变量标签。例:将变量hdi标签改为''SWJTU''
.labelvariablehdi"SWJTU"第50页,共62页。数据变量的显示格式
Stata中数字变量的基本显示格式有3种:e、f及g。其中,e表示科学指数格式;f表示固定格式;g则是默认格式,表示普通格式。数字变量的显示格式图例:3.2数据的显示第51页,共62页。字符变量的显示格式字符变量的显示格式只有1种:%#s。其中,%
是一个提示符;#表示显示的字符数,即宽度;s表示字符变量的显示格式。
字符变量显示格式的命令:
.formatnation%15s
该命令显示nation变量的前15个字符。第52页,共62页。更改变量名称更改变量名称的命令:
.renamesexgender数据的变量排序使用命令order可以重新将数据中变量的先后顺序排列一次,命令为:
.ordercontinnationgdphdirank-liter3.3变量的更名与排序数据排序结果:第53页,共62页。数据的排序除去变量的重新排序以外,Stata还可以依照某一个或多个变量的数值大小排序。通过排序(向上或向下),可以检测某些极值的情况。
变量排序(向上排序)的命令:
.sortcontingdp第54页,共62页。
变量排序(向下排序)的命令:
.gsort-contin-gdp第55页,共62页。Stata的表达式有一系列运算符组成,包括算术符号、关系符号和逻辑符号。3.4Stata中的表达式第56页,共62页。数据处理的一个重要任务就是生成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广东深圳龙岗区横岗街道振业城第一幼儿园招聘1人备考题库附答案详解(精练)
- 2026全军幼儿教师南京培训基地社会用工招聘1人备考题库含答案详解(典型题)
- 2026福建省南平人力资源服务有限公司顺昌分公司( 就业见习岗位)招聘1人备考题库有完整答案详解
- 2026浙商财产保险股份有限公司招聘3人备考题库(第6期)含答案详解(能力提升)
- 2026四川成都金牛区人民医院招聘工作人员的24人备考题库附答案详解(研优卷)
- 人教版五年级数学上册第四单元稍复杂的方程例2-教案
- 现代动作戏武术指导手册
- 智能健康产品与服务手册
- 互联网行业发展趋势与市场分析手册
- 《低碳环保植物种植保护手册》
- 大学科研创新平台管理办法
- 2026上海闵行区七宝镇村(合作社)、镇属公司招聘16人备考题库及答案详解1套
- 安徽省合肥市2026届高三下高考第二次教学质量检测数学试卷
- 2026年哈尔滨市香坊区中考一模数学试卷和答案
- 2025安徽宿州市泗县县属国有企业招聘21人笔试历年难易错考点试卷带答案解析
- 2026年河南工业贸易职业学院单招职业技能考试题库附答案详细解析
- (一模)南昌市2026届高三年级三月测试语文试卷(含答案解析)
- 2026校招:北京保障房中心公司笔试题及答案
- 2026版 中考风向标·物理 课件二、综合实验题
- GB/T 46957-2025电力储能系统并网储能系统安全通用规范
- 代谢循环关键酶与肿瘤进展干预
评论
0/150
提交评论