stata第一章基本操作.ppt_第1页
stata第一章基本操作.ppt_第2页
stata第一章基本操作.ppt_第3页
stata第一章基本操作.ppt_第4页
stata第一章基本操作.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 Stata 基本操作,宋顺林 中央财经大学 会计学院,内容提纲,1.1导入数据 1.2编辑数据 1.3描述数据 1.4结果和程序管理 1.5多表数据管理,1.1 导入数据,打开Stata软件 STATA由四个窗口构成 Review (列出历史命令) Variables (变量列表) Results (报告结果) Command (输入命令) 你可以通过下列菜单调整窗口设置 Edit/preferences Window/command, variables ,display 命令,在命令窗口输入: display 1 display “song“ 试试以下两者的区别: display “1+1“ display 1+1,Help 命令,菜单窗口 help/pdf document (Stata基本参考手册) help/content (Stata所有命令 介绍) help/stata command (搜索查询Stata命令) 命令窗口 help + stata 命令,例如: help display help help 另外,你也可以利用search命令寻求帮助,例如: search display search help,Insheet:导入数据,通常数据来源于数据库下载,而不是手工录入 导入格式 Stata不能直接支持很多格式(Excel files, SAS files) 可以先保存为csv格式后再导入stata 准备工作:将Excel文件另存为csv格式,然后导入 csv文件。 菜单窗口 File/import/ASCII data created by spreadsheet /browse file name 命令窗口 insheet using “D:Teach课件STATAdatacorgov.csv “,clear 在知道文件路径的情况下,往往使用insheet命令更为方便 对insheet了解更多, pls help insheet,drop _all and clear,首先导入数据 insheet using “D:Teach课件STATAdatacorgov.csv “,clear 然后试试以下两个的差别: insheet using “D:Teach课件STATAdatacorgov.csv “ insheet using “D:Teach课件STATAdatacorgov.csv “,clear 为什么要加clear,原因是: 你必须先清除(clear)原来的数据,才能导入新的数据 你也可以先用drop _all 删除原有数据,然后导入新的数据,检查数据 describe ,list,browse,edit,导入数据之后,你可以检查一下数据是否导入成功,有好几种方式可以帮到你: 在命令窗口输入describe 或 d ,将显示样本、变量数、数据大小及变量的详细信息。 输入入list, 显示所有样本数据,试试以下命令: list in 1 list in 2/10 输入browse 或br, 在数据窗口浏览所有数据 输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数据 试试browse,list,edit三个命令,看看三者的区别 注意:上述命令也可以通过菜单的方式实现。,保存数据,菜单窗口 File/save File/save as(另存为) 命令窗口 save “D:Teach课件STATAdatacorgov.dta “ save “D:Teach课件STATAdatacorgov.dta “,replace replace的作用是,如果文件已存在,则替换 注意stata格式文件的后缀为.dta,练习1.1,导入表名为earning的Excel格式数据 检查数据 保存数据为stata数据格式,1.2编辑数据,打开stata数据 use “D:Teach课件STATAdatacorgov.dta“,clear drop命令,删除变量或观察值 drop if year=2010,删除所有2010年的变量 drop year,删除year这个变量 drop _all,删除所有变量 注意:stata值的等号全为双等号,单等号是赋值命令,在以后的操作中,注意=号和=号的区别。,打开stata数据 use “D:Teach课件STATAdatacorgov.dta“,clear keep命令是drop命令的反向命令 keep year topone,删除其它变量,只保留year和topone这两个变量 keep if year=2010,删除其它年度变量,只保留2010年的变量 rename,编辑变量名称 rename topone top1 label ,为变量名贴标签,以更容易理解 label var top1 “第一大股东持股比例“ clear,清空所有数据,练习1.,打开stata数据 删除private变量 只保留stkcd year两个变量 删除2008年的数据 只保留2010年的数据 将year变量改名为y 将y的标签设置为年度,1.3描述数据,count,看看有多少样本 count count if year=2008 summary or sum,描述样本的统计量 sum topone ,描述topone变量最基本统计量,均值、方差、最小值、最大值 sum topone, d,描述topone变量更为详细的统计量,包括偏度、峰度、分位数。 tabulate或tab,描述离散变量的基本统计量 tab private,描述private变量为0和1的百分比,练习1.3,用stata打开corgov文件 看看一共有多少家样本 看看2010年一共有多少家样本 看看roa变量均值、方差、最小值、最大值是多少 看看roa变量的5,75的分位数是多少,偏度是多少 看看2010年private等于的比例是多少,1.4结果和程序管理,log命令,你可以用log存储命令和结果 use “D:Teach课件STATAdatacorgov.dta“,clear 打开log文件:capture log using “D:Teach课件STATAdataoutput.log”,replace sum topone sum topone,d tab private 查看log文件:view “D:Teach课件STATAdataoutput.log” 关闭log文件:log close 查查capture有什么功能,help capture 注意:log命令的功能同样可以通过菜单方式实现,用doedit和do命令管理程序,步骤 用doedit打开程序管理窗口 编辑程序,保存程序,运行程序 例子 use “D:Teach课件STATAdatacorgov.dta“,clear 打开程序:doedit 输入一系列命令: sum topone sum topone,d tab private 保存程序 运行程序:do “D:Teach课件STATAdatado.do“ 思考doedit和do的用处?,练习1.4,建立一个log文件 执行一些操作 用log文件存储你的操作结果 建立一个程序文件(do file) 执行一些操作 用do命令运行你的程序文件,1.3 多组数据处理,整理数据过程中,我们经常会遇到两种情况 我们希望在2000年的数据表后面加上2001年相同变量的样本数据-加行 我们希望在原始数据基础上增加对样本公司的其他特征的变量-添列,Business School of SYSU, 2010,19,1.3 多组数据处理,Master data,Using data,1.5多表数据管理,append 命令:数据表之间纵向合并,追加数据 insheet using “D:Teach课件STATAdatacorgov99-00.csv “,clear save “D:Teach课件STATAdatacorgov99-00.dta “,replace insheet using “D:Teach课件STATAdatacorgov01-10.csv “,clear append using “D:Teach课件STATAdatacorgov99-00.dta “ save “D:Teach课件STATAdatacorgov99-10.dta“,replace br,merge命令,数据表之间横向合并,追加新的变量 insheet using “D:Teach课件STATAdatacorgov.csv“,clear sort stkcd year save “D:Teach课件STATAdatacorgov.dta“,replace insheet using “D:Teach课件STATAdataearning.csv“,clear sort stkcd year merge stkcd year using “D:Teach课件STATAdatacorgov.dta“ tab _merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3表示都有) browse save “D:Teach课件STATAdatacorfin.dta,replace br help _merge,注意append命令和merge命令区别 思考merge和append命令相对于excel直接copy的优势 使用merge命令时,经常容易出错,merge完后,一定要检验数据是否正确,可以用browse,也可以tab _merge。常见错误包括: 忘记sort一下数据,合并不成功 忘记添加关键词,导致合并的数据错误 stata的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论