版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、引言 这一章讨论Stata中一些常用的编程语句。我们将讲解do文件与log文件,用户可以将任何顺序的Stata命令存入一个文本文件或do文件中,并通过Stata中的do命令或do文件编辑器来执行。通过使用Stata的do文件,用户可以避免重复键入相同的程序,使得一些重复性编程问题的处理变得更加方便。 本章的内容包括do文件和log文件的介绍、局部宏和全局宏、标量和矩阵、循环语句以及如何利用return list和ereturn list命令获得Stata命令的结果,这些内容都是Stata编程的基础。第1页/共24页14.1 do文件和Log文件14.1.1 do文件的编写所谓do文件是以. d
2、o为后缀的包含一系列Stata命令的文本文件。编写do文件的标准步骤如下:(1)确定当前工作目录。查看当前工作目录只需输入cd,而要改变当前目录,可以在cd后加上要更改的目标目录地址。(2)打开一个Do文件编辑器。(3)输入Do文件的内容,并保存。保存可以直接点击save按钮,或者打开菜单file,然后寻找并点击save。另外,作为一个比较快捷的方式,用户也可以直接在命令框中输入:doedit第2页/共24页14.1.2运行do文件 1 用户可以通过命令窗口来执行已经编写好的do文件。 2 另一种办法是通过do文件编辑器来执行do文件。第3页/共24页14.1.3 log文件 Log文件可以通
3、过log命令创建。例如,为了创建一个名为example.txt的log文件,用户可以在命令框中键入: . log using example .txt, text replace 其中replace选项允许新写入的log文件覆盖原有的同名文件。如果这里没有replace,且文件中已经存在同名log文件,Stata会拒绝该文件的创建。当程序执行完毕时,用户可以键入 . log close 来关闭当前的log文件。第4页/共24页14.2 局部宏与全局宏14.2.1 局部宏 【例3-2】请定义一个计数宏count从1到4,定义一个包含四个国家简写(US UK DE FR)的局部宏country,然
4、后通过使用foreach语句(循环语句foreach会在13.4节详细介绍)和display语句生成如下样式的结果: Country 1 : US Country 2 : UK Country 3 : DE Country 4 : FR 【例14-3】请定义一个计数宏count从1到4,定义一个包含四个国家简写(US UK DE FR)的局部宏country,然后通过使用foreach语句(循环语句foreach会在)和display语句生成如下样式的结果: 1 US 2 UK 3 DE 4 FR第5页/共24页第6页/共24页 【例14-4】数据集gdp4cty.dta是美国、英国、德国和法
5、国GDP的季度数据,从1971年的第1季度到1995年的第4季度,该数据集中重要的变量如表14-1所示,部分数据罗列在了表14-2中。本例要求利用局部宏和foreach语句生成每一国家的GDP时间趋势图。第7页/共24页第8页/共24页14.2.2 全局宏 全局宏的内涵与定义方式不同于局部宏。它往往被用来存储整个过程中所需要的用到的宏。例如,当我们需要存储一些当前的数据,且这些数据将会被所有的程序或默认路径下的数据集与do文件所使用时,我们就可以创建一个全局宏。 因为全局宏的使用可能会带来一些意想不到的问题,只有在少数下我们才会选择使用全局宏。比如我们在do文件A中创建了一个全局宏abc,之后
6、我们却忘记了。若之后我们在do文件G或H的编写中,又使用了宏abc,此时会将其作为一个它全局宏进行计算,运行出来的结果将会是不合意的,而我们很难避免这样的问题。一些教FORTRAN或C语言的老师经常会鼓励同学们多使用局部宏,尽量避免使用全局宏,运用到Stata的编程中道理也是一样的。第9页/共24页14.2.3 一些扩展函数以及列表函数 在Stata的编程过程中,用户可以通过许多扩展函数以各种灵活的方式来使用宏,此时需要在宏的名称和扩展函数之间添加一个冒号(:),这样用户便可以更加简单的重获或修改宏的内容。 使用宏的扩展函数的语法是: local | global macname : exte
7、nded_function 其中,macname是局部宏或者全局宏名,而extended_function就宏的扩展函数,具体来说包括如下这些函数,见表14-3所示。第10页/共24页 【例14-5】请定义一个包含四个国家简写(US UK DE FR)的局部宏country,使用宏扩展函数word count定义局部宏wds表示最大的循环个数,使用宏扩展函数word i生成局部宏wd作为计数依据,然后通过使用foreach语句(循环语句foreach会在14.4节详细介绍)和display语句生成如下样式的结果: Country 1 : US Country 2 : UK Country 3
8、: DE Country 4 : FR第11页/共24页14.3 标量简介定义标量 scalar define scalar_name = exp 其中,scalar_name是要定义的标量名,标量的赋值通过一个数值或者文字表达式 exp 来表示。显示标量的内容 scalar dir | list _all | scalar_names 其中,scalar dir和scalar list都用于显示标量的内容,其后面可以使用_all表示内存中的所有变量,也可以指定某些标量名称(scalar_names)。 从内存中删掉某些标量 scalar drop _all | scalar_names 第1
9、2页/共24页下面我们举一些简单的例子说明。定义标量a,赋值为2: . scalar a = 2定义标量b,赋值为a的赋值加上3: . scalar b = a+3定义标量root2,其赋值为2的开方: . scalar root2 = sqrt(2)定义标量s1,其赋值是字符串“hello world“:. scalar s1 = hello world第13页/共24页显示定义好的所有标量: . scalar list删掉标量a和b: . scalar drop a b再比如如下两个命令,要求定义标量,并且将这个标量用于定义新的变量:.scalar root2 = sqrt(2.0) /生
10、成一个标量,其赋值为2的开根号.generate DOuble rootGDP = gdp*root2 /将这个标量用于定义新的变量第14页/共24页14.4 循环结构14.4.1 forvalues语句 forvalues语句如下: forvalues lname = range commands referring to lname 其中,lname是指定的局部宏名称,而rang可以有如下形式: #1(#d)#2 表示从#1到#2步长为#d #1/#2 表示以步长为1从#1到#2第15页/共24页 【例14-6】数据集gdp4cty.dta是美国、英国、德国和法国GDP的季度数据,从197
11、1年的第1季度到1995年的第4季度,该数据集中重要的变量如表14-1所示,部分数据罗列在了表14-2中。 (1)这里的任务是利用forvalues语句生成四个变量lngdp1、lngdp2、lndgp3和lngdp4,它们分别是gdp1、gdp2、gdp3和gdp4的对数,然后显示新生成的四个变量的描述性统计量。 (2)生成变量gdp1_1995、gdp2_1995、gdp3_1995、gdp4_1995、gdp1_1997、gdp2_1997、gdp3_1997、gdp4_1997、gdp1_1999、gdp2_1999、gdp3_1999、gdp4_1999的描述性统计结果。第16页/共
12、24页14.4.2 foreach语句foreach语句的语法如下: foreach lname in|of listtype list commands referring to lname 可以使用的类型包括:对于每一个局部宏foreach lname of local lmacname 对于每一个全局宏 foreach lname of global gmacname 对于变量列表中的每一个变量foreach lname of varlist varlist 对于数字列表中的每一个数字foreach lname of numlist numlist 第17页/共24页 【例14-7】我们
13、这里使用数据集lifeexp来说明foreach命令语句的使用,这个数据集在第三章已经使用过了,该数据集是一个关于全球68国人口生存状况的数据,这些国家分别来自欧亚、北美和南美四大洲,数据的内容参看第三章,表3-10 是所有变量的一个概览,表3-11列出了数据集中北美洲国家的观测值。 这里要求计算这些变量的描述性统计量以及它们与popgrowth的相关性,并且绘制它们与popgrowth的散点图。第18页/共24页14.6 使用Stata命令的结果 所有的Stata的命令都可以被归入一下三类:r类、e类、s类(属于这类的情况较少)。其中e类命令是指估计命令(estimation command
14、s),这类命令将返回两个矩阵:e(b)被估计的系数矩阵,e(v)被估计系数的方差与协方差矩阵,同时也会返回一些其他信息(详情参见help ereturn)。其他绝大多数的Stata官方命令属于r类命令,这类命令是将运行结果返回到调用程序当中(详情参见help return)。 14.6.1 r类命令 下面让我们从最简单的r类命令入手。理论上说,所有的Stata命令都会将其所有的输出项存放在一个返回列表中。输入命令: return list 就可以获得这些输出项。第19页/共24页 【例14-8】 打开数据集wage.dta,使用describe命令描述该数据集,然后返回describe命令中的
15、输出项。 【例14-9】本例使用数据集abdata.dta,该数据集是一个面板数据,是140个国家 1976年到1984年的各种宏观指标。在这里的关键变量是id代表每个国家的标号,year代表年份,一个面板数据通常定义这两个变量以便进行各种面板回归和统计。其他的变量包括就业率emp(%)、平均工资wage(指标)、投资占GDP的百分比cap(%)。表14-4 罗列了部分数据 这里要求用tsset命令查看该面板数据的结构,并使用return list返回相关的结果。第20页/共24页14.6.2 e类命令 通过ereturn list命令可以返回e类命令的计算结果。ereturn list命令的
16、语法如下: ereturn list 这个命令在通过Stata执行了e类命令之后使用,大多数的e类命令返回的结果中包含四类: 标量比如e(N),总结估计的过程; 宏比如关于响应变量的信息(e(depvar))、使用的估计方法(e(model)); 矩阵系数和方差矩阵(e(b) e(v)); Stata函数比如e(sample),如果估计过程中使用了所有观测值则返回1,否则为0。第21页/共24页 【例14-10】本例使用数据集wage.dta,观测值有526个,主要变量有被调查者的工资(百元)、经验(年)、受教育水平(年)等,这里要求首先以工资(wage)为被解释变量,经验(experience)和受教育水平(education)做回归,然后使用ereturn list返回上述回归的结果。本例中我们将演示如何将回归结果中的各种元素导出,分以下五个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《GB-T 40473.4-2021银行业应用系统 非功能需求 第4部分:兼容性》专题研究报告
- 【语文】广西南宁市民主路小学小学三年级下册期末试卷
- 妇瘤患者化疗呕吐反应的护理干预
- 浙江省浙南名校联盟2025-2026学年高二上学期11月期中考试政治试卷
- 成本收益结构的优化路径
- 成本信息的共享与协同机制
- 2025 三年级数学上册长方形特征认识课件
- 2025 三年级数学上册万以内减法错例分析课件
- 妇产科护理职业心理成长 impact 课程讲义课件
- 成本管控与医院运营数据的深度挖掘
- 清雪施工方案
- 【上海金融与发展实验室】2025银行业科技金融创新与发展报告
- 2025年江苏省职业院校技能大赛中职组(大数据应用与服务)考试题库(含答案)
- 汽车租赁合同模板
- 医药行业研发项目激励机制管理制度
- 冷库管理规章制度和管理制度
- 第04辑一轮阅读 专题10 阅读理解说明文选标题专练15篇(满分攻略+高考真题+名校模拟)-2025届新高三英语提分培优通关练(高考真题+名校模拟)教师版
- 1、安全管理领导机构和安全管理专职机构制度
- ASTM-D3359-(附著力测试标准)-中文版
- DBJ15-22-2021-T 锤击式预应力混凝土管桩工程技术规程(广东省)
- CJT 3008.3-1993 城市排水流量堰槽测量标准巴歇尔水槽
评论
0/150
提交评论