计量经济学模型案例与软件操作 课件 第二章 计量经济学应用软件基本操作_第1页
计量经济学模型案例与软件操作 课件 第二章 计量经济学应用软件基本操作_第2页
计量经济学模型案例与软件操作 课件 第二章 计量经济学应用软件基本操作_第3页
计量经济学模型案例与软件操作 课件 第二章 计量经济学应用软件基本操作_第4页
计量经济学模型案例与软件操作 课件 第二章 计量经济学应用软件基本操作_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计量经济学应用软件基本操作授课教师:所在学院:联系方式:内容:●

计量经济学应用软件简介●EViews基本操作(主窗口、工作文件、数据序列、组序列、统计分析)●Stata基本操作(窗口、数据导入、数据管理、统计分析、其他操作)本章重难点:●

计量经济学应用软件简介。本节介绍了常用的计量经济学应用软件的特点、应用领域和使用方法。●EViews的基本操作方法。本节介绍了EViews软件的启动、工作文件的创建数据输入与使用、数据序列的创建、数据输入与编辑、组序列的建立和组内序列的数据特征分析以及序列统计分析等。●Stata基本操作。本节详细介绍了Stata的基本操作方法,包括Stata中数据的导入、数据的管理、基本统计分析以及其他操作等。第一节计量经济学应用软件简介

计量经济学应用软件是现代经济学研究中不可或缺的工具,它能够帮助研究人员处理大量的经济数据,并进行各种计量分析。本章将介绍几种常用的计量经济学应用软件,包括EViews、Stata、SAS、SPSS和R。

通过本章的学习,能够掌握这几种计量经济学应用软件的基本操作,为实际的计量经济学研究提供强有力的支持。

EViews是EconometricViews的简称,是全球流行的计量经济学软件,前身为美国QMS公司推出的MicroTSP,支持菜单式窗口和编程双模式运行,操作简便易学。该软件具备数据处理、作图、统计分析、回归建模分析、预测、时间序列(ARIMA)模型分析、时间序列X12季节调整分析、编程、模拟九大核心功能,其中统计分析和回归建模分析涵盖多种模型与分析方法。EViews的适用范围广泛,除经济领域外,还可应用于金融、保险、管理、商务等领域,其多项功能也适用于自然、社会、人文科学各领域,是相关领域工作人员,尤其是经济学、计量经济学、金融计量经济学领域从业者的必备工具。

一、EViews

Stata是全球流行的计量经济学软件,适配Windows、MacOS、Unix系统,是功能齐全的统计软件包。它操作简便、运行速度快,自带完备的分析与数据管理程序,同时支持用户自定义编程拓展功能。该软件支持下拉菜单、命令键入两种操作方式,亦可混合使用,初学者可借助菜单快速上手,而命令的一致性与直观性能提升资深用户的操作效率,也便于复杂或重复任务的编程。此外,Stata还提供help、search、link等丰富的帮助功能,可便捷查询命令句法等相关信息。

二、Stata

SAS即统计分析系统,1976年实现商品化,凭借强大功能与可靠技术支持享誉全球,经多年发展成为国际数据分析的标准软件,应用领域广泛。它是集数据管理、数据分析、信息处理于一体的集成软件,支持用户按需组合各类模块。SAS具备统计分析、计量经济分析、时间序列分析等多项分析功能,用于计量经济学分析时,可完成经典计量模型的估计与检验,还能开展模型诊断工作。

三、SAS

SPSS即社会科学统计软件包,是世界知名统计分析软件,其早年主要应用于企事业单位,1984年推出全球首款微机版本SPSS/PC+,开创微机系列开发方向,奠定个人用户市场第一的地位。该软件采用Windows窗口与对话框操作模式,操作门槛低,掌握基础Windows操作和统计分析原理即可上手。

SPSS/PC+的推出大幅拓展了其应用范围,覆盖自然、技术、社会科学等领域,凭借自动统计绘图、数据分析深入、操作便捷、功能齐全等优势获权威报刊高度评价。四、SPSS

R语言是从S语言演变而来的。20世纪70年代,S语言诞生于贝尔实验室,是RickBecker、JohnChambers、AllanWilks开发的语言。基于S语言开发的商业软件Splus,可以方便地编写函数、建立模型,具有良好的扩展性。该软件的源代码全部公开,其命令统称为R语言。R是开源软件(免费软件),功能强大、更新快,具有强大的图形功能,可以在包括Unix、Linux、Windows、MacOS

等多种平台下运行,可以用于可复制化研究,可以减少大量重复性操作,并可以对分析结果进一步加工。五、R

实际应用的计量经济学软件还有很多,以上列举的只是当前比较流行的五种。应用计量经济学理论及方法进行实证分析,至少应掌握一种常用软件。本书所有示例的数据分析主要采用EViews和Stata软件,下面主要介绍EViews8.0和Stata15.0以上版本软件的基本操作,关于EViews和Stata软件的具体操作,在以后的各章中均结合案例有详细介绍。

第二节EViews基本操作

一、主窗口简介

软件安装后,在Windows窗口双击EViews图标或在程序菜单中单击EViews程序子菜单,启动EViews程序,进入EViews主窗口,见图2-1。

主窗口第一行为EView标题栏,第二行为菜单栏,排列着按功能划分的10个菜单选项:File、Edit、Object、View、Proc、Quick、Options、Add-ins、Window、Help。用鼠标左键单击任意选项会弹出不同的下拉菜单,显示该部分的具体功能。

菜单栏下面空白区是命令输入栏,允许用户通过键盘输入各种EViews命令,每输入一条命令,回车后就相应执行一条命令。

图2-1

命令栏下方大面积空白区域为工作区,由操作产生的工作文件及对象均显示在此窗口。

主窗口底部最后一行为状态栏,主要显示程序路径、数据库和工作文件名称等相关内容。二、工作文件的创建及使用(一)建立工作文件

EViews要求数据的分析处理过程必须在特定的工作文件(Workfile)中进行。所以,用户使用EViews的第一步是必须建立或打开一个工作文件,才能进行EViews操作。

用鼠标左键单击主菜单选项File,在打开的下拉菜单中选择New→Workfile,如图2-2所示。点击Workfile后出现一个工作文件创建对话框,要求指定数据序列性质和数据区间,如图2-3所示。为了描述工作文件的结构,需要提供给EViews关于观测值和与其相联系的标识符的外部信息。

图2-2

图2-3

为了描述工作文件的结构,需要提供给EViews关于观测值和与其相联系的标识符的外部信息。在图2-3所示对话框中,对话框的左边是下拉列表框,“Workfilestructuretype”用来描述数据集合的基本结构,共有三种类型数据的工作文件.1.Dated-regularfrequency

选择此项(默认选项),表示建立时间序列数据的工作文件,右边为数据定义框,Frequency(频率)项指研究数据性质,可选择年度、季度、月度、日度等。2.Unstructured/Undated

若选择此选项,表示建立非结构数据工作文件,非结构数据仅仅是没有指定日期的数据,它使用默认的整数标识符,一般截面数据可选此项。在下拉列表中选择这一类型时,对话框将发生变化,会提供一个空白区域用来输入观测值的个数,输入样本量后点击OK,就可建立相应样本量的工作文件。3.BalancedPanel

在下拉列表中选择BalancedPanel,将创建一个平衡面板结构数据的工作文件,选定频率(Frequency),输入起始日期(Startdate)和终止日期(Enddate)以及截面成员的个数(Numberofcross),可以命名工作文件和命名工作文件页,点击OK,EViews将创建一个使用特定的起始和终止日期以及指定截面成员个数的平衡面板数据工作文件,如图2-4所示。

图2-4(二)工作文件的保存与调用

保存新建立的工作文件有两种方法。一种是在主窗口中选择菜单File→Save或SaveAs;另一种方法是直接单击工作文件窗口工具栏中的Save按钮,保存文件时需要给出文件名。

调用已有的工作文件。在主窗口菜单选项中依次选择File→Open→Workfile,点击Workfile后,选中要打开的文件即可。(三)工作文件数据区间范围的调整

根据实际问题的要求,当需要调整区间的范围时,就要变更工作文件数据序列的起始点或终止点。

在图2-4所示工作文件窗口的工具栏中,选择Proc→Structure→Resizecurrentpage...,然后在出现的对话框中输入新的数据起止点即可。EViews默认的样本区间与工作文件的数据区间相同,如在实际分析中,需要不同于工作文件数据区间的样本,可根据实际需要设定样本区间,样本区间是数据区间的一个子区间。在图2-4所示工作文件窗口的工具栏中选中Sample按钮,在如图2-5所示的对话框中输入样本数据起止点即可。

图2-5三、数据序列创建、数据输入及编辑(一)数据序列创建

在主窗口的菜单选项或工作文件窗口的工具栏中选择Object→NewObject,出现如图2-6所示的对话框。在对话框中选择Series,并在对话框右上方空格处填写新序列名称(默认名是Untitled),如命名为X,操作完毕后点击OK按钮即可。EViews软件不区分序列名称字母的大小写,例如GDP、Gdp和gdp等都被视为同一序列名称。

同时生成多个序列时可使用命令data。如要生成序列X,Y,Z,则可在主窗口命令栏内输入:dataXYZdata与X,Y,Z之间要用空格分开。

打开序列的方法很多,最简便的方法是双击选定的序列。

图2-6(二)数据的输入与编辑

建立工作文件后,无论新生成还是打开一个序列,都会出现如图2-7所示的序列对象窗口。在工具栏上选择Edit+/-按钮进入编辑状态,可输入或修改序列数据。如使用data命令,则直接进入编辑状态。点击Smpl+/-按钮,可在显示工作文件数据区间内全部数据和只显示样本数据之间切换;Label+/-按钮在是否显示数据序列标签两种模式间进行切换;Wide+/-按钮在单列显示和多列显示数据序列之间切换。对于季度和月度数据,采用多列显示模式会更清楚。录入或修改数据完毕后点击Edit+/-按钮恢复只读状态。(三)序列排序

当需要对序列数据进行排序时,可在图2-4所示工作文件窗口工具栏中选择Proc→SortCurrentPage,出现如图2-8所示对话框。

在对话框中Sortkey(s)[Enteroneormoreseriesnamesorseriesexpressions]下面填写排序的关键词,即对哪个或哪几个序列值进行排序。如输入X,Y则对X,Y序列进行排序。

在Sortorder选项中,要指定是按升序(ascending)还是降序(descending)排列。

图2-7

图2-8注意:如果数据序列已经按日期或特定顺序排列,排序会破坏观测值与日期或特定顺序的关系。(四)新序列的建立

在数据分析时,利用已知数据生成新序列是常用的操作。若新序列是工作文件中已有序列的函数,则可由已知序列经函数运算产生。

在主菜单选择Quick→GenerateSeries或点击工作文件窗口工具栏中的Object→GenerateSeries,出现序列建立对话框,如图2-9所示。在上面的Enterequation编辑区中输入赋值语句,在Sample下面输入样本期。

例如,工作文件中已有序列X和Y,利用它们生成新的目标序列Z,可键入赋值语句

Z=2*X-Y/3

如果目标序列是工作文件中存在的序列,此时操作相当于修改原数据。EViews软件中常用算术函数为:自然对数log()、指数exp()、算术平方根sqr()、差分d()、倒数@inv()和绝对值abs()等。

图2-9

注意:当有外部数据文件时,比如Excel数据文件,也可以通过打开(Open)命令,将外部数据直接作为工作文件打开,具体菜单路径为:File→Open→ForeignDataasWorkfile。

常用的运算符号及其含义见表2-1

表2-1运算符号功能+加-减*乘/除^乘方>大于。如果X>Y,则逻辑运算X>Y的值为1,否则为0<小于。如果X<Y,则逻辑运算X<Y的值为1,否则为0=等于。如果X=Y,则逻辑运算X=Y的值为1,否则为0<>不等于。如果X¹Y,则逻辑运算X<>Y的值为1,否则为0

续表运算符号功能<=小于等于。如果X小于等于Y,则X<=Y的值为1,否则为0>=大于等于。如果X大于等于Y,则X>=Y的值为1,否则为0AND“与”逻辑。如果X和Y都不为零,则XANDY的值为1OR“或”逻辑。如果X或Y不为零,则XORY的值为1D(X)X的一阶差分,即X-X(-1)D(X,n)X的第n次一阶差分,即(1-L)nX。其中L是滞后算子D(X,n,s)X的n次一阶差分和一次s阶差分,即(1-L)n(1-Ls)XLOG(X)对X取自然对数DLOG(X)对X取自然对数后做一次一阶差分。LOG(X)-LOG(X(-1))DLOG(X,n)对X取自然对数后,做n次一阶差分,即(1-L)nLOG(X)DLOG(X,n,s)对X取自然对数后,做n次一阶差分和一次s阶差分,即(1-L)n(1-Ls)LOG(X)EXP(X)对X取指数变换ABS(X)对X取绝对值变换SQR(X)对X取平方根变换SIN(X)对X取正弦变换COS(X)对X取余弦变换@ASIN(X)对X取反正弦变换@ACOS(X)对X取反余弦变换RND生成0—1间均匀分布的随机数NRND生成均值为零、方差为1的标准正态分布随机数@PCA(X)生成绝对变化或增长量序列。X-X(-1)@PCH(X)生成相对变化或增长率序列。(X-X(-1))/X(-1)@INV(X)对X取倒数,1/X@DNORM(X)变X为标准正态密度函数@CNORM(X)变X为累积正态分布函数@LOGIT(X)对X进行logistic变换@FLOOR(X)变换X为不大于X的最大整数@CEILING(X)变换X为不小于X的最小整数四、组序列的建立和组内序列的数据特征(一)组序列的建立

组是若干个序列的集合,通过组可研究序列之间的关系。

在图2-4所示工作文件窗口的工具栏中选择Object→NewObject,然后在图2-6所示的对话框左边选择Group项,并给它命名,点击OK后出现组对象定义对话框,如图2-10所示。输入欲建立的组所包含的序列名称后,点击OK,即创建了包含若干序列的组。

也可使用更简洁的命令方式创建组,格式为输入命令

data

X

Y

Z

在回车后出现的组窗口中单击Name,命名该组的名称,即建立了以X、Y、Z序列为内容的组。

图2-10(二)组内序列的数据特征在组窗口中,单击Views按钮,可在下拉菜单中选择不同的项目对组序列进行数据特征统计分析。菜单项目如图2-11所示。列举部分项目功能如下:GroupMembers:增加组中序列。Spreadsheet:以电子数据表的形式显示数据。DatedDataTable:使时序数据以表的形式显示。Graph...:显示序列的各种图形。DescriptiveStats:给出组中序列的描述统计量,如均值、方差、偏度、峰度等。CovarianceAnalysis...:对组中序列进行协方差分析,如给出协方差矩阵、相关系数矩阵等内容。N-WayTabulation...:给出组中序列数据在某一区间的频数、频率和某一序列是否与组中其他序列独立的假设检验结果。TestsofEquality...:给出检验组中序列是否是同均值、同中位数或同方差的假设检验结果。PrincipalComponents...:对组中序列进行主成分分析。

图2-11五、序列统计分析(一)序列的图像

观察序列图像是认识数据规律最直观的方法,EViews中有两种绘图途径,且生成对象不同(如图2-12):①

主菜单点击Quick→Graph,打开图形选择对话框,生成Graph(图)对象;②

打开序列组窗口,点击View→Graph,打开同款对话框,生成Series(序列)对象。

图形选择对话框左侧是树状结构的OptionPages选择框,含GraphType(图形种类)、Frame&Size(图框和尺寸)等7项,其中GraphType、Axes&Scaling(轴和刻度)、GraphElements(图素)为常用项,对话框默认显示GraphType的BasicType(基本图形)。

对话框中部GraphType的Specific选择框有16种图形可选,默认是Line&Symbol(折线与符号图);点击GraphType右下方箭头,可选择8种基本图形,含折线图、条形图、散点图等,其中散点图、饼图等后5种需指定两个及以上序列。对话框右侧Details可对图像做详细设计,完成设置后点击OK即可生成图像。

若需将绘制的图像保留在工作文件中,点击Name按钮为图像命名,即可将其作为对象保存。

图2-12【案例2-1】用一个序列对象画折线图有两种画折线图的方法。第一种操作方法是在EViews工作文件中通过点击选中一个所用序列。通过工作文件窗口中的Show键或直接双击该序列打开序列窗口。点击该序列窗口中的View键选Graph功能。在打开的GraphOptions(图形选择)对话框(默认位置是画折线图)中直接点击OK键,即可得到序列的折线图。第2种操作方法是选中一个所用序列,点击EViews主选单中的Quick键,选Graph功能,从而打开SeriesList对话窗(序列名已自动填入)。点击OK键,打开GraphOptions(图形选择)对话框。【案例2-2】用一个序列对象画分布直方图。在EViews工作文件中通过点击选中一个所用的序列。通过工作文件窗口中的Show键或直接双击该序列打开序列窗口。点击该序列窗口中的View键选Graph功能。在打开的GraphOptions(图形选择)对话窗中部的Specific选择框中选择Distribution(分布图)。点击OK键,即可得到序列的分布直方图。如果在打开的GraphOptions(图形选择)对话框中部的Specific选择框中选择Distribution(分布图)后,继续在GraphOptions(图形选择)对话框右侧的Detail选择框中的Distribution的选择框区中选中KernelDensity(核密度图)。点击OK键,即可得到序列的分布核密度图。【案例2-3】用两个序列对象画散点图

在EViews工作文件中通过按住键盘上的Ctrl键点击选中两个所用序列。在EViews主功能键中点击Quick键选择Graph功能,将打开如图2-12的GraphOptions(图形选择)对话框。或者通过点击EViews工作文件中的Show键打开序列组窗口,点击该序列窗口中的View键选Graph功能,也会打开如图2-12的对话窗。在打开的GraphOptions(图形选择)对话框中部的Specific选择框中选择Scatter(散点图)。点击OK键,即可得到该两个序列的散点图。

如果要画以某个序列为横轴,以其他两个序列为纵轴的散点图,开始即选中三个序列。EViews将以首先选中的那个序列为横轴,以其余序列为纵轴。随后的操作与上相同。注意:熟练使用GraphOptions(图形选择)对话窗后,可以在已画出图形的基础上进一步修饰出更漂亮、更满意的图形来。【案例2-4】用一个序列的数据画相关图(Correlogram)。

在EViews工作文件中通过点击选中一个所用序列对象。通过工作文件窗口中的Show键或直接双击该序列打开该序列窗口。点击该序列窗口中的View键选Correlogram功能。在打开的CorrelogramSpecification(相关图设定)对话窗(见图2-13)中选择所用原序列或其一次、二次差分序列以及相关图的滞后期,点击OK键,即可得到序列的相关图。

图2-13

图2-12(二)序列的描述统计分析

在EViews工作文件中通过点击选中一个所用的序列对象。通过点击工作文件窗口中的Show键或直接双击该序列打开该序列窗口。点击该序列窗口中的View键选DescriptiveStatistics&Tests→HistogramandStats功能,如图2-14,即可得到序列的均值、中位数、极大值、极小值、样本标准差、偏度、峰度值以及数据分布图、JB统计量的值。

图2-14

以本章人均消费(CONS)和人均收入(INC)数据为例,建立工作文件并导入数据。双击INC图标,打开INC序列,在序列INC窗口中,单击View,选中下拉菜单中的DescriptiveStatistics&Tests,在弹出的下拉子菜单中选择HistogramandStats,得到如图2-15的结果。

图2-15中直方图反映人均收入在各区间的分布频率。图右边的框内列出了人均收入的描述统计量:均值(Mean)为42252.66、中位数(Median)为38253.10、最大值(Maximum)为76437.30、最小值(Minimum)为31114.70、标准差(Std.Dev.)为11129.24、偏度(Skewness)为2.012544和峰度(Kurtosis)为6.383803,其中偏度和峰度的计算公式为:

偏度

峰度

图2-15

公式中的σ^为标准差,n为序列样本量。

图2-15中右侧下面两项是序列样本是否服从正态分布的Jarque-Bera检验结果。Stata软件因操作简单且功能强大,成为目前在欧美国家中较为流行的统计与计量软件,拥有众多用户。Stata公司定期升级软件,以适应计量经济学的迅猛发展。Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。对于一些最新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-writtenStatacommands)。这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能更加完善。

第三节stata基本操作一、Stata窗口简介

安装Stata后,双击Stata应用程序图标,启动Stata软件,即可打开Stata,默认界面语言为简体中文,主要窗口见图2-16。此时可以看到,在窗口最上方有一排菜单,即文件(F)、编辑(E)、数据(D)、图形(G)、统计(S)、用户(U)、窗口(W)、帮助(H)。在菜单之下,则为一系列快捷图标。在图标之下,有五个窗口,分别为:左上“历史窗口”,此窗口记录着自启动Stata以来执行过的命令;中上“结果窗口”,此窗口显示执行Stata命令后的输出结果;中下“命令窗口”,在此窗口输入想要执行的Stata命令;右上“变量窗口”,此窗口记录着目前Stata内存中的所有变量;右下“属性窗口”,此窗口显示当前数据文件与变量的性质。

在图2-16所示的Stata主界面中,通过单击“编辑(E)”菜单,选择“首选项”,在弹出的子菜单中选择“用户界面语言”,如图2-17所示。

图2-16

图2-17在弹出的“设置Stata的用户界面语言”窗口,如图2-18,单击“语言”下拉框,可选择所需的语言界面,如选择“English”,点击“确定”,重新启动后,则切换到英文界面,如图2-19所示。

图2-19二、在Stata中导入数据

下面以“2020年城镇居民人均收支数据(Excel数据文件为ch2.xlsx)”为例介绍将数据导入Stata的方法,该文件包含我国31个省城镇居民人均消费和人均可支配收入的数据。(一)通过“数据编辑器”导入数据

首先,打开Stata软件,点击快捷键“数据编辑器(编辑)”快捷图标(参见图2-20),即可打开Stata的数据编辑器(参见图2-21)。

其次,用Excel打开本章Excel数据文件“ch2.xlsx”,会看到如图2-22所示的Excel格式的数据文件,共有3列变量,分别为region(地区)、cons(人均消费支出)、inc(人均可支配收入)。

图2-20

图2-21

图2-22

最后,复制(Ctrl+C)此Excel表中所有数据,粘贴(Ctrl+V)到数据编辑器中。在数据编辑器中会出现对话框,见图2-23。

图2-23(二)通过“导入”菜单输入数据

导入数据的另一方法是(特别是在数据量很大的情况下),点击菜单“文件”→“导入”,然后导入各种格式的数据,参见图2-24。在图2-24中选择“Excel电子表格”,在弹出的对话框中,单击“浏览”,找到需要导入数据的文件,如第一行为变量名,勾选“将第一行作为变量名”,结果如图2-25所示。

图2-24

图2-25

关闭DataEditor(Edit)后,会看到右上方的变量窗口出现了3个变量,分别为cons、inc、region,见图2-26。

点击快捷键“保存”图标(参见图2-27中鼠标位置,也可点击菜单“文件”→“保存”或“另存为”),将数据存为Stata格式的数据文件(扩展名.dta,为data的缩写),比如ch2.dta。

此后可通过“打开”快捷图标或菜单“文件”→“打开”方式直接打开.dta格式数据文件,无须再从Excel中导入数据。

图2-26

图2-27(三)通过命令导入数据

在命令窗口输入以下命令(假设Stata数据文件ch2.dta存放在E盘的根目录),然后回车(按Enter键).useE:\ch2.dta,clear

逗号“,”之后的“clear”为“可选项”(option),表示可用此数据替代内存中原已存在的数据。使用命令use打开dta数据文件,需输入此文件的路径;一般使用快捷键“打开”寻找此文件更为方便。

如要关闭一个数据集,以便使用另外一个数据集,可输入命令.clear

内存中数据将被清空,然后可再打开另一数据集。

通过命令也可打开Excel格式的数据文件,假设数据文件城镇居民人均收支数据2020.xlsx保存在E盘根目录下,第一行为变量名,则可通过以下import命令导入Excel文件数据,效果与菜单导入方式相同,但不如菜单方式方便。.importexcel"E:\城镇居民人均收支数据2020.xlsx",sheet("Sheet1")firstrow命令语句中import为命令关键字,firstrow表示将第一行作为变量名。三、数据管理(一)变量标签

在变量管理器窗口,变量的“名称”旁边会显示其“标签”。点击“变量管理器”快捷图标(参见图2-28),即可打开变量管理器,然后可以编辑变量名称、标签等。

比如,将变量inc的标签改为“income”,然后点击“应用”(界面参见图2-29),inc的标签即改为“income”。注意:Stata软件严格区分大小写字母(casesensitive)。建议变量名使用小写字母,便于阅读。

图2-28

图2-29(二)数据概览

如想看数据集中的变量名称、标签等,可输入命令.describe

其中,“describe”命令简写为“d”。上述文件中3个变量显示结果见图2-30。

如想看变量cons与inc的具体数据,可使用命令.listconsinc

输入上述命令,回车后,结果见图2-31,图2-31中只截取了前15条数据。

图2-30

图2-31

查看具体数据的直接方法是,点击“数据编辑器(编辑)”图标,或右边的“数据编辑器(浏览)”图标,参见图2-32。二者的区别在于,后者只能查看数据,不能改;而前者不仅可以查看数据,还可以修改数据。

如要删除满足“inc≥50000”条件的观测值,可输入命令.dropifinc>=50000

反之,如只想保留满足“inc≥50000”条件的观测值,可使用命令.keepifinc>=50000

删除观测值之后,Stata不提供类似于MicrosoftWord的撤销(undo)命令。一般建议慎重删除数据,删除前最好先将原始数据备份。

如想将数据按照变量inc的升序排列,可输入命令.sortinc

命令sort无法按照变量的降序排列。如想按降序排列,可使用命令gsort.gsort-inc

图2-32(三)生成新变量Stata中定义新变量,可通过命令generate来实现。比如,输入如下命令可定义人均可支配收入的对数.generatelninc=log(inc)如要定义inc的平方项,可使用命令.geninc2=inc^2如要生成inc与cons的互动项(interactionterm),可输入命令.genconsinc=cons*inc如想根据人均可支配收入对数lninc计算人均可支配收入inc1,可使用命令

.geninc1=exp(lninc)在计量经济学中,常使用“虚拟变量”(dummyvariable,也称“哑变量”),即取值只能为0或1的变量,比如性别。假设定义“inc≥50000”为“高收入”,并使用变量high来表示high=1,inc≥500000,其他(2.1)可使用如下命令.genhigh=(inc>=50000)括弧“()”表示对括弧中的表达式“inc>=50000”进行逻辑判断:如果此式为真,则取值为1;如果为假,则取值为0。在上面命令中,如不慎把high打成hihg了。可使用如下命令将变量重新命名.renamehihghigh变量hihg被重新命名为high(也可使用变量管理器进行重命名)。如想将“高收入”的定义改为“inc>=60000”,但仍用high作为变量名,有以下几种方法可以实现。方法一,去掉现有变量high,再重新定义一次.drophigh.genhigh=(inc>=60000)方法二,通过replace命令.replacehigh=(inc>=60000)此命令直接将原变量表示“inc>=50000”替换为新变量表示“inc>=60000”。对于较长的变量名,输入变量名较麻烦。有如下三个简便方法。方法一,直接在变量窗口双击需要的变量,该变量名就会出现在命令窗口。方法二,如有以下变量X1,X2,X3,X4,X5,可用X1-X5来表示这5个变量。方法三,用“*”号来简化变量名的书写。假设想将内存中所有以“X”开头的变量都去掉,可输入命令.dropX*这将去掉内存中的变量X1,X2,X3,X4,X5(删除之后无法恢复,故应慎重使用)。(四)Stata的计算器功能Stata也可作为计算器使用,命令格式为“displayexpression”。比如,计算ln2,可输入如下命令.displaylog(2).69314718四、基本统计分析(一)画图观察数据的最直观方法是画图。想看变量inc的分布情况,可输入以下命令画直方图(参见图2-33).histograminc,width(10000)frequency命令“histogram”表示画直方图,选择项“width(10000)”表示将组宽设为10000(否则将使用Stata根据样本容量计算的默认分组数),选择项“frequency”表示将纵坐标定为频数(默认使用密度)。如想知道更多有关命令histogram的选项与用法,可输入命令.helphistogram对于任何Stata命令,只要输入“helpcommand_name”即可查看该命令的“帮助文件”(helpfile)。如想考察人均消费支出与人均可支配收入之间的关系,最直观方法是画cons与inc之间的散点图,可输入命令(参见图2-34).scatterconsinc

图2-33

图2-34如想在散点图上标注出每个点对应于哪个观测值,可先定义变量n,命令如下.genn=_n“_n”表示第n个观测值。然后以变量n作为每个点的标签来画散点图,命令如下.scatterconsinc,mlabel(n)选择项“mlabel(n)”表示以变量n作为标签(marklabel),结果参见图2-35。也可以直接以变量region作为每个点的标签来画散点图,命令如下.scatterconsinc,mlabel(region)命令结果参见图2-36。

图2-35

图2-36Stata有丰富的作图方法。更多作图方法,参见下拉式菜单“图形”(参见图2-37)。

图2-37(二)统计分析初步如想看变量cons的统计特征,可输入命令.summarizecons此结果显示变量cons的样本容量、平均值、标准差、最小值与最大值。如不指明变量,则显示所有变量的描述统计指标。.sumVariableObsMeanStd.Dev.MinMaxcons3126080.766043.74420331.944839.3VariableObsMeanStd.Dev.MinMaxregion0

cons3126080.766043.74420331.944839.3inc3142252.6611129.2431114.776437.3n31169.092121131如要显示变量cons的经验累积分布函数(empiricalcumulativedistributionfunction),可使用命令.tabulateconsconsFreq.PercentCum.20331.913.233.2320397.313.236.452058713.239.6820644.913.2312.9020906.513.2316.1321623.213.2319.3522134.313.2322.58--more—“Freq.”表示频数,“Percent”表示百分比,而“Cum.”表示累积百分比。如要显示人均消费支出与人均可支配收入之间的相关系数,可输入命令.pwcorrconsinc,sigstar(.05)“pwcorr”表示“pairwisecorrelation”(两两相关),“sig”表示显示相关系数的显著性水平(即p值,列在相关系数的下方)。“star(.05)”表示给所有显著性水平小于或等于5%的相关系数打上“*”号。cons与inc的相关系数为0.9686,且在5%水平上显著(p值为0.0000)。其他回归模型分析与操作,参见后面各章案例分析内容。consinccons1.0000

inc0.9686*1.0000

0.0000

五、其他操作(一)调用命令与终止命令

如果每次都完整地输入整行命令,可能较费时。比较有效率的方法是调用某个曾经使用过的命令,并在此基础上修改。调用旧命令的方法是:在历史命令窗口单击旧命令,将旧命令调入命令窗口,然后进行编辑;如果用鼠标双击旧命令,则将再次执行此旧命令。

有时运行某个命令费时较长(比如,在数值计算时,迭代无法收敛)。如想中途停止该命令的执行,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论