横截面数据时间序列数据面板数据

上传人：y*** IP属地：天津上传时间：2022-01-12 格式：DOC 页数：5 大小：77.50KB 积分：15 举报 版权申诉

免费预览已结束，剩余1页可下载查看

 付费下载

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、横截面数据、时间序列数据、面板数据横截面数据：（时间固定）横截面数据是在同一时间，不同统计单位相同统讣指标组成的数据列。横截面数据是按照统讣单位排列的。因此，横截面数据不要求统讣对象及其范围相同，但要求统计的时间相同。也就是说必须是同一时间截面上的数据。如：名称涨幅浦发银行-2.72白云机场-1.00武钢股份7.44东风汽车-0.98中国国贸-1.33首创股份-2.92上海机场-0.56包钢股份-1.48华能国际-1.94时间序列数据：（横坐标为t,纵坐标为y）在不同时间点上收集到的数据，这类数据反映某一事物、现象等随时间的变化状态或程度。如：面板数据：（横坐标为t,斜坐标为y,纵坐标为

2、z）是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面卩叽当这类数据按两个维度排列时，是排在一个平面习,口只有一个维度的数据排在一条线上有着明显的不同，整个表格像是一个面板,所以把panel data译作“面板数据”o举例：如：城市名：北京、上海、重庆、天津的GDP分别为10、11、9、8（单位亿元）。这就是截面数据，在一个时间点处切开，看各个城市的不同就是截面数据。如：2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12（单位亿元）。这就是时间序列，选一个城市，看各个样本时间点的不同就是时间序列。如：2000、2001、2

3、002、2003、2004各年中国所有直辖市的GDP分别为：北京市分别为8、9、10、11、12；上海市分别为9、10、11、12、13；天津市分别为5、6、7、8、9；重庆市分别为7、8、9、10、11（单位亿元）。这就是面板数据。城2000200120022003北京1453上海2436重庆2135天津4537在写论文时经常碰见一些即是时间序列乂是截面的数据，比如分析1999-2010的公司盈余管理影响因素，而影响盈余管理的因素有6个，那么会形成如下图的数据公司1公司2公司100因素1因素6盈余管理程度因素1因素6盈余管理程度因素1因素6199920002010如上图所示的数据即为面板数据

4、。而时间序列数据和截面数据都是二维的，把面板数据半成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多，一般使用Eviews6.0, Stata等。个人推荐使用Stata,因为Stata比较适合处理面板数据，且个性化强。以下以Statall.O为例来讲解怎么样处理面板数据。山于面板数据的存储结构与我们通常使用的存储结构不太一样，所在统讣分析询，最好在excel中整理一下数据，形成如下图所示的数据年份公司名称因素1因素2因素6盈余管理程度1999公司12000公司1公司12010公司11999公司22000公司2公司22010公司2变量定义及输入数据启动Statall.O,

5、 Stata界面有4个组成部分，Review（在左上角）、Variables（左下角）、输出窗口（在右上角）、Command（右下角）。首先定义变量，可以输入命令，也可以通过点击Data-Create new Variable or changevariableo特别注意，这里要定义的变量除了因素1、因素2、因素6、盈余管理影响程度等，还要定义年份和公司名称两个变量，这两个变量的数据类型（Type）最好设置为int（整型），公司名称不要使用中文名称或者字母等，用数字代替。定义好变量之后可以输入数据了。数据可以直接导入（File-Import），也可以手工录入或者复制粘贴（Data-D

6、ata Edit （Browse）,手工录入数据和在excel中的操作一样。以上面说的为例，定义变量year、company factor factor2 factor3 factor4factoro factor6 DA。变量company和year分别为截面变量和时间变量。显然，通过这两个变量我们可以非常清楚地确定panel data的数据存储格式。因此，在使用STATA估计模型之前，我们必须告诉它截面变量和时间变量分别是什么，所用的命令为tsset,命令为：tsset company year输出窗口将输出相应结果。III于面板数据本身兼具截面数据和时间序列二者的特性，所以对时

7、间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如，对于上述数据，我们想产生一个新的变量Lag _factorl，也就是factorl的一阶滞后，那么我们可以采用如下命令：gen Lag_factorl=L. factorl统计描述：在正式进行模型的估讣之前，我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言，我们至少要知道我们的数据中有多少个截面（个体），每个截面上有多少个观察期间，整个数据结构是平行的还是非平行的。进一步地，我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成：xtd

8、es命令用于初步了解数据的大体分布状况，我们可以知道数据中含有多少个截面，最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下，我们可以采用该命令来诊断处理后的数据是否为平行数据。Xtsum用来查询对组内、组间、整体计算各个变量的基本统计量（如均值、方差等）。为了方便，以下的举例都只用factorl, factor2两个自变量。xtdes DA factorl facto2 xtsum DA factorl facto2模型回归。常用的处理面板数据的模型有混合OLS模型、固定效应模型、随机效应模型。各个模型的区别请上网查查。下面说说各个模型的命令：混合OLS模型输入命令：reg

9、ress DA factorl facto2固定效应模型输入命令：xtreg DA factorl factor , fe随机效应模型输入命令：xtreg DA factorl factor , re模型的选择及检验固定效应模型要检验个体效应的显著性，这可以通过固定效应模型回归结果的最后一行的F统计量看出，F越大越好，可以得出固定效应模型优于混合OLS模型的结论。随机效应模型要检验随机效应是否显著，要输入命令：xttestO如果检验得到的P值为0,则随机效应显著，随机效应模型也优于固定效应模型。至于固定效应模型与随机效应模型选哪一个，则要通过hausman检验来得出。Hausman检验Ha

10、usman检验的原假设是固定效应模型优于随机效应模型，如果hausman检验的P值为0,则接受原假设，使用固定效应模型。相关命令：qui xtreg DA factorl factor2 , fe est store fe qui xtreg DA factorl factor2 ,re est store re hausman fe检验序列相关固定效应模型使用xtserial命令，随机效应模型使用xttestl命令：qui xtreg DA factorl factor2 , rexttestl.对于随机效应模型xtserial DA factorl factor2如果没有xtserial命令即输入上面的命令后弹出no command,则输入finditxtserial.

人人文库> 全部分类> 应用文书 > 作业报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

横截面数据时间序列数据面板数据

文档简介

温馨提示

最新文档

评论

横截面数据时间序列数据面板数据

文档简介

温馨提示

最新文档

评论

相关文档