




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
STATA基本入门前言STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的各项分析工具。因此,STATA可以说是一个相当强而有力的统计软件。一、安装STATA所须的内存容量不大,只有4.03MB。此外,安装也相当简单,只要在SETUP上点两下,安装完成后再分别输入”Sn”、”Code”和”Key”即可开始使用。但是安装过程中有一点必须注意的是,如下图所示,有”Intercooled”和”Small”两个选项。一般而言,为了方便日后要设定较大的内存容量来处理大笔的资料,通常选择以”Intercooled”进行安装。以此項進行安裝二、窗口介绍安装完成后,点选桌面上STATA的图标,窗口画面如下图所示。为了使画面美观,我们可以将画面拉到自己喜欢的地方,如下图所示。为了保存这个窗口画面,我们必须点选工具列上的”Prefs”下的”Save Windowing Preferences”。如此一来,以后开启STATA时都会以此窗口画面呈现。執行過的指令都會保留於此資料中的變數在這裡在此輸入指令指令的執行結果看這裡接下来,我们依序介绍四个窗口的功用:左上Review:此一窗口用于记录在开启STATA后所执行过的所有指令。因此,若欲使用重复的指令时,只要在该指令上点选两下即可执行相同的指令;若欲使用类似的指令时,在该指令上点一下,该指令即会出现在窗口”Stata Command”上,再进行修改即可。此外,STATA还可以将执行过的指令储存下来,存在一个do-file内,下次即可再执行相同的指令。左下Variables:此一窗口用于呈现某笔数据中的所有变量。换言之,当数据中的变量都有其名称时,变量名称将会出现在此一窗口中。只要数据有读进STATA中,变量名称就会出现。它的优点是(1)确认数据输入无误;(2)只要在某变量上点选两下,该变量即会出现在窗口”Stata Command”上。右上Stata Results:此一窗口用于呈现并记录指令执行后的结果。右下Stata Command:此一窗口用于输入所欲执行的指令。Note:以上四个窗口都可以从”Fonts”去更改字体大小。三、输入数据(Entering data)在本小节中,我们将介绍如何把数据读进STATA。但是在正式介绍之前,我们必须先对几个一般性的指令(general command)有所了解,说明如下:cd:即change directory,简言之,告知STATA数据储存的地方。例如当数据储存在e槽的sample数据夹时,则必须先输入cd e:sample。dir/ls:用来显示目录的内容。set memory #m:设定内存的容量。例如:当有一笔庞大的数据要处理时,则可设定100mb的容量,此时可输入set memory 100m。(输入指令memory可以知道内存容量的大小以及使用情况。)set matsize #:设定所需的变量个数。一般而言,不须对此部分进行设定,除非所欲处理的资料庞大或是当执行后出现matsize too small的讯息时再进行修改即可。内建为40。set more off/on:若欲执行结果以分页的型式呈现时,则输入set more on;若欲执行结果同时呈现时,则输入set more off。help:求助键。后面必须接的是指令。说明如何使用该指令,例如:help regress。search:求助键。后面可接任何文字。说明在何处可以找到该文字。例如:search normal distribution。clear:清除键。用来删除所有数据。接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:1、输入EXCEL数据将EXCEL的数据输入STATA的方式还可细分成以下两种:将EXCEL的数据输入STATA之前,必须先将数据存成csv 文件,再利用指令insheet来读数据。Example:当csv档的第一列有变量名称时:cd e:sampledirmemoryset memory 10minsheet using sample1-1.csv当csv档的第一列没有变量名称时:insheet gender id race ses schtyp prgtype read write math science socst using sample1-2.csv直接复制EXCEL上的数据,再到STATA选取”Window”下的”Data Editor”,点选后会出现”Stata Editor”工作表,再到”Edit”下选取”Paste”即可贴上数据。2、输入ASCII 的数据型态依ASCII 的数据型态区分,将ASCII 的数据输入STATA的方式也有以下两种:数据型态一:见sample1-3.txtinfile gender id race ses schtyp str10 prgtype read write math science socst using sample1-3.txtNote:记住文字的设定方式(str# variable name)。数据型态二:见sample1-4.txt第二种的数据型态通常须要codebook。如下表所示。variable nameColumn numberid1-2eng3-4math5-6sex7micro8-9macro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11 using sample1-4.txt3、利用Do-file editor输入数据将数据或是指令写入Do-file editor,再执行即可。例如:将下面数据复制并贴在Do-file editor(选取”Window”下的”Do-file editor”)上,再选择”do currnet file”执行即可。cd e:sampleinput id female race ses str3 schtype prog read write math science socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41 36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 6151 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51 53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA的数据型态输入除了以上三种方法之外,还可以开启之前以STATA储存的资料。use sample1-6.dtaNote:此一指令亦可用在读取网络上的数据(use 网址)。最后,将数据输入的相关指令整理成下表。insheetread ASCII (text) data created by a spreadsheetinfileread unformatted ASCII (text) datainfixread ASCII (text) data in fixed formatinputenter data from keyboarduse load a Stata-format dataset四、探索资料(Exploring data)为了更详细地呈现出在数据探索时所需使用的相关指令,我们利用sample4-1来说明指令的用法。首先,利用前节所提及的数据输入方法将sample4-1读进STATA。在正式分析数据之前,我们可以利用一个log档来储存之后所要执行的指令以及所得到的结果。指令的表示方法如下:log using result4-1, text(log檔的名稱為result4-1)接下来,我们可以先利用下面的指令来检视sample4-1的数据:count:可得样本数。describe:描述数据来源以及数据大小。list:依序列出观察值的各个变量值。codebook:描述资料的详细内容。此外,我们就可以利用summarize、tabulate和tabstat等指令得到数据的叙述统计与基本特性。表示如下:summarize:列出资料的叙述统计。Example:summarize write, detailsum write if read=60(sum是summarize的简写)sum write if prgtype=academic(接在if之后的句子中的”=”要放两个)sum write in 1/40(只列出第1笔到第40笔资料)tabulate:列出变数的次数表。Example:tabulate prgtype tabulate prgtype racetabulate prgtype, summarize(read)tabulate prgtype race, summarize(write)tabstat:列出变量的叙述统计。Example:tabstat read write math, by(prgtype) stat(n mean sd) tabstat write, stat(n mean sd p25 p50 p75) by(prgtype)接下来,我们介绍一些用来划图的指令:茎叶图:stem writestem write, lines(2) 直方图:graph write, bin(10)graph write, hist normal bin(10) 箱形图:graph write, boxsort prgtype(要先有这个指令才能执行下一个指令)graph write, box by(prgtype) 此外,利用correlate或是pwcorr可以得到相关矩阵;亦可利用graph划出散布图。correlate write read sciencepwcorr write read science, obsgraph write read, twowaygraph write read, two jitter(2)(two是twoway的簡稱,jitter是用來區分重疊的觀察點)graph write read, two jitter(2) boxgraph read science write, matrix half现在我们可以将log文件结束了,指令输入如下:log close若欲检视log档中的结果,可以输入指令:type result4-1.log或是到所储存的目录下点选。最后,将数据探索的相关指令整理成下表。countShow the number of observations describeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDescriptive statisticstabulateOne- & two-way frequency tablestabstatTable of descriptive statisticsstemStem-and-leaf plotgraphHigh resolution graphssortSort observations in a datasethistHistogram of a categorical variablecorrelateCorrelationspwcorrPairwise correlationstypeDisplay an ASCII file五、修饰资料(Modifying data)在本小节中,我们亦利用sample4-1的数据进行说明。首先,读进数据。读完数据后,可以为此数据取个名称,指令如下:label data High School and Beyond, 200 cases现在我们可以将变量的顺序作一排列。例如:原先的变量顺序为gender、id和race,但是我们想把顺序改成id、gender和race,则可以下面的指令来执行:order id gender在执行codebook时,我们会发现有些变量尚未加上卷标(label),为了更清楚地表达变量所代表的意义,我们可以执行以下的指令:label variable schtyp The type of school the student attended.现在,我们想要产生一个新变量total,此变量代表read、write和math的总和。指令如下:generate total = read + write + math此外,若是我们想加总的分数是read、write和socst,而非read、write和math,此时的指令输入如下:replace total = read + write + socst另一方面,我们还可以将变量total表示成以等级(A、B、C、D and F)的形式。指令如下:generate grade = totalrecode grade 0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel values grade abcdf为了记忆变量的意义为何,我们还可以利用note的方式来记录变量。指令如下:notes race: values of race coded as 5 were recoded to be missingnotes(叫出note的指令)另外,介绍一些利用公式来产生变量的指令。egen zread = std(read)summarize zreadlist read zread in 1/10egen rmean = mean(read), by(ses)list read ses rmean in 1/10egen mread = median(read), by(prog)list read prog mread in 1/10最后,我们可以将以上的执行结果储存下来。指令如下:save sample5-1(存成另一個檔)save sample4-1(取代原來的sample4-1)现在亦将数据修饰的相关指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlabel variableApply a label to a variablegenerateCreates a new variablereplaceReplaces one value with another valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defineDefine a set of a labels for the levels of a categorical variablenotesApply notes to the data fileegenExtended generate - has special functions that can be used when creating a new variablesaveStore the dataset currently in memory on disk in Stata data format六、管理数据(Managing data)在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:保留所欲分析的数据、删除多余的数据或是将两份数据结合等等。假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以下两种方法可进行:1、另存新檔:亦即将所欲分析的部分数据储存在另一个档案中。例如:我们只针对read成绩大于或是等于60分的学生进行分析,则可利用下面的指令来筛选。keep if read = 60summarize save sample6-1Note:当只要保留某些变量时,则利用指令keep。例如:keep read write。2、直接处理:亦即在原始数据上进行分析。承上例,指令输入如下:preservedrop if read 60summarizerestoreNote:若要删除某些变量时,则利用指令drop。例如:drop read write。接下来,我们介绍如何将两笔数据结合在一起。数据的结合主要可以分为两种,水平合并和垂直合并。前者是指变量的增加;后者则是指样本数的增加。说明如下:1、水平合并use sampleh1append using sampleh22、垂直合并: use samplev1sort idsave samplev1, replaceuse samplev2, clearsort idsave , replaceuse samplev1merge id using samplev2Note:在垂直合并前要记得先sort。最后,我们将数据修饰的相关指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observations if condition is metkeepKeep variables (dropping others)drop Drop variables (keeping others)append usingAppend a data file to current filesortSort observationsmergeMerge a data file with current file七、资料分析透过前面几节的介绍,应该对于STATA的指令和使用方法有了基本的认识。现在,我们开始说明如何利用STATA来处现统计上的问题以及计量方面的模型。1、检定:我们利用下面的例子来示范如何进行统计上的检定工作。sample4-1:ttest write =60ttest write, by (gender)ttest write, by (gender) unequalsample7-1:ttest before= after2、回归在执行回归分析时所使用的指令为regress。cd e:sampleuse sample7-2regress growth lnrlp84 lnemp oclnemp cr4 lnrd oc另外,当存在heterogeneity of variance的问题时,可在后面加上robust;另外,若是不想放入截距项时,可在后面加上n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中书法概述课件
- 离婚双方贷款房产分割及共同还款协议
- 生猪、菜牛、菜羊、家禽养殖基地养殖资金购销合同
- 离婚后特殊病患子女抚养权及医疗费用承担协议
- 生物质能源项目贷款合同附共同担保人及环保责任
- 电信IDC机房服务-移动数据业务标包合作协议
- 公务员面试培训咨询服务合同
- 化学工业新产品推广细则
- 物业管理矛盾调解手册
- 园艺工程:参与或观赏园林景观工程
- 五年级美术 《感受漫画造型》 公开课比赛一等奖
- 眼科手术器械的清洁与消毒
- 管理学基础(第3版)全套教学课件
- 大润发供应商系统
- 红帽认证管理员RHCSA(习题卷1)
- 2021地质灾害治理工程施工质量验收规范
- 婚恋工作室交友计划书
- 经典安徒生童话故事100篇
- 冰箱温度监测登记表
- 08878动漫产业概论模拟试题答案
- 5G边缘云计算技术
评论
0/150
提交评论