版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、数据录入 直接(zhji)录入 打开dta数据文件 导入其它格式的数据文件 其它方式2021年12月10日星期五计量经济学软件应用课程(kchng)讲义1第1页/共32页第一页,共33页。1直接(zhji)录入 (1)直接(zhji)在stata中录入(适用于小样本少变量数据):打开程序,调用数据编辑窗口,直接(zhji)录入数据,如excel中操作。 调用数据窗口方式:(a)在command窗口中输入edit命令;(b)点工具栏上的 (2)在excel中录入后,直接(zhji)复制到stata数据编辑窗口中。 (3)键盘直接(zhji)输入:在command窗口,用input命令。划线部
2、分输入. drop _all. input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end 2021年12月10日星期五计量经济学软件应用课程(kchng)讲义2第2页/共32页第二页,共33页。2.数据文件的读取 (1)Stata数据文件,后缀.dta 直接(zhji)双击 菜单操作:在工具栏上直接(zhji)点击 或File Open:2021年12月10日星期五计量经济学软件应用课程(kchng)讲义3第3页/共32页第三页,共33页。use 命令(mng lng) 语法格式: use filename , clear nolabel
3、,读取整个数据文件 use varlist if in using filename , clear nolabel,从数据文件中仅读取几个(j )变量 范例: use C:Program Files (x86)Stata12auto.dta, clear use C:Program Files (x86)Stata12auto.dta, clear nolabel use make price using C:Program Files (x86)Stata12auto.dta, clear 第4页/共32页第四页,共33页。(2)其它(qt)格式的数据文件 Excel数据(shj):*.x
4、ls, *xlsx。这是stata12新增的功能。 用spreadsheet建立的ASCII(txt)数据(shj):*.raw, *.txt, *.csv,用insheet命令。 固定列宽的ASCII(txt)数据(shj):*.dct,用infix命令 以dictionary格式建的ASCII(txt)数据(shj):*.dct, *.raw,用infile命令。 无格式的ASCII(txt)数据(shj): *.txt, *.raw,用infile命令。 SAS XPORT数据(shj):*.xpt,用fdause命令。 ODBC数据(shj)源:包括access数据(shj)源,*.m
5、db,dBase数据(shj)源,*.dbf xml数据(shj):*.xml第5页/共32页第五页,共33页。 菜单(ci dn)操作:fileimport2021年12月10日星期五计量经济学软件应用课程(kchng)讲义6第6页/共32页第六页,共33页。3.其它(qt)方式 (1)用StatTransfer 软件转换 可以用statTranser 9软件将各种格式的数据转换成dta格式数据 前提是你安装了这个软件 (2)安装外挂命令程序包,如usespss.ado程序包就是( jish)一个用于读取spss生成的格式数据的程序包。 在search all中敲入搜索关键词:找到可能你需要
6、的程序包,而后安装即可。 这个方法安装的外挂命令,不会在菜单中出现,需要你记住命令名。2021年12月10日星期五计量经济学软件应用课程(kchng)讲义7第7页/共32页第七页,共33页。二、数据(shj)的保存或导出 1保存用save/save as 2导出 从file菜单中export选项下选择(xunz)你想保存的格式; 用outfile,outsheet,fdasave,xmlsave命令2021年12月10日星期五计量经济学软件应用课程(kchng)讲义8第8页/共32页第八页,共33页。三、数据(shj)操作 变量名、标签等属性 变量属性显示和修改 变量的数据类型和长度(chng
7、d) 变量生成和变量值修改 缺失值的处理 变量的剔除和保留 数据的排序 字符变量和数值变量的相互转换2021年12月10日星期五计量经济学软件应用课程(kchng)讲义9第9页/共32页第九页,共33页。1.变量属性,如名称(mngchng)、标签、值标签 变量名:由英文字符、数字、中文字符组成。 字母大小写表示的含义不同! 标签:对变量含义的解释 值标签:用于对分类变量值的含义进行解释 如foreign有domestic和foreign,在数据(shj)量化上,可用0代表domestic,1代表foreign。2021年12月10日星期五计量经济学软件应用课程(kchng)讲义10第10页/
8、共32页第十页,共33页。2.变量属性(shxng)的显示 菜单操作:DataDescribe Data in Memory Describe命令,语法(yf)格式:describe var1 var2 用于,可显示1个,或多个。 如describe foreign2021年12月10日星期五计量经济学软件应用课程(kchng)讲义11第11页/共32页第十一页,共33页。3.变量(binling)属性的修改 变量名更改:rename命令,常用语法格式(g shi):rename old_var new_var,如rename income inc. 变量标签(label)的定义:label命
9、令,语法:label var varname “#”,如label var foreign “car type”。除用于定义变量的标签外,其还可用于定义数据的标签,如label data “auto in American” 分类(或指示)变量的值标签定义:亦label命令,要完成分类变量值的标签定义有两步,如把变量foreign取值为0,定义为domestic,取值为1,定义为foreign,并用origin表示该变量值标签定义结果: label define origin 0 “domestic” 1 “foreign” label values foreign origin2021年12
10、月10日星期五计量经济学软件应用课程(kchng)讲义12第12页/共32页第十二页,共33页。4.变量(binling)的数据类型和长度整数数值型:(1)byte,(2)int, (3)long。小数数值型:(1)float,(2)double。数值型数据(shj)一般定义为float型,除非你有特别定义。字符串型:string2021年12月10日星期五计量经济学软件应用课程(kchng)讲义13第13页/共32页第十三页,共33页。数值(shz)型数据字符(z f)型数据第14页/共32页第十四页,共33页。数值变量(binling)和字符变量(binling)的转换 encode命令:
11、将字符变量转换(zhunhun)为数值变量。 格式:encode varname if in, generate(newvar) label (name) noextend 菜单: Data Create or change data Other variable-transformation commands Convert variables from string to numeric 范例:encode make, generate(make2) decode命令:将数值变量转换(zhunhun)为字符变量 格式:decode varname if in, generate(newva
12、r) maxlength(#) 菜单: Data Create or change data Other variable-transformation commands Convert variables from numeric to string 范例:deocde price, genrate(price2)第15页/共32页第十五页,共33页。包括(boku)数值数据的字符转换 destring命令: 将字符变量转换为数值(shz)变量 语法:destring varlist, generate (newvarlist) | replace options options:ignor
13、e (“chars”) 删除字符变量中的非数值(shz)字符,force将非数值(shz)字符转换为缺失值 tostring命令: 将字符变量转换为数值(shz)变量 语法:tostring varlist, generate (newvarlist) | replace第16页/共32页第十六页,共33页。5.新变量(binling)生成 generate/egen命令: gen命令格式:generate type newvar=exp if in 范例(fnl):gen id=. egen命令格式:它是gen的更高级应用, egen type newvar=fcn(arguments) i
14、f in , options 范例(fnl):egen mmpg=mean(mpg)2021年12月10日星期五计量经济学软件应用课程(kchng)讲义17第17页/共32页第十七页,共33页。 菜单(ci dn)操作: Data Create or change data Create new variable Data Create or change data Create new variable (extended)第18页/共32页第十八页,共33页。6.变量值的修改(xigi) replace命令(mng lng) 格式:replace oldvar=exp if in , no
15、promote 范例:如replace id=1第19页/共32页第十九页,共33页。7.缺失(qu sh)值的处理 在现有的调查中,经常(jngchng)用88, 99,888,999,.等来表示不知道或不清楚。 在stata中如何一般用”.”来表示该变量的观测缺失值。 将变量缺失值转化为数值,用mvencode命令 格式:mvencode varlist if in, mv(#|mvc=# mvc=#. else=#) override 范例: mvencode rep78 if foreign = 0, mv(998) 将变量的某些数值转化为缺失值,用mvdecode命令 格式: mvd
16、ecode varlist if in, mv(numlist | numlist=mvc numlist=mvc.) 范例: mvdecode rep78, mv(998=. 999=.a)2021年12月10日星期五计量经济学软件应用课程(kchng)讲义20第20页/共32页第二十页,共33页。 菜单(ci dn)操作: Data Create or change data Other variable-transformation commands Change missing values to numeric或Change numeric values to missing第21页
17、/共32页第二十一页,共33页。8.变量(观测(gunc)值)的剔除,保留,显示 drop/keep命令: 格式(g shi):(1)变量:drop/keep varlist;(2)观测值:drop/keep if exp 范例:drop pop*,drop if medage 32 菜单操作:(1)变量:Data Variables Manager;(2)观测值:Data Create or change data Keep or drop observations Clear命令 list命令: 格式(g shi):list varlist if in ,options第22页/共32页第
18、二十二页,共33页。9.数据(shj)的排序 Sort命令(mng lng) 语法: 升序sort varlist in ,stable。 选项stable指如果两个观测值相同,则保持其顺序不变。 降序gsort - varname - varname , generate (newvar) mfirst。 选项mfirst表示将缺失值放在前面。第23页/共32页第二十三页,共33页。 菜单操作: (1)只完成(wn chng)升序:Data Sort Ascending sort (2)升、降序皆可:Data Sort Ascending and descending sort 范例:202
19、1年12月10日星期五计量经济学软件应用课程(kchng)讲义24第24页/共32页第二十四页,共33页。四、分类数据(shj)的处理 变量(binling):连续变量(binling)、分类变量(binling) 将连续变量(binling)转化为指示变量(binling) 如generate priceg=(price=6000) 将连续变量(binling)转化为分类变量(binling) 语法:generate newvar=recode(varname, num1,num2, num3, ., numk) 将分类变量(binling)转化为指示变量(binling) 语法:xi i.
20、varname第25页/共32页第二十五页,共33页。五、数据(shj)集的合并和附加 1.数据集的合并:merge命令 语法: (1)按指定的关键(gunjin)变量进行1对1匹配合并(One-to-one merge on specified key variables) merge 1:1 varlist using filename , options (2)按指定的关键(gunjin)变量进行多对一匹配合并(Many-to-one merge on specified key variables)(外部数据文件的关键(gunjin)变量值唯一值) merge m:1 varlist
21、using filename , options第26页/共32页第二十六页,共33页。 菜单操作(cozu): Data Combine datasets Merge two datasets 范例: use c:program files stata12auto1.dta merge 1:1 id using c:program files stata12auto2.dta2021年12月10日星期五计量经济学软件应用课程(kchng)讲义27第27页/共32页第二十七页,共33页。 2.数据集的附加:append命令 语法: append using filename filename . , options 菜单(ci dn)操作: Data Comb
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医务室校医工作制度
- 医疗业务员工作制度
- 医疗用激光工作制度
- 医院制氧站工作制度
- 医院诊疗室工作制度
- 华企8小时工作制度
- 卫生院科研工作制度
- 危废物管理工作制度
- 县作家协会工作制度
- 县委办反恐工作制度
- 储能电站设备智能运维与数据驱动技术方案
- 福建省福州市2026年中考适应性考试化学试题(含答案解析)
- 2026春统编版(新教材)小学道德与法治二年级下册(全册)各单元知识点复习课件
- 行政职业能力测试2026题库
- 按劳分配为主体、多种分配方式并存课件-2025-2026学年统编版道德与法治八年级下册
- 街道行政执法监督制度
- 遗传的物质基础课件文库
- 【量子位智库】2025年度具身智能创业投融资全景报告
- 城市内涝风险评估方案
- 江西省国有资本运营控股集团有限公司2026年第一批批次公开招聘参考考试试题附答案解析
- 2026年水产养殖学专业水产种业创新与产业发展答辩
评论
0/150
提交评论