STATA软件操作(一)基础数据处理_第1页
STATA软件操作(一)基础数据处理_第2页
STATA软件操作(一)基础数据处理_第3页
STATA软件操作(一)基础数据处理_第4页
STATA软件操作(一)基础数据处理_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学实习课,STATA软件的应用(1),1.Stata简介,由美国计算机资源中心(Computer Resource Center)研制; 现在为Stata公司的产品; 目前最高版本11.0; 操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点 。,STATA的用户界面,命令回顾 窗口,变量名窗口,命令窗口,结果窗口,STATA语法格式,特殊选项关键词 命令参数,命令选项,STATA的运算,Stata的加、减、乘、除及乘方运算符依次是+、*、/ 和 。 Stata的关系运算符有:=(等于)、(大于)、=(大于等于)、(小于)、=(小于等于

2、)、=(不等于) Stata的逻辑运算符有: ,使用数据编辑窗口输入,进入数据编辑窗口 直接输入“edit” 在工具条上点击 双击每一列的标题可以更改变量名,每一行代表一条记录,每一列代表一个变量,打开已有数据文件,与表格式文件交互粘贴,与Excel,Word的表格等直接通过复制粘贴的方式交互数据。,STATA的数据输入与储存,数据存储 save命令 FileSave As,菜单方式,命令方式,STATA的数据打开,数据打开 use命令 Fileopen insheet using “C:data.txt ”,数据库的维护,数据库的排序: sort 变量清单 gsort +/-变量清单 sor

3、t x 按变量x中数值从小到大进行排列 gsort x 按变量x中数值从小到大进行排列 gsort -x 按变量x中数值从大到小进行排列,STATA数据库的删除操作,删除变量或记录 drop x1 x2 /* 删除变量x1和x2 drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5) drop in 10/12 /* 删去第1012个记录 drop if x0 /* 删去x0的所有记录 drop if x=. /* 删去x为缺失值的所有记录 drop if x=.|y=. /* 删去x或y之一为缺失值的所有记录 drop if x=.&y=. /* 删去x和y同时

4、为缺失值的所有记录 drop _all /* 删掉数据库中所有变量和数据,STATA数据库的保留维护,保留变量或记录 keep in 10/20 /* 保留第1020个记录,其余记录删除 keep x1-x5 /* 保留数据库中介于x1和x5间的所有变量(包括x1和x5),其余变量删除 keep if x0 /* 保留x0的所有记录,其余记录删除,STATA的变量赋值,用generate产生新变量 gen 新变量表达式 gen bh=_n /* 将数据库的内部编号赋给变量bh。 gen group=int(_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5个1,5个2,5个 3。直到数

5、据库结束。 gen y=log(x) if x0 /* 产生新变量y,其值为所有x0的自然对数值log(x),当x=0时,用缺失值代替。,STATA的变量赋值,egen 类型新变量=fcn(argument),选择项 fcn是功能项:seq(),fill(),rsum(),rmean(), rmin(), rmax(), rfirst(), rlast() 例:set obs 12 egen a=seq() egen b=seq(),from(1) to(3) block(3) egen c=fill(2 4) egen d=rsum(a b c) egen e=rmax(a b c),STA

6、TA数据库的替换,替换已存在的变量值 replace 变量表达式 replace bolck=6 if block=0 /* 将block0的数全部替换为6。 replace z=. if z0 /* 将所有小于0的z值用缺失值代替。 replace age = 25 in 17/* 将第17条记录中的变量age替换为25。,STATA数据库的更名,变量更名 rename 原变量名 新变量名 rename var1 x /*把var1 更名为 x,STATA数据库结构维护,纵向连接数据库:append using 文件名 横向连接数据库: merge 关键变量 using 文件名 例,ex1,

7、ex2,STATA数据库结构维护,行列互换 xpose,clearvarname format(%fmt) 选项: varname /*将原数据库中的变量名放在一个名为 _varname的变量中 format (%fmt) /*转换的同时,将所有变量转换为规定格式%fmt 例:ex7 xpose ,clear format(%9.1f) xpose ,clear varname,STATA数据库结构维护,列数据的接龙 将一个或多个变量的值依次接到某个变量后 stack 变量名1 变量名2,into (新变量名) clear stack 变量名1 变量名2,group(#) clear */ #

8、必须能被变量数整除,STATA数据库结构维护,动态观察数据两种结构转换 reshape long 变量,i(个体识别变量)j(时间变量) /*将横向结构数据转变为纵向结构数据 reshape wide 变量,i(个体识别变量)j(时间变量) /*将纵向结构数据转变为横向结构数据 例: reshape long h , i(no) j(time) reshape wide h , i(no) j(time),noh1h2 1156.6142.3 2148.8134.4 3133.1150.3 4140.7141.9 5139.2143.5 6140.2138.1 7134.9142.9 8141

9、.4140.9 9138.5134.7 10148.9141.2 11144.4135.5 12145.4140.2,reshape long h,i(no) j(time) notimeh 11156.6 12142.3 21148.8 22134.4 31133.1 32150.3 41140.7 42141.9 51139.2 52143.5 61140.2 62138.1 71134.9 72142.9 81141.4 82140.9 91138.5 92134.7 101148.9 102141.2 111144.4 112135.5 121145.4 122140.2,ex8,ST

10、ATA数据库结构维护,频数的展开 expand命令 例: expand f,b,a,数据库结构的转换,频数的展开 fab 900 501 210 811 expand f,fab 900 501 210 811 900 900 900 900 900 900 900 900 501 501 501 501 210 811 811 811 811 811 811 811,ex9,STATA的作图,作图命令graph gra 变量名 , 图形类型 通用选择项 特殊选择项 图形类型 histogram/* 直方图,为缺省值。 oneway/* 一维散点图 twoway/* 二维散点图、线图 matr

11、ix/* 二维散点图阵 bar /* 条图、百分条图 pie /* 圆(饼)图 box /* 箱式图 star /* 星形图,直方图,人数,身高(cm),124,132,140,148,156,164,0,10,20,30,40,graph7 x (version 7) graph7 x, bin(10) freq xlab(124,132 to 164) ylab(0,5 to 40) norm l1(人数) b2(身高) xlab(124(8)164) ylab(0(10)40) bin(#) 指定直方图中的分组数,缺省值为5 freq 指定以频数为纵轴画图,缺省时为以频率为纵轴 xlab ylab 指定坐标轴刻度 b2()l1() 在图形下方添加副标题在图形左侧添

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论