




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
STATA统计软件操作 Stata入门Stata的数据读入数据库的描述变量的生成与处理数据的合并数据的转换单变量描述双变量描述 描述数据的统计量图形的制作参数估计 区间估计假设检验方差分析相关分析线性回归分析 Stata入门 五大功能 数据管理 统计分析 图形制作 矩阵运算和程序设计 界面 Command 命令 Results 结果 Review 回顾 Variables 变量 菜单基本功能 文件 File 编辑 Edit 偏好 Prefs 用户界面设置菜单 数据 Data 数据的基本处理 描述 排序 改变变量 生成新变量 整合数据 拆分数据等 图表 Graphics 统计 Statistics数据分析 使用者 User 窗口 Window 帮助 help 快捷根据图表的基本功能 Log 记录文件窗口 Viewer 帮助窗口 Results 分析结果窗口 Do fileEditor 编程窗口 DataEditor 数据编辑窗口 DataBrowse 数据浏览窗口 Clear more Condition 显示更多结果 Break 不要显示更多结果 Stata数据的读入 log文件 创建文件 logusing 文件路径和名称 其后带append表示在原有文件的基础上增加新内容 其后带replace表示取代原记录文件 暂停 logoff 再次开始 logon 关闭 logclose 数据的存储空间 增加存储空间 setmem40m 清空存储空间 clear 相当于dropall Stata数据的读入 数据的读入 可直接读入下列尾缀形式的数据 dta txt raw xls 读入文件中的部分变量 useabcusing 文件路径和名称 读入文件中的部分样本 use 文件路径和名称 inX Y X Y表示个案序号 读入文件中某些特征的样本 use 文件路径和名称 if条件句 数据库的描述 描述数据的基本情况 describe ddescribe simple 只展示变量名 describe short 报告变量总体情况 describe detail 输出全部变量的全部信息 describeabc 描述部分变量的情况 变量编码本 codebook codebook 变量名 描述变量特征 Stata数据类型及特点 与数据类型对应的是数据库中变量的存储类型 storagetype 字符型 保存格式为str 省略表示的是字符位数数值型 保存格式有byte int long float double 默认格式是float 前三种只保留整数 占空间最大到最小的顺序是double float long int byte压缩变量的命令为compressCompress为压缩所有变量 Compressyr 为压缩共同前缀的变量 Compressa c为压缩从a到c之间的所有变量 数据库的描述 描述变量取值的基本命令参数 inspect 显示数据 browse直接进入数据的浏览窗口 list最好指定变量 否则会输出数据中所有变量的分布 数据排序 sort 例 比较城乡孩子的性别bysorturban inspectgirl或者sorturban然后byurban inspectgirl 变量的生成与处理 注意事项 不要使用新变量取代旧变量 充分了解原始变量的分布以及每个数值代表的含义 遵循不重不漏 将原始变量和新变量的取值进行对比 检查是否有误 注意原始变量的缺失值 使用gen replace命令生成新变量 gen replaceif共同使用形成分组变量recodev gen nv recodevv的取值 nv的取值 其他取值 表示所有其他没有列出的数值 gen 新变量名 recodeyrsch0 011 112 213 314 415 516 621 7 gen edu 变量的生成与处理 生成分类变量 egen新变量命 cut 旧变量名 at 取值的下限 eg egenagegrp1 cut age at 0 7 13 16 20 按照变量b的分类生成均值变量 egena mean mean a by b 生成一个变量b和c的行均值变量 avg 忽略缺失值 egenavg rmean bc 生成标准数值 egenzweight std weight 计算每一年观察的样本 从而了解在每年的调查中 有多少相同的样本 或相同的个体 gennumobs count personid by personidyear 数据的合并 纵向 纵向合并 作用 增加样本量命令 append菜单 Data Combinedatasets Appenddatasets 程序 appendusing 文件路径和名称 appendusing 文件路径和名称 keep变量名 数据的合并 横向 横向合并作用 增加变量 merge 菜单 Data Combinedatasets Mergetwodatasets或Data Combinedatasets Mergemultipledatasets程序 先看使用数据 use 文件路径和名称 sort关键变量名 save 文件路径和名称 replace 再看主要数据 use 文件路径和名称 sort关键变量名 最后 合并数据 merge关键变量名using 文件路径和名称 keep 变量 数据的合并 系统变量 关于系统变量 merge 它的取值限于1 观察值仅来自主要数据 使用数据没有匹配的样本 2 观察值仅来自使用数据 主要数据没有匹配的样本 3 观察值来自于主要数据和使用数据 若使用update选项 还会有 4 观察值来自于主要数据和使用数据 且主要数据的缺失值得到更新 5 观察值来自于主要数据和使用数据 且两个数据的数值不匹配 数据的转换 reshape 数据的结构 宽数据 wideformat 长数据 longformat 菜单 Data Createorchangevariables Othervariabletransformationcommands Convertdatabetweenwide long 数据转换 长 宽 程序 reshapewide变量名 i 观察值的标识符 j 次标识符 变量名 表示一组同样内容的变量的共同的前缀 即X ij中的X 指定希望转换的变量名称 选项i及括号捏的变量一起 指定观察值的标识符 或表示取值独一无二 代表每个逻辑观察值的变量 eg gsortmothid age bymothid genorder n reshapewidekididagegirlyob i mothid order 数据转换 宽 长 程序 reshapelong变量名 i 观察值的标识符 j 次标识符 变量名 表示根据次标识符指定的 有共同主干但尾缀不同的一组变量 生成一 多 个新变量 选项i指定观察值的标识符 具有独一无二的取值 是代表每个逻辑观察值的变量 单变量描述 单个变量频数统计 tabulatea相当于taba 多个变量的单变量描述 tab1abc 双变量描述 交互分类表 tabab或者 tab2abc 给出其中任意两变量的交互分类表 附加命令的功能 统计量的检验 Chi2 计算Person卡发值 检验交互表中的行与列变量是否独立 不能用于加强数据 exact 展示Fisher精确检验的显著水平 expectedgamma 展示Goodman和Kruskal的gamma值和其渐近线的标准误 适合于定序数据 不能与加权数据连用 lrchi2 展示似然卡方 若任意单元格的频数为0 该选项无法执行 taub 展示Kendall的tau b值及其渐近线的标准误 适合于定序数据 V 展示Cramer的V 双变量描述 附加命令的功能 单元格 cchi2 展示每个单元格对Person卡方的贡献 clrchi2展示每个单元格对似然卡方的贡献 column提供列百分比 row提供行百分比 cell提供总百分比 expected提供每个单元格的期望频数 nofreq不显示频数或者不显示具体表格 直接显示统计量 missing将缺失值与有效值同样对待 wrap不自动换行宽表 nokey不显示单元格提示 nolabel不使用数值标签 描述数据的统计量 sum 变量名 suma detail 给出更详细的信息 bysorturban suma 在不同城乡分布中统计变量a tab分组变量a contents meanbsdb 表示按照变量a分组计算变量b的均值和标准差 tabab contents meancsdd 表示按照变量a和b分组计算变量c的均值和d的标准差 描述数据的统计量 tabab contents meanc rowcol 表示按照变量a和b分组计算变量c的均值 然后计算行和列均值 tabstatabcd展示一个或多个数值型变量的描述性统计量 默认输出均值 tabstatabcd by e statistics meansdmedian columns statistics 表示按照e分类计算变量a b c d的均值 标准差 中位值 格式是列为统计量 tabab sum c 表示按照变量a b分类计算c的统计量 图形的制作 y和x的散点图 graphtwowayscatteryx twowayscatteryx scatteryxy和x的线图 graphtwowaylineyx twowaylineyx lineyx 注意 先将x排序再做图 否则图会杂乱无章 按照x变量分类的纵向条形图 graphbary over x 按照x变量分类的横向条形图 graphhbary over x 给变量x y z 三者之和为100 生成饼图 graphpie 按变量x的分类 生成一张饼图 graphpie over x 图形的制作 直方图 生成一张变量x的取值图 histogramx 按变量x的分类 生成一张其取值图histogramx discrete 箱线图 按变量x的分类 生成变量y的箱线图 graphboxy over x 按变量x的分类 生成变量y1和y2的箱线图graphboxy1y2 over x 按变量x的分类 生成变量y的横向箱线图 graphhboxy over x 矩阵图 生成x1 x2 x3的矩阵图 只显示一半 graphmatrixx1x2x3 half将图形x1和x2合并 graphcombinex1x2 区间估计 单个总体均值的区间估计 求多个变量的置信区间 对变量的数目没限制 cix1x2x3 eg bysorturban cix1x2x3ifage 14 meanx1x2x3 输出均值 标准误和95 的置信区间 按变量e分类来求取a b c三个变量的区间估计 meanabc over e 区间估计 单个总体比例的区间估计计算a这个二分变量的比例 标准误和95 的置信区间 proportiona 按b分类来计算a这个二分变量的区间估计 proportiona over b 区间估计 单个总体比率的区间估计按城乡分类 估计体重身高之比的区间估计 ratio weight height over urban 注意 stata默认输出的是95 的置信区间 若想要99 或90 的置信区间 则须在命令最后写 level 99 或 level 90 假设检验 一个总体均值的检验 ttest变量 数值 例如 ttestheight 160ifage 14或者ttestheight 160ifage 14 level 99 两个独立样本均值比较的t检验 ttesta by b eg 分城乡孩子的体重差异检验 ttestweight by urban 假设检验 配对样本均值比较的t检验 ttesta1 a2 多个总体均值差异的检验 即方差分析 onewayyx y为因变量 x为类别自变量 例如 onewayweightsibsifage 13 tabscheffe tab输出各组描述性统计结果 scheffe采用scheffe方法提供多重组间比较结果 方差分析 双 多 因素方差分析 anovayab a b为因素 anovayaba b 加入a b的交互作用 协方差分析 anovayabc cont c 指定c为连续变量 相应地a b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二年级新班主任发言稿
- 时间管理授课课件
- 高三班级成绩质量分析
- 初中历史学科试卷质量分析
- 爱护环境读书课件
- 二零二五版汽车抵押贷款合同借款人信用记录查询与维护合同
- 二零二五年度个人应急借款合同担保公证及援助方案
- 2025版彩瓦租赁与销售结合服务合同
- 二零二五年度彩钢房租赁与临时办公解决方案协议
- 二零二五年度生态修复工程承包垫资协议
- 勇气三声部合唱简谱川师音乐学院
- DB32/T 2283-2024 公路工程水泥搅拌桩成桩质量检测规程
- 人教版八年级物理下册全册各章综合测验及期中期末试卷含答案
- 2024标准版安全生产责任制培训记录
- 制造业的智能化改造与升级
- 《如何治理小金库》课件
- 脓肿切开引流术
- 汽车电器维修:雨刮系统电路分析
- 协及医院老年综合评估表格
- 建筑基础知识培训课件
- 蜡疗技术操作规范
评论
0/150
提交评论