




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
The Workflow of Data Analysis Using Stata目录表格目录.21图形目录.23示例目录.25前言.29对字体、文件名、命令和示例的说明.33第1章 导论.1第1节 工作流程的指导原则可复制性.2第2节 工作流程的几个步骤31.2.1数据清理41.2.2.进行分析41.2.3.结果呈现41.2.4.文档保存4第3节 每个步骤中的具体任务.51.3.1.计划.51.3.2.组织51.3.3.记录51.3.4.执行6第4节 选择工作流程的标准61.4.1.精确61.4.2.效率61.4.3.简洁71.4.4.标准化.71.4.5.自动化.71.4.6.易用性.71.4.7.扩展性.8第5节 改变工作流程.8第6节 本书的结构安排8第2章 计划、组织和记录.11第1节 数据分析的循环过程13第2节 计划14第3节 组织182.3.1.组织的原则.182.3.2.组织文件和目录192.3.3.创建个人目录结构.21小型项目的目录结构.21大型个人项目的目录结构.23多人合作项目的目录结构.23特殊用途目录.25牢记目录内容.27规划个人目录结构.29文件命名.30批处理文件302.3.4.新建目录结构(高阶).31新建目录结构的示例31第4节 记录.342.4.1.关于什么是需要记录的内容.362.4.2.记录的层次.372.4.3.关于编写记录文件的建议.38记录文件的评估.392.4.4. Research log39Research log 示例.40Research log 模板.422.4.5. Codebook编码表.43基于测量工具的编码表.432.4.6. 数据库记录.44第5节 本章小结45第3章 Do文件的编写和调试.47第1节 运行命令的3种方式.473.1.1. 命令窗口483.1.2. 对话框.493.1.3. Do文件49第2节 编写有效的Do文件503.2.1. 使Do文件更加稳健.51使Do文件更加self-contained51使用版本控制53排除目录信息53包含随机数种子.553.2.2. 使Do文件更具可读性55 尽量多使用附注.56对齐与缩进.57单行不要太长.58谨慎使用缩写.61前后一致633.2.3. Do文件模板.63Do文件中必备命令.63一个简单的Do文件模板66相对复杂的Do文件模板.66第3节 Do文件的调试.683.3.1. 低级错误及其修改.68Log文件处于打开状态.68Log文件已经存在.68命令拼写错误.69变量名拼写错误69选项错误.70选项之前缺少逗号703.3.2. 解决错误的步骤70第一步:升级Stata及其用户书写程序.70第二步:使用新的slate.71第三步:使用其他数据.72第四步:不要忽视任何错误的可能性.72第五步:分别执行每个命令72第六步:排除Do文件的一部分.74第七步:重新编写Do文件.74第八步:并非编写错误的其他原因.753.3.3. 例1:调试一处细微错误.753.3.4. 例2:调试非预期结果773.3.5. 高级调试方法.81第4节 如何获取帮助.82第5节 本章小结.82第4章 将工作自动化运行.83第1节 宏.844.1.1. Local and global macros.84Local macros.84Global macros.85定义宏时使用双引号.85新建long strings854.1.2. 区分分组变量和嵌套模型.864.1.3. 用local来设置选项.88第2节 Stata命令返回的信息90在local宏的帮助下使用返回结果92第3节 Loop循环语句:foreach命令与forvalues命令.92Foreach命令.94Forvalues命令.954.3.1. 使用loops的方式.95Loop示例1:列举变量和纸标签.96Loop示例2:创建交互变量.97Loop示例3:用教育的替代措施来调整模型.98Loop示例4:用同一方式记录多个变量.98Loop示例5:创建一个可累积信息的宏.99Loop示例6:检索Stata返回信息.1004.3.2. 在loop中记录循环次数.101使用loop将结果保存至矩阵.1024.3.3. 嵌套循环.1044.3.4. 循环的调试.105第4节 include命令.1064.4.1. 用include文件制定分析样本.1074.4.2. 用include文件记录数据.1074.4.3. 使用include的注意事项.109第5节 ado文件.1104.5.1. 一个更改目录的简单程序.1114.5.2. 加载和删除一个ado文件.1124.5.3. 列举变量名称和标签.1134.5.4. 一个更改工作目录的通用程序1174.5.5. 注意事项.118第6节 帮助文件.1194.6.1. nmlabel.hlp1194.6.2. help me.122第5章 名称,备注和标签.125第1节 post文件125第2节 数据管理和统计分析的双重工作流程127第3节 名称,备注和变量.129第4节 do文件命名.1295.4.1. 命名do文件重新创建数据集.1305.4.2. 命名do文件复制统计分析过程1305.4.3. 使用master do文件.131Master log文件1335.4.4. 命名do文件的一个模板134在复杂分析中使用子目录.135第5节 数据集的命名和internally documenting136勿将文件命名为“最终版本”1375.5.1.暂时或一次性数据集.1375.5.2.大型项目的数据集1385.5.3.数据集的标签和备注.1385.5.4.datasignature命令.139一个使用datasignature命令的工作流程.140Datasignature无法探测到的改变.141第6节 变量命名.1435.6.1.创建和命名变量的基本原则1435.6.2.变量命名的体系144顺序命名体系.145来源命名体系.145记忆命名体系.1465.6.3.为命名进行规划.1465.6.4.选择名称的规则.147设想寻找变量的过程147使用简洁的、无歧义的名称148在决定名称前先进行尝试.151第7节 为变量添加标签5.7.1. 列举变量的标签和其他信息151改变数据集中变量的顺序.1555.7.2. 为变量添加标签的有关语句1555.7.3. 为变量添加标签的原则.156注意truncation.156在post文件之前检测变量标签.1575.7.4 暂时更改变量标.1575.7.5 创建包含变量名的变量标签.157第8节 为变量添加备注.1605.8.1. 与添加备注有关的命令161列出备注.161删除备注162搜索备注.1625.8.2. 在备注中使用宏和循环162第9节 值标签1635.9.1.两步法创建值标签.164第一步:定义标签164第二步:贴标签164为何使用该两步法164删除标签1655.9.2.创建值标签的原则.165原则1:标签尽量简短.165原则2:包含分类编号.166原则3:避免使用特殊符号168原则4:熟知标签被使用于何处.1695.9.3.清理值标签.1705.9.4.值标签对缺失值的处理须保持一致1715.9.5.在贴标签时使用loop语句.171第10节 使用多种语言5.10.1 针对不同语种使用语言集标签.1745.10.2 针对长标签和短标签使用不同语言集标签174第11节 名称和标签的工作流程176第一步:做出改变时要提前规划.176第二步:存档、复制与重命名.177第三步:修改变量标签177第四步:修改值标签.177第五步:确认修改.1785.11.1. 第一步 检查数据来源178第一步a:列出当前名称和标签178第一步b:尝试当前名称和标签1815.11.2. 第二步 创建复制和重命名变量.182第二步a:创建复制.183第二步b:创建重命名命令183第二步c:重命名变量1845.11.3 第三步 修改变量标签.185第三步a:创建变量标签命令185第三步b:修改变量标签1865.11.4. 第四步 修改值标签187第四步a:列出当前标签.188第四步b:创建label define 命令来编辑标签.189第四步c:修改标签并将标签添加到数据集.1935.11.5. 第五步 检查新名称和新标签.194第12节 本章小结.195第6章 清理数据197第1节 数据导入.1986.1.1.数据格式198ASCII数据格式198Binary-data数据格式2006.1.2.导入数据的方法.201与导入数据相关的stata命令201从其他统计软件中导出数据.203使用数据转换软件.2036.1.3.确认数据转换.203对俄罗斯ISSP 2002数据进行转换204第2节 核实变量.2106.2.1. 检查变量值.211检查科学家职业历程数据的变量值.212检查家庭观念数据的变量值.2156.2.2. 检查独立有效性.216“获得学位所用时间”究竟测量了什么216检查出现频率极高的值218变量之间的联系.220问卷中问题的更改2256.2.3. 检查缺失值225缺失值的大小比较.225创建标识案例是否缺失的指标.228使用扩展缺失值228核实和扩大缺失值编码.229使用include文件.2366.2.4. 内在一致性检验238科学家职业里程数据的一致性.2386.2.5. 修正不一致数据的原则.241第3节 为数据分析新建变量.2416.3.1.创建新变量的原则242新变量,新名字.242核实新变量是否正确.243记录新变量.244保留原变量.2446.3.2.创建新变量的核心命令244Generate命令.245Clonevar命令245Replace命令.2466.3.3.创建有缺失值的变量2476.3.4.创建新变量的其他命令.249Recode命令.249Egen命令.250Tabulate, generate() 命令2526.3.5.为新建变量创建标签2536.3.6.核实变量是否正确.254检查代码.255列出变量.255绘制连续变量散点图256使用tabulate命令.258用多种方式创建变量259第4节 数据集的保存2606.4.1.选择观察样本.261删除部分样本VS另存所需样本.2616.4.2.删除变量.262从俄罗斯ISSP 2002数据中选择变量.2636.4.3.变量的排序2636.4.4.内部记录.2646.4.5.变量压缩(compress).2646.4.6.运行诊断265Codebook, problems 命令.265检查ID唯一的变量.2676.4.7.添加data signature2696.4.8.保存文件2706.4.9.保存文件之后271第5节 数据分析前期准备的其他示例271创建控制变量271为积极态度创建二分类指标.274为积极态度创建四分类量表.277第6节 merge.2796.6.1. match-merging280 将ID变量排序2816.6.2. one-to-one merging.281合并无关数据集.2816.6.3. 区分match-merge和one-to-one merge.283第7节 本章小结285第7章 数据分析与结果呈现.287第1节 统计分析的规划和组织2877.1.1. 总体规划2887.1.2. 中层规划2897.1.3. 具体规划291第2节 组织do文件.2917.2.1. 使用master do文件2927.2.2. do文件里应该包含的内容.294第3节 统计分析的记录.2957.3.1. log文件和do文件中的备注.2957.3.2.记录结果的出处296图表的标题298第4节 使用automation来分析数据.2987.4.1.用来定义变量集的locals.2997.4.2.重复性分析的loops命令.300用loops命令进行t检验300用于替代性模型校验的loops.3027.4.3.用于汇集和输出结果的矩阵303汇集t检验结果.303保存嵌套回归模型的结果306保存article的不同变形结果.3087.4.4.从矩阵中创建图形.3107.4.5.使用include文件加载数据和选择样本.311第5节 基线统计.312第6节 复制3137.6.1.丢失或遗忘的文件.3137.6.2.软件与版本控制.3147.6.3.未知的随机数种子.314Bootstrap辅助程序标准错误.314让stata设置种子.315Training和confirmation样本.3167.6.4.使用不在do文件里的global.318第7节 结果的呈现.3187.7.1.创建表格.319使用excel电子表格.319使用esttab命令的回归结果.3217.7.2.创建图形323图形的颜色.324字体大小3267.7.3.对论文和报告的建议.326论文.326报告.327第8节 研究项目的被忘清单.328第9节 本章小结328第8章 文件的保护331第1节 文件类型与保护层次332第2节 数据丢失的原因与文件恢复的问题.334
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农产品新能源烘干设备创新创业项目商业计划书
- 生产线智能分析决策系统创新创业项目商业计划书
- 移动CRM客户关系情感分析工具创新创业项目商业计划书
- 农品鲜品购创新创业项目商业计划书
- 创立特色玉米品牌创新创业项目商业计划书
- 中草药养生创新创业项目商业计划书
- 河南省名校阶段性测试(四)2024-2025学年高一下学期5月月考生物试题(解析版)
- 全旗知识产权培训课件
- 潜力传媒创业计划书
- 二零二五年度复合基质研发与市场推广合作协议
- 21、学生饮用奶食品安全应急预案
- 醉里乾坤大壶中日月长-初中语文九年级第六单元名著导读《水浒传》整本书阅读精读研讨课 公开课一等奖创新教学设计
- 特立帕肽治疗骨质疏松性骨折中国专家共识(2024版)解读
- 第一章 有理数 大单元教学设计-2024-2025学年七年级数学上册(人教版2024)
- 2024米面油采购合同范本
- AQ 2029-2010 金属非金属地下矿山主排水系统安全检验规范(正式版)
- 小学小升初数学试卷(基础题)
- 2024年交管12123学法减分考试题库和答案
- 2022版数学新课程标准高中数学新课程标准2022
- 浙江省食品快检项目名单(2024年版)、检测信息公布要求、检测室设备设施配置参考清单、结果验证规范、能力评价表、操作指南
- 黄瓜栽培技术及病虫害防治
评论
0/150
提交评论