




已阅读5页,还剩222页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.0 在医学科研统计中的应用 中南大学公共卫生学院 卫生统计教研室 虞仁和 数据处理的一般原则 医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等各个方面,是一门很高超的艺术。在数据处理过程中,原始数据的采集和录入,数据的管理,恰当选用统计方法,熟练使用统计软件等,都是必须重视的关键环节。 原始数据的记录形式 医学研究的原始数据常列成类似下表的二维结构,即行与列结构的数据集形式。在下表中,每一行称为一个记录 (r ,或一个观察单位 ( e) ;每一列称为一个变量 ( v ar i ab l e ) ,用以表示变量、项目或观察指标等。下表记录的原始数据是一个由 2 7 4 例观察单位和 11个变量组成的数据集。 肾衰病人预后研究的临床资料记录 病人 编号 病案号 性别 年龄 生理 评分 肾毒性 黄疸 昏迷 肌酐 胆固醇 肾功能预后 1 0 0 4 7 5 7 男 26 14 无 有 无 520 治愈 2 0 0 7 9 5 0 女 31 13 无 无 无 523 4 . 5 治愈 3 0 1 1 0 9 3 男 55 17 无 无 无 209 3 . 3 治愈 4 0 1 7 5 5 5 男 25 9 无 无 无 1 3 0 3 4 . 1 治愈 274 2 7 9 1 8 3 女 88 15 有 无 无 331 6 . 1 丧失 原始数据的记录形式 原始数据中 , 变量分为标识变量和分析变量两种 。 包括数据的核对与增删等 , 是研究记录中不可缺少的内容 , 如上表中的 “ 病人编号 ” 和 “ 病案号 ” 即为标识变量 。 上表中除上述 2个标识变量外 ,其它 9个变量均为分析变量 。 分析变量又被分为反应变量 (解释变量( 反应变量是表示试验效应或观察结果大小的变量或指标。 解释变量又称指示变量 (分组变量 (、分类变量 (、协变量等。 根据研究目的以及变量间的相互关系,各变量的作用并非一成不变。 原始数据的录入 在进行统计分析前 , 原始数据需录入计算机 。 录入的文件类型大致有: 如 如 如 据文件等 。 目前 , 上述文件类型绝大多数都可以相互转换 。 录入数据时 , 应遵循便于录入 , 便于核查 , 便于转换 , 便于分析的原则 。 便于录入是指尽可能地减少录入工作量 , 例如 , 下图是前表原始数据录入为 数据 的形式 , 录入时 , 用数值变量取代了字符变量 ( 如图中的 “ 性别 ” , “ 肾毒性 ” , “ 黄疸 ” , “ 昏迷 ” ) , 可以大大节约录入的时间和费用 。 (如将性别标记为 1=“男 ” , 0=“女 ” )。 原始数据的录入 数据处理中的几个基本问题 1 数据核查 数据录入后 , 首先须对录入的数据进行核查 , 以确保录入数据的准确性和真实性 。 核查准确性可分两步进行 。 第一步逻辑检查 , 通过运行统计软件中的基本统计量过程 , 列出每个变量的最大和最小值 , 如果某变量的最大或最小值不符合逻辑 , 则数据有误 。 例如 , 在 数据 件中 , 当变量 “ 年龄 ” 的最大值为 “ 300”时 ,一定有误 。 利用软件的查找功能可立即找到该数据 , 然后根据该数据对应的标识值找出原始记录 , 更正该数据 。 如本例可查到该数据对应的 “ 病人编号 ” 为 “ 27”, 查原始记录的年龄为 “ 30”。 第二步数据核对 ,将原始数据与录入的数据一一核对 , 错者更正 。 有时 , 为慎重起见 , 采用双份录入的方式 , 然后用程序作一一比较 , 不一致者一定是录错的数据 。 数据核查的另一项任务是对数据的真实性做出初步判断。 数据处理中的几个基本问题 2 离群数据的处理 当个别数据与群体数据严重偏离时 , 被称为离群数据 (极端数据 ( 。 统计软件一般都有判断离群数据的方法 。 判断离群数据有多种方法 , 例如 , 观察值距箱式图 (箱体底线 ( 第 25百分位数 ) 或顶线 ( 第75百分位数 ) 的距离为箱体高度 ( 四分位数间距 ) 的 倍时被视为离群点;观察值距箱体底线或顶线的距离超过 3倍的箱体高度时被视为极端值 。 若有离群数据出现,可分为两种情况处理: 一种是,如果确认数据有逻辑错误,又无法纠正,可直接删除该数据。例如,若某一数据中某病例的身高变量为 “ 1755”原始记录亦如此,又无法再找到该病例时,显然这是一个错误的记录,只能删除。 另一种是,若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛盾,则不剔除;若结果矛盾,并需要剔除,必须给以充分合理的解释,例如用何种方法确定偏离数据,该数据在实验中何种干扰下产生等。 数据处理中的几个基本问题 3统计方法 前提条件的检验 : 应用参数方法进行假设检验往往要求数据满足某些前提条件,如两个独立样本比较 要求方差齐性,因此需要做方差齐性检验。 如果要用正态分布法估计参考值范围,首先要检验资料是否服从正态分布。 在建立各种多重回归方程时,常需检验变量间的多重共线性和残差分布的正态性。 统计方法选择的基本思路 数据处理中,正确选择统计方法至关重要。选择统计方法可以沿着以下思路进行。 第一个层面,看反应变量是单变量、双变量还是多变量。 对于前者,第二个层面看属于三种资料类型中的哪一种; 第三个层面看单因素还是多因素; 第四个层面看单样本、两样本或多样本; 第五个层面看是否是配对或配伍设计; 第六个层面看是否满足检验方法所需的前提条件。 单变量计量资料的分析 1 样本均数与总体均数比较 分析思路为:反应变量为单变量 计量资料 单因素 样本均数与总体均数比较 如果服从正态分布 , 选用样本均数与总体均数比较的 如果不服从正态分布 ,则考虑用非参数检验方法 。 2 两个相关样本均数的比较 分析思路为:反应变量为单变量 计量资料 单因素 两个相关样本均数比较 ( 因为是配对设计 ) 。 如果差值服从正态分布 , 选用配对 如果差值不服从正态分布 , 选用单样本秩和检验 ( 3 两个独立样本均数比较 分析思路为:反应变量为单变量 计量资料 单因素 两个独立样本均数比较 。 如果方差齐性 , 且两样本均服从正态分布 , 选用两样本 如果方差不齐 , 但两样本均服从正态分布 , 选用 t检验 , 或两样本秩和检验 ( 如果方差不齐 , 且两样本不服从正态分布 , 选用两样本秩和检验 。 本例选两样本 单变量计量资料的分析 4 多个样本均数比较 应变量为单变量 , 又属计量资料时 , 多个样本均数比较分为单因素和多因素两种情形 。 而重复测量资料则被视为多个反应变量的类型 。 (1) 单因素方差分析:若方差齐性 , 且各样本均服从正态分布 , 选单因素方差分析 ( ;若方差不齐 , 或某样本不服从正态分布 , 选 和检验 ( 若方差分析或秩和检验结果显著 , 需进一步做多重比较 , 如 扩展 (2) 两因素方差分析但不分析交互作用:主要是随机区组设计资料 ,涉及 2个因素 , 即 1个处理因素和 1个区组因素 。 如果满足方差齐性和正态分布两个条件 , 选用两因素方差分析 ( 如果不满足上述两个条件 , 选用随机区组设计资料的 单变量计量资料的分析 (3) 三因素方差分析但不分析交互作用: 主要有拉丁方设计和二阶段交叉设计两种资料类型 。 对于拉丁方设计资料 , 涉及 3个因素 , 即 1个处理因素和 2个区组因素;对于二阶段交叉设计资料 , 3个因素分别为处理因素 、 受试者和试验阶段 。 如果满足方差齐性和正态分布两个条件 ,拉丁方设计可选用三因素方差分析 ( 如例4阶段交叉设计可选用广义线性模型的方差分析 , 如例4如果不满足上述两个条件 , 选用非参数方法 ( 参见有关文献 ) 。 若对处理因素的方差分析或秩和检验结果显著,均需进一步做多重比较。 单变量计量资料的分析 (4) 多因素方差分析且分析交互作用: 此类资料包括析因设计资料 ( 例 11, 正交设计资料 ( 例 11, 嵌套设计资料 ( 例 11,裂区设计资料 ( 例 11等 。 (5) 重复测量资料: 单因素重复测量只有 1个重复测量因素,如表 12因素重复测量除有 1个重复测量因素外,至少还有 1个其它处理因素,可分析交互作用,如例12 单变量计数资料的分析 两个率 总体与样本 2检验 /切概率法 / 两样本率的 u 检验 配对 2检验 ( 单 样本 u 检验 / 基于二项分布的确切概率法 两样本 非配对 配对 多个样本率 / 构成比 2检验 分层 2检验( Co c h r 分层计数资料 双向无序 单向有序 双向有序 关联度 分组变量有序 反应变量有序 配对 / 配伍设计 非配对 / 配伍设计 列联系数分析 2检验 秩和 检验 验/ 系数检验 秩相关分析 /线性趋势检验 单变量等级资料的分析 若为两组配对等级资料的比较,选 若为两组独立样本等级资料的比较,选 若为多组独立样本等级资料的比较,选 双变量资料的分析 1 简单相关分析 分析两变量的相关关系时 , 若两变量满足二元正态分布 , 可选 若两变量不满足二元正态分布 , 可选 相 关 分 析 ( 2 线性回归分析 分析两变量的回归关系时 , 若两变量关系呈线性趋势 , 可选简单线性回归分析( 。 3 曲线回归分析 分析两变量的回归关系时 , 若两变量关系呈曲线趋势 , 可按曲线类型选指数曲线 ,多项式曲线 , 生长曲线 , 也可选用非线性回归分析方法 。 多变量资料的分析 1 有应变量的多元分析 若应变量 且服从正态分布 , 自变量满足多元正态分布 , 可选 多元回归分析或多元逐步回归分析 因变量 二分类或多分类 ) , 且以判别分类为主要目的 , 自变量满足多元正态分布 , 可选判别分析或逐步判别分析 。 若因变量 并含有截尾数据 , 可选 若因变量 且以分析危险因素为主要目的 , 如果为配比设计 , 选条件 果无配比设计 , 选非条件 多变量资料的分析 2. 无因变量的多元分析 欲将变量或观察单位划分为性质相近的 可选用聚类分析 。 3. 相关分析 若分析 1个变量与 1组变量的相关关系 , 可选多重线性相关分析;若分析 1组变量与另 1组变量的相关关系 , 可选典型相关分析 。 述 社会科学用统计软件包,是目前世界上最优秀统计分析软件之一。 随着产品服务领域的扩大和服务深度的增加,其英文全称已于 2000年更改为 “ 统计产品与服务解决方案 。 述 . C. . 968年。 1984年 C+,其最初的几个版本是基于 C+虽然功能强大,但在用户界面、输入、输出环境等方面并不十分理想。 1992年 最初的 过对操作平台的升级、数据交换与管理功能的升级、输出结果的升级和统计分析功能的升级, 按照约定,凡是 C+;凡是 C+的 述 虽然也可以通过编辑程序来运行,但他最显著的特点是菜单和对话框操作方式,绝大多数操作过程仅靠点击鼠标即可完成 。因而,它以易于操作而成为最受欢迎的统计软件包之一。 1 操作简便 有一定统计基础且熟悉 了数据录入及部分命令程序等少数输入工作需要使用键盘键入外 , 对于常见的统计分析方法完全可以通过对 “ 菜单 ” 、 “ 对话框 ” 的操作完成 , 无需编程 。 2 数据管理功能强大且操作直观 转换 、 检索 、 统计分析 、 作图 、 制表及编辑等功能;采用类似 数据接口较为通用 ,能方便的从其他数据库中读入数据 。 3 统计分析方法比较全面 件的统计过程包括了常用的 、较为成熟的统计分析方法 , 提供了从简单的描述统计到复杂的多因素统计分析方法 。 比如数据的探索性分析 、 一般统计描述 、 简单列联表分析 、 均数比较 、 一般线性模型 、 混合模型 、 相关回归 、 对数线性模型 、 聚类和判别 、 因子和对应分析 、 多维标度 、 信度分析 、 非参数检验 、 时间序列 、 生存分析及缺失值估计等 。 4 功能模块组合灵活 件由 其中 其余为扩展模块 , 分别用于完成某一方面的统计分析功能 。 用户可根据自己的分析工作需要和计算机设备的实际配置情况选择和装配模块 。 总之 , 形象直观 、 易学易用 。 只要掌握一定的 懂得统计分析基本原理和方法 , 就可使用该软件为特定的科研服务 。 (一 ) 1、 双击 ( 或单击 ) 程序的桌面快捷方式图标启动 2、 通过 “ 开始 ” 菜单的 “ 程序 ” 运行方式启动 (二 ) 1、 单击主菜单中的 “ 在下拉菜单中单击“ 可退出 2、单击主菜单右上角控制框中的关闭按扭,可 退出 主界面 (数据编辑窗 )简介 一、 数据编辑窗 在数据编辑窗中 , 有标题栏 、 菜单栏 、 工具栏 、 状态栏和数据表视窗及变量表视窗 。 数据编辑窗主要有建立新的数据文件 、 编辑和显示已有数据文件等功能 。 数据编辑窗组成 数据编辑窗由 数据表视窗 )和 变量表视窗 ) 两个视窗组成 , 两个视窗切换单独显示 。 数据表视窗用于显示和编辑变量值;变量表视窗用于定义 、 显示和编辑变量特征 。 在 一次只能打开和显示一个数据文件 。 1标题栏 标题栏位于窗口顶部 , 左边为控制菜单图标和窗口名称 , 右边为窗口控制按钮 。 标题栏 菜单栏 工具栏 数据表视图 变量表视图 状态栏 2菜单栏 标题栏下面是一行由 10个菜单项组成的主菜单 , 其内容为: 文件操作 文件编辑 视图 建立数据与数据整理 数据转换 统计分析 绘图 实用程序 窗口信息与控制 帮助 3工具栏 为了方便用户 , 4状态栏 状态栏位于窗口的底部 , 显示 当执行 状态栏中显示正在执行的相应过程名称 。 5数据表视窗 ( 数据表视窗用于数据输入 、 编辑 、 显示 。 视窗中为一个可扩展的平面二维表格 , 表格的顶部为变量名 , 表格的左边是观察单位序号 。 一个变量名和一个观察单位序号就对应了二维表格中的一个单元格 ( 视窗的工具栏下面有一个条形栏 , 它的左边为窗口状态栏 , 显示输入数据的记录号和变量名 , 右边为输入数据栏 ,显示从键盘输入的变量值 。 当用户选定某个单元格位置 , 它就被圈为黑框 , 用户从数据输入栏输入数据 , 单击该单元格或回车后 , 数据就以隐含格式进入黑框 。 观察单位序号 变量 数据单元格显示 6变量表视窗( 变量表视窗用于定义 、 显示变量和编辑变量特征 , 视窗中有一个平面二维表格 , 表格的顶部为变量特征 , 表格的左则是变量序号 ,一行可定义一个变量 。 定义变量有如下内容:变量名 ( , 变量类型 ( , 变量宽度 ( , 保留小数位 ( ,变量标签 ( , 变量值标签 ( ,缺失值 ( , 变量显示 ( ,对齐方式 ( , 变量类型 ( 。 变量特征 变量序号 二、结果输出窗( 件包对数据进行分析后,把统计分析的结果自动地写到结果输出窗口中。 该窗口由左右两框组成:左框主要显示输出的标题,为右框的内容提供了一大纲视图,右框主要显示统计图、表以及一些文字说明(输出统计分析结果)。移动该窗口的垂直与水平滚动条便可看到输出结果的全部内容,或可用鼠标单击左框中的标题直接转入相应的输出结果。 左框和右框的宽窄可通过移动两框架间的纵线调节。双击左框架所选内容的标题图标可在右框架中显示或隐藏该内容,还可以通过移动左框中的选项来改变输出结果的顺序。 二、结果输出窗( 二、结果输出窗( 打开结果输出窗有以下几种方式:在第一次产生分析结果的 果输出窗被自动打开;打开新的结果输出窗,从菜单选择 根据输出结果的 3种形式,即文本、图形和表格,结果输出窗相应地设有 3个编辑器,即文本编辑器、统计图编辑器和统计表编辑器,输出结果可通过激活这些编辑器进行编辑。 三、程序编辑窗( 程序编辑窗口用于建立、编辑命令文件和其它文本文件。命令文件由若干条 用 1 启动 . 数据文件的建立或读入 (1)制定数据文件结构 (2)录入数据 (3)编辑数据文件 3 数据的统计处理 4 结果输出 5 保存文件 数据文件的建立 一是在 二是从 在 般来说,包括三个步骤: 定义变量, 录入数据, 保存数据。 一、 定义变量 定义变量名 定义变量类型 定义变量长度(小数点) 定义变量标签 定义变量值标签 定义变量显示格式(宽度、对齐方式) 定义变量步骤 (一 ) 首先启动 入 数据编辑窗口。 数据编辑窗口被分为两个视窗: “ 据表视窗) ” 和 “ 量表视窗) ” 。 (二 ) 单击数据编辑窗口底部的 “ 签切换到变量定义界面。 此时,电子表格中的行为变量,列依次为变量名、变量类型、变量长度、小数点位数、变量标签、变量值标签、缺失值、变量宽度、对齐方式和数据量度十个选项。 定义变量步骤 (三 ) 定义变量名 在 定义变量对话框 中的 “ 面输入要定义的变量名 。 系统按变量定义顺序给出的变量名默认值为: 此类推 。 定义变量名应遵循如下原则: 1. 首字符必须是英文字母或汉字,不能以下划线 “ ”或圆点 “ .”结尾。 2. 变量名不能使用 谓 “ 保留字( ” 就是在程序语言或操作系统内已经指定用途的字句。 Y、 3. 变量名中不能有空格或某些特殊符号,如 “ !”、 “ ? ”和 “ ” 等。 4. 系统中不区分变量名中的大小写字符。例如 5. 变量名称最好以能够代表该数据意义的文字来命名,如此可提高变量的可读性。 定义变量步骤 (四 ) 定义变量类型 在 “ 的单元格,单击定位后,单元格右方出现按钮 。单击该按钮,弹出定义变量类型 (话框。系统默认为数值型 对话框中出现八种可供选择的变量类型,分别是: 八种可供选择的变量类型 “ 标准数值型变量 , 系统默认 “ 带逗点的数值型变量:千进位用逗号分隔 , 小数与整数间用圆点分隔 “ 圆点数值型变量:千进位用圆点分隔 , 小数 与整数间用逗号分隔 “ 科学计数法 “ 日期型变量 “ 带美元符号的数值型变量 “ 自定义变量 “ 字符型变量 定义变量 类型 若选了 “ 则用户可在 定义变量类型(话框 中部的 “ “ 本框中键入相应的数值型的宽度 ( 长度 ) 及小数位数 。 其默认值为宽度: 8, 小数位数:2。 应该注意 , 数值型的宽度应该大于该变量的数据的 “ 整数位数 +小数位数 + ” 。 若选了 “ 则用户可在 定义变量类型(话框 “ 本框中键入字符串的长度 。 (五 ) 定义变量名的标签,简称变量标签 (定义变量标签是对该变量名所表示的数据项内涵的进一步说明。有时变量名不足以表示该变量的内涵,这时需要定义变量的标签。而变量标签最多可由 256个字符组成。在统计分析过程的输出中会在变量名对应的位置显示该变量的标签,有助于理解输出结果。变量标签为可选项 (可以定义,也可以不定义。 单击 定义变量对话框中的 “ 钮 , 键入 “ .”即可 (六 )定义变量值标签 每个变量名对应一个数据项 , 每个变量取不同的值 ,表示数据项中的不同信息 。 有时为了更好理解统计分析过程中的输出结果 , 要给变量的取值 ( 简称变量值 ) 赋以标签 。 那么在输出结果的相应位置上就会出现该标签 , 使读者一目了然 。 并不是所有变量值都要取标签 , 一般来说离散变量才给变量值定义标签 。 例如: 变量名 变量标签 变量值 变量值标签 性别 1 男 2 女 (六 )定义变量值标签 单击定义变量对话框中的 “ 钮,弹出变量值标签对话框 在 “ 域用户可键入变量值标签:首先在“ 后的文本框内键入变量值 , 再在 “ 的文本框内键入该变量值的标签 , 然后用单击 “ 钮 。重复此操作 , 直到全部变量值及其标签都输完为止 。 例如 应先在 “ 中键入 1, 再在 “ 键入 “ 男 ” , 然后击 “ 钮 。 类似的 , 继续在“ 中键入 2, 在 “ 键入 “ 女 ” , 然后再单击“ 至此 , 所有变量值都已赋以标签 , 按 “ , 返回到 定义变量对话框 。 (七 ) 定义变量缺失值 在 系统缺失值和用户缺失值。前者不需定义,系统自动生成。只有用户缺失值才需定义。 在变量表视图中的 “ 的单元格中,单击定位后,单元格右方出现按钮 。单击该按钮,弹出缺失值定义(话框。 若无缺失值,可选 “ No (八 ) 定义变量的显示宽度 变量表视图的 “ 示列宽,用于调整数据表中各列的显示宽度。系统默认为 8位。 “ 的单元格中,单击定位后,单元格右方出现按钮 ,点击可增加或减少位数,或直接在方格中填入数字。列宽位数要大于该变量中 则在数据表中,数据显示不完整。 (九 ) 定义变量显示的对齐方式 在变量表视图 “ 的单元格中,单击定位后,单元格右方出现按钮 , 点击该按钮,在下拉列表框选择对齐方式。三个选项 “ “ 、“ 别为左对齐、右对齐、居中。系统默认为右对齐。 (十)定义变量的度量类型 在变量表视图 “ 的单元格中,单击定位后,单元格右方出现按钮 , 点击该按钮,在下拉列表框中选择度量类型。 变量类型为 量类型默认值为 量类型为 默认值为 量变量,如身高、体重、血压等测量值。 级变量(半定量,有序分类) 如疗效记录: 治愈、显效、 好 转、无效。 性变量,如血型记录: 二、 数据录入 完成变量定义后,单击数据编辑窗口左下方的 ” 签,切换到数据表视图,此时,电子表格中的列为变量,行为个案。数据录入方法主要有以下三种: 把光标移到要输入的该变量名对应的一列的顶部 , 即序号为 1的单元格并单击之 , 使该单元格为当前操作的单元格 , 输入该变量的第一个值 , 回车 。 此时 , 序号为 1的单元格接受该数值 , 并且当前操作单元格下移到序号为 2的单元格 。 输入第二个值 , 回车 。 如此一直到把该变量的数值输完为止 。 先把光标移到第一个变量和第一个观察单位序号的交叉单元并单击之,使之成为当前操作单元格。输入第一个观察单位序号的第一个变量值,按 “ ,该单元格接受该数据,同时激活右边一个单元格(即成为当前操作单元格)。接着,输入第一个观察单位序号的第二个变量,按 “ ; 。直到输完第一个观察序号的最后一个变量值。 要想输入某个观察序号的某个变量值 , 可以移动光标到二维数据表格中的相应的单元格并单击之 , 使之成为当前操作单元格 。 键入变量值 , 回车即可 。 三、 数据文件的存储 (一 )数据存储 选主菜单 “ 的 “ “ 弹出保存文件 ( s) 对话框 , 选择保存路径 , 键入文件名 , 确定数据类型 , 单击保存 。 展名为 展名为 展名为 l 展名为 l 展名为 S P S S (*v) S P S S W 立 的数据文件 S P S S (*v) S P S S 据文件 S P S S /P C + (*.s y s ) S P S S 建立的数据文件 S P S S P * 其他软件生成的 I 文件 T a bde li mi *t) I ( T a b 分隔符 ) 文件 S y .s y d), (*.s y s) S y 据文件 F ix e d I ( *t) 文本文件 E L (*.x E L 建立的数据文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 3. X 产生的数据文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 2. X 产生的数据文件 1 - 2 - 3 R e l .w 用 L - 2 - 3 1. X 产生的数据文件 S Y L K( *k) S Y L K( 符号链接 ) 格式数据文件 V (*f) 式数据文件 I I (*f) 式数据文件 I (* 式数据文件 调用已建立的数据文件 选择 “ “打开文件( “ 文件类型 ” 下拉列表框中选择相应的文件类型 。 * C+ (* * 其他软件生成的 * * * 用 产生的数据文件 选定文件 ,单击打开 (O)按钮 , 选定的文件就被读入 。 数据文件整理 数据整理是对原始数据中的变量或观察单位进行编辑、增加、删除、排序、转置、合并和加权等处理。数据文件的整理主要是通过主菜单的 “ “ 个菜单项来实现,其主要功能分别见下表。 “单项说明 命令 说明 Un d o 撤销前一个操作。 用来删除刚刚输入的数据或恢复修改的数据。 Re d o 重做用“ u n d o ”命令撤销了的操作。 Cu t 剪切指定的内容到剪贴板。 Co p y 复制指定的内容到剪贴板。 P a 粘贴剪贴板中内容到指定的位置。 P a V a b 粘贴剪贴板中的变量到指定的位置。 r 清除数据编辑窗口中指定的内容(包括变量或观察单位)。 F in d 搜寻指定变量的某个变量值。 Op ti o n s 提供了“ Ge n e ra l ” 、“ V ie we r ” 、“ D ra f t V e r ” 、“ Ou tp u t L a b 、“ Ch a 、“ In c ti v e ” 、“ P iv o t T a b 、“ Da 、“ Cu n c y ”、“ S c 10 个选项卡,可以对数据文件以及输出结果(包括统计表、图)的格式、外观等进行定 义。 “单项说明 命令 说明 De f in e V a r o p e e s 定义与修改一个变量的属性。 Co p y Da ro p e e s 将某个变量的属性(如小数位数)复制给变量类型与其相同的一个或多个变量。 De f in e Da te s 定义时间。主要用于时间序列分析。 In se a 在指定位置插入一个变量 In se a se s 在指定位置插入一个观察单位 G o Ca 定位到指定的观察单位 S o a se s 按某变量值对观察值进行排序 T ra n sp o 转置数据文件 Re c tu 数据结构的重组 M e r g e F il e s 合并数据文件 Ag g re g a 对数据进行分类与不分类的汇总 Id e n ti f y Du p li c a as e s 定义重复的观察值 o g o n a l De n 正交设计 S p li t F il e 分割数据文件 S e t Ca se s 选择观察单位 W e ig h t c a s e s 变量加权。常用于计数频数表资料,如列联表和等级资料频数表,加权后的变量被说明 成频数。 一、数据编辑 数据编辑操作在数据编辑窗口中的 “ 图下进行。 (一 ) 选择操作对象 光标定位于选定的变量名上,单击鼠标左键,则该变量名所在列全部反白显示。 光标定位于选定的观察单位序号上,单击鼠标左键,则该观察单位所在行全部反白显示。 光标定位于第一个变量名上,单击鼠标左键不要松开,向右移动鼠标,直到要选的列全部反白显示,再松开鼠标左键。 光标定位于第一个观察单位序号上,单击鼠标左键不要松开,向下移动鼠标,直到要选的行全部反白显示,再松开鼠标左键。 一、数据编辑 鼠标左键单击要选的第一个变量名,然后按下 用鼠标左键单击其他变量名,最后松开 6. 选择不连续的若干个观察单位:用鼠标左键单击要选的第一个观察单位序号,然后按下 用鼠标左键单击其他观察单位序号,最后松开 要选择某个变量的第二个至第九个的变量值,可将光标定位于该变量的第二个变量值上,按下鼠标左,向下拖动鼠标一直到第九个变量值再松开鼠标左键,使选中的单元格全部反白显示。 光标定位于开始的单元格,按下鼠标左键,向右横向拖动鼠标,直到选中的单元格全部变为反白显示时,松开鼠标左键。 一、数据编辑 (二 ) 数据剪切、拷贝和粘贴 含两种状态:一种是单纯剪切,相当于删除 ;另一 种在原处剪切,转移粘贴到另一处适当的地方。 剪切的方法有: 方法一:选定要剪切的内容,再从 “ 单项中选择“ 。 方法二:选定要剪切的内容,点鼠标右键,从快捷菜单中选择 “ 方法三:选定要剪切的内容,用鼠标左键单击工具栏的图标按钮 。 方法四:选定要剪切的内容,同时按下 X 键。 以上四种方法都会使选定的内容从数据编辑器中消失,并且暂时转存到假想的剪贴板上保存起来。 一、数据编辑 (二 ) 数据剪切、拷贝和粘贴 要把选中的内容复制到另一适当的位置,而其原来的内容还在原来的位置上。 拷贝的方法有: 方法一:选定要复制的内容,再从 “ 单项中选择“ 方法二:选定要复制的内容,点鼠标右键,从快捷菜单中选择 “ 方法三:选定要复制的内容,用鼠标左键单击工具栏的图标按钮 。 方法四:选定要复制的内容,同时按下 C 键。 以上四种方法的结果是原来选定的内容不变,而其相同内容存储到剪贴板上。 一、数据编辑 (二 ) 数据剪切、拷贝和粘贴 把剪切操作或拷贝操作存入剪贴板的内容粘贴到新的适当的地方。 拷贝和粘贴一个变量 按 (一 )的方法选择一个变量; 按剪切或拷贝操作,把它转存到剪贴板上 ; 按后述插入变量的方法,在适当位置上插入一个空变量; 第 4步有四种方法: 方法一: 从 “ 菜单项中选择 “ 方法二:点鼠标右键,从快捷菜单中选择 “ 方法三:用鼠标左键单击工具栏的图标按钮 。 方法四:同时按下 V 键。 一、数据编辑 (二 ) 数据剪切、拷贝和粘贴 拷贝和粘贴一个观察单位 按
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西省忻州地区2023-2024学年七年级下学期期中双减成果展示数学试卷(含解析)
- 全球造纸市场供需趋势考核试卷
- 印刷过程余热回收技术考核试卷
- 生产效率提升策略考核试卷
- 纸质包装的防水防油技术研究考核试卷
- 2025年中国PEV薄膜数据监测报告
- 2025年中国DVI产品数据监测研究报告
- 2025年中国60匙位智能钥匙管理系统主机数据监测报告
- 2025年中国16支棉纱数据监测报告
- 2025至2030年中国高浓度聚合硫酸铁市场分析及竞争策略研究报告
- 《生成式人工智能服务管理暂行办法》知识培训
- 2025年改性无水硫酸钙晶须市场调研报告
- 2024上海市招聘社区工作者考试题及参考答案
- 文化旅游文创产品开发与市场营销方案
- 中华人民共和国史期末复习
- 呼伦贝尔市国企招聘考试试题及答案2025
- 苏教版 五年级 数学 下册《第1课时 因数和倍数》课件
- 《解读临床医学认证》课件
- 全国高职高专院校信息素养大赛考试题及答案
- 手术应激反应
- 国画基础知识题库单选题100道及答案解析
评论
0/150
提交评论