




已阅读5页,还剩94页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 3 5 研究生用 1 SPSS13 0基础知识 暨南大学医学院医学统计教研室夏苏建 2020 3 5 2 SPSS的含义 SPSS是软件英文名称的首字母缩写原意为 StatisticalPackageforSocialScience即 社会科学统计软件包 2020 3 5 3 SPSS最显著的特点 SPSS是国际上最流行并具有权威性的统计分析软件之一 它由美国斯坦福大学的三位学生于1968年研制 SPSS最显著的特点是用菜单和对话框选择并完成统计过程 操作简便 是非统计专业人员应用最多的统计软件 2020 3 5 4 SPSS的不同版本 尽管SPSS在不断升级 但其基本统计分析内容无变动 以SPSS13 0版本为基础介绍 对于SPSS11 5和16 0版本 本指导也适用 SPSS13 0与SPSS11 5以前版本的最大不同是 变量名可以最多长达64个字节 统计图的编辑更加灵活 2020 3 5 5 SPSS13 0安装步骤 运行SPSS13Eval安装程序安装完成后 拷贝crack目录下的执行文件Patch到安装目录运行即可 2020 3 5 6 SPSS的教学特点 尽可能用默认选择项或最简捷的操作方式获得必要的结果 按医学统计学和医学论著的要求来解释结果 2020 3 5 7 实习一数据文件的建立 保存和调用 SPSS启动SPSS主要窗口及其功能数据文件的建立 2020 3 5 8 一 SPSS启动 有3种方式启动SPSS 在桌面双击SPSS13 0图标从菜单选择 开始 程序 SPSSforWindows SPSS13 0forWindows在资源管理器中双击SPSSWIN exe文件 2020 3 5 9 二 SPSS主要窗口及其功能 数据编辑窗 Dataeditor 结果输出窗 Viewer 程序编辑窗 SyntaxEditor 2020 3 5 10 数据编辑窗 Dataeditor SPSS Employeedata sav 2020 3 5 11 2 结果输出窗 Viewer 按性别统计不同岗位人员的收入 2020 3 5 12 3 程序编辑窗 SyntaxEditor 2020 3 5 13 三 数据文件的建立 数据文件的建立是指把收集到的数据存入到计算机的磁盘中 以便调用 修改 添加数据和统计分析 主要步骤是 数据编码建立数据文件结构数据录入和保存数据 2020 3 5 14 表1 16例某病住院病人的部分资料 2020 3 5 15 一 数据编码 定义变量名 variable 定义变量的标签 variablelabels 对数据进行编码和定义变量取值的标签 valuelabels 数据编码的一般方法 2020 3 5 16 数据编码 2020 3 5 17 表1 16例某病住院病人的部分资料 2020 3 5 18 一 定义变量名 variable 变量名的长度不能多于64个字符 每个英文字母或阿拉伯数字为1个字符 每个汉字为2个字符 变量名不应过长 最好有实际含义 如性别或sex 首字符应该为英文字母或汉字 变量名的任何字符不能使用 变量名不能使用SPSS的保留字 如 ALL AND OR NOT EQ GE GT LE LT NE TO WITH 系统中不区分变量名的大小写字符 例如TIME和time被认为是同一变量 2020 3 5 19 二 定义变量名的标签 variablelabels 定义变量名标签是对变量名做进一步说明 如果变量名已经说明了变量的内涵 则不必设置变量名标签 如性别 血型 name 等有时 变量名不能明确表示该变量的含义 如date in 变量名标签设置为 入院时间 变量标签不受字符位数的限制 可以用英文或中文表示 在统计分析的输出结果中 可显示变量的英文或中文标签 使输出结果的可读性更好 2020 3 5 20 三 对数据进行编码定义变量值标签 valuelabels 对于分类变量 常用数字对不同的类别进行编码 从而方便数据的输入和统计分析 有时为了更好理解数据内容和输出结果 给变量的不同取值赋以不同标签 使用户一目了然 如乙型肝炎表面抗原HBsAg 0 阴性 1 阳性 2 未检测 2020 3 5 21 四 数据编码的一般方法 数值变量 如 年龄 体重 不必编码就可直接输入 无序分类变量 如 性别 1 男 2 女 职业 1 医生 2 护士 3 行政人员 4 工人 5 其他 有序分类变量 疼痛 0 无 2 轻度 3 中度 4 重度 年龄 1 15岁 2 15 34岁 3 35 59岁 4 60岁 可选择多项的变量 复选题 2020 3 5 22 可选择多项的变量 复选题 如药物的不良反应 无0 有 头昏1 恶心2 上腹不适3 口干4 食欲不振5 此例可以分解为5个数值变量 如A1 A2 A3 A4 A5 用数值0表示 无 1表示 有 也可设置1个字符变量 如affect 如同时有 头昏 恶心 和 食欲不振 症状 可用字符变量值 125 表示 使得资料输入方便 2020 3 5 23 二 建立数据文件结构 打开数据编辑窗口启动SPSS以后 数据编辑窗口首先自动打开 单击Cancel按钮 即进入数据窗口 DataView 在SPSS运行过程中欲建立新的数据文件 从菜单选择 File New Data 单击数据编辑窗左下方的VariableView按钮 使当前窗口由数据窗口 DataView 转为变量窗口 VariableView 2020 3 5 24 2020 3 5 25 数据编辑窗口 DataEditor 数据窗 DataView 变量窗 VariableView 2020 3 5 26 变量窗口 VariableView 2020 3 5 27 变量名 Name 在光标处直接输入 变量类型 Type 默认设置 数值变量类型 Numeric 长度 Width 是8个字符 小数点 Decimal 2位 记作F8 2 它的含义是 该变量数字长度共8个字符 其中小数点占1个字符 小数点以前的数值占5个字符 小数点以后的数值占2个字符 字符变量 String 的默认长度是8个字符 记作A8 如果输入姓名 地址等文字内容 必须选用字符变量 方法 单击相应变量的Numeric 出现 单击 2020 3 5 28 2020 3 5 29 数据长度 Width 和小数点位数 Decimals 通过单击 选择 也可在变量类型 Type 中设置 日期变量 Date 的设置单击相应变量的Numeric 出现 单击 2020 3 5 30 变量标签 Labels 在光标处直接输入中文或英文标签 如果变量名能够说明该变量的内涵 可不必设置变量标签 变量取值标签 Values 不是必须设置项目 设置 性别 的变量值标签 1为男性 2为女性 方法 单击相应变量的Values 出现 单击 缺失值 MissingValues 不是必须设置项目 数值变量的默认缺失值为 本例hbsag 乙肝表面抗原 的未检用 2 表示 故设 2 为缺失值 方法 单击相应变量的Missing 出现 单击 列宽 Column 用于调整数据表中各列的宽度 默认为8个字符宽 2020 3 5 31 2020 3 5 32 数据表中数据排列方向 Align 数值变量 Numeric 的默认为右对齐 Right 字符变量 String 的默认为左对齐 Left 图1 2 测量类型 Measure 对于数值变量默认为Scale 数量 字符变量默认为Nominal 名义 如姓名 对于等级资料 如疗效的4个等级用数值1 2 3 4表示 可以定义为Ordinal 等级 也可默认用Scale 本例的性别分别用数值1和2表示男性 女性 这时的1和2已经没有数值大小的含义 故可以定义为字符变量 测量类型为Nominal 但为了操作方便和某些统计分析 还是经常把它定义为数值变量 默认测量类型为Scale 单击变量窗口左下方的DataView按钮 使当前窗口转为数据窗口 2020 3 5 33 2020 3 5 34 三 数据录入 2020 3 5 35 按变量输入数据 按列输入 将光标移到该变量与第一个观察单位交叉处的单元格 单击鼠标 被定位的单元格边框加黑显示 输入变量的第一个值 回车或按向下移动光标键 黑框单元格定位于观测量序号为2的单元格 输入第二个数据 按观察单位 按行输入 输入数据将光标移动要输入的观察单位 单击鼠标 将该观察单位标记 输入变量的第一个值 按 Tab 或 键 输入第二个数据 按单元格输入数据将光标移动到想要输入的单元格 单击鼠标 输入变量值 按回车键 也可按此法修改变量值 2020 3 5 36 显示变量值标签 2020 3 5 37 四 数据文件的保存 将数据窗中的数据以文件形式保存到指定磁盘的目录中 保存数据文件可以使用 File 菜单项中的Save 保存 和Saveas 另存为 保存有两种 直接保存为SPSSforWindows的数据文件 扩展名为 sav 默认 保存为其他格式的数据文件 以便其他软件可以使用 如Excel xls 和dBASEIII dbf 2020 3 5 38 五 数据文件的调用 从SPSSforWindows对话框中调用 SPSS启动后 对话框默认选择项为 Openanexistingdatasource 文件栏中最多可保留以前打开的9个文件 默认 从菜单中调用 单击File 展开下拉菜单 菜单的下半部为以前打开的文件 单击OpenFile图标 按路径选择要打开的文件 SPSS可直接调用Excel数据文件 第1行是变量名 2020 3 5 39 实习二数据文件的编辑 整理 转换和合并 数据文件的编辑数据文件的整理数据文件的转换数据文件的合并 2020 3 5 40 一 数据文件的编辑 一 变量的插入和删除 二 观察单位的插入和删除 三 数据的剪切 Cut 复制 Copy 粘贴 Paste 四 恢复删除或修改前的数据 2020 3 5 41 一 变量的删除和插入 删除一个变量插入一个变量 Variable 练习 将例1 1数据文件中的变量num删除后 再插入该变量 重新输入 2020 3 5 42 删除一个变量把光标移至待删除的变量名处 单击鼠标 按键盘上Delete键 或从菜单上选择Edit Cut 2020 3 5 43 插入一个变量 Variable 在数据窗口 把光标定位于新变量要占据的那一列的任意行上 单击鼠标 单击 插入变量 InsertVariable 图标 结果在光标位置的左边插入一个变量名为 Var0000n 的变量 其中n是系统定义的变量序号 原来占据此位的变量右移 可在变量窗口对插入的变量重新命名并定义其属性 2020 3 5 44 二 观察单位的插入和删除 插入一个观察单位 Case 删除一个观察单位把光标移至待删除的观察单位序号处 单击鼠标 按键盘上Delete键 或从菜单上选择Edit Cut 练习 将例1 1数据文件中的第2个病例删除后 再插入病例 重新输入 2020 3 5 45 三 数据的剪切 Cut 复制 Copy 与粘贴 Paste 练习 如例1 1数据文件中的date in变量值全部输入完毕后 发现第1个观察单位的 09 29 2004 漏输 使后面的变量值都上移一行 怎么办 2020 3 5 46 将变量date in当前的第1个观察单位及以后的变量值标记 从菜单选择Edit Cut 将光标定位于第2个观察单位处 从菜单选择Edit Paste 将 09 29 2004 输入到第1个观察单位处 2020 3 5 47 四 恢复删除或修改前的数据 如对本次的修改与删除不满意 想恢复操作前的状态 可从菜单选择Edit Undo 也可单击 撤消 或 恢复 快捷图标 2020 3 5 48 二 数据文件的整理 排序 SortCases 练习 将例1 1中的数据按 性别 和 年龄 从小到大排序 观察到什么 2020 3 5 49 方法 从菜单选择Data SortCases 打开SortCases对话框 将变量 性别 和 年龄 分别选入Sortby栏 默认升序排列 Ascending 单击OK按钮 2020 3 5 50 二 选择观察单位 SelectCases 练习 将例1 1数据文件中 男性 同时 年龄 在65岁以下的观察单位选择出来 观察到什么 2020 3 5 51 方法 从菜单选择Data SelectCases 打开Select对话框 选择ifconditionissatisfied 单击if按钮 在条件栏中输入sex 1 age 65 单击Continue按钮 单击OK按钮 2020 3 5 52 条件符号的含义 not 数字和符号可从对话框中直接选择 如果从键盘选入 应处于英文输入状态 以减少出错的可能 2020 3 5 53 单击右键 含义 And 2020 3 5 54 2020 3 5 55 三 数据文件的转换 用赋值方法生成新变量 Compute 对变量值重新划分 Recode 复选题编码与SUBSTR函数的使用 2020 3 5 56 一 用赋值方法生成新变量 Compute 练习2根据例1 1数据文件中的 身高 和 体重 计算体重指数 然后赋值给新变量 bmi 体重指数的计算公式如下 注意公式中身高的单位为m 体重指数 BMI 体重 kg 身高 m 2 2020 3 5 57 二 对变量值重新划分 Recode 练习将图2 9数据文件中的体重指数bmi变量值重新编码 0 24 1 24 并赋值给新变量 肥胖 2020 3 5 58 从菜单选择Transform Recode IntoDifferentVariables 打开RecodeintoDifferentVariables对话框 将 bmi 选入NumericVariable栏 在OutputVariable栏输入新变量肥胖 单击Change按钮 单击OldandNewValues按钮 2020 3 5 59 2020 3 5 60 三 复选题编码与SUBSTR函数的使用 不要求 练习 图中的变量case和e代表10位癌症患者化疗后的不良反应 不良反应共有5种 分别用字符1 2 3 4 5表示 如第1位患者无不良反应 用字符0表示 第2位患者同时有1 2 3项不良反应 用字符123表示 依此类推 字符变量e的变量值便于数据录入 但不便于统计分析 因此需要用SUBSTR函数将字符变量e分解为数值变量e1 e2 e3 e4 e5 分别代表5种不良反应 用数值0表示无 1表示有 2020 3 5 61 数据文件与复选题编码 2020 3 5 62 Paste自动打开Syntax编辑窗口 2020 3 5 63 复制 粘贴 编辑Run All 2020 3 5 64 2020 3 5 65 四 数据文件的合并 不要求 一 增加观察单位 AddCases 二 增加变量 AddVariables 2020 3 5 66 一 增加观察单位 AddCases 从外部数据文件中增加变量 variable 到当前数据文件中 称为横向合并 横向合并不仅要求两个需要合并的数据文件必须有一个共同的变量 如病人编号 变量名和数据类型都相同 称为关键变量 还要求两个文件中关键变量的部分变量值是相等的 如病人编号是相同的 2020 3 5 67 练习 将数据文件a sav和b sav合并为c sav a b c 2020 3 5 68 打开数据文件a sav 作为工作文件 WorkingDataFile 从菜单选择 Data Mergefiles AddCases 选定数据文件b sav为外部文件 单击 打开 单击 OK 将合并后的新工作文件 NewWorkingDataFile 另存为数据文件c sav 2020 3 5 69 2020 3 5 70 二 增加变量 AddVariables 从外部数据文件中增加变量 variable 到当前数据文件中 称为横向合并 横向合并不仅要求两个需要合并的数据文件必须有一个共同的变量 如病人编号 变量名和数据类型都相同 称为关键变量 还要求两个文件中关键变量的部分变量值是相等的 如病人编号是相同的 2020 3 5 71 练习 将数据文件c sav和d sav合并为e sav c d e 2020 3 5 72 分别对数据文件c sav和d sav按关键变量 病人编号 升序排列 Data SortCases 打开数据文件c sav 作为工作文件 WorkingDataFile 从菜单选择 Data Mergefiles AddVariables 选定数据文件d sav为外部文件 单击 打开 单击Matchcasesonkeyvariablesinsortedfiles 在已排序的数据文件中匹配关键变量值相等的观察单位 激活它下面的三个选项 本例选择Bothfilesprovidecases 将 病人编号 选入KeyVariables栏 图2 22 单击 OK 将合并后的新工作文件另存为数据文件e sav 2020 3 5 73 2020 3 5 74 实习三Frequencies Descriptives Means和CaseSummaries程序 FrequenciesDescriptivesMeansCaseSummaries窗口转换输出结果的保存及打印 2020 3 5 75 Frequencies Descriptives Means和CaseSummaries这4个命令都可以计算均数 标准差 标准误等主要指标 如果只计算上述3个主要指标 选用Descriptives命令较为方便 如果需计算中位数 百分位数和绘制频数分布图 应选用Frequencies命令 如果需分组计算均数 中位数 几何均数 标准差 标准误等指标 应选用Means命令 必须有分组变量 如果计算几何均数 选用CaseSummaries命令较为方便 2020 3 5 76 一 Frequencies 1 计算均数 标准差 标准误 2 计算中位数 四分位数 P2 5和P97 5和P95 3 绘制频数分布图 4 计算参考值范围 2020 3 5 77 从菜单选择Analyze DescriptiveStatistics Frequencies 打开Frequencies对话框 将变量身高选入Variables栏 单击Statistics按钮 打开Statistics对话框 选择 2020 3 5 78 2020 3 5 79 单击Charts按钮 打开Charts对话框 选择 Histograms 直方图 对分类资料 可选用条图Barcharts和圆图Piecharts Withnormalcurve 加载正态曲线 本例未选 2020 3 5 80 2020 3 5 81 图3 3某农村地区1999年14岁女孩的身高频数分布图 2020 3 5 82 结果解释 均数为143 2 cm 标准差为6 43 cm 标准误为0 56 cm 中位数为142 8 cm P25和P75分别为139 3 cm 147 2 cm P2 5和P97 5分别为129 7 cm 157 8 cm P95为154 5 cm 频数分布图近似正态分布 小结 该地14岁女孩的身高频数分布近似正态分布 身高均数为143 2 cm 标准差为6 43 cm 95 的参考值范围为 143 2 1 96 6 43 即130 6 155 8 cm 2020 3 5 83 二 Descriptive 计算身高的最小值 最大值 均数和标准差 从菜单选择Analyze DescriptiveStatistics Descriptives 打开Descriptives对话框 将变量身高选入Variables栏 单击Options按钮 打开Options对话框 打钩的是默认项目 单击Continue按钮返回 单击OK按钮 2020 3 5 84 2020 3 5 85 结果解释 最小值和最大值分别为125 9和162 6厘米 均数和标准差分别为143 2和6 43厘米 2020 3 5 86 三 频数表资料与Weight 加权 例 某种传染病的潜伏期 天 如下 求平均潜伏期M和潜伏期的第95百分位数P95 2020 3 5 87 用变量f进行加权 从菜单选择 Data WeightCases 打开WeightCases对话框 单击OK按钮 加权后 虽然数据窗的数据表面上没有改变 但程序已经记住 有26个观察值为6 48个观察值为10 25个观察值为14 等 2020 3 5 88 从菜单选择Analyze DescriptiveStatistics Frequencies 打开Frequencies对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 活体运输合同范本
- 快递许可经营合同范本
- 游戏服务合同范本
- 原木订单合同范本
- 合法采砂船转让合同范本
- 铁塔空间租赁合同范本
- 银行居间借贷合同范本
- 出售废旧围挡合同范本
- 通信井盖采购合同范本
- 冷藏车合同范本
- 跨境出口策划方案(3篇)
- 小学数学教师进城选调考试试题及答案
- GB/T 27043-2025合格评定能力验证提供者能力的通用要求
- 慢性鼻窦炎诊断和治疗指南(2024)解读
- 2025至2030中国太阳能发电中的水泵行业发展趋势分析与未来投资战略咨询研究报告
- 厂内专用垃圾转运方案(3篇)
- 2025年地质勘探与资源矿产管理技术考试试题及答案
- 中小学教师中高级职称答辩备考试题及答案(50题)
- 高中班级常规管理课件
- 2025年电信传输工程师职称考试试题
- 2024-2025学年人教版八年级数学上册《全等三角形》综合训练练习题(含答案解析)
评论
0/150
提交评论