已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一讲spss基础 SPSS概述 spss界面及操做入门 数据文件及数据的导入 数据管理 SPSS概述1 spss发展史2 基本特点3 产品定位4 基本模块 SPSS发展简史 软件名称最早 StatisticalPackageforSocialScience现在 IBMSPSSStatistics软件发展60年代 美国斯坦福大学三位研究生研制70年代 SPSS总部成立于芝加哥 推出SPSS中小型机版 SPSSX80年代 微机版 V1 4 SPSS PC 90年代 Windows版 V6 10 本世纪 11 21版 中文版 3 SPSS的基本特点 优势功能强大兼容性好易用性强扩展性高 以一种不同的方式 劣势计算速度相对较慢在统计模型的纳入上速度较慢 4 SPSS的产品定位 现有产品线DataCollectionFamilyStatisticsFamilyModelingFamilyDeploymentFamily 5 SPSS基本模块 6 1 spss界面及基本操作入门1 spss的四个窗口2 软件基本使用方式3 菜单项4 对话框操作规范5 结果窗口操作 SPSS窗口简介 1 数据编辑窗口数据表格标准的电子表格数据视图 主操作界面变量视图 定义变量单元格编辑器显示精确数值不能直接输入公式菜单快捷工具栏状态栏 8 SPSS窗口简介 2 结果浏览窗口各种统计软件中最为美观的结果输出提供类似资源管理器的界面 9 SPSS窗口简介 3 语法窗口编写SPSS程序时使用4 脚本窗口高级用户进行SPSS二次平台开发时使用 10 统计分析软件的基本使用方式 人机交互对话方式批处理 程序 方式菜单方式和对话框方式 11 11 SPSS的菜单项 文件数据与转换分析图形帮助 12 SPSS对话框操作基本规范 一级对话框元素候选变量列表框测量尺度 标签 变量名方式选入变量列表框变量移动钮根据当前框的状态不断变化 13 SPSS对话框操作基本规范 一级对话框元素五个标准按钮确定 取消粘贴 用于自动生成SPSS程序重置 恢复对话框状态为初始状态帮助 方法简介 用法简介其他按钮多数情况下会弹出二级对话框灰色表示不可用 14 SPSS对话框操作基本规范 二级对话框元素单选框 组 一般均成组出现多选一复选框 组 可成组 也可单独出现多选多 15 SPSS对话框操作基本规范 二级对话框元素下拉列表框功能实际上和单选框组相同文本框往往会和单选框 复选框结合起来使用框组以上各种元素的集合集中完成某项功能 16 SPSS结果窗口操作 结果文件的打开和保存结果的拷贝 导出操作 17 系统选项 中文设置 界面语言结果输出语言枢轴表默认格式 18 18 2 数据文件及数据的导入1 变量的测量尺度及标签2 新建数据文件及数据的导入3 数据文件的保存 案例 中国消费者信心指数数据文件CCSS Sample sav什么是消费者信心指数 消费者信心 是指消费者根据国家或地区的经济发展形势 对就业 收入 物价 利率等问题的综合判断后得出的一种看法和预期消费者信心指数 对消费者整体表现出的信心程度及变动的一种测度 它在预测未来宏观经济的走向方面具有不可替代的价值 是市场经济国家非常重要的经济风向标之一 Ccss数据记录了来源于中国城市的2007年4月 2007年12月 2008年12月 2009年12月的1147个样本 它基于标准化问卷结果的录入 部分问卷题目见下 20 中国消费者信心指数研究问卷 S0受访者所在城市 100北京200上海300广州S1请问您贵姓是 S2记录被访者性别 1男性2女性S3请问您的十足年龄是 S4请问您的学历是 1初中 技校或以下2高中 中专3大专4本科5硕士或以上 21 中国消费者信心指数研究问卷 C0请问您的家庭目前有下列还贷支出吗 C0 1房贷1有2无99拒答C0 2车贷1有2无99拒答C0 3其他一般消费还贷1有2无99拒答A3首先 请问与一年前相比 您的家庭现在的经济状况怎么样呢 是变好 基本不变还是变差 1明显好转2略有好转3基本不变4略有变差5明显变差9说不清 拒答A3a为什么您这样说呢 最多限选两项 0中性原因90不知道 拒答10改善 收入相关110恶化 收入相关20改善 就业状况相关120恶化 就业状况相关30改善 投资相关130恶化 投资相关40改善 家庭开支相关140恶化 家庭开支相关50改善 政策 宏观经济150恶化 政策 宏观经济相关 22 定义变量 变量类型数值型应用最为广泛字符型由于分析 整理都较困难 建议尽量少用 改为编码录入日期型实际上是特殊的数值型变量 尽量少用 23 定义变量 测量尺度标度测量 ScaleMeasurement 温度体重有序测量 OrdinalMeasurement 默认字母顺序表示大小顺序 等价于有序分类名义测量 NominalMeasurement 等价于无序多分类 24 定义变量 变量名与变量值标签可用于对变量及变量值含义进行说明 使结果更易于阅读缺失值除非问卷中有特殊编码 否则按默认情况处理其它设置均按默认值处理 一般不需要更改 25 2020 2 7 26 数据录入技巧 连续多个相同值的输入快速查找异常值 极端值充分利用排序功能和EXCEL WORD快速交换数据复制粘贴 注意变量名称不能被直接复制充分利用变量值标签大大加快录入速度快速改变变量排列次序完全的拖放操作 这是SPSS系列的发展方向 在变量视图和数据视图中均可进行 27 27 常用工具栏按钮 值标签按钮大大简化了数据管理工作重复调用对话框按钮在数据集关闭前均有效转向数据按钮 28 28 新建数据文件及数据导入File菜单详解 新建数据文件在SPSS中 新建一个数据文件容易的不得了 已经到了什么都不用做的地步 数据文件的工作名称与存储名称导入其他格式的数据文件SPSS可以直接读入许多常用格式的数据文件使用文本导入向导读入文本文件 29 File菜单详解 保存数据文件首次保存另存为注意事项善于使用 S存为其他格式时注意兼容性File菜单中的其他条目 30 3 SPSS数据管理入门 1 变量级别的数据管理 转换菜单2 文件级别的数据管理 数据菜单 数据管理入门 数据管理包括的内容信息的录入和保存数据的整理 清理数据的排列格式变换数据文件的拼接 拆分数据的预处理 32 变量级别的数据管理 转换菜单 功能特点 转换 Transform 菜单主要集中了一些对变量数值进行变换的过程 如对原始数据进行四则运算 对数据重新编码 求出变量的秩次等这些功能往往在统计分析的预处理中起着非常重要的作用 34 计算变量并赋值 在原有数据基础上 对某些记录进行四则运算 并将结果存入一个指定变量的操作 任务一 年龄分组CCSS项目中的受访者年龄在18 64岁 他们在分析中会被分为18 34 35 54 55 64三组 为便于使用 年龄变量S3重新赋值后将会被存储为新变量TS3 其取值1 2 3分别代表上述三种情况 35 注意 含有条件组合的赋值方式 分别表示ANDORONT如 表示不等于 已有变量值的分组合并将连续变量转化为等级变量 或者将分类变量的不同变量等级进行合并的操作 利用变量重新编码 任务二 同上例 要求用重编码方法注 编码过程 重新编码为相同变量 编码后的变量值复制在原变量上 重新编码为相同变量 生成一个新变量来存放编码的结果 36 数值变量的离散化分段 可视离散化过程在可视界面下使用百分位数 标准差范围或者等间距方式将连续变量划分为若干组段 任务三 将S3年龄变量分成10组 要求等间距 并将分组后的变量名称设置为S3new 最优离散化过程将连续性变量按照该分类变量类间差异最大化的优化原则离散化为分类变量 如果要生成预测模型 当模型中的因变量为分类变量时 在分析中往往会对自变量离散化 此时就可以使用该过程任务四 将S3年龄对S4学历进行预测建模 要求基于此构思对S3进行最优离散化 37 Transform转换菜单中的其它过程 变量的自动重编码按原变量值得大小或者字母排序生成新变量 任务五 S0城市的数值为100 200 300 现将其自动编码为S0new变量值的平移变量的值整体前移或者后移 任务六 将S3年龄数据整体后移一行 并存为为新变量S0shift 38 转换菜单中的其它过程 指定数值的查找与计数任务七 生成新变量S3Old 用于标示S3 55的个案计算变量秩次根据变量值的大小来排出次序 秩次 并储存在新变量中任务八 根据S2性别分组计算S3年龄的秩次 39 文件级别的数据管理 Data菜单 一 功能列表 对数据进行加工整理 比如根据统计分析的要求对数据进行分组 合并 加权 筛选等操作简单命令 包括插入变量 插入个案 到达某条个案 复制数据集等 它们的功能不言自明 且大多都可以使用鼠标在数据表界面上直接完成 很少使用菜单来调用 本书将不再对其进行讲解 常用的简单过程 包括排序 拆分文件 个案筛选和个案加权 这几个过程并不复杂 但使用的极为频繁 是大家必须要掌握的内容 数据重组向导 用于进行数据转置 或者对重复测量数据进行长型 宽型记录格式间的转换 详后 文件合并向导 将几个数据文件合并为一个大的SPSS数据文件 含横向合并和纵向合并两种情况 详后 41 排序个案 任务一 ccss数据首先按照月份升序排列 月份相同时 按ID号升序进行排序将某个变量按升序或降序排列 可以非常容易的发现输入错误 因为他们往往就是最大 最小值缺失值在排序中会排在最小值的前面 可以通过排序的方法很快发现哪些记录为缺失 42 拆分文件 将数据文件分组进行处理任务二 对S3年龄按S0城市进行逐一进行描述统计分析 如何拆分文件的选项 分析所有个案 不创建组 不拆分比较组 按所选变量拆分文件 各组分析结果紧挨在一起便于相互比较按组组织输出 按所选变量拆分文件 各组分析结果单独放置拆分文件一旦设定完成 就将在之后的分析中一直有效 状态栏处会有 拆分条件 的字样提示 如果要取消拆分 必须在拆分文件对话框中重新设定 43 个案筛选 按要求筛选出数据集的一部分任务三 筛选出2007年4月份的全部数据 并单独存放为新的数据文件进行月份的频数分析 可以进行随机抽样筛选可以在数据集中按记录序号筛选 44 记录加权 分类资料数据录入格式枚举格式频数格式只有先进行加权设定 统计软件才能正确识别count变量sex的取值而是频数任务四 建立数据文件 男性20名 女性32名 并输出相应的频数表 45 数据汇总 注意 这里指的是希望将原数据文件分类汇总为一个新的汇总数据文件进行分析 如果只是希望进行汇总描述 则不需要使用本过程任务五 分Time月份和S0城市对CCSS案例数据中的变量index进行均数汇总 并将结果输出到新数据文件Sum index1中 46 文件级别的数据管理 Data菜单 二 多个数据文件的合并 对话框界面下只能两两合并 多个文件一次就完成合并需要写程序纵向合并增加个案数的合并两个数据文件的变量名称和数目可以不全相同任务六 将文件a sav和b sav合并 48 多个数据文件的合并 横向合并增加变量个数的合并 个案个数可以不全相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年注册环保工程师考试高频考点专项训练卷
- 预制板梁安装工程合同(3篇)
- 公务员国考历年行测真题(2018)及答案
- 2025年众创空间建设项目可行性研究报告及总结分析
- 2025年民宿客源分配协议
- 2025年山东省济宁市微山县保安员招聘考试题库附答案解析
- 2025年流媒体平台开发项目可行性研究报告及总结分析
- 2025年美容美发培训服务协议
- 2025年绿色化工技术的应用与推广可行性研究报告及总结分析
- 2025年文化艺术教育项目可行性研究报告及总结分析
- 2025年商用净水器行业分析报告及未来发展趋势预测
- 高分子化学期末考试试卷及答案
- DB1509∕T 0004-2023 东佛里生羊饲养管理技术规程
- 宝安区集体物业招商招租管理办法(征求意见稿)
- 室内精装修工程施工工艺标准
- 算力资源集中管理与调度平台方案
- 新闻真实性的理论与实践
- 陕西教师岗前考试真题及答案解析
- 秋冬季防火安全培训课件
- YS-T1714-2024《连接器用铍铜丝》
- 越南自卫反击战课件
评论
0/150
提交评论