统计方法与spss应用ppt课件.ppt_第1页
统计方法与spss应用ppt课件.ppt_第2页
统计方法与spss应用ppt课件.ppt_第3页
统计方法与spss应用ppt课件.ppt_第4页
统计方法与spss应用ppt课件.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础数据分析 描述性统计 2010年4月7日 运用SPSS对调研数据进行描述分析 研究者通过发放问卷 从被访者样本中获得大量数据后 如何通过描述分析来理解数据呢 一 Spss概览二 问卷编码与录入三 描述性统计分析 一 频数分析 二 分组求均值 三 交互分析 四 多选题分析 学习目标 一 SPSS概览 SPSS原意为 StatisticalPackagefortheSocialSciences 即 社会科学统计软件包 随着SPSS产品服务领域的扩大和服务深度的增加 SPSS公司于2000年正式将英文全称更改为 StatisticalProductandServiceSolutions 意为 统计产品与服务解决方案 标志着SPSS战略方向的重大调整 在众多统计软件中 SPSS SAS STATA是目前世界上最流行的三大通用统计软件 功能强大 实用与美观统一的视窗风格 SPSS最突出的特点就是操作界面友好 操作简单 菜单式操作可以实现绝大部分统计分析功能 特别适合具有初级统计知识的用户使用 非专业统计人员的首选统计软件 界面概览 菜单栏 工具栏 变量栏 数据区 数据变量切换 数据编辑窗口左下角包括 DataView 和 VariableView 两个视区 分别用来录入变量的值 即数据 和定义变量 名称 类型等 变量工作区 启动SPSS后 弹出对话框选项如下 1 Runthetutorial 浏览操作指导2 Typeindata 显示数据编辑窗口 建立新数据文件3 Runanexistingquery 运行一个已存在的文件4 CreatnewqueryusingDatabaseWizard 使用数据库向导建立一个新的文件5 Openanexistingdatasource 打开一个已存在的数据文件 可选择 sav 文件 6 Openanothertypeoffile 打开一个已存在的其它类型的文件7 Don tshowthisdialoginthefuture 再运行SPSS系统时不显示该对话框 直接进入数据编辑窗口 一 启动SPSSforWindows 数据编辑窗口的主菜单 File 文件操作 Edit 文件编辑 View 浏览编辑 Data 数据管理 Transform 数据转换 Analyze 统计分析 Graphs 统计图表 Utilities 实用程序 Windows 窗口控制 Help 帮助 二 认识SPSS工作界面 一 定义变量选择 变量窗口 VariableView 项 定义变量 不要忘记保存 默认SPSS数据文件后缀 sav Name 变量名 不能超过8个字符 可使用汉字 英文字母或数字 最好有意义 以免遗忘数据的含义 三 使用SPSS建立数据文件 Type 变量类型 共8种类型 分别为 一是数值型变量 Numeric Numeric为标准数值型变量 默认总长度为8位 小数是2位 Comma为逗号型变量 整数部分 从右向左 每3位一个逗号 Dot为句号型变量 整数部分 从右向左 每3位一个圆点 但对小数位的分割 应用逗号表示 二是字符串型变量 String 变量的长度是任意的 Scientificnotation为科学计数型变量 如原始数据1231 3表示成科学计数型为12 313E2 Dollar为美元型变量 在Comma型的基础上 增加一个美圆符号 CustomCurrency自定义型变量 机器自动提示选择方法 三是日期型变量 Date dd mm yy 日 月 年 如06 05 04mm dd yy 月 日 年 如05 06 04dd mmmm 英文 yyyy如06 May 2004当你选择Data类型后 系统会自动显示日期类型 供你选择 Width 数据或字符串的宽度 默认值为8个字符 Decimal 小数位数 Label 变量标签 用来说明变量所代表的意义 Value 对变量值的进一步说明 如 1 男 2 女 Missing 定义缺失值类型 系统缺失值 数值变量读入了空白值或非数值数据 SPSS的数据表上显示 自定义缺失值 特殊的数据 自己指定一个值 计算机会作为特殊值 计算时跳过 如区分合理的缺失 Columns 定义数据在屏幕上该变量对应列的显示列宽 默认值为8个字符 范围是1 255 Align 定义数据在单元中的对齐方式 Measure 定义数据测量类型PrimaryScalesofMeasurement Measure SPSS中有Scale Ordinal和Nominal三种 Scale 尺度变量 即使用距离或比例量尺测量的数据 数据值之间存在顺序关系和距离关系 如月收入2000元比1500元 两者相差500元 运动员的成绩 它可以是数值型 日期型和货币型变量 但不能是字符串型变量 Ordinal 顺序变量 变量值之间的顺序有意义 但没有距离关系 可以是数值型和字符串型变量 如 运动员的名次 一般要求变量有较明显的次序 Nominal 名义变量 变量之间没有顺序关系 如 工作 这个变量的数据可以包括教师 公务员 商场经理等 如 运动员的编号 字符串型变量等 选择 DataView 项 输入变量数据1 在SPSS窗口直接录入数据新建一个SPSS数据文件 Data2 用 OpenFile 选择已存在的数据文件读入数据 可以直接读入Excel文件 但该文件的数据结构要符合SPSS的数据结构3 用 OpenDatabase 读入数据库文件 二 输入数据 练习1 请将下表内容在SPSS数据编辑器中输入 表1 新生入学登记表 三 编辑数据1 修改数据找到所要修改的数据 激活 双击 修改即可 2 插入或删除一行数据插入行 点击所要插入的行号 点击工具栏 或击右键 的 插入行Insertcase 的图标 望远镜图标的后面 就在此行增加一空行 删除行 找到所要删除的行 选中 按Delete键 3 插入或删除一列 一个变量 插入列 点击所要插入的列号 点击工具栏的 插入列Insertcase 的图标 望远镜图标的后面第2个 就在此列增加一空列 删除列 找到所要删除的列 选中 按Delete键 练习2 在练习1的数据文件中完成插入与删除的功能 四 保存和输出分析结果保存结果文件在结果浏览窗口中选择菜单File Save 在文件名框中键入 文件名 并回车即可 Export 选择输出的内容ExprotFile 填入输出的目标文件名ExportWhat 选择输出结果的哪些部分File 选择网页格式和纯文本格式练习3 将例1中保存的数据文件导出为文本文件 也可采用 剪切 粘贴 操作保存至word文档 二 问卷编码与录入 编码 就是对一个问题的不同回答进行分组和确定数字的过程 在调查问卷中 一般有三种类型的问题 单选题 多选题 开放式问题 其建立数据结构文件的编码方式有所不同 大多数问卷中的大多数问题是封闭式的 并且已经预先编码 在每一种答案左边都有一个数字代码为指定的编码 多选题因为可选择多个答案 其数据录入方式较为特殊 单选题录入时一般根据题项赋值录入 例1 您最常去哪家超市购物 1 沃尔玛2 乐福3 三江4 麦德龙5 欧尚注意 1 题号不能重复 变量名称最好以英文字母为开头 大小写均可 如A1 age salary2 同一量表的题号最好有相同的识别码 如量表1都用a1 a2 量表3都用c1 c2 3 名义或类别变量的变量名称最好与其内涵有关 如年龄 AGE 年级 YEAR 工作类别 JOB等 4 英文版SPSS 变量代码不要用中文字 可在Label项下加注变量的中文说明 一 单选题的编码与录入 问卷编码表 多选题的录入方式有两种 1 多重二分法 multipledichotomymethod 将多选题中的每一个答案设为一个SPSS变量 每个选项有0或1两个取值 分别表示选择了该答案和不选择该答案 即 0 否 1 是例2 08 您经常去哪些超市购物 沃尔玛 家乐福 三江 麦德龙 欧尚 二 多选题的编码和录入 2 多重分类法 multiplecategorymethod 适用于多选题中的限选题 排序题 首先应该估计多选项问题最多可能出现的答案个数 然后每一个答案设置一个变量 变量取值为多选项问题中的可选答案 例3 09 您经常去哪些超市购物 限选2家 沃尔玛 家乐福 三江 麦德龙 欧尚 例4 10 您通常喜欢去哪家超市购物 请按照您喜欢的程度 最喜欢排第一位 依次类推 对以下超市品牌进行排序 沃尔玛 家乐福 三江 麦德龙 欧尚第一 第二 第三 第四 第五 问卷调查表您的性别 1男生2女生您的职务 1主任2组长3教师一 您认为目前教学改革对哪些人会有影响 可多选 1教师2行政人员3学生4其他二 您认为目前教学改革的阻力主要来自哪些方面 最多选三项 1教育行政单位2学校行政人员3家长团体4教师本身5其他团体 练习4 请对以下问卷中的题项进行编码 变量编码表 说明 NUM 编码 问卷编号 Sex 性别job 职务 单选 输入所选答案的序号即可 A11 A15 第一题的4个选项 选中者输入1 未选中者输入0A21 A23 第二题的3个选项 选择第一个答案输入1 选择第二答案输入2 依此类推 1 多选了答案问卷录入时 如果 单选 选了多项 或者 限制多选 超额了 有两种处理办法 按照无效处理随机处理如 您的经济状况在单位属于 1 上层 2 中上层 3 中层 4 中下层 5 下层同时选中1和2 那么 如第一次遇到这种情况 就取第一个被选项 第二次遇到则取后一个被选中项 以减少数据的缺失和误差 二 问卷编码和录入时的注意事项 2 答案缺失 没选 用户缺失值 非系统缺失值 用0或9编码 注意与栏位有关 比如 您的年龄是 岁 没填则输入99您的性别 男 女没填则输入03 不适用情况当碰到被调查者不适用的情况时 被调查者不需要对这些问题进行作答 研究者可以用8 98等来赋值 如果答案有8 可以用其他数字如0来代替 最好事先完成一份问卷编码表 便于出错之后的修正 练习5 请大家来看一份问卷 并运用SPSS进行编码录入 见学生调查问卷 1 单选题录入2 多选题录入 1 任选题 2 限选题 3 排序题 SPSS的单变量描述统计命令 一 频数分析 Frequencies 操作 Analyze DescriptiveStatistics Frequencies基本功能 不仅能够输出每个变量值出现的次数 占比 还可以计算数值型变量的均值 中位数 众数等反映数据集中趋势的统计量 以及标准差 全距等反映数据离散程度的统计量 可输出直条图 直方图 饼图等 例5 美国汽车家庭保有量调研对 收入 汽车保有量 价值取向 等变量进行频数分析 三 运用SPSS进行描述性分析 分析结果 操作 Analyze CompareMeans Means基本功能 对数据分组描述 可以输出分组数据的均值 标准差 极差等 在调查中 性别 年龄段 收入水平 职业类别等变量通常称为人口统计学变量 是市场研究中用于细分市场的常用标准 当变量非常多 数据量非常大的时候 需要对重要问题进行深入分析 Means命令提供了分组描述的功能 例6 仍以美国汽车家庭保有量调研为例 见数据 汽车 sav 将 收入 按中位数180百美元为界 将小于180百美元定为 低收入组 大于等于为 高收入组 定义一个新的变量 收入分组 分析两组家庭的汽车保有量 二 分组求均值 Means 分析结果 三 交互分析 列联表分析 Crosstabs 虽然频数计数 百分比分布 以及平均数总结了相当多的信息 但简单的列表并不能产生调研的全部价值 大多数数据可以进一步用各种方法进行组织 基本功能 适用于由两个或两个以上变量交叉分类形成的列联表 对变量之间的关联性进行分析 操作 Analyze DescriptiveStatistics Crosstabs交叉表的目的 目的是用于检验作用于同一组样本的变量之间是否存在显著的联系 交互分析常用来检验两类假设 变量间的独立性假设和比例一致性假设 独立性假设 检验同一群被试 样本 在两个变量上的反应 目的是判断在总体范围内两个变量之间的关系 比例一致性假设 二个步骤 1 从两个总体中分别抽得两个样本 也可以从同一总体中随机抽样形成两个样本 但两样本接受不同的实验处理 2 根据两个样本在同一变量上的反应推论两个总体是否相同 操作过程 1 Analyze DescriptiveStatistics Crosstabs打开对话框 2 一般将 自变量 独立变量 选作行变量Row 把 因变量 题项变量 选作列变量Column s 3 单击Statistics对话框 选中Chi square 在Nominal中选中PhiandCramer sV 目的是要求输出两项统计量 它们是衡量交互分析中两个变量关系强度的重要指标 按Continue返回 4 单击Cells 选择默认的Observed 同时在Percentages中选择Row 目的是要求输出单元格的观测次数以及在行变量的百分比 单击Continue返回 5 单击OK运行例7 考察家庭收入与汽车保有量的关系 两个变量的交叉分析 家庭收入 家庭规模与汽车保有量的关系 三个变量交叉 分析结果 假设检验是建立在样本信息基础上 接受 或 拒绝 假设的统计过程 又称 显著性检验 一般假定H0 0表示所要检验的假设 称为零假设 而H1 0则称为备择假设 所有这些听起来非常专业的技术 都是我们每天在做的推理形式 只不过没有用 假设 或 参数 这些术语罢了 例如 比尔为什么开始系安全带了 直觉假设检验 关于假设检验的初步介绍 假设检验的五个基本步骤 1 开始陈述你相信存在于总体的事实 即总体均值和百分率 如比尔相信只有10 的司机系安全带 2 抽取一个随机样本 然后测定样本统计量 比尔发现他的朋友中有80 的人系安全带 3 将统计量与假设的参数进行比较 比尔注意到80 和10 有很大区别 4 决定样本是否支持最初的假设 观察到80 的司机系安全带的事实并不支持只有10 的人系安全带的假设 5 如果样本不支持假设 修正假设使得他与样本统计量一致 驾驶员系安全带的事实事件发生率约为80 例8 某次调查 藉以找出两产品购买者喜爱收看的电视节目 从而为公司广告决策提供参考 两产品购买者最喜欢收看电视节目的人数调查结果如下 试判断两产品购买者喜欢收看的节目有无差异 0 05 要判断A产品和B产品购买者喜欢收看的电视节目是否一致 可采用交互分析中的Chi Square一致性检验 1 依题意H0 两种产品购买者喜欢的电视节目无差异 H1 两种产品购买者喜欢的电视节目有显著差异 2 Spss操作过程 Data weightcases 加权个案 对 收看节目人数 变量f进行加权 选择weightcasesby 将f放入frequency analyze descriptivestatistics crosstabs将 电视节目 变量y键入row s 栏 将 所购买产品 变量x键入column s 栏 选择统计量 chi square单击cells键 选择observed何expected两个统计量ok 输出结果说明 表明有效数据N 1680 40 所占百分比为100 没有缺失值 表1 数据综述表 上表列出了两种产品购买者对7种电视节目喜欢人数的实际频数和期望频数 表2 列联表 由表3可看出 最小期望频数 88 9 1 0 0 格子的期望频数40 表中看出皮尔逊卡方值x2 30 771 自由度df 6 渐进双侧概率p 0 0 05 显著性水平小于0 05意味着零假设不成立 故拒绝H0 接受H1 即两种产品购买者喜欢收看的电视节目不一致 有显著差异 表3 卡方检验 注意 用卡方分布进行一致性或独立性检验时 当最小期望频数 1 少于20 格子的期望频数40时 一般较多使用皮尔逊卡方值 Chi square 卡方值 用于行和列变量是否独立的卡方检验 如果列联表中某一单元格中的期望值小于1或者20 以上的单元格期望值小于5 那么就不能选择此项 练习6 网民媒体接触习惯调查 您认为下列哪一种读物更适合在周末阅读 有三个选项 日报的周末版 杂志 周报 研究者想知道不同性别的网民选择是否一致 见网民媒体 sav 典型的比例一致性检验 P 0 027 0 05 表明不同性别的网民对周末读物的选择有显著差异 四 多选题分析 MultipleResponse 多选题 多重应答 如何进行分析呢 仍然以描述为主 对于多选题是不能将其看成是数个独立的单选题来分析的 因为这些变量实际上回答的是一个大问题 这样将问题割裂开来可能会导致不正确的分析结果 而无法计算一些汇总指标 在多选题中最重要的汇总指标有以下两个 1 应答人数百分比 PercentofCase 选择该项的人占总人数的比例 2 应答次数百分比 PercentofResponses 在做出的所有选择中 选择该享年的次数占总次数 总反应数 的比例 注意 多选题分析中 应答的次数 应答人数 MultipleResponse菜单 专门为多选题数据的描述而设计 用于生成频数表和交叉表 例8 在对保险市场的一项调查中 设计了这样一道问题 保险市场 sav 06 按照您自己的实际情况 请依次选择您购买商业养老保险的原因 最多不超过三项 1 使晚年生活有保障 2 一种安全的投资保值方式 3 报着试试看的态度购买 4 亲戚朋友推荐 5 单位统一组织购买 6 保险公司的宣传 7 其他赋值方法 多重分类法 因限定 最多不超过三项 则设3个变量 第一原因 第二原因 第三原因 每个变量的取值是1 7 如果没有限定 则为多选项二分法录入数据 设7个变量 每个变量0或1赋值 第一步 DefineSets过程 用于将若干变量定义为多选题变量集 操作如下 Analyze MultipleResponse DefineSetsVariableinSet框 选入包含在变量集中的7个变量Dichotomics CountedValue框 输入值 1 二分法赋值中变量值为1表示该选项被选中 多重分类法则不同 Name框 输入 reason 定义多选题变量集的名称为reason Lable框 输入 购买原因 为变量集给出中文标签 购买原因 AddClose 相应的多选题变量集就定义完成了 出现 购买原因 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论