SPSS在调查研究中的应用PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-02-04 格式：PPT 页数：112 大小：3.57MB 积分：88 举报 版权申诉

已阅读5页，还剩107页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

社会统计软件SPSS在调查研究中的应用全总研究室调研四处张倩颖2011年10月 1 第一节变量及其关系第二节数据整理第三节单变量分析第四节双变量分析 2 第一节变量及其关系变量数据分为四类名义变量序次变量间距变量比率变量定类定序定距定比了解变量数据类型很重要因为不同类型的变量数据往往使用不同的统计方法进行分析 3 名义定类变量名义变量是最简单的一种数据类型表示为没有次序的类别如果只有二类就是二分类变量如果是三类或更多类就叫多分类变量从数学运算特性来讲名义变量只能有等于或不等于的性质最常见的名义变量就是性别性别只有二类男性和女性并且没有次序之分习惯上用1表示男性 2表示女性这样赋值是随意的没有任何的数学或统计学上的理由 4 名义变量有很多名义变量例如省份地区性别户口政治面貌宗教信仰民族婚姻状况职业国家等类别的排列和赋值没有任何实际意义 5 6 序次定序变量序次变量与名义变量类似所不同的是各类是有次序之分的即由小到大由低到高排列或相反序次变量的数学运算特性除具有等于或不等于之外还有大于或小于之分但是类与类之间的距离是不相等的健康状况文化程度技术等级职务等级您对您目前从事的职业是否满意 7 每个人可以按照某种特征分类 8 间距定距变量对于间距变量次序和数量都很重要间距变量的值就是变量的实际值每二类之间差异都是相等的比如年龄身高体重等定距变量的数学运算特性等于不等于大于小于加减 9 受教育年限 10 比率定比变量受教育年限是间距变量但是实际上它是测量等级更高的变量叫比率变量定比变量的数学运算特性等于不等于大于小于加减乘除在社会科学中只满足间距变量而不能同时满足比率变量的情况极为少见一般不区分间距变量和比率变量而是当作一类称为间距变量如年龄受教育年限工龄上一周实际工作多少小时上月从本单位获得的全部货币收入元 11 离散变量和连续变量上述四类变量又可以分为二大类离散变量和连续变量离散变量名义变量和序次变量把人物事按照他们的性质或特性划分也叫分类变量分类变量不能用来进行数学计算或转换比如计算平均数连续变量间距变量和比率变量把人物事按照他们的某一特征的数量进行划分 12 13 14 15 个案调查数据所描述的对象可以是人动物事物社会调查研究的对象就是人变量指所研究对象的特征对于不同的人某个变量的值可以不同如调查中数据所描述的对象或个案就是职工对于每个职工都有许多变量例如出生年月文化程度职业等数据的每一行是一个职工个案每一列是一个变量个案与变量 16 因变量与自变量因变量也叫结果变量或反映变量 i e 自变量影响的结果可以是连续变量或分类变量自变量也叫解释变量或预测变量 i e 用来解释或预测因变量可以是连续变量或分类变量 17 变量之间的关系因果关系相关关系 18 第二节数据整理 SPSS软件概览数据的转换与处理 19 一 SPSS概览讲解统计方法之前先要熟悉SPSS软件操作过程变量定义数据输入数据整理变量计算等什么是SPSSSPSS窗口变量定义数据输入输出 20 什么是SPSS SPSS是软件英文名称的首字母缩写原意为StatisticalPackagefortheSocialSciences 即社会科学统计软件包随着SPSS产品服务领域的扩大和服务深度的增加 SPSS公司于2000年正式将英文全称更改为StatisticalProductandServiceSolutions 意为统计产品与服务解决方案 SPSS已有40年历史是应用最广的定量数据分析和管理的统计软件 21 SPSS窗口 SPSS有三个窗口数据编辑窗口DataEditorWindow数据显示窗口DataView变量显示窗口VariableView结果输出窗口OutputViewerWindow命令编辑窗口SyntaxEditorWindow 22 主菜单菜单引导与WindowsOffice其他软件类似10个菜单 DetailsinTextpage5 23 24 25 结果输出窗口 26 命令编辑窗口 27 数据输入保存输出可以直接输入可以从Excel导入使用数据录入软件例如EpiData 免费下载http www epidata dk download php保存Save 另存为SaveAs输出为其他类型格式的数据如Excel HTML 28 变量定义变量名以英文字母中文开头不超过8个字符唯一性空格或特殊符号不能使用变量类型数值型字符型日期型变量名标签对变量名的解释说明增强可读性变量值标签对定类和定序变量是必不可少的 29 变量值标签 30 变量个案的增删增加Insertvariables cases 删除Clear 31 二数据的转换与处理计算新变量 Compute 变量的重新赋值 Recode 变量值的计数 Count 选择部分案例 SelectCases Temporary命令缺失值的处理 32 1 计算新变量 Compute 数据分析经常要在已有变量的基础上计算一些新变量例如计算年龄调查时间减去出生时间使用Compute在TargetVariable中写入新的变量名在NumericExpression中写入计算公式 33 计算年龄计算的新变量默认放在数据的最后一列 34 计算年龄变量可以有条件的计算例如你只想计算男性年龄用If限制 35 选择Includeifcasesatisfiescondition 36 然后Continue OK就完成这一过程形成下面的命令与没有限制条件时的命令对比 37 2 变量的重新赋值 Recode 对某一个变量的类别进行重新分组和赋值例如文化程度 a9 有9个类别现在要重新分类合并为5类或3类 38 使用RecodeIntoSameVariablesIntoDifferentVariables 39 选择IntoDifferentVariables 40 文化程度 9类变成5类 41 然后Continue OK就完成这一过程形成下面的命令 42 变量重新赋值也可以进行条件限制和限制性的计算新变量的过程基本一样例如你只想对年龄40岁及以上的职工进行文化程度的重新赋值使用If进行限制 43 选择Includeifcasesatisfiescondition 44 然后Continue OK就完成这一过程形成下面的命令 45 3 变量值的计数 Count 计算一些变量中某一个值出现的次数例如 a631 a638有8个关于保险的问题 1 已参保 2 未参保 3 不知道现在我想知道每个职工都分别已参保了几种保险使用Countc 再如工作环境中有几种职业危害 46 47 然后Continue OK就完成这一过程形成下面的命令我们显示一下计数结果的频数分布计算一下平均参保数量下页 48 计数结果的分布情况每人参加了2种保险 49 4 选择部分案例 SelectCases 有时候你只想对数据中的某一部分案例进行分析比如你只想对党员这部分人进行分析这时就用SelectCases 把非党员暂时或永久地排除除非重新选全部否则此种筛选一直存在 50 选择Ifconditionissatisfied 点击If UnselectedCasesAre Filter Delete 51 选择Ifconditionissatisfied 点击If UnselectedCasesAre Filtered 下页 52 带斜杠的都是非党员不带斜杠的都是党员 53 如果选择UnselectedCasesAre Deleted 那么刚才带斜杠的人都会被从数据中删除掉所以数据再保存时需要特别注意 54 5 Temporary命令暂时前面讲到选择案例进行分析通过Filter或Delete 把你需要的研究对象挑选出来实际上还有一种更简单的办法就是使用Temporary命令这一命令不能通过点击菜单得到必须自己写 Temporary命令和你所要做的分析同时运行做下一个分析时上次的Temporary命令就已经失效这就带来了很大方便 55 假如你想要计算党员的平均收入可以有两种办法一种是用选择案例 Filter或Delete 将党员挑出来然后计算平均收入另一种就是用Temporary命令将我的计算操作暂时限制在党员 Temporary命令的用法 temporary selectifa6 1 DESCRIPTIVESVARIABLES a49z STATISTICS MEANSTDDEVMINMAX 56 2020 2 4 57 两种方法产生的结果完全一样 58 党员的月平均收入 59 6 缺失值的处理系统缺失值和用户缺失值离散型变量将0和missing都作为缺失值处理连续型变量当0有意义时表示为0值如培训次数当0值不太可能存在时缺失处理如上月收入 60 第三节单变量分析频数分布表 Frequency 描述统计 Descriptive 集中趋势平均数中位数离散程度测量全距方差标准差多项选择题 61 引言频数分布和绘图是数据分析最基本但很有用的方法对某个变量的总体情况进行了解但不能准确刻画变量的特征因此还要计算一些指标来反映变量的特征这些指标包括测量变量值的平均水平和变量分布的离散程度 62 一频数分布表频数分布表是数据分析最简单最基本的一种方法是数据分析的第一步将一个变量按观察值大小分为不同组段将各观察值归纳到各组段中最后清点各组段的观察值个数称频数以表格形式表示称为频数或频次分布表简称频数表例如婚姻状况频数分布表 63 SPSS操作过程 64 SPSS输出结果 65 频数分布表的制作名义变量将变量值按照习惯的或其他有意义的顺序排列序次变量将变量值按照由小到大或由大到小顺序排列间距变量当变量值较少时按序次变量那样排列当变量值很多时需要进行分组然后顺序排列 66 序次变量间距变量 67 通过点击PivotTableObject可以编辑修改 68 二集中趋势测量对于某一变量其值的平均水平或代表性值常用的有两个指标中位数 Median 平均数 Mean 69 中位数把一个变量的值由小到大或由大到小排列起来处于中心的那个值就是中位数即中位数将变量的分布分成前后相等的两部分其中一半的值低于中位数另一半的值高于中位数中位数适用于序次变量和间距变量 70 中位数计算方法取决于案例数是奇数还是偶数奇数时就是中心的那个数偶数时是中心两个数的平均值将所有案例按照值的大小从小到大排列起来如果案例数为n 那么中位数值就在这个变量分布的 n 1 2处 71 例如案例数n 11 是奇数那么中位数就在 11 1 2 6即第6个数就是41 案例数n 10 是偶数那么中位数就在 10 1 2 5 5即第5和第6个数之间就是第5和第6个数的平均数第5和第6个数都是39 所以平均数还是39 72 职工收入中位数即一半人收入低于900元另一半人收入高于900元 73 平均数简单算术平均数是使用最广泛的平均数其计算方法就是把所有案例的该变量值都加起来然后除以案例数平均数只适用于间距变量 74 如果有n个案例其某个变量值分别为那么或者 75 平均年龄平均收入 76 平均数三个数学性质只有间距变量连续变量才能计算变量分布的重心将一个变量的所有值都减去平均值然后把这些差加起来必定等于0敏感性计算平均数时用到了所有变量值因此每个变量值都对平均值产生影响对奇异值特别大或特别小的值比较敏感 77 奇异值会影响平均数但不会影响中位数 4812平均数 4 8 12 3 8中位数 8 48120平均数 4 8 120 3 44中位数 8 78 三离散程度测量两个相同平均数的变量离散程度可能有很大不同为了更准确反映变量的分布特征是比较集中还是比较分散除了平均数以外还需要计算离散程度平均指标和离散程度指标一般同时使用常用的三个指标全距 Range 方差 Variance 和标准差 StandardDeviation 79 相同的平均数不同的离散程度 80 全距最简单的度量离散程度的指标是全距也叫极差是指最大值与最小值的差全距是度量离散程度极为粗糙的指标因为它的计算只涉及整个变量分布的最大值和最小值它很可能会是一个误导性的指标 81 年龄全距 59 17 42岁 82 收入全距 18692 66 18626元 83 标准差标准差测量的是各个观测值和平均值的平均距离有多远平均离差 MeanDeviation 将所有观测值减去平均值就得到每个观测值离平均值的距离我们叫离差将每个观测值的离差加起来就得到总离差然后除以观测值个数就得到平均离差即平均距离 84 方差因为离差有正负而我们关心的是距离于是计算每个离差的平方平方以后就没有负数将这些离差的平方加起来得到离差平方和离差平方和的平均值就是方差 variance 注意分母中不是n 而是n 1 85 由于离差平方和与离差和在量上不对等前者大于后者无法反映平均离差因此计算方差的正平方根这就是标准差 standarddeviation 86 标准差标准差用来测量变量围绕平均值的分布情况离散程度标准差 0 表明变量的分布不存在任何离散这种情况发生在所有观测值都相同时否则s o 当观测值的分布越分散 s就越大标准差和平均数类似对奇异值很敏感有时候少量奇异值会大大增加标准差 87 年龄标准差 8 656 收入标准差 735 749 88 离散系数离散系数 Coefficientofvariation 是用来对变量的离散程度进行比较的直接比较标准差是不准确的需要与平均值对比当平均数比较接近时标准差的大小基本反映了差异大小标准差大的差异大标准差小的差异小当平均数有较大差异时标准差大小本身不能准确说明差异大小计算离散系数 89 男女收入男性收入标准差更大但是平均数也更大男性收入离散系数小于女性说明男性的收入差异小于女性 90 SPSS在下列功能中计算平均数标准差 91 92 93 计算各省的平均收入 94 多项选择题多选项二分法将每个可选答案设为一个变量统计此变量有没有被选中多选项分类法估计答案个数每个答案设一个变量变量值取多选项多选项分析把多个变量设成一个集合算出累计频次 95 第四讲双变量分析为了检验各个自变量如何影响因变量影响方向影响程度必须针对不同的变量类型选择相应的统计方法交叉表分析 Crosstabs 均值比较 Means 方差分析线性回归相关系数 Correlate 下表列出比较常用的统计方法 96 97 1 二个离散变量的关系交互表 Chi square卡方检验可以用来检验二个离散变量之间的关系例如文化程度与职业用来分析两个变量之间的关系通常自变量是列变量因变量是行变量 98 交叉交互表将一个变量的值或类别的频数分布按照另一个变量的值或类别进行显示每一行和每一列的交汇处为一个单元格列合计数和行合计数就是每个变量的频数分布也叫边缘分布 marginaldistributions 列合计和行合计的交汇处就是总案例数或样本量 N 99 SPSS操作过程 100 SPSS命令与结果 101 交叉表中计算比例在自变量的每一类

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

SPSS在调查研究中的应用PPT课件.ppt

文档简介

温馨提示

最新文档

评论

SPSS在调查研究中的应用PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档