spss璇句欢澧炲姞PPT课件.ppt_第1页
spss璇句欢澧炲姞PPT课件.ppt_第2页
spss璇句欢澧炲姞PPT课件.ppt_第3页
spss璇句欢澧炲姞PPT课件.ppt_第4页
spss璇句欢澧炲姞PPT课件.ppt_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章SPSS概述 1 SPSS的背景 SPSS StatisticsPackageforSocialScience 社会科学统计软件包应用领域涵盖了宽泛的社会科学应用模块化统计分析软件 2 SPSS的基本特点和功能 使用简便统计功能强方便快捷的绘图汉字操作 样本数据的描述和预处理假设检验 包括参数检验 非参数检验及其他检验 方差分析 包括一般的方差分析和多元方差分析 列联表相关分析回归分析对数线性分析聚类分析判别分析因子分析对应分析时间序列分析生灭分析可靠性分析 3 SPSS数据分析的基本步骤 建立SPSS数据文件 分析之前的预处理 统计分析 分析结果的解释说明 定义SPSS数据文件的结构 录入 修改 保存SPSS数据文件 4 第二章认识SPSS 5 SPSS的使用界面 变量编辑窗口数据编辑窗口编辑窗口的主菜单输出浏览器 6 7 8 9 SPSS的菜单 1 File 文件管理菜单 有关文件的调入 存储 显示和打印等 2 Edit 编辑菜单 有关文本内容的选择 拷贝 剪贴 寻找和替换等 3 View 视图4 Data 数据管理菜单 有关数据变量定义 数据格式选定 观察对象的选择 排序 加权 数据文件的转换 连接 汇总等 5 Transform 数据转换处理菜单 有关数值的计算 重新赋值 缺失值替代等 6 Analyze Statistics 统计菜单 有关一系列统计方法的应用 7 Graphs 作图菜单 有关统计图的制作 8 Utilities 用户选项菜单 有关命令解释 字体选择 文件信息 定义输出标题 窗口设计等 9 Windows 窗口管理菜单 有关窗口的排列 选择 显示等 10 Help 求助菜单 有关帮助文件的调用 查寻 显示等 10 第三章数据文件的建立与数据的录入 11 数据的类型 变量每个变量都有10个属性 依次为Name Type Width Decimals Label Values Missing Columns Align Measure 12 13 数据测度Measure 刻度级Scale数据序次级Ordinal 比如成绩等第 ABCD 名义级Nominal 比如喜欢的颜色 14 定义一个变量和数据输入 新建一个数据文件 选择变量编辑窗口VariableView依次定义变量的10项属性切换到DataView输入数据察看变量信息菜单 Utilities Variables命令 15 16 17 导入数据 SPSS可从Excel Txt PowerBuilder等格式的数据文件中导入数据从Excel中导入数据菜单 File Open Data命令核对录入 导入的数据 18 19 第四章分析的准备工作 20 个案的排序 菜单 Data SortCases在对话框中选择排序的字段和升降序支持多个字段的联合排序 21 22 23 分割文件 将当前的数据文件分割成若干组 对每个组分别进行分析 并非真正的分割文件菜单 Data SplitFile命令实例 将 休闲调查1 sav 按 性别 变量分割 然后分性别统计年龄的平均值菜单 Analyze DescriptiveStatistics Descriptives命令计算平均值 24 25 26 性别 男 性别 女 27 分类汇总 以指定的分类变量取值为依据 将另一个或多个变量分成若干类后再各类内部进行描述统计 并把统计结果生成新的数据文件菜单 Data AggregateAggregateVariablesBreakVariables分类变量实例 对 休闲调查1 sav 中的年龄变量按 家月收入 进行分类汇总 28 29 30 第五章单变量描述统计分析 31 频数分析Frequencies 最常用的统计分析之一 功能是描述变量的分布特征菜单 Analyze DescriptiveStatistics Frequencies命令在左侧源变量框中选择一个或多个变量送入Variables中 根据需要选择相应的选择项 实例 对 休闲调查1 sav 中的 文化程度 进行频数分析并输出直方图 32 33 34 PercentileValues栏 百分位数选择项 nQuartiles 输出四分位数 nCutpointsforequalgroups 输出等分点的百分位数 2 100之间 Dispersion离差栏 nStd Deviation标准差nVariance方差nRange全距nMinimumnMaximumnS E mean均数的标准误 35 GeneralTendency中心趋势栏Mean均数Median中位数Mode众数Sum算术和Distribution分布参数栏Skewness正态分布的偏度 同时显示偏度的标准误 Kurtosis正态分布的峰度 如果Skewness与Kurtosis的值为0 那么表示观测量数据的分布非常接近正态分布 如果Skewnes的值为正数 表示数据的分布为正偏态分布 如果Kurtosis的数值为正 那么表明数据的分布要比正态分布具有更尖锐的峰型 36 Charts统计图形 37 结果分析 38 结果分析 39 结果分析 40 41 从上述内容可知 系统在未特别指定的情形下 频数分布表是按照原始数值逐一作频数分布的 这与日常需要的等距分组 组数要求不符 为此 在调用Frequencies过程命令之前 可先对原始数据进行分组处理 42 选Transform菜单Recode项的IntoDifferentVariable 命令项 在弹出的RecodeIntoDifferentVariable对话框中选x点击钮使之进入NumericVariable OutputVariable框 在OutputVariable栏的Name处输入收入 点击Change钮表示新生成的变量名为收入 点击OldandNewValues钮弹出RecodeIntoDifferentVariable OldandNewValues对话框 在Oldvalue栏内选Range项 输入第一个分组的数值范围 在Newvalue栏内输入新值 点击Add钮 依此将各组的范围及对应的新值逐一输入 最后点击Continue钮返回RecodeIntoDifferentVariable对话框 再点击OK钮即完成 系统在原数据库中生成一新变量为收入 这时调用Frequencies过程命令将输出等距分组且组数为10的频数分布表 43 44 描述统计Descriptive 适用于名义级 序次级和刻度级变量 功能是将描述统计的各个统计量作为分析结果输出菜单 Analyze DescriptiveStatistics Descriptive命令实例 对 休闲调查1 sav 中的 年龄 住房面积 家月收入 进行描述统计 45 46 47 结果分析 48 Explore过程 它在一般描述性统计指标的基础上 增加有关数据其他特征的文字与图形描述 有助于用户思考对数据进行进一步分析的方案 菜单Analyze DescriptiveStatistics Explore实例 对 休闲调查1 sav 中的 家月收入 进行探索性统计 49 50 2020 1 27 51 52 家月收入Stem and LeafPlotfor性别 男FrequencyStem Leaf4 003 13573 004 0068 005 0000013314 006 0000002355566812 007 00000003488916 008 000000000000555611 009 0000000355519 0010 00000000000014455686 0011 00000516 0012 00000000000023587 0013 00000023 0014 0005 0015 000003 0016 0002 0017 083 0018 0491 0019 03 0020 0007 00Extremes 2300 Stemwidth 100Eachleaf 1case s 53 茎叶图又称 枝叶图 它的思路是将数组中的数按位数进行比较 将数的大小基本不变或变化不大的位作为一个主干 茎 将变化大的位的数作为分枝 叶 列在主干的后面 这样就可以清楚地看到每个主干后面的几个数 每个数具体是多少 茎叶图有三列数 左边的一列数统计数 它是上 或下 向中心累积的值 中心的数 带括号 表示最多数组的个数 中间的一列表示茎 也就是变化不大的位数 右边的是数组中的变化位 它是按照一定的间隔将数组中的每个变化的数一一列出来 象一条枝上抽出的叶子一样 所以人们形象地叫它茎叶图 茎叶图是一个与直方图相类似的特殊工具 但又与直方图不同 茎叶图保留原始资料的资讯 直方图则失去原始资料的讯息 将茎叶图茎和叶逆时针方向旋转9O度 实际上就是一个直方图 可以从中统计出次数 计算出各数据段的频率或百分比 从而可以看出分布是否与正态分布或单峰偏态分布逼近 茎叶图在质量管理上用途与直方图差不多 但它通常是作为更细致的分析阶段使用 由于它是用数字组成直方图 所以在做的时候比直方图时 通常我们常使用专业的软件进行绘制 54 55 1 画数轴 度量单位大小和数据批的单位一致 起点比最小值稍小 长度比该数据批的全距稍长 2 画一个矩形盒 两端边的位置分别对应数据批的上下四分位数 Q1和Q3 在矩形盒内部中位数 Xm 位置画一条线段为中位线 3 在Q3 1 5IQR 四分位距 和Q1 1 5IQR处画两条与中位线一样的线段 这两条线段为异常值截断点 称其为内限 在F 3IQR和F 3IQR处画两条线段 称其为外限 处于内限以外位置的点表示的数据都是异常值 其中在内限与外限之间的异常值为温和的异常值 mildoutliers 在外限以外的为极端的异常值 extremeoutliers 4 从矩形盒两端边向外各画一条线段直到不是异常值的最远点 表示该批数据正常值的分布区间 5 用 标出温和的异常值 用 标出极端的异常值 相同值的数据点并列标出在同一数据线位置上 不同值的数据点标在不同数据线位置上 至此一批数据的箱线图便绘出了 统计软件绘制的箱线图一般没有标出内限和外限 56 第六章平均数分析与T检验 57 平均数分析 单个样本的T检验 用样本的均值对总体均值的假设进行检验独立样本的T检验 用两个样本的均值差的大小检验对应两个总体的均值是否相等配对样本的T检验 对配对样本的两次测量结果的差异大小检验两个总体的差异是否显著一般均值分析方法 分析多个样本均值差异大小 确定分类变量与分析变量是否独立 58 59 单样本T检验过程 通过计算出样本的均值来估计总体均值是否为某个确定的值思想 根据样本计算出的均值 去估计这个样本来自均值为某一确定值常数的总体 即 0 的概率有多大在大样本情况下 如果总体方差未知时用T检验在小样本情况下 用T检验要求总体服从正态分布 60 两种假设 H0 样本均值与总体均值的差异完全抽样误差选成的H1 样样均值与总体均值的差异除了由抽样误差造成 也反映了两个总体均值的确存着差异 61 接受H0 统计值t的相伴概率P值大于 拒绝H0 统计值t的相伴概率P值小于 通常 取为0 05相伴概率P值 0 05时 接受原假设相伴概率P值 0 05时 拒绝原假设 62 命令 Analyze CompareMeans OneSampleTTest实例 对 休闲调查 sav 中的 住房面积 变量进行单个样本的T检验 原假设为 城市居民户均住房面积为38平方米TestVariable需分析的变量 住房面积TestValue已知的总体均值 38Option ConfidenceInterval可信区间范围 95 63 64 65 第七章两个变量之间的线性相关分析 66 两个变量之间的线性相关分析过程 相关分析是分析两个变量之间关系的密切程度时常用的统计方法最简单的相关分析方法是线性相关分析 即两个变量之间是一种直线相关的关系线性相关关系分为正相关 负相关和无相关相关系数r的取值范围为 1 r 1 r的绝对值越接近1 表示两个变量的相关性越强 67 常用术语 直线相关 最简单的情况 两变量呈线性共同增大或减少曲线相关 两变量存在相关趋势 但非线性 用变量代换后一般可化为直线相关正相关 A变量增加时B变量也增加 反之称为负相关完全相关 A变量取值确定后可准确推算出B变量的取值 分完全正 负相关两种 68 相关系数r的判别 r 0正相关 r 0负相关r的绝对值越接近1 表示两个变量愈接近线性关系 r绝对值等于1时 两者为完全线性关系r的绝对值越接近0 表示两个变量愈没有线性关系 r绝对值等于0时 两者为完全没有线性关系 69 r的绝对值大于0 8时 视为高度相关r的绝对值介于0 5 0 8时 视为中度相关r的绝对值小于0 3时 视为不相关 70 处理方法 进行相关分析前 必须先做散点图 初步判断两个变量间是否存在相关趋势 是否为直线趋势 以及数据中是否存在异常点 71 72 73 Bivariate过程 菜单 Analyze Correlate Bivariate是Correlate菜单中用得最多的过程 占95 用于进行两个变量间的线性相关分析 结果中可以得到Pearson相关系数 Kendall等级相关系数和Spearman等级相关系数 74 75 76 实例 实例 在 休闲调查1 sav 中 对被调查者的 住房面积 和 家月收入 作相关分析先用Graphs Scatter Simple作散点图住房面积为Y轴 家月收入为X轴然后菜单 Analyze Correlate Bivariate 77 78 79 80 81 第八章线性回归分析 82 回归分析 回归分析是处理两个及两个以上变量间非确定关系的统计方法例1 人的表面积与身高 体重间的关系例2 头发中某种金属元素的含量与血液中该元素的含量回归分析中自变量与因变量的确定 83 相关分析与回归分析 相关分析也是反映两变量间关系的统计方法 但是两种方法的侧重点不同仔细比较两张图里点的散布情况 84 图1 85 图2 86 比较结果 两张图中点的X与Y变量间都有明显的直线趋势图1的散点较稀疏 图2的散点较紧密 所以图1的相关系数比图2的要小 即相关系数反映散点的疏密性图1中散点分布的斜率较大 说明X的变动对Y数值影响大 这需要用回归分析来研究 87 Regression菜单 线性回归 包括简单线性回归和多元线性回归 由Linear过程实现非线性回归是线性趋势向非线性趋势的拓展 包括CurveEstimation过程和NonlinearRegression过程 88 89 分析步骤 做出散点图观察变量间的趋势 多个变量则做出散点图矩阵 重叠散点图和三维散点图考察数据的分布 做必要的预处理分析变量的正态性和方差齐等问题 进行直线回归分析残差分析 检查残差的独立性和正态性强影响点的诊断和多重共线性问题的判断 90 常用指标 回归系数b反映相应一个自变量上升一个单位时 应变量取值的变动情况可决系数R2即相应的相关系数的平方 用R2表示 反映应变量y的全部变异中能够通过回归关系被自变量解释的比例 R2越接近1越好 91 回归直线意义的F检验统计量F 平均回归平方和 平均残差平方和 若F值过小说明自变量对因变量的解释

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论