已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
版权所有 使用者请勿删改 SPSS软件应用第一讲 Thursday March19 2020 1 SPSS基本介绍 全称 StatisticalPackagefortheSocialScience社会科学统计包软件是当前在社会科学上最流行的统计应用软件 如 市场营销调查 社会学研究 教育学研究等 Thursday March19 2020 2 你想轻轻松松发篇好文章在核心期刊上吗 Thursday March19 2020 3 SPSS EXCEL计算描述统计指标小结 你想用一款比excel更傻瓜快捷高效的软件吗 Thursday March19 2020 4 你想轻轻松松看懂论文 毫无压力吗 你想做比他更好的研究吗 Thursday March19 2020 5 统计在教育学的小例子 你会不会忍不住想 1 样本中 有多少男孩 多少女孩 2 班级数学平均分是多少 女孩数学多少分 男孩数学多少分 3 班上100 120分数段有多少学生 深入的 你会不会想探究 男生的数学是不是真的比女生好 本地学生是不是比外地学生成绩好 数学好的学生计算机会不会也不错 两者之间有一定的关联 中考分数可不可以预测高考分数 Thursday March19 2020 6 基本学习内容 相关统计知识SPSS基本界面简介SPSS数据文件创建 编辑以及修改 Thursday March19 2020 7 统计学基本概念 描述统计 descriptivestatistics 研究的是数据收集 处理 汇总 图表描述 概括与分析等统计方法 优点 化繁为简 例如用图表展示数据 建立数据模型 使数据清晰明了 Thursday March19 2020 8 推断统计 inferentialstatistics 研究如何利用样本数据来推断总体等特征的统计方法 例如 要了解武汉市 一个地区 初中生运用计算机基本技能的能力 不可能对每个初中生的技能水平进行一一测量 需要抽取部分初中生 进行测量 然后根据获得的样本数据对所研究的总体特征进行推断 Thursday March19 2020 9 总体 population 总体是包含所研究的全部个体 case 的集合 思考 在研究中 有些总体很好确定 比如研究武汉市学生的中考成绩 那么武汉市所有学生就是总体 但有些场合总体范围很难确定 比如要了解学生是否喜欢一种新兴的教育技术 电子白板 首先要确定哪些学校是使用者 即确定构成该使用者的总体 但事实上 总体范围的确定比较复杂 Thursday March19 2020 10 总体 样本与个体 样本 sample 样本是从总体中抽取一部分个体的集合 构成样本的个体数目称之为样本量 samplesize 个体 case 统计分析的基本单元 人 企业 单位等 研究的参与者 样本中的一个成员 一个样本中有n个个体 那么样本量 samplesize 是n Thursday March19 2020 11 参数 统计量 xsp 平均数标准差比例 总体 样本 推断 Thursday March19 2020 12 参数 parameter 和统计量 statistic 参数 parameter 参数是用来描述总体特征的概括性数字度量 它是研究者想要了解的总体的某些特征值 一般由总体平均数 总体标准差 等 由于总体数据通常是庞大的 我们所不知道的 所以参数是一个未知的常数 因为如此 所以要进行抽样 根据样本计算出某些值去估计总体参数 Thursday March19 2020 13 参数 parameter 和统计量 statistic 统计量 statistic 统计量是用来描述样本特征的概括性数学度量 它是根据样本数据所计算出来的量值 统计量是样本的函数 一般有样本平均数x 样本标准差s 由于样本是抽选出来的 所以统计量总是知道的 抽样的目的是根据样本量去估计总体参数 例如用样本平均数x去估计总体平均数 用样本标准差s去估计总体标准差 除去样本平均值 样本方差这些常规统计量 还有为统计分析的需要而构造出来的统计量 比如统计检验的z统计量 t统计量 2统计量 f统计量等 Thursday March19 2020 14 变量 variable 变量是说明现象的某种特征的概念 简单的说是你想测量的个体的基本属性 例如 学生的性别 年龄 期中考试的分数 高考的分数 期中考试的班级排名等 对于性别 年龄 分数 排名的测量有4种类型 分别是 名义尺度 顺序尺度 间隔尺度 比率尺度 Thursday March19 2020 15 名义尺度 Nominalscale 例 性别男女 例 居住的城市武汉北京上海天津 例 你喜欢哪类书籍科幻小说纪实文学散文诗歌 性别学生学号你使用过SPSS吗 1 是的0 没有 Thursday March19 2020 16 名义尺度 nominalscale 名义尺度是一种标记方式 其中数字或者符号只是用来表示对物体分类 categories 的标签 表示不同性每一类都只表示分类 不存在比较关系 设置的答案要注意互斥性和完备性 没有顺序性 不能做加减法运算 目的是求的各类答案数量 常用的统计方法有频数分析 比率分析 求众数分析 Thursday March19 2020 17 顺序尺度 ordinalscale 期中考试某班全体同学的名次 第一名 第二名 衣服的尺码 S M LX XS SP受教育的程度 小学 初中 高中 大学 研究生 Thursday March19 2020 18 顺序尺度 ordinalscale 顺序尺度 ordinalscale 的数字和符号不仅代表类别 而且还表示按某种特征或者属性排列的高低 大小和先后顺序 特点 两个数字之间的差距没有绝对的意义 在顺序尺度中各类答案的分数是不能做加减乘除运算的 分数只是说明一个顺序关系 可进行频数分析 比例分析 求众数分析 Thursday March19 2020 19 间隔尺度 intervalscale 例子 高考分数等考试分数温度值不仅是顺序关系 重点是有可测量顺序之间的相等差距 被调查者评定的分数可做加减 但不能作乘除运算 因为等距尺度中不具备真正的零点 不存在倍数关系 Thursday March19 2020 20 比率尺度 rationscale 比率尺度是测量数据中最高水平的尺度 可以进行分类分类 排序 加减乘数等运算 是最精确的计量尺度 有绝对零点 TrueZero 绝对 0 意味着 没有 例如 体重你这个学期选了几门课程 年龄价格收入 Thursday March19 2020 21 两个值是否有大小 等级区别 在两个差值1 2之间与2 3之间 是否是相等的 其中的0是否表示 没有 No nominal名义尺度Yes goon继续 No ordinal顺序尺度Yes goon继续 No interval间隔尺度Yes goon继续 Thursday March19 2020 22 为什么测量尺度很重要 Thursday March19 2020 23 测量尺度的重要性 测量尺度决定所获取的信息 名义尺度是测量中最低的信息水平比率尺度测定可能包含大量的信息 是最精确的尺度尺度度量标准越高越好不同的测量尺度具有不同的分析方法 Thursday March19 2020 24 小练习 一个研究者对研究武汉市初中生阅读习惯充满兴趣 他在当地的一家初中随机找了35个学生进行了调查 询问他们性别 年龄 所在年级 班级名次 最喜欢的书的类型 小说 记录文学 社科类读物等 每个月在书籍上的开销 花在读书上的时间做了收集 提问 1 在这个研究中 总体 population 是什么 样本 sample 是什么 2 样本量 samplesize 是多少 3 变量 variable 有哪些 分别属于什么测量尺度 4 样本是否能反映总体 武汉市初中生 当地一家初中随机找的学生 n 35 性别是名义尺度 年龄是间隔尺度 所在年级是顺序尺度 班级名次是顺序尺度 最喜欢的书籍是名义尺度 书上的开销和花在书上的时间都是比率尺度 Thursday March19 2020 25 思考 你可以使用不同的尺度测量相同的变量 教育 你接受了多少年的基本教育 比率尺度ration 最高教育水平 顺序尺度ordinal 测量尺度的复杂性 是顺序尺度还是间隔尺度 例 这堂课老师展示的PowerPoint你喜欢吗 请按1到5进行排序 1表示非常不喜欢 5表示非常喜欢 非常不喜欢不喜欢一般 谈不上很喜欢也谈不上不喜欢喜欢非常喜欢 Thursday March19 2020 26 基本学习内容 相关统计知识SPSS基本界面简介SPSS数据文件创建 编辑以及修改 Thursday March19 2020 27 SPSS基本介绍 SPSS软件共有4个窗口 表示4种不同类型的SPSS文件数据编辑窗口Dataeditor savfile DataviewVariableview数据输出窗口outputviewer spvfile 语法窗口syntaxeditor spsfile 脚本窗口scriptwindow 3 19 2020 28 变量 个体 3 19 2020 29 Thursday March19 2020 30 输出窗口 Thursday March19 2020 31 基本学习内容 相关统计知识SPSS基本界面简介SPSS数据文件创建 编辑以及修改 Thursday March19 2020 32 创始属于你自己的数据文件 插入新的变量insertingnewvariables定义变量definingvariables插入新的个体Insertingnewcases输入数据Entering editingdatapoints删除变量Deletingvariables删除个体Deletingcases保存数据Savingyourdataset Thursday March19 2020 33 用SPSS来储存小练习中的数据 一个研究者对研究武汉市初中生阅读习惯充满兴趣 他在当地的一家初中随机找了35个学生进行了调查 询问他们性别 年龄 所在年级 最喜欢的书的类型 小说 记录文学 社科类读物等 每个月在书籍上的开销 每月零花钱 花在读书上的时间做了收集 提问 1 在这个研究中 总体 population 是什么 样本 sample 是什么 2 样本量 samplesize 是多少 3 变量 variable 有哪些 分别属于什么测量尺度 4 样本是否能反映总体 Thursday March19 2020 34 练习 1 创建一个新的SPSS数据文件 2 在变量视图创建以下几个变量 Variables 学号 性别 年龄 学生家庭社会经济状况 低中高 中考总成绩 高考总成绩 确定其基本属性 小数 测量尺度 值 并保存该文件 sav 共创造5个个体 Case 3 保存数据文件SPSS数据文件 sav Excel文件 xls xlsx xlsm Thursday March19 2020 35 数据的描述 图与表 频数分布表饼图条形图直方图线图 Thursday March19 2020 36 频数分布表 美国使用交互性电子白板情况中学教师授课专业统计 落在某一特定类别或组中的数据个数 把各个类别及落在其中的相应频数全部列出 用表格形式表现出来 叫频数分布 Thursday March19 2020 37 饼图piechart 美国一所中学使用交互性电子白板情况 使用者占60 n 370 不使用者占60 n 248 用圆形以及圆内扇形的角度来表示数值大小的图形 主要用于一个样本或者总体中各组成部分占全部数据的比例 Thursday March19 2020 38 条形图barchart 玩游戏n 455 编程n 44 听音乐n 477 看电影n 350 匈牙利德布勒森市初高中学生计算机使用情况调查 Thursday March19 2020 39 2020 3 19 40 直方图histogram 某班级学生身高统计 Thursday March19 2020 41 条形图和直方图的区别 疑问 直方图和条形图看上去都是由方条组成 是否有区别 处理的数据是否不一样 答1 条形图 用宽度相同的条形的高度和长短来表示数据多少的图形 其宽度是固定的 直方图 直方图是用面积表示各组频数的多少 宽度是有意义的 答2 条形图是针对的分类数据 直方图正对的是数值型数据 Thursday March19 2020 42 SPSS FrequencyTable频数表 方法一 1 分析 描述统计 频率 2 选取变量 variable 放进变量表单 variableslist 中 你可以同时选取几个变量 3 可以选择从高到低 也可以选择从低到高 Thursday March19 2020 43 Thursday March19 2020 44 SPSS饼图 条形图 直方图 分析 描述统计 频率单击对话框左边的图表选择图表类型 性别 高考语文 Thursday March19 2020 45 方法二 图形 图表构建程序图形画板模板选择程序旧对话框 Thursday March19 2020 46 实例 课堂实例中 我想看看三个班级各自的语文成绩 同时我想看看基于各自的家庭经济收入的三个班的高考语文成绩 如何实现呢 Thursday March19 2020 47 库 条 拖拽或者双击进入图表预览使用实例数据横轴 是否为x轴 班级 纵轴 是否为y轴 高考数学X轴上 设置颜色 家庭收入 Thursday March19 2020 48 一班家庭收入对高考数学平均分并没有什么影响二班家庭状况中等的高考数学平均分略高于收入低的学生平均分 家庭收入高的学生平均分最低 三班家庭收入高学生平均分略高于家庭收入中等略高于家庭收入差的 Thursday March19 2020 49 Thursday March19 2020 50 Thursday March19 2020 51 计算新变量computevariables 如果我想计算所有学生高考语文 高考数学和高考英语的平均分 如何计算 Thursday March19 2020 52 计算新变量computevariables 转换 计算变量 transform computevariable 目标变量 取名 例如 平均分数学表达式 高考语文 高考数学 高考英语 3 Thursday March19 2020 53 拓展练习 有一份电子白板量表 收集的时候 用 2表示很不满意 2表示满意 现在想用1表示不满意 5表示满意 如何转换 Thursday March19 2020 54 基本概念学习 集中趋势众数中位数和分位数均值离散程度测量平均差方差标准差 Thursday March19 2020 55 SPSS EXCEL计算描述统计指标小结 Thursday March19 2020 56 集中趋势的度量 分类数据 众数顺序数据 中位数和分位数数值型数据 均值众数 中位数和均值的比较 Thursday March19 2020 57 集中趋势的度量 1 众数 mode 众数是一组数据中出现频率最高的变量值 也就是出现最多的变量值 例如 1 1 1 2 2 1 1 3 4 5 4 2 1 1 191是出现频率最多的 所以是众数 mode 众数是一个位置代表值 它不受数据中极端值的影响 从分部的角度看 众数是具有明显集中趋势点的数值 可以有两个或者多个众数 还可以没有 可用于分类数据 Thursday March19 2020 58 TheMode众数 特点 1 集中趋势的测量2 出现次数最多3 不受极端值的影响4 一组数据可能没有众数5 也可能有多个众数 Thursday March19 2020 59 排序后处于中间位置上的值 不受极端值的影响主要用于顺序数据 也可用数值型数据 但不能用于分类数据 中位数 median Thursday March19 2020 60 中位数 median 举例 中位数位置 n 1 2例 7 8 9 12 15位置 5 1 2 3 中位数是97 8 9 12位置是 4 1 2 2 5中位数是8 5 Thursday March19 2020 61 平均数 平均数也称均值 mean x bar x x1 x2 x3 x4 x5 xn n这里指的是算数平均值 还有加权平均值和几何平均值 接上例 x 850 1200 1650 1700 2000 2500 2600 3000 3800 120000 10 3130平均数在统计中具有重要地位 它是进行统计分析和统计推断的基础 Thursday March19 2020 62 集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据 不能用于分类数据和顺序数据 平均数 Thursday March19 2020 63 众数 中位数 均值的特点和应用 众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用 64 众数 中位数和均值的关系 65 在对称的正态分布条件下 算术平均数等于众数等于中位数 在非对称正态分布的情况下 众数 中位数和平均数三者的差别取决于偏斜的程度 偏斜的程度越大 它们之间的差别越大 当次数分配呈右偏 正偏 时 算术平均数受极大值的影响 当次数分配呈左偏 负偏 时 算术平均数受极小值的影响 中位数则总是介于众数和平均数之间 Thursday March19 2020 66 基本概念学习 集中趋势众数中位数和分位数均值离散程度测量方差标准差 Thursday March19 2020 67 样本方差和标准差 方差的计算公式 标准差的计算公式 68 理解 两个人打枪 每个人打6次 甲中靶 1 2 3 8 9 10乙中靶 3 4 5 6 7 8 69 计算方差 标准差 两个人甲乙打枪 每个人打6次 甲中靶环数 1 2 3 8 9 10均值 5 5乙中靶环数 3 4 5 6 7 8均值 5 5甲中环数的方差 s2 5 5 1 2 5 5 2 2 5 5 3 2 5 5 8 2 5 5 9 2 5 5 10 2 6 1 20 25 12 25 6 25 6 25 12 25 20 25 15 5乙中环数的方差s2 5 5 3 2 5 5 4 2 5 5 5 2 5 5 6 2 5 5 7 2 5 5 8 2 6 1 6 26 2 25 0 25 0 25 2 25 6 25 3 5 Thursday March19 2020 70 方差和标准差 varianceandstandarddeviation 数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的 称为总体方差或标准差 根据样本数据计算的 称为样本方差或标准差 Thursday March19 2020 71 Thursday March19 2020 72 自由度 degreeoffreedom 一组数据中可以自由取值的数据的个数当样本数据的个数为n时 若样本均值 x确定后 只有n 1个数据可以自由取值 其中必有一个数据则不能自由取值例如 样本有3个数值 即x1 2 x2 4 x3 9 则 x 5 当 x 5确定后 x1 x2和x3有两个数据可以自由取值 另一个则不能自由取值 比如x1 6 x2 7 那么x3则必然取2 而不能取其他值样本方差用自由度去除 其原因可从多方面来解释 从实际应用角度看 在抽样估计中 当用样本方差s2去估计总体方差 2时 s2是 2的无偏估计量 Thursday March19 2020 73 请看以下一段统计数据 财经 综合报道 据文汇报报道 联合国妇女署中国国家项目经理汤竹丽 JulieBroussard 日前在中欧国际工商学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年微型金融服务平台搭建可行性研究报告及总结分析
- 2025年门禁系统访问控制协议
- 电信大学(大数据、5G、云计算)考试题库(含答案)
- 2025年多媒体展示系统建设项目可行性研究报告及总结分析
- 2025年区域创新创业孵化器建设项目可行性研究报告及总结分析
- 2025年矿井维修电工(中级)职业技能(理论知识)考试真题试题 含答案
- 2025年新能源交通工具发展可行性研究报告及总结分析
- 2025年货运无人驾驶技术项目可行性研究报告及总结分析
- 2025年增强现实技术在购物体验中的应用可行性研究报告及总结分析
- 2025年快递上门服务合同协议
- 2025年法院检察院书记员面试题和参考答案
- 2025年中国射频模组行业市场集中度、企业竞争格局分析报告-智研咨询发布
- 2025年广西度三类人员(持b证人员)继续教育网络学习考试题目及答案
- 2025年广东省公务员考试(行政执法专业和申论)综合练习题及答案
- 电玩城充值活动方案
- 《我们神圣的国土》课件
- 重晶石矿开采项目可行性研究报告
- 矿山开采沉降管理办法
- GJB939A-2022外购器材的质量管理
- 纪委监督检查知识培训课件
- 2025 年 九年级英语上册Unit 7 单元测试卷含答案
评论
0/150
提交评论