已阅读5页,还剩136页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育统计学 spss统计软件的应用 序言 统计是为了适应国家管理需要和社会政治经济发展而产生并发展起来的 国势学派政治算术学派 一 现代统计学 统计学是研究如何搜集 整理 分析反映事物总体的数字资料 并对总体特征进行推断的理论和方法 二 教育统计学的基本内容 教育统计学是运用统计学的原理和方法研究教育现象的数量特征和数量关系的一门方法论科学 1 描述统计就是对已获得的数据进行整理 概括 以描述事物总体分布特征的统计方法 如数据分布 平均数 标准差 百分比等等 2 推断统计是根据样本所提供的信息 运用概率的理论 在一定可靠程度上对总体分布特征进行估计和推测的方法 第一章描述统计 一 统计学的基本概念 一 总体与样本 总体 研究对象的全体称为总体 样本 从总体中抽取出的一部分个体 研究样本是为了 从局部推断总体 样本容量 样本所包含的个体数量 常用n表示样本容量 以30为大小样本的分界线 二 常用的统计符号 三 变量与数据 变量指的是在研究中被观察的事项 这些被观察的事项从定量的角度进行观察 将会取得不同的数值 这就是数据 例如 对话教学中学生创新品质培养的策略研究 家庭教养方式对学生成绩影响的研究 变量的类型与特点 大学生心理与行为调查表 一 基本情况1 性别 1 男 2 女2 家庭所在地 1 城市 2 城镇 3 农村二 态度与行为3 对现专业的态度 1 很满意 2 较满意 3 一般 4 不太满意 5 很不满意4 平均每月生活费用大概为元 其中伙食费约元 5 是否在做家教或兼职 1 是 2 否6 是否有恋爱对象 1 有 2 未明确 3 没有7 喜欢哪种教学方法 1 讲授式 2 自学式 3 研讨式 4 其它 大学教师教学效果评价问卷 学生用 很不不很同同一同同意意般意意1 在老师所教的课中 我学到一些有价值的东西 2 通过老师上这门课 我对该学科的兴趣提高了 3 我学会并理解了老师所讲授的课程内容 4 通过上这门课 我提高了认识和分析相关问题的能力 5 通过上这门课 我提高了解决相关问题的能力 6 通过上这门课 我学会了如何学习该学科的方法 课堂练习一 下列变量中哪些是连续变量 哪些是离散变量 时间 性别 家庭的大小 绝对感觉阈限 职员工作评定等级 测验成绩 课堂练习二 试从变量的性质上 指出下列数据所属的变量类型 李芳在班上名列第5名 初二 3 班有女生24人 王鹏跑100米用了16秒4 丹丹的身高是150厘米 朱华英做对了10道题 郭明明的数学测验是90分 二 频数分布 频数分布是统计学中极为重要的概念之一 描述的是数据的分布状态 可以反映全体数据的分布结构和数量特征 是统计规律的主要表现形式 一 频数分布表的概念 将变量取哪些值 取每个变量值的频数情况汇总为表格形态 称为频数分布表 二 频数分布表的结构 频数分布表由两个要素组成 一是分组 二是频数和频率 描述了各组数据在总体中的相对重要程度 例题1 农民工调查 务工初龄务工初龄人数百分比16 19岁8230 8 20 248331 2 25 294118 4 30 343111 7 35以上217 9 平均年龄23 7岁 例题2 第六次全国人口普查年龄结构 例题3 80名学生某科考试分数 8889907289888483928690867687919090748584908589767785939181849183808587868784899184898884839585898989809583918687929389739582878990708585688382898885808980907772 80名学生成绩的频数分布表 三 特征量数 在实际中 常常需要用更精炼概括的方式 计算特征量数 来描述观测数据的分布特征 特征量数主要包括集中量数 差异量数和地位量数 一 集中量数 集中量数是反映一组数据集中趋势的量 表明大多数数据在此集结 可以用于描述一组数据的整体水平 1 算术平均数 算术平均数是最为普遍用来描述一组数据集中趋势的统计量数 基本公式 平均数的特点与应用 平均数具有简明易懂 计算简便 反应灵敏等优点 但也存在易受极端值影响的缺点 平均数是一组数据的典型代表值 人们一般习惯使用平均数来代表一组数据的整体水平 例如 用平均分反映一个班组学生的某项能力测验结果 用平均受教育年限来反映特定年龄段所有人的教育程度 用平均分来集中概括各位评委对参赛选手进行评分的最终结果等等 例题4 设有一组观测数据为70 64 78 69 79 72 求这组数据的平均数 据公式 不难知道这组数据的平均数为 例5 中国女童0 7岁身高体重标准表 2 加权平均数 加权平均数是对重要程度有所不同的一组数据进行加权以后而计算出的平均数 计算公式为 例题6 要评价教师的整体教学水平 并规定教学评估由学生评估 个人评估和同行教师评估三部分评分加权评定 并规定这三部分的权重分别是3 2 5 请确定教学水平综合评定计算公式 假定 某位教师接受评估时 学生评估结果是88分 该教师个人自评是94分 同行专家评估结果是84分 则该教师教学水平最终评估分数是多少分 分析解答 显然 问题的实质就是考虑分数的加权 再求其平均数 设来自学生评估的分数为X1 个人评估的分数记为X2 同行专家评估的分数记为X3 且根据三部分权重按3 2 5分配 该教师的最终分数是 加权平均数的应用 教育评价指标加权各科考试分数加权汇总样本统计量加权合成总体参数 3 中数和众数 中数是一组数据中位置居中的数 众数是一组数据中频数最多的数 二 差异量数 一组数据不仅具有集中趋势 而且还有离中趋势 所谓离中趋势指的是数据具有偏离中心位置的趋势 它反映了一组数据的离散程度或变异程度 统计学上 把反映一组数据离散程度的量称为差异量数 观察数据 甲组 60 70 80 90 100乙组 78 79 80 81 82 观察两组数据 你喜欢哪一组数据 1 全距与平均差 全距 最大值与最小值之间的差距 平均差 一组数据中每个数与平均数的平均差距 2 方差与标准差 方差标准差 例题7 甲组 60 70 80 90 100乙组 78 79 80 81 82计算差异量数并比较 标准差的特点与应用 计算精确 反应灵敏 适合代数运算 不太容易理解 易受极端值影响 描述的是数据分布的离散程度 决定着平均数代表性的优劣 例题8 以下是公管专业99级和2000级的 教育统计与测量 成绩 试作比较分析 三 地位量数 有些情况下 需要用一种地位量数来说明一个数据在团体中所处的位置 统计学上常用百分等级和标准分数来表示数据在团体中所处的地位 示例 一个人身高1 6米 如何评价其身高在团体中的地位 解析 同样身高1 60米的一男一女 或许只有35 左右的成年男子其身高低于1 60米 而在女性群体中 却有85 的成年女子其身高低于1 60米 可见 同样的身高1 60米 在两个不同的团体中其地位是不一样的 1 百分等级 百分等级也称百分位 常用记号PR表示 反映的是某个观测分数占据的百分位置 在0到100之间取值 计算步骤 将数据由小到大排序 m 下累积次数n 样本容量 例题9 在200名学生参加的某次语文水平测验中 有30 的学生其成绩低于60分 有50 的学生其成绩低于72分 有95 的学生其成绩低于85分 那么 这三个测验分数在团体数据中所处的百分等级PR分别是30 50和95 有人称其为 位置值 学分位 等等 99级教育统计与测量成绩表 百分等级 百分位数 2 标准分数 定义 标准分数又称Z分数 是以标准差为单位来表示一个数据在团体中所处相对位置的量数 标准分换算公式 式中 S表示样本标准差 1 标准分数的意义 从定义可以看出 它表示了一个数与平均数之差除以标准差所得的商 如果一个数小于平均数 其Z分数为负数 如果一个数大于平均数 其Z分数为正数 Z分数的绝对值越大 它离平均数也就越远 例题10 甲 乙 丙 丁四人在某次语文考试中分别获得72分 60分 48分和90分 而全体学生的语文平均成绩为60分 标准差为12分 则这4个相应的标准分数分别为 例题11 对某校高二学生进行期中学习质量检测 语文 数学和英语成绩的平均数分别是80分 70分和85分 这三种成绩的标准差分别是10分 15分和12分 某学生的三科成绩分别是85分 82分和90分 问 该生这三科成绩哪一科最好 2 标准分数的应用 用于比较不同质的数据差异 用于合成不同质的数据 用于异常数值的取舍 三个标准差原则 练习1 某校规定每科成绩计分比例为 平时 期中 期末 3 3 4 语文 数学 英语 4 3 3 某学生三科成绩如下表所列 求该生总平均分数 练习2 试比较甲 乙两个学生三门学科的总成绩 并说明他们各科成绩以及总平均成绩在团体中的位置 四 相关分析 我们首先来思考两个变量之间的关系 自我形象与自信心 教育投入与教育效益 相关分析的任务就是定量描述两个变量之间的相关关系 一 相关的概念 两个变量之间相依相伴的变化关系称为相关关系 两个变量之间的变化关系 既表现在变化方向上 又表现在密切程度上 二 相关的种类 根据不同的分类标准 相关关系可以分成不同的种类 分类将有利于更好的理解和掌握相关的概念 按方向分 正相关 变量之间变动方向相同 同增同减 负相关 变量之间变动方向相反 一个增加 另一个则小 零相关 变量之间的变动没有规律可循 负相关举例 居民收入水平与居民的食品消费比重商品价格与销售量心身健康和人格特征中的精神质维度存在明显的负相关 按密切程度分 高度相关 两变量有非常密切关系中度相关 两变量有比较密切关系弱相关 两变量有较弱的关系 三 相关系数 用来描述两个变量变化方向及密切程度的特征量数称为相关系数 一般用r来表示 相关系数的取值范围是 1 r 1 r的符号说明了相关的方向 r的绝对值大小描述了相关的密切程度 r 0 表示零相关 r 1 表示高相关 r0 表示正相关 1 积差相关 积差相关的适用条件是 两个变量都是连续变量 大样本 且都服从正态分布 计算公式 式中 x X变量的标准差 y Y变量的标准差 n 样本容量 例题12数学 物理 英语相关分析 2 等级相关 等级相关适用于顺序变量 对数据的分布特征和样本容量不做要求 因此 适用范围更为广泛 但是精确度不如积差相关 等级相关的计算公式 式中 D表示成对数据的等级之差 例题13 计算结果 四 相关系数的检验与解释 相关系数计算出来以后 是否有统计学意义 一般需要做统计检验 相关系数的解释需要注意的是 相关关系不是因果关系 只是一种伴随关系 弱相关只是没有线性关系 不排除有其它关系 第二章统计推断 统计推断就是根据样本所提供的信息 运用概率的理论 在一定的可靠程度上对总体的分布特征进行估计和推测的方法 统计推断的基本问题 目标 通过选取适当的样本作为总体的代表 去推断总体的统计特征 关键 找到样本与总体的特定关系 并用数学语言建立理论模型 样本要对总体有良好的代表性 一 统计推断的理论基础 一 概率与概率分布 随机现象与随机事件概率与概率分布 1 随机现象与随机事件 随机现象是指 当一定条件具备时 有多种可能结果 但不能准确预知哪一种结果会发生 结果的发生带有偶然性 随机现象的每一个可能结果称为随机事件 例如 A 到十字路口恰好遇到红灯 B 考试分数在90到100之间 例题1 抛掷三枚硬币试验 随机事件 A 出现三个正面 B 出现二正一反 C 出现一正二反 D 出现三个反面 博弈规则A D为甲组 B C为乙组 任意选一组 抛掷三枚硬币 出现哪一个组的结果 事件 押中者为赢 2 概率 随机事件发生的可能性大小称为概率 某一事件A发生的次数m与总次数n之比被定义为该事件A发生的概率 记为 P A m n概率P的取值范围 0 1 P 1 表示必然事件 P 0 表示不可能事件 P 0 表示小概率事件 小概率原理 3 概率分布 概率分布是指随机变量所有取值点的概率分布情况 它揭示了随机现象的统计规律 1 随机现象有哪些随机事件 2 每一事件出现的概率是多大 例题1的概率分布列 摸玻璃球的游戏规律 概率分布研究 口袋里有16个玻璃球 依次随机取出8个球 哪种结果的可能性大 智商分布图 4 正态分布及其应用 正态分布是一类常见的随机现象的概率分布 例如 考试分数 身高 智商等特点 两头小 中间大 标准正态分布图 3 2 10123 标准正态分布表的使用 本书附表1就是正态分布表 表中每一行有3个对应的数值Z Y P 其中Z是标准分数Z的值 Y是Z对应的正态曲线的高 P是阴影部分的面积 也就是随机变量取值在平均数0与所查Z值之间的概率 见下图 标准正态分布表P值示意图 例题2 1 P 0 Z 1 15 0 37493 2 P 0 54 Z 0 82 P 0 Z 0 54 P 0 Z 0 82 0 20540 0 29389 0 49929 3 P 0 25 Z 0 97 P 0 Z 0 97 P 0 Z 0 25 0 33398 0 09871 0 23527 二 平均数差异的显著性检验 在实际工作中 许多问题都可以归结为比较两个平均数是否有显著差异 在统计学上 对于两组测量数据的平均数进行显著性检验 需用T检验 一 平均数检验的基本任务 检验两个样本的平均数差异是否显著 二 平均数假设检验的思想 首先对总体平均数建立一个原假设Ho 然后 根据观察数据计算检验量及其概率P 第三 根据判断法则 在一定的概率置信度下判断假设 Ho 的合理性 并作出接受或拒绝Ho的决策 三 原假设与备择假设 统计假设检验中使用的假设有两种 一种称为原假设 一种称为备择假设 原假设又称为虚无假设 零假设 以符号H0表示 备择假设又称研究假设等 以符号H1表示 四 小概率原理与显著性水平 小概率原理 小概率事件在一次观察中几乎不可能发生 在统计假设检验中 小概率事件的概率值被称为统计假设检验的显著性水平 记为 值常取0 05和0 01两个水平 正态曲线的临界值与拒绝区 五 判断法则 六 应用举例 1 样本平均数与总体平均数差异的显著性检验2 两个样本平均数差异的显著性检验 例题3单总体检验 从某校初一年级抽出一个班49人 对数学自学辅导教材进行实验 期末全年级测试平均成绩为70分 而这49人的平均分为 77 7 标准差为15 试检验实验效果 所谓检验实验效果 就是对样本平均数与已知总体平均数进行差异显著性检验 以验证样本所代表的总体平均数 与 0是否有显著差异 检验步骤 提出零假设 H0 0 即假定样本所代表的总体平均数与已知平均数无显著差异 如有差异仅是抽样误差所致 本题 0 70分 计算检验统计量Z值 用如下公式 式中 样本平均数77 7 0 已知总体平均数70 样本标准差15 n 样本容量49 代入公式得 检验步骤 作出判断因为Z 3 59 Z0 01 2 58 概率P 0 01 结论为 拒绝H0 接受H1 和 0之间的差异非常显著 表明新教材实验很有成效 例题4双总体检验 欲研究高一学生在英语学习方面有无性别差异 抽选了180名男生和160名女生 进行了统一测验 得到如下结果 试问高一阶段的英语学习有无性别差异 解答 这是关于男生和女生英语成绩的双总体检验 总体方差未知 但由于是大样本 故可用S近似代替 作Z检验 1 建立无差假设H0 1 2 H1 1 22 计算统计量 解答 续 3 确定 0 05 Z 1 964 比较判断 Z 0 05 差异不显著 保留H0 拒绝H1 答 高一男女生在英语学习方面没有显著性差异 教师工作压力的性别的差异 性别的差异表1十个分量表的性别差异比较 利用统计软件进行假设检验 根据统计的任务和数据特点正确选择检验方法无差假设是默认的 约定俗成的 无需声明根据检验值出现的概率大小 判断假设的真伪 三 X2检验 在社会科学研究中 最为常见的是来自于社会调查的数据 频数 属于类别变量 这类数据不适合计算平均数 标准差 不能做参数检验 一 检验的基本思想 检验处理的是类别变量 而不是数值变量 检验的思想就是考查样本的实际频数fo与某种理论频数fe的差异是否显著 值的意义需要查 值表才能作出解释 分布的形态 检验的计算公式 分布的特点 分布呈正偏态 右侧无限延伸 分布随自由度的变化而形成一簇分布曲线 分布图 二 适合性检验 适合性检验就是检验某个类别变量的实际数据分布 是否与某种理论假设相吻合 检验方法 把一个类别变量的数据编制成k个类目的单向表 单因素 假设的提法 H0 fo fe或者是 该类别变量各分类次数相同 理论频数根据原假设推算自由度df k 1 某音乐学院想了解学生对不同音乐的爱好程度 特作了一次调查 结果如下 试问 该校学生对不同音乐的爱好是否有所不同 例题5 解答 一 提出假设H0 学生对不同音乐的爱好是一致的 H1 学生对不同音乐的爱好是有差异的 二 计算 2值理论次数fe N 4 948 4 237三 查表确定临界值df 3 2 3 0 05 7 81 2 3 0 01 11 34四 比较判断 2 7 81 p 0 05 拒绝H0 接受H1 二 独立性检验 两个分类变量之间的独立性检验 可以判断两个变量是相互关联 还是彼此独立 检验方法 独立性检验一般要将两个类别变量的数据进行双向分组 一组分成r项 另一组分成c项 制成表格就形成了r c列联表 自由度df r 1 c 1 独立性检验的假设是 两个变量彼此独立而互无关联 理论频数的计算方法是 例题6 学生对报考师范大学的态度与家庭经济关系的双向表 题解 一 提出假设H0 报考师范的态度与家庭经济条件没有关系 H1 报考师范的态度与家庭经济条件有关系 二 计算 2值首先计算与每个实际观测频数相对应的理论频数 题解 续 三 确定的临界值当自由度df r 1 c 1 3 1 3 1 4时 查表得 四 比较判断拒绝H0 接受H1 结论为 学生是否愿意报考师范大学的态度与家庭经济状况有关系 三 四格表的 2检验 在r c列联表中 2 2列联表是一种特殊的常见的情形 它是将两个变量各分为两组 并排成两行两列的形式 2 2列联表 四格表的 2检验公式 四格表的 2检验 既可以使用基本公式 也可以使用简捷公式 1 四格表的简捷公式 2 四格表的亚茨 Yates 校正公式 N 40 fe 5 两校初中毕业生某年参加中考 高中录取结果如下表 问两校该年的高中录取率存在显著差异吗 例题7 题解 一 提出假设 H0 A B两校该年高中录取率没有显著差异H1 A B两校该年高中录取率有显著差异二 计算X2值三 当df 1时 四 比较判断 否定H0 接受H1 我们有99 的把握断定 A B两校该年的高中录取率确实存在显著差异 练习1 某幼儿园教师调查大 中 小班幼儿对唱歌 跳舞和画图最喜爱哪一种 每个幼儿只能填写一种 调查结果见下表 试根据调查资料 判断幼儿对唱歌 跳舞 画图的喜爱是否与年级高低有关 下表为施用两种心理疗法获得不同疗效的人数分布 据此能否作出一方法优于另一方法的判断 练习2 统计方法小结 一 描述统计适用对象 数值变量统计任务 描述样本的统计特征 平均数 标准差 方差等二 频数分析适用对象 数值变量 类别变量等所有变量统计任务 描述变量取值的分布特征 统计方法小结 三 线性相关分析适用对象 数值变量 等级变量统计任务 分析两个变量的相关性 相关系数有无统计学意义需做检验注意事项 积差相关要求变量服从正态分布 不适合对类别变量进行相关分析 相关关系只能说明变量变化的一致性趋势 不能说明因果关系 统计方法小结 四 平均数检验适用对象 数值变量 要求正态分布统计任务 比较两个平均数 判断其差异是否显著原假设 H0 两个平均数没有显著差异 判断法则 统计值出现的概率sig 0 05 就可以拒绝接受原假设 大于0 05就只能接受原假设 统计方法小结 五 2检验适用对象 定类变量统计任务 分析两个定类变量有无交互作用 有没有关系 如果有关系 再进一步作X2检验 判断其关系有无统计学意义 第三章SPSS基本操作 StatisticalPackageforSocialScience 社会科学统计软件包 StatisticalProductandServiceSolutions 统计产品与服务解决方案 一 SPSS的功能特点 1 完全的Windows风格2 完备的统计计算功能 3 强大的图表制作功能4 广泛的数据文件共享 TXT FOXBASE EXCEL 二 SPSS的运行窗口 SPSS常用的窗口有数据编辑器和输出浏览器 一 数据编辑器 Dataeditor 进入SPSS 系统自动打开数据编辑器 数据编辑器包括 DataView 和 VariableView 两个视区 分别用于输入变量的值 数据 和定义变量 名称 类型等 操作演示 二 输出浏览器 Viewer 浏览器用于显示和编辑对数据进行分析以后得到的图表 统计结果 浏览器类似于资源管理器 左边显示输出内容的树状结构 右边则显示输出的具体内容 三 数据文件的编辑 一 数据文件的录入与保存 定义变量输入数据保存数据文件 二 变量的计算 根据统计任务的需要 运用Compute命令 将若干原始变量合成新变量 例如 计算分量表的得分 或者计算量表总分 操作 Transform Compute 打开对话框进行选择和执行 三 数据文件的分组与比较 将数据文件按某个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业数字化转型战略实施路径
- 连锁酒店营销策略实践总结
- 学校教室施工方案
- 灰泥雾凇施工方案
- 监控外线施工方案
- 税务筹划与企业财务规范操作
- 冷链物流安全管理对策
- 产品研发流程及质量管理体系工具
- 医院信息系统与维护方案
- 税务采砂场安全视频监控技术方案
- “红旗杯”竞赛总题库-3班组长创新和数字化管理能力考试题库(附答案)
- 工程力学-何培玲(中文电子课件)全套教案课件
- 彩钢棚搭建合同协议书
- 高中生物教学中反思性学习的深度探究与实践应用
- 【KAWO科握】2025年中国社交媒体平台指南报告
- 职业人群心理健康促进指南 2025
- 人教版初中化学九年级上册第六单元《碳和碳的氧化物》课题1《金刚石、石墨和C60》第二课时《单质碳的化学性质》教学设计
- 【西安交通大学】2025年电力人工智能多模态大模型创新技术及应用报告
- 旅游业消费者行为分析数据表
- 工贸行业企业安全风险分级管控清单
- 应用写作-终结性考核-国开(SC)-参考资料
评论
0/150
提交评论