已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育统计学 教育统计与测量教育科学一门分支学科 它是教育统计与测量教育科学一门分支学科 它是将统计与测量学原理和方法应用于教将统计与测量学原理和方法应用于教 育实践和研究领域而形成的一门应用性教育学科育实践和研究领域而形成的一门应用性教育学科 属于工具性学科 具有基础性地 属于工具性学科 具有基础性地 位 位 第一节第一节 什么是教育学什么是教育学 一 什么是教育统计学一 什么是教育统计学 教育统计学是运用数理统计的原理和方法 研究教育问题的一门应用科学 它的主要任务教育统计学是运用数理统计的原理和方法 研究教育问题的一门应用科学 它的主要任务 是研究如何搜集 整理 分析由教育调查和教育试验所获得的数字资料 并以此为依据 是研究如何搜集 整理 分析由教育调查和教育试验所获得的数字资料 并以此为依据 进行科学推断 揭示教育现象所蕴含的客观规律 进行科学推断 揭示教育现象所蕴含的客观规律 例 我们可以通过调查把握近五年来某地区小学教师学历达标的比例 逐年变化的例 我们可以通过调查把握近五年来某地区小学教师学历达标的比例 逐年变化的 情况 通过调查我们也可以了解学校各种设施逐年改善的情况 了解学生的升学率 情况 通过调查我们也可以了解学校各种设施逐年改善的情况 了解学生的升学率 辍学率等等 辍学率等等 教育统计学与教育调查 教育试验的关系 教育统计学与教育调查 教育试验的关系 教育调查与教育试验会提出具体的研究任务 解决具体的问题 而教育统计学教育调查与教育试验会提出具体的研究任务 解决具体的问题 而教育统计学 主要是对数据进行分析和处理 如果统计学不与一定的调查和试验联系起来 研究者就不主要是对数据进行分析和处理 如果统计学不与一定的调查和试验联系起来 研究者就不 知自己在干什么 说明什么问题 反过来 调查和试验不与统计联系起来 则它们会是杂知自己在干什么 说明什么问题 反过来 调查和试验不与统计联系起来 则它们会是杂 乱无章的 这样教育的规律就显示不出来 乱无章的 这样教育的规律就显示不出来 二 教育统计学的内容二 教育统计学的内容 从具体应用的角度来分 可以分成 从具体应用的角度来分 可以分成 1 描述统计 就是对已获得的数据进行整理 概括 显现其分布特征的统计方法 描述统计 就是对已获得的数据进行整理 概括 显现其分布特征的统计方法 2 推断统计 根据样本提供的信息 运用概率理论进行分析论证 在一定可靠程度上 对推断统计 根据样本提供的信息 运用概率理论进行分析论证 在一定可靠程度上 对 总体分布特征进行估计 推测 这种统计方法称为推断统计 其内容包括总体参数估计和总体分布特征进行估计 推测 这种统计方法称为推断统计 其内容包括总体参数估计和 假设检验两部分 假设检验两部分 第二节第二节学习教育统计学的意义学习教育统计学的意义 首先 统计学是教育科学研究的工具 如教育者对随机因素的处理 首先 统计学是教育科学研究的工具 如教育者对随机因素的处理 其次 是提高专业素养 专业水平的需要 如可以帮助你阅读大量统计说明的资料 其次 是提高专业素养 专业水平的需要 如可以帮助你阅读大量统计说明的资料 否则就不能理解别人的研究 否则就不能理解别人的研究 再次 提高教育实际工作的效率和科学性 可以帮助了解现有的教育管理 从而在再次 提高教育实际工作的效率和科学性 可以帮助了解现有的教育管理 从而在 此基础上制定新的计划 提高教育实际工作的效率和科学性 同时 还可不断发现此基础上制定新的计划 提高教育实际工作的效率和科学性 同时 还可不断发现 问题 提出调整的方法和方案 因而能够提高工作效率 问题 提出调整的方法和方案 因而能够提高工作效率 最后 是科学训练的需要 可以学会科学研究所需的推理和逻辑的能力训练 最后 是科学训练的需要 可以学会科学研究所需的推理和逻辑的能力训练 第三节第三节 统计学中的几个基本概念统计学中的几个基本概念 一 随机变量一 随机变量 试验结果数值不是恒定不变的量 我们把它称为变量 和它相反的量叫做常量 即数值保试验结果数值不是恒定不变的量 我们把它称为变量 和它相反的量叫做常量 即数值保 持恒定的量 表示随机现象各种结果的变量称为随机变量 统计处理的变量都是随机变量 持恒定的量 表示随机现象各种结果的变量称为随机变量 统计处理的变量都是随机变量 一般用一般用 X Y Z 表示 表示 具有以下三个特性的现象 称为随机现象 具有以下三个特性的现象 称为随机现象 第一 第一 一次试验有多种可能结果 其所有可能结果是已知的一次试验有多种可能结果 其所有可能结果是已知的 第二 第二 试验之前不能预料哪一种结果会出现试验之前不能预料哪一种结果会出现 第三 第三 在相同的条件下可以重复试验在相同的条件下可以重复试验 随机现象的每一个结果叫做一个随机事件 随机现象的每一个结果叫做一个随机事件 二 总体和样本二 总体和样本 总体是我们所研究的具有某种共同特征的个体的总和 总体是我们所研究的具有某种共同特征的个体的总和 比如我们要了解全国初中生的英语水平 只有具有比如我们要了解全国初中生的英语水平 只有具有 全国的全国的 初中生初中生 英语英语 这些共同这些共同 特征个体才构成一个总体 总体中的每个单位称为个体 特征个体才构成一个总体 总体中的每个单位称为个体 总体和样本的分类 总体和样本的分类 总体可以分为两种 一种为有限总体 另一种叫做无限总体 当总体所包含的个体总体可以分为两种 一种为有限总体 另一种叫做无限总体 当总体所包含的个体 数目有限时 这一总体称为有限总体 而总体所包含的个体数目无限时 则称为无数目有限时 这一总体称为有限总体 而总体所包含的个体数目无限时 则称为无 限总体 限总体 样本种包含的个体数目称为样本的容量 一般用样本种包含的个体数目称为样本的容量 一般用 n 表示 样本中个体数目大于表示 样本中个体数目大于 30 称为大样本 等于或小于称为大样本 等于或小于 30 称为小样本 称为小样本 总体和样本的关系 具有相对性 即在一定的条件下可以相互转换 比如我们想研总体和样本的关系 具有相对性 即在一定的条件下可以相互转换 比如我们想研 究目前南阳师院在校大学生的外语水平 那么目前在校大学生就可以构成一个整体 究目前南阳师院在校大学生的外语水平 那么目前在校大学生就可以构成一个整体 如果现在想研究全国大学生的外语水平 那么南阳师院在校大学生就是全国范围内如果现在想研究全国大学生的外语水平 那么南阳师院在校大学生就是全国范围内 的一个样本 在这种情况下 总体就变成样本 的一个样本 在这种情况下 总体就变成样本 总体 样本 与研究的目的相联系 总体 样本 与研究的目的相联系 三 统计量和参数三 统计量和参数 样本上的数字特征是统计量 也就是说 根据教育调查或试验获得的数据所计算出样本上的数字特征是统计量 也就是说 根据教育调查或试验获得的数据所计算出 来的能够描述这组数据各种特征的数量是统计量 来的能够描述这组数据各种特征的数量是统计量 总体上的各种数字特征是参数 也即反映总体上各种特征的数量是参数 总体上的各种数字特征是参数 也即反映总体上各种特征的数量是参数 第二章 数据的初步整理 第一节 数据的来源 种类及其分类 一 教育统计资料的来源一 教育统计资料的来源 1 经常性资料 档案性资料 如学生 家长和老师的资料等 经常性资料 档案性资料 如学生 家长和老师的资料等 2 专题性资料 主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题 通过调查 专题性资料 主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题 通过调查 或实验的方法来搜集的 或实验的方法来搜集的 二 数据的种类二 数据的种类 数据就是随机变量的观察值 数据就是随机变量的观察值 1 按来源分 点计数据和度量数据 点计数据指计算个数的数据 它具有独立的分类单数 按来源分 点计数据和度量数据 点计数据指计算个数的数据 它具有独立的分类单数 如人口数 学校数 男女数等 一般都取整数形式 如人口数 学校数 男女数等 一般都取整数形式 度量数据是指用一定的工具或一定的标准测量所获得的数据 如身高 体重 成绩分数 度量数据是指用一定的工具或一定的标准测量所获得的数据 如身高 体重 成绩分数 按测量数据是否等距和有绝对零 又可分三种水平 按测量数据是否等距和有绝对零 又可分三种水平 有相等单位又有绝对零的数据称为比率变量数据 如身高 体重 反应时 有相等单位又有绝对零的数据称为比率变量数据 如身高 体重 反应时 有相等单位但无绝对零的数据 称为等距变量数据 如温度 各种能力分数 智商等 有相等单位但无绝对零的数据 称为等距变量数据 如温度 各种能力分数 智商等 既无相等单位也无绝对零的数据称为顺序变量数据 如等级评定 品质评定 能力等级既无相等单位也无绝对零的数据称为顺序变量数据 如等级评定 品质评定 能力等级 等 等 计数数据常用百分比率的检验方法 计数数据常用百分比率的检验方法 2检验等 比率或等距变量常用检验等 比率或等距变量常用 T 检验及方差分析 检验及方差分析 顺序变量常用等级相关 等级差异数分析等 顺序变量常用等级相关 等级差异数分析等 2 按随机变量取值是否具有连续性按随机变量取值是否具有连续性 分为间断型随机变量的数据和连续型随机变量 分为间断型随机变量的数据和连续型随机变量 取值个数有限的数据 称为间断型随机变量的数据 这种数据的单位是独立的 两个单位取值个数有限的数据 称为间断型随机变量的数据 这种数据的单位是独立的 两个单位 之间不能再划分成细小的单位 一般用整数表示 许多调查得来的数据属此类 之间不能再划分成细小的单位 一般用整数表示 许多调查得来的数据属此类 取值个数无限的数据 称为连续型随机变量的数据 它们可能的取值范围能连续充满某一取值个数无限的数据 称为连续型随机变量的数据 它们可能的取值范围能连续充满某一 个区间 数据的单位之间可以在划分成无限多个细小的单位 数据可以用小数表示 个区间 数据的单位之间可以在划分成无限多个细小的单位 数据可以用小数表示 第二节第二节 统计表统计表 1 标题 表的名称 上方 简明扼要 标题 表的名称 上方 简明扼要 2 表号 表的序号 左方 时间顺序 表号 表的序号 左方 时间顺序 3 标目 表中对统计数据分类的项目 标目 表中对统计数据分类的项目 4 线条 四条基本线条 不宜多 线条 四条基本线条 不宜多 5 数字 小数数位要一致 对齐 尽量不留空格 无数字可画横杠 可用省略号或问号表数字 小数数位要一致 对齐 尽量不留空格 无数字可画横杠 可用省略号或问号表 示 示 6 表注 补充说明表的来源 字号不要大于表中的其它文字 简单明了 重点突出 表注 补充说明表的来源 字号不要大于表中的其它文字 简单明了 重点突出 二 统计表的种类二 统计表的种类 1 简单表 只列出观察对象的名称 地点 时序或统计指标名称的统计表 简单表 只列出观察对象的名称 地点 时序或统计指标名称的统计表 2 复合表 按两个或两个以上标志分组的统计表 复合表 按两个或两个以上标志分组的统计表 三 频数分布表列法三 频数分布表列法 频数 某一个随机事件在频数 某一个随机事件在 n 次试验中出现的次数称为这个随机事件的频数 一般用次试验中出现的次数称为这个随机事件的频数 一般用 f 表示 表示 频数分布 各种随机事件在频数分布 各种随机事件在 n 次试验种出现的次数分布称为频数分布 即把随机事件出现次试验种出现的次数分布称为频数分布 即把随机事件出现 的次数都呈现出来 的次数都呈现出来 频数分布表 把频数分布用表格的形式表示出来就是频数分布表 频数分布表 把频数分布用表格的形式表示出来就是频数分布表 频数分布表分类 频数分布表分类 1 简单频数分布表简单频数分布表 1 间断变量的频数分布表 间断变量的频数分布表 2 连续变量的频数分布表 连续变量的频数分布表 第一步 求全距第一步 求全距 R 最大值最大值 最小值最小值 128 81 47 第二步 决定组数和组距第二步 决定组数和组距 k 一般分为一般分为 10 15 组 组 i 一般定为一般定为 1 2 3 5 10 本例本例 k 10 i R k 47 10 5 第三步 决定组限 即决定各组的上下限 第三步 决定组限 即决定各组的上下限 组中值组中值 上限 上限 下限 下限 2 第四步 登记频数第四步 登记频数 2 累积频数和累积百分比分布表 累积频数就是把频数一组一组累加起来 得到的频数叫累积频数和累积百分比分布表 累积频数就是把频数一组一组累加起来 得到的频数叫 累积频数 累积频数 累积百分比就是把频数用百分比变成相对频数 用表格把这两种频数表示出累积百分比就是把频数用百分比变成相对频数 用表格把这两种频数表示出 来就是累积频数分布表和累积百分比分布表 来就是累积频数分布表和累积百分比分布表 1 累积频数分布表制作 累积频数分布表制作 A 先制作频数分布表先制作频数分布表B 从最低一组的频数开始登记 从最低一组的频数开始登记 思考题 思考题 将下列将下列 30 名学生的英语分数编制成组距为名学生的英语分数编制成组距为 5 的简单频数 累积频数 上限以下 的简单频数 累积频数 上限以下 分布表 并绘制简单频数直方图 分布表 并绘制简单频数直方图 76 71 66 63 88 83 77 72 68 64 70 76 81 79 73 71 66 61 55 65 74 86 78 82 74 84 67 72 76 74 第三节第三节 统计图统计图 统计图是用来表达统计指标与被说明的事物之间数量关系的图形 它是整理数据的一种方统计图是用来表达统计指标与被说明的事物之间数量关系的图形 它是整理数据的一种方 法 在运用统计图时 一般附有统计表 法 在运用统计图时 一般附有统计表 一 统计图的结构及其绘制规则一 统计图的结构及其绘制规则 1 标题 简明扼要 切合内容 必要时注明时间地点 字体在图中为最大 一般在图下方 标题 简明扼要 切合内容 必要时注明时间地点 字体在图中为最大 一般在图下方 2 图号 图号 3 标目 对于有纵横轴的统计图 应在纵横轴上分别标明统计项目及其尺度 标目 对于有纵横轴的统计图 应在纵横轴上分别标明统计项目及其尺度 4 图形 图形线在图中为最粗 要清晰 图形的高与宽之比图形 图形线在图中为最粗 要清晰 图形的高与宽之比 3 5 为宜 以美观为准 为宜 以美观为准 5 图注 文字简明扼要 字体要小 写在图题的下方 图注 文字简明扼要 字体要小 写在图题的下方 二 表示间断变量的统计图二 表示间断变量的统计图 1 直条图 用直条的长短表示统计事项数量的图形为直条图 常用来表示点计数据 直条图 用直条的长短表示统计事项数量的图形为直条图 常用来表示点计数据 制作直条图的方法制作直条图的方法 1 条宽应一致 只是高度不同 从而控制高度来表示大小 条宽应一致 只是高度不同 从而控制高度来表示大小 2 各直条之间要有一定的间隔 因为它表示的是间断变量 但间隔不要太宽 或太窄 各直条之间要有一定的间隔 因为它表示的是间断变量 但间隔不要太宽 或太窄 一般是一个到半个直条宽度之间 一般是一个到半个直条宽度之间 3 各直条的安排要有一定的顺序 如时间前后 数字大小 等级次序等 各直条的安排要有一定的顺序 如时间前后 数字大小 等级次序等 4 为了直观 直条的附近不要写数字 如需特别说明 可以安排一些图例 为了直观 直条的附近不要写数字 如需特别说明 可以安排一些图例 直条图的分类 单式直条图和复式直条图直条图的分类 单式直条图和复式直条图 直条图还可分为横条图和纵条图 常见的为纵条图 直条图还可分为横条图和纵条图 常见的为纵条图 2 圆形图 是用来表示间断性资料构成比的图形 圆形图 是用来表示间断性资料构成比的图形 三 表示连续变量的统计图三 表示连续变量的统计图 1 频数分布图 频数分布图 1 直方图用面积表示频数分布 用各组上下限上的 直方图用面积表示频数分布 用各组上下限上的 矩形面积表示各组频数 矩形面积表示各组频数 直方图的制作直方图的制作 以组距为底边以组距为底边 以分组区间的上下限为底边二端点以分组区间的上下限为底边二端点 以次数为高画矩形以次数为高画矩形 各直条各直条 距形间不留空隙 距形间不留空隙 直方图与直条图的异同直方图与直条图的异同 同 都是用矩形来表示数据 同 都是用矩形来表示数据 异 直条图表示间断变量 而直方图来表示连续变量 直条图各直条之间有间距 直方图异 直条图表示间断变量 而直方图来表示连续变量 直条图各直条之间有间距 直方图 各直条之间没有间隔 直条图是以直条的长短高低来表示数量关系 而直方图是以面积来各直条之间没有间隔 直条图是以直条的长短高低来表示数量关系 而直方图是以面积来 表示频数分布 表示频数分布 多边图 多边图是以纵轴上的高度表示频数的多少的图形 多边图 多边图是以纵轴上的高度表示频数的多少的图形 制图方法大体与直方图相同 其不同之处在于 以各组中点为横坐标 以各组的频数为纵制图方法大体与直方图相同 其不同之处在于 以各组中点为横坐标 以各组的频数为纵 坐标描点 然后把每相邻的两点用直线连接起来 即成多边图 坐标描点 然后把每相邻的两点用直线连接起来 即成多边图 若两组数据总频数不相同时 其纵轴应当以频数百分比表示 若两组数据总频数不相同时 其纵轴应当以频数百分比表示 3 累积频数与累积百分比图 累积频数与累积百分比图 制作方法与多边图制作方法很相像 其区别在于 描点时应以各组的上限为横坐标制作方法与多边图制作方法很相像 其区别在于 描点时应以各组的上限为横坐标 以各组的累积频数或累积百分比为纵坐标 然后描处标点 然后形成一个曲线 以各组的累积频数或累积百分比为纵坐标 然后描处标点 然后形成一个曲线 第三章第三章 集中量集中量 二 算术平均数的计算方法二 算术平均数的计算方法 第二节第二节加权平均数 几何平均数 加权平均数 几何平均数 调和平均数调和平均数 一 加权平均数 是不同比重数据 或平均数 的平均数 一 加权平均数 是不同比重数据 或平均数 的平均数 例 某门课程期中考试成绩与期末考试成绩的权数分别为例 某门课程期中考试成绩与期末考试成绩的权数分别为 3 和和 7 已知某个考生期 已知某个考生期 中考了中考了 92 分 期末考了分 期末考了 85 分 若不考虑其他因素 问该生在这门课上的成绩是多分 若不考虑其他因素 问该生在这门课上的成绩是多 少 少 二 几何平均数 当一个数列的后一个数据以前一个数据为基础成比率 即等比级二 几何平均数 当一个数列的后一个数据以前一个数据为基础成比率 即等比级 数 增长时 要用几何平均数求其平均增长率 即等比级数中的比率 数 增长时 要用几何平均数求其平均增长率 即等比级数中的比率 常用作速 常用作速 率的集中量 率的集中量 例如 某大学连续四年的毕业人数为 例如 某大学连续四年的毕业人数为 980 1100 1200 1300 问毕业生平均增长率是 问毕业生平均增长率是 多少 多少 三 调和平均数 是一组数据倒数的算术平均数的倒数 亦称倒数平均数 用公式三 调和平均数 是一组数据倒数的算术平均数的倒数 亦称倒数平均数 用公式 表示为 表示为 第三节第三节中位数中位数 一 一 中位数的概念中位数的概念 二 中位数的计算方法二 中位数的计算方法 三 百分位数的概念及其计算方法三 百分位数的概念及其计算方法 1 概念概念 百份位数是位于以一定顺序 一般是由小到大 排列的一组数据中某一百分位 百份位数是位于以一定顺序 一般是由小到大 排列的一组数据中某一百分位 置的数置的数 2 计算方法计算方法 第三节第三节 众数众数 对众数有理论众数及粗略众数两种定义方法 理论众数是指与频数分布曲线最高点相对应对众数有理论众数及粗略众数两种定义方法 理论众数是指与频数分布曲线最高点相对应 的横坐标上的一点的横坐标上的一点 积分积分 粗略众数是指一组数据中频数出现最多的那个数 粗略众数是指一组数据中频数出现最多的那个数 二 众数的求法二 众数的求法 1 观察法 先把数据列出来 然后找出现频数最大的数 即为众数 观察法 先把数据列出来 然后找出现频数最大的数 即为众数 例如 有人想了解大学二年级一个半学生的年龄大概是多少 就可以把学生的年龄抄下来 例如 有人想了解大学二年级一个半学生的年龄大概是多少 就可以把学生的年龄抄下来 发现发现 18 岁有岁有 3 个人 个人 19 岁岁 8 人 人 20 岁岁 4 人 人 21 岁岁 2 人 还有人 还有 22 岁岁 1 人 这时就可知这人 这时就可知这 个班的年龄众数是个班的年龄众数是 19 岁 岁 三 算术平均数 中位数和众数的评价及关系三 算术平均数 中位数和众数的评价及关系 一 评价与应用 一 评价与应用 1 算术平均数 最常用 优点也最多 算术平均数 最常用 优点也最多 优点 优点 1 感应灵敏 感应灵敏 2 严密确定 严密确定 3 简明易懂 计算简便 简明易懂 计算简便 4 适合代数运算 适合代数运算 5 受抽样变动的影响较小 受抽样变动的影响较小 二 三者的关系 二 三者的关系 当频数分布呈正态时 当频数分布呈正态时 第四章 差异量 第一节第一节方差和标准差方差和标准差 一 一 方差和标准差的概念方差和标准差的概念 方差也叫变异数 均方 方差也叫变异数 均方 是指离差平方的算术平均数 是指离差平方的算术平均数 2 频数分布表计算法 频数分布表计算法 2 百分位距 百分位距是指两个百分位数之差 百分位距 百分位距是指两个百分位数之差 例 某研究者对例 某研究者对 100 名小学生进行智商测试 数据经过整理 结果如下 现要计算这名小学生进行智商测试 数据经过整理 结果如下 现要计算这 100 名学生智商的百分位距 名学生智商的百分位距 第三节 相对差异量 一 概念一 概念带有与原观察值相同单位的名数 称为绝对差异量 带有与原观察值相同单位的名数 称为绝对差异量 如前面所学的全距 四分位距 平均差及标准差等 这些差异量对两种单位不同 或单位如前面所学的全距 四分位距 平均差及标准差等 这些差异量对两种单位不同 或单位 相同而两个平均数相差较大的资料 都无法比较差异的大小 如比较身高和体重的离散程相同而两个平均数相差较大的资料 都无法比较差异的大小 如比较身高和体重的离散程 度 这时就需要用相对差异量 即差异系数 进行比较 度 这时就需要用相对差异量 即差异系数 进行比较 小结 差异量和集中量的比较小结 差异量和集中量的比较 联系 都是一组数据的特征量 联系 都是一组数据的特征量 区别 从不同角度来反映数据的特征 区别 从不同角度来反映数据的特征 1 集中量如果在数轴上表示 它是一个点 而差异量则可表示为一段距离 集中量如果在数轴上表示 它是一个点 而差异量则可表示为一段距离 2 这段距离越宽 说明数据的离散程度越大 数据的集中量代表性越差 反之 数据则比这段距离越宽 说明数据的离散程度越大 数据的集中量代表性越差 反之 数据则比 较整齐 分布范围比较窄 数据的集中量代表性越好 较整齐 分布范围比较窄 数据的集中量代表性越好 第六章 抽样分布与总体平均数的推断 第一节第一节 抽样分布抽样分布 1 总体分布 总体内所有个体数值的频数分布 总体分布 总体内所有个体数值的频数分布 例如 我们想研究去年全市中考语文的考试情况 把去年全市参加中考的所有考生例如 我们想研究去年全市中考语文的考试情况 把去年全市参加中考的所有考生 的语文分数拿来制作一个频数分数 这个分布就是总体分布 的语文分数拿来制作一个频数分数 这个分布就是总体分布 二 平均数抽样分布的几个定理二 平均数抽样分布的几个定理 1 从总体中随机抽出容量为从总体中随机抽出容量为 n 的一切可能样本的平均数之平均数等于总体的平均数 的一切可能样本的平均数之平均数等于总体的平均数 平均数抽样分布的形态及特征平均数抽样分布的形态及特征 形态上形态上 如果是大样本 不管总体是正态分布的还是非正态分布的 平均数的抽样如果是大样本 不管总体是正态分布的还是非正态分布的 平均数的抽样 分布都是正态分布或接近正态分布 如果是小样本 那么只有总体呈正态分布时 分布都是正态分布或接近正态分布 如果是小样本 那么只有总体呈正态分布时 平均数的抽样分布才是正态分布的 平均数的抽样分布才是正态分布的 特征上特征上 一切可能样本平均数的分布以总体平均数为中心 其取值围绕总体平均数一切可能样本平均数的分布以总体平均数为中心 其取值围绕总体平均数 在上下波动 平均数抽样分布的平均数等于总体平均数 而抽样分布的标准差与总在上下波动 平均数抽样分布的平均数等于总体平均数 而抽样分布的标准差与总 体标准差成正比体标准差成正比 与样本容量成反比 与样本容量成反比 标准误标准误 抽样误差我们用抽样分布上的标准差来表示 因此 某种统计量在抽样分布上的标抽样误差我们用抽样分布上的标准差来表示 因此 某种统计量在抽样分布上的标 准差称为该种统计量的标准误 准差称为该种统计量的标准误 e 三 样本平均数与总体平均数离差统计量的形态三 样本平均数与总体平均数离差统计量的形态 从正态总体中 随机抽容量从正态总体中 随机抽容量 N 的一切可能样本的平均数 是以总体平的一切可能样本的平均数 是以总体平 均数为中心呈正态分布的 均数为中心呈正态分布的 1 当总体标准差已知时当总体标准差已知时 2 当总体标准差当总体标准差 未知时未知时 t 分布与正态分布的区别之处分布与正态分布的区别之处 t 分布的形态随自由度 分布的形态随自由度 df n 1 变化呈一簇分布形态 即自由度不同的变化呈一簇分布形态 即自由度不同的 t 分布形态分布形态 也不同 也不同 自由度越小 分布范围越广 自由度越小 分布范围越广 第二节 总体平均数的参数估计 根据样本对总体参数的推断有两种 总体参数估计和假设检验 根据样本对总体参数的推断有两种 总体参数估计和假设检验 一 总体参数估计的基本原理一 总体参数估计的基本原理 根据样本统计量对相应总体参数所作的估计叫总体参数估计 总体参数估计分为点根据样本统计量对相应总体参数所作的估计叫总体参数估计 总体参数估计分为点 估计和区间估计 估计和区间估计 1 点估计点估计 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计 例如 有人通过抽样 对大学生做了一个调查 当研究者问例如 有人通过抽样 对大学生做了一个调查 当研究者问 你认为谁对你影响最你认为谁对你影响最 大 大 经统计 这个样本中有 经统计 这个样本中有 36 6 的认为父亲对自己的影响最大 的认为父亲对自己的影响最大 2 区间估计区间估计 二 二 已知条件下总体平均数的区间估计已知条件下总体平均数的区间估计 1 当总体当总体 已知 总体呈正态分布 大样本 已知 总体呈正态分布 大样本 n 30 或小样本 或小样本 n 30 时 不管大 时 不管大 小样本 抽样分布都是正态的 小样本 抽样分布都是正态的 2 当总体当总体 已知 总体虽不呈正态分布 大样本 已知 总体虽不呈正态分布 大样本 n 30 时 样本平均数的分布近 时 样本平均数的分布近 似正态 似正态 已知某年某区高考数学成绩的方差为已知某年某区高考数学成绩的方差为 100 从该地区随机抽 从该地区随机抽 20 名考生的数学成绩名考生的数学成绩 为 为 65 68 38 56 72 75 47 58 70 63 67 64 60 69 61 66 55 76 68 62 试求该地区这一年高考数学平均分 试求该地区这一年高考数学平均分 95 和和 99 的置信区间 的置信区间 总体平均数总体平均数 99 置信区间为 置信区间为 三 三 未知条件下总体平均数的区间估计未知条件下总体平均数的区间估计 1 未知条件下总体平均数区间估计的基本原理未知条件下总体平均数区间估计的基本原理 1 当总体 当总体 未知 总体呈正态分布 无论大小样本 样本平均数与总均的离差未知 总体呈正态分布 无论大小样本 样本平均数与总均的离差 是不能转成标准正态分布的 可按是不能转成标准正态分布的 可按 T 分布做推断 分布做推断 2 当总体 当总体 未知 总体虽不呈正态分布 大样本容量较大 未知 总体虽不呈正态分布 大样本容量较大 n 30 时 样本平 时 样本平 均数可以转换成均数可以转换成 t 值 值 第三节 假设检验的基本原理 以总体平均数的假设检验为例 当对某一个总体平均数 以总体平均数的假设检验为例 当对某一个总体平均数 进行假设检验时 首 进行假设检验时 首 先从这个总体中随机抽取一个样本 计算出样本平均数的值 然后 假定样本所属先从这个总体中随机抽取一个样本 计算出样本平均数的值 然后 假定样本所属 总体的平均数 总体的平均数 等于某个假设总体的平均数 等于某个假设总体的平均数 0 那么 这个样本就来自这 那么 这个样本就来自这 个假设总体 样本统计量的值是这个假设总体平均数值的一个随机样本值 样本平个假设总体 样本统计量的值是这个假设总体平均数值的一个随机样本值 样本平 均数与总体平均数之间的差异是由抽样误差造成的 均数与总体平均数之间的差异是由抽样误差造成的 从假设总体中抽取的一切可能样本统计量的值应当以假设的总体平均数为中心形成从假设总体中抽取的一切可能样本统计量的值应当以假设的总体平均数为中心形成 一个正态分布 这个分布可以分成两个区域 一个正态分布 这个分布可以分成两个区域 如果这个样本统计量的值落在了这个抽样分布中出现概率比较大的区域里 这时只如果这个样本统计量的值落在了这个抽样分布中出现概率比较大的区域里 这时只 好保留零假设 即研究者不得不承认这个样本来自这个假设的总体 或者这个样本好保留零假设 即研究者不得不承认这个样本来自这个假设的总体 或者这个样本 所属总体与假设总体没有真正的差异 如果这个样本统计量的值落在了抽样分布中所属总体与假设总体没有真正的差异 如果这个样本统计量的值落在了抽样分布中 出现概率极小的区域里 根据小概率事件在一次随机抽样中几乎不可能发生的原理 出现概率极小的区域里 根据小概率事件在一次随机抽样中几乎不可能发生的原理 不得不承认样本统计量与假设总体的平均数存在着本质的差异 不得不承认样本统计量与假设总体的平均数存在着本质的差异 二 小概率事件二 小概率事件 三 显著性水平三 显著性水平 统计学中把这种拒绝零假设的概率称为显著性水平 表示为 统计学中把这种拒绝零假设的概率称为显著性水平 表示为 检验的形式 检验的形式 双侧检验只强调差异不强调方向的检验为双侧检验 所提出的假设检验的问题是是双侧检验只强调差异不强调方向的检验为双侧检验 所提出的假设检验的问题是是 否一样 相同 有差异等等 否一样 相同 有差异等等 单侧检验既检验差异又考虑差异的方向的检验为单侧检验 具体来说 又分为左侧单侧检验既检验差异又考虑差异的方向的检验为单侧检验 具体来说 又分为左侧 检验和右侧检验 检验和右侧检验 四 统计推断的两类错误及其控制四 统计推断的两类错误及其控制 对于总体参数的假设检验 有可能犯两种类型的错误 对于总体参数的假设检验 有可能犯两种类型的错误 错误和错误和 错误 错误 假设有一个样本平均数值落到抽样分布的零假设的保留区间 这时认为样本平均数假设有一个样本平均数值落到抽样分布的零假设的保留区间 这时认为样本平均数 与总体的差异是由抽样误差造成的 没有真正差异 或者说差异不显著 差异没有与总体的差异是由抽样误差造成的 没有真正差异 或者说差异不显著 差异没有 达到显著性水平 这时就不能拒绝零假设 如果样本平均数落到了零假设的保留区达到显著性水平 这时就不能拒绝零假设 如果样本平均数落到了零假设的保留区 间以外 小概率事件发生了 则有相当大的把握拒绝零假设 即认为样本平均数与间以外 小概率事件发生了 则有相当大的把握拒绝零假设 即认为样本平均数与 总体平均数的差异不是由抽样误差造成的 而是有真正的差异 或显著的差异 总体平均数的差异不是由抽样误差造成的 而是有真正的差异 或显著的差异 第四节 总体平均数的显著性检验 显著性检验的一般步骤 显著性检验的一般步骤 1 提出假设 提出假设 2 选择检验统计量并计算其值 选择检验统计量并计算其值 3 确定检验形式 确定检验形式 4 统计决断 统计决断 一 一 已知条件下总体平均数的显著性检验例子 某小学历届毕业生汉语拼音测验平均分已知条件下总体平均数的显著性检验例子 某小学历届毕业生汉语拼音测验平均分 66 分 标准差分 标准差 11 7 现以同样的试题测验应届毕业生 并从中随机抽取 现以同样的试题测验应届毕业生 并从中随机抽取 18 份试卷 算得份试卷 算得 平均分为平均分为 69 分 问该校应届与历届毕业汉语拼音测验成绩是否一样 分 问该校应届与历届毕业汉语拼音测验成绩是否一样 解 解 1 提出假设 提出假设 2 选择统计量并计算其值 选择统计量并计算其值 3 确定检验形式 确定检验形式 双侧检验双侧检验 4 统计决断 统计决断 查查 Z 值表 值表 二 二 未知条件下总体平均数的假设检验未知条件下总体平均数的假设检验 通常要做通常要做 t 检验 同时还要看样本的大小 小样本一定要做检验 同时还要看样本的大小 小样本一定要做 t 检验 大样本通常还检验 大样本通常还 可以转换成可以转换成 Z 检验作近似处理 检验作近似处理 3 确定检验形式 确定检验形式 双侧检验双侧检验 4 统计决断因为当 统计决断因为当 df 20 1 时 查附表时 查附表 2 第七章 平均数差异的显著性检验 数理统计学的研究表明 假若数理统计学的研究表明 假若 第二节第二节 相关样本平均数差异的显著性检验相关样本平均数差异的显著性检验 例例 1 有人做了一项分散识字教学法与集中识字教学法的比较实验 根据研究的需要 将 有人做了一项分散识字教学法与集中识字教学法的比较实验 根据研究的需要 将 学生配成了学生配成了 10 对 再把每对学生中的一个随机地指派到实验组 另一个指派到对照组 两对 再把每对学生中的一个随机地指派到实验组 另一个指派到对照组 两 组学生分别接受用不同的教学法进行的教学 经过一段时间的学习之后 两组学生接受统组学生分别接受用不同的教学法进行的教学 经过一段时间的学习之后 两组学生接受统 一的测试 结果如表一的测试 结果如表 7 1 所示 现在问 两种识字教学法是否有显著性差异 所示 现在问 两种识字教学法是否有显著性差异 例 某小学在新生入学时对例 某小学在新生入学时对 28 名儿童进行了韦氏智力测验 结果平均智商名儿童进行了韦氏智力测验 结果平均智商 99 标准差 标准差 14 一年后再对这些被试施测 结果平均智商 一年后再对这些被试施测 结果平均智商 101 标准差 标准差 15 已知两次测验结果的相 已知两次测验结果的相 关系数关系数 r 0 72 问能否说随着年龄的增长与一年的教育 儿童智商有了显著提高 问能否说随着年龄的增长与一年的教育 儿童智商有了显著提高 第三节第三节 独立大样本平均数差异的显著性检验独立大样本平均数差异的显著性检验 定义 两个样本内的个体是随机抽取的 它们之间不存在一一的对应关系 这样的两个样定义 两个样本内的个体是随机抽取的 它们之间不存在一一的对应关系 这样的两个样 本称为独立样本 本称为独立样本 假设某小学从某学期刚开学就在中 高年级各班利用每周班会时间进行思想品德教育 学假设某小学从某学期刚开学就在中 高年级各班利用每周班会时间进行思想品德教育 学 期结束时从中 高年级各抽取两个班进行道德行为测试 结果如下表所示 问高年级思想期结束时从中 高年级各抽取两个班进行道德行为测试 结果如下表所示 问高年级思想 品德教育的效果是否优于中年级 品德教育的效果是否优于中年级 第四节方差齐性检验 定义 对两个总体的方差是否有显著性所进行的检验称为方差齐性 相等 检验 定义 对两个总体的方差是否有显著性所进行的检验称为方差齐性 相等 检验 F 分布的特点是 分布的特点是 1 F 分布是一簇分布 随分子和分母的自由度不同而有不同的分布曲线 分布是一簇分布 随分子和分母的自由度不同而有不同的分布曲线 2 F 分布是正偏态的 即一簇正偏态的曲线 不过 随着分子和分母自由度的增大而逐渐趋分布是正偏态的 即一簇正偏态的曲线 不过 随着分子和分母自由度的增大而逐渐趋 于正态 于正态 3 F 比值都是正的 比值都是正的 4 由于计算由于计算 F 比值时总把大的方差估计值作为分子 小的作为分母 所以比值时总把大的方差估计值作为分子 小的作为分母 所以 F 比值比值 1 两个独立样本的方差齐性检验两个独立样本的方差齐性检验 例 某市初中毕业班进行了一次数学考试 为了比较该市毕业班男女生成绩的离散程度 例 某市初中毕业班进行了一次数学考试 为了比较该市毕业班男女生成绩的离散程度 从男生中抽出一个样本 容量为从男生中抽出一个样本 容量为 31 从女考生中也抽出一个样本 容量为 从女考生中也抽出一个样本 容量为 21 男女生成绩 男女生成绩 的方差分别为的方差分别为 49 和和 36 请问男女生成绩的离散程度是否一致 请问男女生成绩的离散程度是否一致 第八章方差分析 下表是下表是 A B C 三种实验处理的数据 其中三种实验处理的数据 其中 k 3 表示有三种实验处理 表示有三种实验处理 n 5 表示每种实验表示每种实验 处理中有处理中有 5 个实验数据 个实验数据 表示某一种实验处理的平均数 表示某一种实验处理的平均数 表示总平均数 表示总平均数 三组平均数之间存在差异 每一组内的三组平均数之间存在差异 每一组内的 5 个数据彼此也有差异 这两部分的差异合起来即个数据彼此也有差异 这两部分的差异合起来即 为实验结果总的差异 或者说 每一数据与总平均数的差异等于它与本组平均数之差加上为实验结果总的差异 或者说 每一数据与总平均数的差异等于它与本组平均数之差加上 小组平均数与总平均数的差异 小组平均数与总平均数的差异 第二节第二节 完全随机设计的方差分析完全随机设计的方差分析 为了检验某一个因素多种不同水平间的差异的显著性 将从同一个总体中随机抽取的被试 为了检验某一个因素多种不同水平间的差异的显著性 将从同一个总体中随机抽取的被试 再随机地分入各实验组 施以各种不同的实验处理以后 用方差分析法对这多个独立样本再随机地分入各实验组 施以各种不同的实验处理以后 用方差分析法对这多个独立样本 平均数差异的显著性进行检验 称为完全随机设计的方差分析 又叫做独立组实验设计 平均数差异的显著性进行检验 称为完全随机设计的方差分析 又叫做独立组实验设计 例如 为了提高初三学生的物理成绩 物理教师设计了例如 为了提高初三学生的物理成绩 物理教师设计了 A B C D 四种计算机辅助教学四种计算机辅助教学 软件 为了检查四种软件的教学效果 从某校初三学生中随机抽取了软件 为了检查四种软件的教学效果 从某校初三学生中随机抽取了 24 名学生 分成四组 名学生 分成四组 然后随机指派一组学生去使用一种教学软件 学期结束时进行统一考试 成绩如下 问四然后随机指派一组学生去使用一种教学软件 学期结束时进行统一考试 成绩如下 问四 种教学软件产生的助学效果有无不同 种教学软件产生的助学效果有无不同 第三步 统计决断第三步 统计决断 根据分子和分母自由度查根据分子和分母自由度查 F 值表 得值表 得 例例 2 为了研究作业量对小学五年级学生学习成绩的影响 从某小学五年级各班中随机抽 为了研究作业量对小学五年级学生学习成绩的影响 从某小学五年级各班中随机抽 取取 A B C 三个平行班来做实验 假定该校五年级有三个以上的平行班 各班的平均学习三个平行班来做实验 假定该校五年级有三个以上的平行班 各班的平均学习 成绩 智力水平及各种教学条件都基本相等 成绩 智力水平及各种教学条件都基本相等 研究者让 研究者让 A 班教师每天布置班教师每天布置 10 道作业题 道作业题 B 每天布置每天布置 3 道作业题 道作业题 C 班每天都不布置作业 学期结束时三个班进行统一的数学考试 班每天都不布置作业 学期结束时三个班进行统一的数学考试 这三个班学生的成绩如下 问作业量不同是否影响了数学成绩 这三个班学生的成绩如下 问作业量不同是否影响了数学成绩 第二节第二节 随机区组设计的方差分析随机区组设计的方差分析 用方差分析法对多个相关样本平均数差异所进行的显著性检验 称之为随机区组设计的方用方差分析法对多个相关样本平均数差异所进行的显著性检验 称之为随机区组设计的方 差分析 差分析 每一区组内被试的人数分配有以下三种方式 每一区组内被试的人数分配有以下三种方式 3 区组内以一个团体为一个基本单元 在被试的安排上也有两种方式 一种是从每个区 区组内以一个团体为一个基本单元 在被试的安排上也有两种方式 一种是从每个区 组中只抽取一个团体 这个团体接受所有的处理 另一种是从每个区组中抽取的团体数是组中只抽取一个团体 这个团体接受所有的处理 另一种是从每个区组中抽取的团体数是 实验处理数的整数倍 将这些团体分成若干等份 每一部分被试接受一种实验处理 实验处理数的整数倍 将这些团体分成若干等份 每一部分被试接受一种实验处理 例如 将某市的学校分成五个区组 全国重点 市重点 区重点 一般学校和较差的学校 例如 将某市的学校分成五个区组 全国重点 市重点 区重点 一般学校和较差的学校 从这五个区组中分别抽取从这五个区组中分别抽取 4 所学校 实验中安排了所学校 实验中安排了 A B C D 四种处理 这样每个区组四种处理 这样每个区组 各有一所学校接受一种处理 各有一所学校接受一种处理 第九章 卡方检验 第一节第一节 2及其分布及其分布 一 卡方检验的特点一 卡方检验的特点 卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所 作的假设检验 即根据样本的频数分布来推断总体的分布 它属于非参数检验 作的假设检验 即根据样本的频数分布来推断总体的分布 它属于非参数检验 参数检验是在总体分布形式已知的情况下 对总体分布的参数如均值 方差等进行推断的参数检验是在总体分布形式已知的情况下 对总体分布的参数如均值 方差等进行推断的 方法 但是 在数据分析过程中 由于种种原因 人们往往无法对总体分布形态作简单假方法 但是 在数据分析过程中 由于种种原因 人们往往无法对总体分布形态作简单假 定 此时参数检验的方法就不再适用了 非参数检验正是一类基于这种考虑 在总体方差定 此时参数检验的方法就不再适用了 非参数检验正是一类基于这种考虑 在总体方差 未知或知道甚少的情况下 利用样本数据对总体分布形态等进行推断的方法 由于非参数未知或知道甚少的情况下 利用样本数据对总体分布形态等进行推断的方法 由于非参数 检验方法在推断过程中不涉及有关总体分布的参数 因而得名
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年博尔塔拉蒙古自治州辅警协警招聘考试真题附答案详解(能力提升)
- 2024年商洛辅警协警招聘考试真题及答案详解(名师系列)
- 2024年临沂辅警招聘考试题库完整参考答案详解
- 2023年白山辅警招聘考试题库及1套参考答案详解
- 2024年信阳辅警招聘考试题库含答案详解(综合题)
- 2024年临夏州辅警招聘考试真题及答案详解(全优)
- 2023年黄石辅警协警招聘考试备考题库及答案详解一套
- 2024年娄底辅警协警招聘考试备考题库含答案详解(综合卷)
- 2023年辽阳辅警协警招聘考试备考题库附答案详解(模拟题)
- 2024年北海辅警招聘考试题库及答案详解1套
- 2025年智能配电系统行业分析报告及未来发展趋势预测
- DB37∕T 4383-2021 混凝土结构硅烷浸渍技术规程
- 2025年甘肃省冶金高级技术学院招聘事业编制工作人员15人笔试考试参考题库及答案解析
- 数据全周期管理制度
- 老年医学科老年骨折的康复训练计划
- 政治隐喻分析-洞察与解读
- 项目施工人员岗前培训与考核方案
- 2025秋人教版数学二年级教学设计第二单元 和复习 教学设计 人教版(新教材)数学二年级上册
- 仪器期间核查培训课件
- 2025河南省农副产品销售合同
- 车辆动态监控人员培训课件
评论
0/150
提交评论