




已阅读5页,还剩137页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育测量与评价2011 02 11 06 教材 华东师范大学王孝玲编著课时数 64 72课时 3 4学分 章节数 共十五章 三大部分描述统计 推断统计 抽样设计 教育统计学 huangrongliang 695013 两个理论基础 凡物的存在必有其数量 美国心理学家桑代克1875 1949 凡有数量的东西都可以测量 美国测量学者麦柯尔 复杂的因果关系 随机现象 在因果关系复杂的条件下无法根据已知的有限原因精确地预测结果因为即使在已知条件相同的情况下 每一次预测也都是有偏差的随机现象 学生成绩心理测验得分候车人数作物产量产品质量收入支出等等 随机现象 在一定的条件下 可能出现也可能不出现 可能这样出现 也可能那样出现的一类现象 特征 条件不能完全决定结果 研究内容 出现的可能性有多大 不出现的可能性有多大 或者这样出现的可能性有多大 那样出现的可能性有多大 数量差异性与数量规律性 数量差异性 一定条件下 出现可能不一样 数量规律性 通过大量试验和观察 总结出随机现象的规律 数量规律性 平均数 方差 标准差 比率 百分比 相关系数等 非数量规律性 数量分布 二 统计学和教育统计学 统计学就是研究随机现象的数量规律性的一门数学分支 1 统计学含义 Statistics原意是国力 国势 定义1 统计学是研究统计原理和方法的科学 P1 定义2 统计学是研究如何搜集 整理 分析反映事物总体信息的数字资料 并以此为依据 对总体特征进行推断的原理和方法 研究什么 对象 怎么做 干什么 目的 研究搜集 整理 分析数字资料推断 总体特征 原理和方法 部分推断全体 2 教育统计学的含义 教育统计学是运用数理统计的原理和方式研究教育问题的一门应用科学 它的主要任务是研究如何搜集 整理 分析由教育调查和教育实验所获得的数字资料 并以此为依据 进行科学推断 从而揭示蕴含在教育现象中的客观规律 教育与心理统计学 三 统计学与教育统计学的内容 数理统计学1 统计学教育统计学应用统计学农业统计学人口统计学 2 统计学或教育统计学具体内容 三 统计学与教育统计学的内容 统教计育学统或计学 描述统计 推断统计 实验设计 统计图表集中量数差异量数相关分析 统计估计假设检验 参数估计非参数估计 点估计区间估计 参数检验非参数检验 样本选择与分配实验误差分析因子分析 方差分析回归分析 抽样设计 三 统计学与教育统计学的内容 1 描述统计 descriptivestatistics 对已获得的数据进行整理 概括 显现其分布特征的统计方法 P2 主要是对样本数据的处理 2 推断统计 inferentialstatistics 根据样本所提供的信息 运用概率的理论进行分析 论证 在一定可靠程度上对总体分布特征进行估计 推测的统计方法 在一定风险下 部分推断全体 3 实验设计 experimentalstatistics 为提示实验中自变量与因变量的关系 在实验之前所制订的实验计划 1 确定现象2 随机现象 随机事件 随机变量 统计处理的变量都是随机变量 五 统计学中几个基本概念 3 个体 Case 总体 Population 与样本 Sample 总体 无限总体与有限总体 表示数目样本 大样本 n 30 与小样本 n 30 总体与样本是相对的 4 统计量 Statistic 与参数 Parameter 统计量 样本上的数字特征 参数 总体上的各种数字特征 总体 样本 统计量 描述统计 作出推断 随机抽样 描述 总体 样本与个体 一 统计数据 来源数据种类特性 统计分类 报表 二分法和四分法 变异性 规律性 1 按数据观测方法和来源 数据种类 数据的水平 二分法 2 按数学属性 百分制的分数理论上讲是间断的 但由于数据密度大较多 实际处理时归入连续型数据处理 连续型数据处理较方便 类似以后也有 总体比率用正态分布处理 间断型随机变量 取值个数有限的数据人数个数名次五分制得分 连续型随机变量 取值个数无限的数据身高体重智商时间长短百分制得分 问题 为什么要进行数据分类 数据有不同属性 可分 不同类型数据用不同统计方法处理 1 按数据观测方法和来源 点计数据 计数数据 与度量数据 测量数据 2 按数学属性 间断 离散 数据与连续数据 数据种类 数据的水平 四分法 3 按数据测量水平 称名数据等级 顺序 数据等距数据等比数据 比率数据 标题 表号 标目 线条 数字 表注 六部分 标题 图号 标目 图形 图注 五个方面 简单表 分组表 1个标志 复合表 2个及以上标志直条图 条形图 圆形图 线形图 频数分布图 多变量图 散点图 雷达图 脸谱图等 二 统计表 统计图 例1 小教本011 30名 教育统计学单元考试成绩58 61 88 74 81 66 70 93 72 91 66 99 89 98 90 98 90 64 93 89 100 91 92 97 90 94 99 92 92 90 频数分布表制作步骤 58 61 88 74 81 66 70 93 72 91 66 99 89 98 90 98 90 64 93 89 100 91 92 97 90 94 99 92 92 90 一般不少于5组 也不要超过15组 组距指的是每一个组内包含的距离 用i表示 斯特奇斯 H A Sturges 根据经验公式 本例为i 7 11 将组距调节为10 即每10分为一个组 组数 42 10 4 2 应该分5组 1 求全距R 全距指的是全部观察值中最大值与最小值之差 R xmax xmin 100 58 42 2 决定组数k和组距i K R i 频数分布表制作步骤 3 决定组限组限就是每一组的起点值和终点值 4 登记频数 小教本011教育统计学单元考试学生成绩频数 累积频数分布表 小教本011教育统计学单元考试学生成绩频数分布直方图 第三章常用的特征量 1 集中量 平均数 中位数 众数 百分位数2 差异量 全距 四分位距 平均差 方差和标准差 差异系数 百分位距 3 地位量 4 相关量 5 分布形态量 偏态量 峰态量 集中量 集中量是代表一组数据典型水平或集中趋势的量 它能反映频数分布中大量数据向某一点集中的情况 集中量包括算术平均数 加权平均数 几何平均数 调和平均数 中位数 众数等 算术平均数 算术平均数是所有观察值的总和除以总频数所得之商 简称为平均数或均数 样本平均数总体平均数 算术平均数的优点 反应灵敏 严密确定 简明易懂 计算方便 适合代数运算 受抽样变动的影响较小 样本算术平均数是总体平均数的最好估计值 算术平均数的缺点 易受两极端数值 极大或极小 的影响 一组数据中某个数值的大小不够确切时就无法计算其算术平均数 这种 两极端数值 存在的问题 可用什么办法解决 中位数 Md 中位数是位于依一定顺序排列的一组数据中央位置的数值 在这一数值上 下各有一半频数分布着 中位数的原始数值计算方法 单数 121415151718202324 17双数 12141515171820232425 17 5 中位数的应用及其优缺点 中位数虽然也具备一个良好的集中量所应具备的某些条件 例如比较严格确定 简明易懂 计算简便 受抽样变动影响较小 但是它不适合进一步的代数运算 它适用于以下几种情况 1 一组数据中有特大或特小两极端数值时 2 一组数据中有个别数据不确切时 3 资料属于等级性质时 众数 Mo 众数是集中量的一种指标 对众数有理论众数及粗略众数两种定义方法理论众数是指与频数分布曲线最高点相对应的横坐标上的一点 粗略众数是指一组数据中频数出现最多的那个数 众数的优缺点 众数虽然简明易懂 但是它并不具备一个良好的集中量的基本条件 它主要在以下情况下使用 当需要快速而粗略地找出一组数据的代表值时 当需要利用算术平均数 中位数和众数三者关系来粗略判断频数分布的形态时 利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时 正态 正偏态 负偏态 P34 加权平均数 加权平均数是不同比重数据 或平均数 的平均数 计算公式为 二 差异量 1 差异量 表示一组数据变异程度或离散程度的量 2 类型 全距 四分位距 平均差 方差和标准差 差异系数 百分位距 注 差异量越大表明数据越参差不齐 分布范围越广 二 差异量 1 全距 Range R xmax xmin 例110 50 58 61 63 69 71 71 71 78 81 83 86 86 88 99 16 3 百分位距PD P93 P7P90 P10 4 平均差 5 方差和标准差 2 四分位距QD Q3 Q1 2 99 10 89 二 差异量例110 50 58 61 63 69 71 71 71 78 81 83 86 86 88 99 5 方差和标准差 计算方法 1 原始数据法 2 计算工具法 3 其他 1 原始数据法 3 计算工具法 4 数学软件 spss等 2 频数分布表计算法 问题讨论 一组数据的标准差 大好呢 还是小好 二 差异量 6 相对差异量 差异系数 用途 1 比较不同单位资料的差异程度 单位不同 2 比较单位相同而平均数相差较大 对象不同 3 判断特殊差异情况 正常范围 5 CV 35 不正常 CV 35 平均数无意义CV 5 数值计算正确性 应用1 非零点 条件 2 等比量表 三 分布形态量偏态量与峰态量 1 偏态量 SK 0 分布对称SK 0 偏态 SK 0 正偏SK 0 负偏 2 峰态量 Ku 0 263 正态峰Ku 0 263 非正态 Ku 0 263 低阔峰Ku 0 263 高狭峰 偏态量 负偏 正偏 第五章概率及概率分布 概率的一般概念概率分布 离散分布与连续分布二项分布与正态分布正态曲线的面积与纵线正态分布在测量上的应用 5 1概率 probability 的一般概念一 概率的定义二 概率的性质 0 P A 1 P A 0 不可能事件 P A 1 必然事件 三 概率的加法和乘法 小概率事件A p A 0 05 小概率原理 小概率事件在一次试验中 几乎不可能发生 5 2二项分布 bionimaldistribution 二 二项分布函数 2 二项分布函数 在n次试验中成功事件P恰好出现x次的概率 例在男生占2 5的学校中随机抽取10个学生 问正好抽到4个男生的概率是多少 至多抽到2个男生的概率是多少 1 是否是二项试验 2 共试验次数 3 所求随机事件出现次数 例在男生占2 5的学校中随机抽取10个学生 问正好抽到4个男生的概率是多少 至多抽到2个男生的概率是多少 解 随机抽取一个学生即随机试验一次 因为试验结果只有两个 男生 与 女生 而且抽到男生与抽到女生是没有关系的 故此试验是贝努利试验 正好抽到4个男生的概率 至多抽到2个男生的概率是 二项分布 bionimaldistribution 5 2二项分布 bionimaldistribution 三 二项分布图 二项分布的形态 P q 对称 p q 偏态 1 当n 时 二项分布 正态分布 2 当np 5且nq 5时 二项分布开始接近正态分布 5 2二项分布 bionimaldistribution 四 二项分布的平均数和标准差 当二项分布开始接近正态分布时 在n次二项试验中成功事件出现的平均数和标准差是 例从我们班中随机抽取10名同学 从理论上讲 平均应抽到男生多少个 标准差是多少 五 二项分布的应用 1 求n次二项试验中成功事件出现的概率 2 判断试验结果的机遇性与真实性的界限 1的反向 正态分布的图形特点 正态分布的密度曲线是一条关于对称的钟形曲线 特点是 两头小 中间大 左右对称 即 取x 附近值的可能性大 取偏离x 越远的值的可能性越小 5 3正态分布 normaldistribution 二 正态曲线的面积与纵线 2 标准正态曲线下的面积及Z值计算 2 查表法 A 已知Z值求面积P a 求P 0 z z1 b 求P z z1 或P z z1 c 求P z1 z z2 例1 P 0 z 1 96 P 2 58 z 0 例2 P z 1 P z 1 96 P z 1 96 例3 P 1 z 2 P 1 z 2 P 1 96 z 1 96 例某班48人的数学考试成绩分布呈正态分布 其平均分为75分 标准差为10 问理论上说65至85分之间当有多少人 已知 n 48 求P 65 x 85 分析 由正态分布图 要求65至85之间的理论人数 即 解 1 查表得 P 1 Z 1 2P 0 Z 1 2 0 3413 0 6826 P 65 x 85 48 P 1 Z 1 48 0 6826 48 32 8 所以 只要知道这部分在全部48人中的份额 48 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用 1 将原始分数转换成标准分数Z值 2 确定录取的分数线 3 确定等级评定的人数 4 品质评定数量化 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用1 将原始分数转换成标准分数Z值 例1 2001年某市公务员选拔考试甲 乙二人成绩 0 22 1 12 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用 1 将原始分数转换成标准分数Z值 结论 Z甲 Z乙 标准分数体系 T KZ C T 10Z 50 例1 2001年某市公务员选拔考试甲 乙二人成绩 1 06 0 91 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用 1 将原始分数转换成标准分数Z值 例1 2001年某市公务员选拔考试甲 乙二人成绩 T 10Z 50 标准分数体系 T KZ C 60 6 59 1 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用 1 将原始分数转换成标准分数Z值 2 确定录取的分数线 例1某年高考平均分500 标准差100 考分呈正态分布 某考生得到650分 设当年高考录取率为10 问该生能否被录取 录取率10 X0 P Z Z0 0 1 P 0 Z Z0 0 4 Z0 1 28 X0 628 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用 1 将原始分数转换成标准分数Z值 2 确定录取的分数线 例2某项职业录取考试 在参加的1600人中准备录取200人 考试分数接近正态分布 去年同样考试的平均分数为74分 标准差为11 问今年录取分数会多少 求录取率p n N P Z Z0 p P 0 Z Z0 0 5 p Z0 已知录取人数 求最低录取分数 查表 5 3正态分布 normaldistribution 三 正态分布在测验记分方面的应用3 确定等级评定的人数 例2如果100个人的教育实习成绩呈正态分布 现将其分成优 良 中 合格 不合格五个等距的等级 问各等级应有相应的多少人 等距分点 已知等级数k 求各等级人数ni 确定相应界值Zi 求相应面积Pi 第六章抽样分布及总体平均数的推断 总体分布 抽样分布 样本分布样本平均数与总体平均数离差统计量的形态总体平均数的估计假设检验基本原理总体平均数显著性检验抽样分布 参数估计 假设检验 6 1抽样分布及有关性质 例2某市共有3600人大学生参加了全市大二学生的统一英语测试 现在随机抽取50人为样本 其平均分数为85分 标准差10分 试问该市平均分数为多少 平均数抽样分布 容量为50 一切可能个的样本平均数的频数 频率 分布 所有样本平均数的平均数 抽样分布的平均数 平均数 6 1抽样分布及有关性质 总体分布 总体内个体数值的频数分布 抽样分布 某一种统计量的概率分布 样本分布 样本内个体数值的频数分布 平均数抽样分布 标准差抽样分布 中位数抽样分布 抽样分布 6 1抽样分布及有关性质 1 分布概念及相关符号 总体分布 总体内个体数值的频数分布 抽样分布 某一种统计量的概率分布 样本分布 样本内个体数值的频数分布 平均数标准差 又称平均数标准误 反映了抽样误差的大小 平均数抽样分布标准差意义 6 1抽样分布及有关性质 1 分布概念及相关符号2 平均数抽样分布的几个定理 4 总体不是正态分布 如果样本容量较大 则反映总体和的样本平均数的抽样分布 也接近正态分布 又称平均数标准误 反映了抽样误差的大小 1 2 3 从正态总体中 随机抽取的容量为n的一切可能样本平均数的分布 平均数抽样分布 也呈正态分布 6 1抽样分布及有关性质 3 样本平均数与总体平均数离差统计量的形态 1 总体标准差已知 正态分布 Z分布 2 总体标准差未知 t分布 6 1抽样分布及有关性质 3 样本平均数与总体平均数离差统计量的形态 1 已知 Z分布 2 未知 t分布 t分布 t distribution 英国统计学家高赛特 W S Gossett 1908年以笔名 student 发表的一篇论文中推导的一种分布 因此也称为学生分布 6 2总体平均数的估计 例2某市共有3600人大学生参加了全市大二学生的统一英语测试 现在随机抽取50人为样本 其平均分数为85分 标准差10分 试问该市平均分数为多少 一 总体参数点估计 评价标准 1 无偏性2 有效性P873 一致性 二 总体参数区间估计 6 2总体平均数的估计 二 总体参数区间估计 一 总体标准差已知 Z估计 例2某种零件的长度服从正态分布 已知总体标准差 1 5厘米 从总体中抽取100个零件组成样本 测得它们的平均长度为10 00厘米 试估计在99 置信水平下 全部零件平均长度的置信区间 解 因为总体标准差 1 5已知 所以的分布服从正态分布 即可用Z估计 所以 所以 全部零件平均长度99 的可能在 9 61 10 39 范围内 10 0 39 1 已知 Z估计 2 未知 t估计 t分布 t distribution 英国统计学家高赛特 W S Gossett 1908年以笔名 student 发表的一篇论文中推导的一种分布 因此也称为学生分布 二 正态总体均值 的区间估计 二 正态总体均值 的区间估计 对于给定的置信度 1 及自由度 n 1 总体均值 的置信区间 一 总体标准差已知 Z估计 二 总体标准差未知 t估计 6 2总体平均数的估计 二 正态总体均值 的区间估计 一 总体标准差已知 Z估计 二 总体标准差未知 t估计 例3某市共有3600人大学生参加了全市大二学生的统一英语测试 现随机抽取50人为样本 其平均分数为85分 标准差10分 试求总体平均数的95 的置信区间 解 因为总体标准差 未知 所以的分布服从t分布 即可用t估计 所以 因为n 50 所以df n 1 49 查t表得 6 2总体平均数的估计 二 总体参数区间估计 一 总体标准差已知 Z估计 二 总体标准差未知 t分布 A 大样本n 30 B 小样本n 30 例 从某小学三年级随机抽取17名学生 其阅读能力的平均得分为29 92 标准差为4 1 试估计该校三年级阅读能力总体平均数95 和99 置信区间 问题 在1908年t分布理论提出前 怎样解决 未知的估计问题 6 2总体平均数的估计 二 正态总体均值 的区间估计 一 总体标准差已知 Z估计 二 总体标准差未知 t估计 总体平均数区间估计 一 正态总体标准差已知 Z估计三 正态总体标准差未知 t估计1 小样本2 大样本t估计或近似Z估计 6 3假设检验 本章节内容 假设检验的有关概念假设检验基本思路假设检验基本步骤及二类错误总体平均数假设检验 某总体平均水平有无显著变化 6 3假设检验 一 假设检验有关概念1 假设与假设检验2 小概率事件及小概率原理 3 假设检验基本思路4 假设检验的一般步骤 1 提出假设 2 选择检验统计量并计算其值 Z检验或t检验3 选择检验的形式 双侧检验或单侧检验4 规定显著性水平 5 统计决断 拒绝区域 6 3假设检验 例1某班进行比奈智力测验 结果 已知比奈测验的常模 问该班智力水平 不是这一次的测验结果 是否确实与常模水平有差异 n 100 1 提出假设 2 选择检验统计量并计算其值 因为总体标准差 已知 故采用Z检验 所以 3 选择检验的形式 因为没有资料表明 该班智力水平是否高于或低于常模水平 所以采用双侧检验 4 统计决断 因为Z 2 即该班智力水平与常模水平 有显著性差异 所以0 01 p 0 05 2 58 Z0 01 2 Z0 05 2 1 96 Z 2 所以在0 05显著性水平上接受H1 而拒绝H0 0 95 6 3假设检验 例P10417某市7岁男童体重平均数为21 61千克 标准差为2 21千克 某小学70名7岁男童体重平均数为22 9 问该校7岁男童体重与该市是否一样 1 提出假设 2 选择检验统计量并计算其值 因为总体标准差 2 21已知 故采用Z检验 所以 3 选择检验的形式 因为没有资料表明 该校7岁男童体重是否高于或低于全市7岁男童体重 所以采用双侧检验 4 统计决断 因为Z0 01 2 2 58 4 88 即该校7岁男童体重与全市7岁男童体重 有极其显著性差异 所以 p 0 01 所以在0 01显著性水平上接受H1 而拒绝H0 6 3假设检验 例2某区初三英语测验平均分数为80 该区某校25份试卷的平均分数和标准差分别为83和10 问该校初三英语平均分数与全区是否一样 1 提出假设 2 选择检验统计量并计算其值 因为总体标准差未知 故采用t检验 所以 3 选择检验的形式 因为没有资料表明 该校初三英语成绩是否高于或低于全区水平 所以用双侧检验 4 统计决断 因为n 25 所以df n 1 24 查t表得 因为t 1 470 05 所以接受H0 而拒绝H1 即该校初三英语平均成绩与全区水平没有显著差异 t 1 47 6 3假设检验 一 假设检验有关概念1 假设与假设检验2 小概率事件及小概率原理 3 假设检验基本思路4 假设检验的一般步骤 5 假设检验的二类错误 1 第一类错误 以真为假 弃真错误 2 第二类错误 以假为真 取伪错误 假设检验是概率条件下的反证法 在假设检验中 一般都首先控制第一类错误 6 3假设检验 二 平均数的显著性检验小结 1 提出假设 2 选择检验统计量并计算其值 Z检验或t检验3 选择检验的形式 双侧检验或单侧检验4 规定显著性水平 5 统计决断 正态总体 第七章平均数差异的显著性检验 1 需要考虑的问题 2 需要知道什么 3 共同点 显著性差异检验4 不同点 两个样本 需考虑的问题 两总体是否正态分布 两样本是否相关两总体方差 12和 22是否已知 如果未知 则是否 12 22 两样本为大样本还是小样本 平均数差异的抽样分布 一 正态总体相关样本r已知 平均数差异的抽样分布 一 正态总体相关样本r已知 1 提出假设 2 选择检验统计量并计算其值 Z检验或t检验或3 选择检验的形式 双侧检验或单侧检验4 规定显著性水平 5 统计决断 平均数差异显著性检验步骤 差异显著性检验的主要过程 1 确定两总体 样本 是否相关 2 根据问题要求 确定检验形式 双侧或单侧 3 看总体标准差是否已知 已知Z检验 4 独立且 未知 方差是否齐性 齐性t 不齐性t 5 看是大样本还是小样本 6 判断样本Z t或t 值是否落入小概率区域 7 若落入小概率区域 还需确定差异的显著性级别 7 2相关样本平均数差异的显著性检验 一 配对组的情况 等组实验 例1 为了揭示小学二年级的两种识字教学法是否有显著性差异 根据学生的智力水平 努力程度 识字量多少 家庭辅导力量等条件基本相同的原则 将学生配成10对 然后把每对学生随机地分入实验组和对照组 实验组施以分散识字法 而对照组施以集中识字法 后期统一测验如下表 79 5 71 3 459 1 提出假设 2 选择检验统计量并计算其值 因为相关样本且总体标准差未知 故采用t检验 所以 3 选择检验的形式 因为没有资料可以说明 两种教学方法哪一种效果好 所以采用双侧检验 79 5 71 和9 12 9 94r 0 704 样本均值和标准差 3 46 4 统计决断 因为n 10 所以df n 1 9 查t表得 因为t 3 46 3 25 t 9 0 01 2 所以p 0 01 所以在0 01显著性水平上接受H1 而拒绝H0 即这两种教学方法有极其显著性的差异 因为t 3 46 2 262 t 9 0 05 2 需进一步查t 9 0 01 2 平均数差异的抽样分布 二 正态总体独立样本 r 0 贝赫兰斯 费舍 Fisher 问题 直至1957年柯克兰与柯克斯解决方案最佳 7 4方差齐性检验 一 F分布 由例1 2可知 独立样本 总体标准差未知条件下 进行差异显著性检验 首先 首先要进行总体方差齐性检验 用总体标准差估计值S 总体标准差 未知下 怎样判断 即只要检验无显著性差异即可 F检验 英国统计学家费舍R A Fisher首创 第十章 2检验 10 1 2分布及 2检验 一 2检验的特点 2检验是根据样本频数分布 对总体分布进行推断的假设检验 2检验与测量数据假设检验的区别 测量数据假设检验 数据属性 总体分布 检验对象 2检验 连续型 间断型 正态分布 未知 总体参数 非总体参数 10 1 2分布及 2检验 一 2检验的特点 二 2检验的统计量 三 2的抽样分布 四 2检验应用 例1从某大学随机抽取54位老年教师 其中健康状况属于好的有15人 中等的有23人 差的有16人 问该校老年教师健康状况好 中 差的人数比率是否是1 2 1 解 1 提出假设 H0 健康状况好 中 差的人数比率是1 2 1H1 健康状况好 中 差的人数比率不是1 2 1 2 选择统计量并计算 实际频数 理论频数 ft1 54 1 4 13 5 ft2 54 2 4 27 ft3 54 1 4 13 5 根据零假设 1 22 3 统计决断 df k 1 2 查 2值表 2 1 22 P 0 05 根据 2检验统计决断规则 所以在0 05显著水平上保留零假设 拒绝备择假设 即该校老年教师的健康状况 好 中 差人数的比率是1 2 1 2检验能解决的问题 调查人们对于某社会现象的看法 结果如下 问三种态度人数有无显著差异 同质性检验 2检验能解决的问题 表中314名学生的考试成绩是否服从正态分布 数据正态性的检验 2检验能解决的问题 对3627名中小学生的心理测验得到如下结果 部分 问性格类型与智力水平之间有无关联 相关性 或独立性 检验 第二节单向表的 2检验 把实得的点计数据按一种分类标准编制成表就是单向表 单因素 二 一个自由度的 2检验 当df 1 其中只要有一个组的理论值ft 5 就要运用亚茨 Yates 连续性校正法 例 某区中学团员比例为0 8 现从该区某中学随机抽取20人 其中团员12人 问该校团员的比例与全区是否相同 答案 3 830 05 ft1 20 0 8 16 ft2 20 0 2 4 实际频数 理论频数 5 且df 2 1 1 团员 非团员 三 次数分布正态性的 2检验 P177 自由度为K 3 第三节双向表的 2检验 在双向表的 2检验中 如果要判断两种分类特征 即两个因素之间是否有依从关系 这种检验称为独立性 2检验 例1家庭经济情况属于上 中 下的高三毕业生 对于是否报考师范大学有三种不同态度 愿意 不愿意 未定 其人数如下表 问学生是否愿意报告师范大学与家庭经济情况是否有关系 解 1 提出假设 H0 学生是否愿意报考师范的态度与家庭经济状况无关系H1 学生是否愿意报考师范的态度与家庭经济状况有关系 例1家庭经济情况属于上 中 下的高三毕业生 对于是否报考师范大学有三种不同态度 愿意 不愿意 未定 其人数如下表 问学生是否愿意报告师范大学与家庭经济情况是否有关系 2 选择统计量并计算 i 1 2 3j 1 2 3 根据零假设及学生对报考师范大学的态度与家庭经济状况之间关系的双向表 可计算出相应理论频数 10 48 3 统计决断 df r 1 c 1 查 2值表 0 01 P 0 05 根据 2检验统计决断规则 所以在0 05显著水平上保留H1 拒绝H0 即学生是否愿意报考师范大学的态度与家庭经济状况有关系 3 1 3 1 4 r 3 c 3 第十一章相关分析 相关意义积差相关等级相关质与量的相关品质相关 相关关系 变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时 变量y的取值可能有几个各观测点分布在直线周围 相关的概念两个变量之间不精确 不稳定的变化关系称为相关关系 第一节相关的意义 相关的概念两个变量之间不精确 不稳定的变化关系称为相关关系 分类 正相关 负相关 零相关相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数 一般用r表示 1 r 1 相关系数 取值及其意义 r的取值范围是 1 1 1 r 1 r 1 为完全相关r 1 为完全正相关r 1 为完全负正相关r 0 不存在相关关系 1 r 0 为负相关0 r 1 为正相关 r 越趋于1表示关系越密切 r 越趋于0表示关系越不密切 相关及相关系数的几点说明 相关系数的值 仅仅是一个比值 不等距 也不是百分比 因此 不能直接作加 减 乘 除 r 0 2 r 0 4 r 0 8如果两个变量之间存在因果关系 则这种关系可以用相关关系体现出来 相关不等于因果 相关系数只能描述两个变量之间的变化方向及密切程度 并不能揭示二者之间的内在本质联系 样本 总体相关系数 correlationcoefficient 若相关系数是根据总体全部数据计算的 称为总体相关系数 记为 若是根据样本数据计算的 则称为样本相关系数 记为r 第十二章回归分析 主要内容 一元线性回归一元线性回归方程的检验一元线性回归方程的应用多元线性回归简介变量间的关系 相关系数 双向关系回归方程 单向关系 什么是回归分析 从一组样本数据出发 确定变量之间的数学关系式 利用所求的关系式 由一个变量 自变量 来预测或控制另一个特定变量的取值 并给出这种预测或控制的精确程度 一元线性回归模型 一元线性回归方程 回归线拟合的常用原则 就是使各点与该线纵向距离的平方和为最小 回归线 回归线拟合的常用原则 就是使各点与该线纵向距离的平方和为最小 回归方程 确定回归线的方程称回归方程 由x估计Y 由Y估计x 由Y估计X 估计方程的求法 例题分析 例2 根据第十一章例子的数据男青年前臂长y对身高x的线性回归方程 回归方程为 y 4 897 0 2348x 第十四章抽样设计 技术 统计的质量取决于数据的质量推断统计学各种方法运用的前提就是要先获得对总体有足够代表性的样本资料或实验数据 推断可靠性三因素 数据的质量 统计方法及数据处理的准确性 样本对总体的代表性 怎样抽 抽多少 第一节抽样调查与抽样方法 从总体中抽取部分个体组成样本 对该样本进行观察 进而推断未知总体情况 称为抽样调查 抽
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手指被鱼刺扎伤课件
- 大数据下的教育评价体系优化与应用研究-洞察及研究
- 微观结构调控与性能提升-洞察及研究
- 手拉手共进步课件
- 学生食堂安全操作培训课件
- 湖北省荆州市沙市中学2025-2026学年高一上学期9月月考地理试卷(含答案)
- 学生防火安全知识培训课件
- 印刷厂库存管理优化细则
- 走进农民工关注新生代实践报告书
- 天津滨海高新区政策文件汇编12
- 公路技术状况检测与评定-公路技术状况评定
- 正式员工正规劳动合同范本
- 四川省雅安市2022年中考语文试题
- 《肖申克的救赎》完整中英文对照剧本
- 人工搬运风险与控制培训课件
- 新能源材料与器件PPT完整全套教学课件
- 肺癌中医护理常规(整理)
- 住宅专项维修资金管理系统方案
- 新媒体时代人口老龄化问题下媒体适老化改造探析
- 医疗保险特药使用申请表
- 急性胃肠炎诊疗常规
评论
0/150
提交评论