




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章抽样分布与参数估计 1 第四章抽样分布与参数估计 主讲人 任杰 第四章抽样分布与参数估计 2 一 抽样与抽样分布 回顾 总体 个体 样本 研究对象的全体 组成总体的每一个元素 从总体中抽取的有代表性的个体 第四章抽样分布与参数估计 3 一 抽样与抽样分布 一 抽样 sampling 1 定义 即按一定方法从总体中抽取一部分有代表性的个体作为研究的样本 2 抽样的原则 随机性 随机性原则 抽样时 总体中每一个个体的被取与否 并不是由研究者主观决定的 而是每一个个体按照概率原理被抽取的可能性是相等的 3 目的 所抽样本的代表性要好 第四章抽样分布与参数估计 4 4 方法 1 简单随机抽样 Simplerandomsampling 把所要研究的总体按顺序编号 然后从中抽取一定量的样本的方法 在这种抽样中 每一个个体被抽到的机会是均等的 且任一元素被抽到的机会也是独立的 方法 抽签法 随机数字法思考 这种方法有没有缺陷 第四章抽样分布与参数估计 5 2 等距随机抽样 Intervalrandomsampling 把总体编号之后 按照一定的间隔来抽取个体组成样本 间隔 k 确定的依据 总体的大小 N 及样本所需的容量 n k n N 思考 优缺点是什么 第四章抽样分布与参数估计 6 3 分层随机抽样 Stratifiedrandomsampling 按照总体已有的某些特征 将总体分成几个不同的部分 层 再分别在每一部分中随机抽样 原则 层间变异要尽可能大 层内变异要尽可能小 思考 为什么要定这样的原则 第四章抽样分布与参数估计 7 思考 想要对广州市小学生的学习能力进行研究 如何抽样 P104 第四章抽样分布与参数估计 8 二 抽样分布 1 定义 样本统计量的概率分布叫抽样分布 样本平均数的概率分布叫平均数抽样分布 样本方差或标准差的概率分布叫方差抽样分布或标准差抽样分布 两样本相关系数的概率分布叫相关系数的抽样分布 第四章抽样分布与参数估计 9 说明 一个总体可用随机变量X表示 从这个总体中抽取容量一定的样本 构成样本的每一个个体xi从理论上讲是具有和总体X相同分布的随机变量 则样本统计量也是一个随机变量 这个随机变量的概率分布叫抽样分布 第四章抽样分布与参数估计 10 1 2分布 1 定义 2分布主要用来描述服从标准正态分布的随机变量的平方和的抽样分布 即有变量X N 0 1 设x1 x2 x3 xn为X的一个样本 则是服从自由度为n的 2分布 第四章抽样分布与参数估计 11 2 2分布函数 第四章抽样分布与参数估计 12 3 2值的计算 第四章抽样分布与参数估计 13 或 3 2值的计算 第四章抽样分布与参数估计 14 2 自由度的确定 自由度 df degreeoffreedom 在对总体参数进行估计时 作为估计依据的变量值可以自由变化的个数 或者说是相互独立的随机变量的个数 确定 常用样本容量减去参数估计时所运用的样本统计量的个数作为自由度 第四章抽样分布与参数估计 15 4 2分布的特点 2分布是连续型分布 但有些离散型数据的分布也近似 2分布 2分布是一个正偏态分布 曲线形状随自由度而改变 2值都是正值 2分布具有可加性 其和也是 2分布 2分布的平均数与方差 第四章抽样分布与参数估计 16 5 2分布的密度曲线 第四章抽样分布与参数估计 17 6 2表的应用 说明 2分布曲线下的面积为1 已知自由度和 2值 可以知道表中该 2值以上的概率 2表中的P值 也可以知道该 2值以下的概率 根据概率值可以求某概率的临界值 第四章抽样分布与参数估计 18 练习 df 30时 P 13 8 P 43 8 P 50 9 df 10时 若P 20 95 则 20 若P 20 05 则 20 若P 21 2 2 2 95 则 2 2 21 2 P108 第四章抽样分布与参数估计 19 2 t分布 1 分布函数t分布是统计学家Gosset 1908 以笔名 Student 发表的一篇论文中推导的关于随机变量函数的一种分布 设X N 0 1 Y 2 n 且X与Y相互独立 则随机变量服从于自由度为n的t分布 记作 第四章抽样分布与参数估计 20 3 t分布的特点 t分布是一簇分布 t分布是以平均值0为中点的单峰对称分布 t分布的左侧t值为负 右侧t值为正 t的取值在 之间 t分布的形状由自由度df决定当样本容量趋于无穷大时 t分布为正态分布 样本容量大于30时 接近正态分布 第四章抽样分布与参数估计 21 5 t分布表的应用 t分布表中概率的含义 在某一自由度 df 下大于某一t值的概率 此t值称为临界值 将此概率记作 当将 置于分布的一侧时 称为单侧概率 记作t df 当将 置于分布的两侧时 称为双侧概率 记作t 2 df 第四章抽样分布与参数估计 22 5 t分布表的应用 查t分布表根据自由度和t值确定概率 根据自由度和概率确定t值 第四章抽样分布与参数估计 23 若有t t n 则 1 n 25 P t 2 060 P t 2 060 P tt0 05 t0 P t t0 05 t0 3 n 35 P t t0 025 t0 第四章抽样分布与参数估计 24 第四章抽样分布与参数估计 25 思考 P111 第四章抽样分布与参数估计 26 3 F分布 1 定义 从两个正态分布总体中各抽出容量为n1和n2的样本 其 2值除以各自自由度的比值之比 称为F比率 F比率的概率分布叫F分布 第四章抽样分布与参数估计 27 2 公式 第四章抽样分布与参数估计 28 当 1 2时 F值为 这时 F分布可以看作从一个正态分布的总体中 随机抽取容量分别为n1和n2的两个样本方差之比的分布 记作 F F n1 1 n2 1 这样就可以对两个方差的关系进行分析了 第四章抽样分布与参数估计 29 3 F分布的特点 F分布是正偏态分布 其曲线形状随分子和分母不同的自由度而改变 F值都是正值 若与某一显著性水平 对应的F临界值记作 第四章抽样分布与参数估计 30 4 F分布密度曲线 第四章抽样分布与参数估计 31 F分布密度函数 第四章抽样分布与参数估计 32 关于F分布的定理 若F F n1 n2 则1 F F n2 n1 F1 n1 n2 1 F n2 n1 第四章抽样分布与参数估计 33 第四章抽样分布与参数估计 34 5 F分布表的应用 表中所列为在某自由度下 两种显著性水平的临界值 分单侧概率和双侧概率 第四章抽样分布与参数估计 35 若df1 10 df2 20 P F F0 05 2 F0 P FF0 05 F0 P F2 20 2 P F 2 82 2 P F 1 93 P F 2 55 第四章抽样分布与参数估计 36 二 总体参数的估计 一 定义总体参数估计 用样本统计量对样本代表的总体参数进行估计 二 类型1 点估计2 区间估计 第四章抽样分布与参数估计 37 一 点估计 1 定义 用某一样本统计量的值来估计相应总体参数的值 叫点估计 如 用样本的平均数估计总体的平均数 用样本的方差估计总体的方差 用样本之间的相关系数 估计总体之间的相关系数 等等 第四章抽样分布与参数估计 38 2 良好点估计量的特性 无偏性 如果一切可能个样本统计量的值与总体参数的值的偏差的平均值为0 则该估计量就具备无偏性 有效性 即对总体参数值进行估计的样本统计量的方差越小 该估计量的有效性最好 一致性 当样本容量无限增大时 估计值应能越来越接近它所估计的总体参数值 第四章抽样分布与参数估计 39 样本平均数作为总体平均数点估计值具有无偏 有效 一致的特点 是一个很好的估计值 证明见P118 样本方差作为总体方差的估计值并不是无偏的 而才是一个无偏估计量 用样本方差估计总体方差需要进行校正 校正系数为 第四章抽样分布与参数估计 40 第四章抽样分布与参数估计 41 练习 从某学院心理学公共课考试试卷中随机抽取了10名考生的试卷 记下其成绩分别为 82 66 60 73 89 88 70 65 80 93 试估计该学院心理学课程的平均成绩和分散程度 76 6 9 8 第四章抽样分布与参数估计 42 思考 点估计存在什么不足 第四章抽样分布与参数估计 43 二 区间估计 1 基本概念1 定义 并不具体指出总体参数的值是什么 而是指出总体参数值可能落入的范围 及其落入该范围的概率的大小 2 原理 根据抽样分布理论 用样本统计量分布的标准误计算区间的长度 用样本统计量的分布解释总体参数落入某一区间的可能的概率 第四章抽样分布与参数估计 44 说明一 抽样分布是指样本统计量的概率分布 以样本平均数分布为例 若有X N 2 设x1 x2 x3 xn为X的一个样本 则样本平均数的抽样分布服从 第四章抽样分布与参数估计 45 说明二 对该样本的平均数来说有 即该样本的平均数有95 的可能落入 平均数抽样分布 总体平均数上下1 96个标准差范围内 第四章抽样分布与参数估计 46 说明三 将上式加以转换 则有 即当总体平均数未知时 用样本平均数估计总体平均数落入的区间为 这时总体平均数落入该区间的可靠性为 犯错误的概率为 第四章抽样分布与参数估计 47 3 置信区间 置信度和显著性水平 置信区间 又叫置信限 即总体参数所在的区间的长度 反映了估计的精确性 显著性水平 估计总体参数落入某一区间时 可能犯错误的概率 常用 表示 置信度 1 第四章抽样分布与参数估计 48 思考 在我们对总体参数进行估计时 总是希望置信区间越小越好 小才精确 置信度越高越好 即犯错误的可能性低 二者可以同时做到吗 当置信度或者说显著性水平一定时 我们如何缩短总体参数的值的范围 第四章抽样分布与参数估计 49 2 总体平均数的区间估计 第一种情况 总体方差已知此时若总体呈正态分布 或者总体是非正态分布但样本容量大于30 则样本平均数的分布也为正态分布 其统计量与总体的关系如下 第四章抽样分布与参数估计 50 第四章抽样分布与参数估计 51 则某个抽样样本平均数在平均数抽样分布中的相对位置 第四章抽样分布与参数估计 52 总体平均数的置信区间就可用标准正态分布来估计 则当置信度为1 时 总体平均数的置信区间为 第四章抽样分布与参数估计 53 练习 1 若某校学生英语四级考试成绩的平均数为65 标准差为20 若从该校抽取容量为36的样本 则样本平均数抽样分布的平均数与标准差分别是多少 2 若已知某校英语四级考试容量为36的样本平均数 则该校学生英语四级考试的总平均成绩和标准差是多少 第四章抽样分布与参数估计 54 练习 3 某校历年来初一学生的思维能力的标准差为7 现从今年初一学生中随机抽取了36名学生 其思维能力的平均值为85分 标准差为8 计算该校初一学生平均思维能力的 95置信区间 4 如果又抽取了100名学生 计算其平均值为84 标准差为7 5 则总体平均数的 95置信区间又是多少 这两个区间有什么不同 为什么 第四章抽样分布与参数估计 55 2 总体平均数的区间估计 第二种情况 总体方差未知当总体方差未知时 样本平均数分布的统计量就不能直接按前面的方式进行计算 而是要用样本的方差来估计总体的方差 再进行计算 这时样本平均数的分布为t分布 第四章抽样分布与参数估计 56 第四章抽样分布与参数估计 57 第四章抽样分布与参数估计 58 则总体平均数的置信区间为 第四章抽样分布与参数估计 59 练习 在上面练习中 若总体标准差未知 事实上也常常如此 如何根据两个抽样样本估计总体平均数的 95置信区间 第四章抽样分布与参数估计 60 3 标准差与方差的估计 1 标准差的区间估计 选讲 大样本标准差抽样分布为近似的正态分布 各统计量为 第四章抽样分布与参数估计 61 当总体方差未知时 用样本方差作为估计值 则标准差抽样分布的标准误为 第四章抽样分布与参数估计 62 则总体标准差的置信区间为 第四章抽样分布与参数估计 63 练习 已知某样本的分散程度为S 10 样本容量为40 那么该样本的总体的分散程度如何 第四章抽样分布与参数估计 64 2 总体方差的区间估计 选讲 样本方差与总体方差之比的抽样分布符合 分布 估计公式为 第四章抽样分布与参数估计 65 方差置信区间示意图 第四章抽样分布与参数估计 66 应用 因为标准差的估计受到样本容量的限制 而方差估计是用 分布进行估计的 不受样本容量的限制 所以常常先估计方差 再根据方差与标准差的关系 计算标准差相当于方差置信水平的置信区间 第四章抽样分布与参数估计 67 练习 如果样本的容量为15 样本标准差为10 则样本之总体的方差的 95置信区间是多少 标准差呢 第四章抽样分布与参数估计 68 3 两总体方差之比的区间估计 第四章抽样分布与参数估计 69 第四章抽样分布与参数估计 70 当两总体方差相等时 即两样本来自同一总体时 两样本方差为F分布 且比值将在1的上下波动 其比值区间为 这样 就可以对二总体方差是否相等进行估计了 第四章抽样分布与参数估计 71 练习 已知某校31名男生和41名女生四级考试平均成绩分别为65分和68分 标准差分别为22分和20分 求男女生成绩总体方差之比的 95置信区间 第四章抽样分布与参数估计 72 4 相关系数的抽样分布 选讲 从两总体中抽取多对容量为n的相关样本 计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃林业职业技术学院《证券投资模拟》2023-2024学年第二学期期末试卷
- 西藏大学《文档数据库》2023-2024学年第二学期期末试卷
- 河北工程大学科信学院《变频器原理及应用》2023-2024学年第二学期期末试卷
- 温州职业技术学院《电竞赛事运营》2023-2024学年第二学期期末试卷
- 安康学院《小学生品德发展与道德教育》2023-2024学年第二学期期末试卷
- 湖南大众传媒职业技术学院《嵌入式系统原理及应用》2023-2024学年第二学期期末试卷
- 天津滨海职业学院《手球》2023-2024学年第二学期期末试卷
- 镇江市高等专科学校《机制设计理论及应用》2023-2024学年第二学期期末试卷
- 广西蓝天航空职业学院《传播与策划》2023-2024学年第二学期期末试卷
- 济宁医学院《大气科学概论》2023-2024学年第二学期期末试卷
- T-CSDA 0005-2024 三维桥架保温隔声复合模块建筑地面工程应用技术标准
- 【历史】辽宋夏金元时期的科技与文化教案-2024-2025学年统编版七年级历史下册
- 2024年盾构操作工职业技能竞赛理论考试题库(含答案)
- 术前月经来潮的应急预案
- CDN加速服务合同(2024年版)
- 韩愈课件身世经历
- 《中国的民主政治》课件
- 部队安全保密教育课件
- 2024年10月自考00152组织行为学试题及答案
- 心血管内科降低患者桡动脉止血器压迫不适发生率品管圈PDCA成果汇报书
- 《研学旅行课程设计》研学旅行课程案例展示 题库
评论
0/150
提交评论