




已阅读5页,还剩61页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章总体分布 样本分布与参数估计 4 1总体分布与样本分布 一 总体 母体 反映总体特征的随机变量的取值的全体 总体分布 母体分布 反映总体特征的随机变量的概率分布 从无限次随机抽取 然后放回 的角度看 表征一个总体特征的变量 指标 都可以视为随机变量 有限总体的概率分布 就是有限总体中不同个体的比率 频率 分布 二 随机样本与样本观测值 样本数据 1 随机样本表征n次抽取个体的随机抽样的一组随机变量X1 X2 Xn 2 样本观测值n次随机抽样的结果 x1 x2 xn 称为随机样本X1 X2 Xn的样本观测值 n称为随机样本向量 X1 X2 Xn 的维度 即自由度 3 样本 累积 分布函数设样本观测值x1 x2 xnki为小于xi 1的样本值出现的累积频次 n为样本容量 则可得样本累积频率分布函数如下 样本累积频率分布函数 又称样本 累积 分布函数 样本 累积 分布函数Fn x 是对总体的累积分布函数F x 的近似 n越大 Fn x 对F x 的近似越好 样本分布与总体分布 格利文科 Glivenko 定理 样本分布与总体分布的关系 定理 当样本容量n趋于无穷大时 Fn x 以概率1 关于x 均匀地收敛于F x 该定理是运用样本推断总体的理论依据 定理的数学表达为 随机样本的均值函数和方差函数都是一个随机变量 样本数据的样本均值x是随机变量X的观测值 样本数据的样本方差s2是随机变量S2的观测值 随机样本的均值函数 随机样本的方差函数 三 统计量与统计量的分布统计量定义 统计量是不含未知参数的 随机样本X1 X2 Xn的函数 统计量的值的定义 统计量的值是不含未知参数的 样本观测值x1 x2 xn的函数 四 由标准正态分布N 0 1 的随机样本所引出的几个重要统计量分布 2 t与F分布1 2 n 分布的构成设随机变量X服从N 0 1 分布 X1 X2 Xn为X样本 则 2 X2i X21 X22 X2n服从自由度为n的 2分布 记为 2 2 n 2 n 分布的均值E 2 n 方差D 2 2n n 1 n 4 n 10 2 n 分布图 2 n 密度函数 其中 n为自由度 n 2 为珈玛函数 是一个含参数n 2的积分 为 2 t分布自由度为n的t分布 记为t n 是由N 0 1 分布和 2 n 分布组成的 其表达式为 其中 X服从N 0 1 Y服从 2 n 分布 且X与Y相互独立 密度函数为 t分布图 3 F分布F分布是由两个 2分布之比组成的 服从F m n 其中 U服从 2 m V服从 2 n m 100 n 20 m 15 n 20 重要性质 密度函数形式为 五 由一般正态分布的随机样本所构成的若干重要统计量的分布定理 若X1 X2 Xn是正态总体N 2 的一个随机样本 则样本均值函数和样本方差函数 满足如下性质 1 X服从N 2 n 分布 2 X与S2相互独立 3 服从N 0 1 分布 4 服从 2 n 1 分布 5 服从t n 1 分布 1 服从N 0 1 6 服从 2 n 分布 定理 若X1 X2 Xn1和Y1 Y2 Yn2分别是正态总体N 1 12 和N 2 22 的一个随机样本 且它们相互独立 则满足如下性质 3 服从F n1 1 n2 1 其中 S12是容量为n1的X的样本方差 S22是容量为n2的Y的样本方差 2 服从t n1 n2 2 1 2 4 服从F n1 n2 六 任意分布的随机样本均值函数的均值与方差设 随机变量X服从任何均值为 标准差为 的分布 X是随机样本X1 X2 Xn的均值函数 记随机变量X的分布函数的均值为 X 标准差为 X 则有如下结论成立 X 2 X n或 2X 2 n 注 一个应用广泛的样本均值函数的均值和方差 0 1分布的样本均值函数均值和方差 反映总体中某类个体的比例的随机变量X 可以简单地用0 1分布B 1 p 表示 E X p D X p 1 p p是总体中某类个体的比例 由样本X1 X2 Xn产生均值函数X的均值 X p 方差的均值也是总体中某类个体的比例p 所以 常用x来估计p 七 大样本均值函数的分布 中心极限定理设 随机变量X服从任何均值为 标准差为 的分布 X是随机样本X1 X2 Xn的均值函数 中心极限定理 当n充分大时 X近似地服从均值为 标准差为 n的正态分布 在实际问题中n多大 但一般n 30 对于一个学生而言 来参加家长会的家长人数是一个随机变量 设一个学生无家长 1名家长 2名家长来参加会议的概率分别为0 05 0 8 0 15 若学校共有400名学生 设各学生参加会议的家长数相互独立 且服从同一分布 1 求参加会议的家长数X超过450的概率 2 求有1名家长来参加会议的学生数不多于340的概率 解 中心极限定理例题解析 根据中心极限定理 中心极限定理可得 对比总体参数和样本统计量 4 2点估计在实际问题中 人们常常判断总体分布的参数 这就需要用样本来推断总体分布的这些参数 这就是参数估计 参数估计分为 点估计和区间估计两种方法 1 点估计概念设 是总体分布中一个需要估计的参数 现从总体中抽取一个随机样本X1 X2 Xn 记估计 的统计量为 则称为 的估计量 若得到一组样本观测值x1 x2 xn 就可得出 的估计值 记 注 在选取样本统计量作为点估计时 必须考虑到 无偏差性 这一点很重要 如果样本统计量的期望值 或均值 与打算估计的总体参数值相同 则估计值不存在偏差 总体分布参数 的点估计 就是求出 的估计值 对比总体参数和样本统计量 点估计 2 矩法估计就是用样本矩来估计总体矩 矩的一般形式 E Xk 表示k阶原点矩 以原点为中心 E X k表示k阶中心矩 以 为中心 3 极大似然估计法设 总体X的 累积 概率分布函数为F x 概率密度函数f x 其中 为未知参数 也可以表示未知参数向量 若X为离散型随机变量 则由离散型与连续型的对应关系 f x 对应于离散情况下的概率P X x X为连续型随机变量时 X的随机样本X1 X2 Xn的联合概率密度函数为 称为 的极大似然估计函数 当X为离散随机变量时 L表示概率 L关于 的极大值如果存在 极大值就是 的极大似然估计值 其含义是 一组观测值x1 x2 xn在一次实验中出现了 其联合概率就应当是最大的 所以选择使联合密度L最大的那个 例 设x1 x2 xn是正态总体N 2 的一个样本观测值 求 与 2的极大似然估计值 解 极大似然函数为 取对数 分别对 与 2求偏导 并令偏导为0 可求出 与 2的极大似然估计值如下 如果将上述xi换成Xi 上式成为极大似然估计量 例 设X服从区间 a b 上的均匀分布 a b是求知参数 x1 x2 xn 是来自总体X的样本 求a b的矩估计量解 X的密度函数 4 3判别点估计的优劣标准 1 无偏估计量 如果 则称为 的无偏估计量 2 最小方差性若总体参数为 的估计量的方差Var 小于等于其他所有对 的估计量的方差 即则称 的估计量具有最小方差性 3 有效估计量如果一个估计量满足 1 无偏性 2 最小方差性 那么 该估计量为有效估计量 4 渐近无偏估计量如果 n为样本容量 则称为渐近无偏估计量 5 一致估计量如果满足 则称为 的一致估计量 一致估计量的另一等价定义 1 渐进无偏的 2 9 渐进有效性如果一个估计量满足 1 是一致估计量 2 比其它的估计量更小的渐进方差 注 在实践中广泛应用的准则 1 小样本准则a 无偏性 b 有效性 2 大样本准则一致估计量 渐进方差定义 例 设 x1 x2 xn 是来自具有有限数学期望的任一总体X的一个样本 记E X a 证明 是a的无偏估计 4 4区间估计 1 置信区间若总体分布含有一个未知参数 找出了2个依赖于样本X1 X2 Xn的估计量 使 其中 0 1 一般取0 05或0 01 则称随机区间为 的100 1 的置信区间 百分数100 1 称为置信度 2 总体均值的置信区间 总体方差已知 设 总体X服从已知N 2 2已知 抽取n个观 测值x1 x2 xn 求总体均值 的100 1 如 95 的置信区间 首先构造 因为X服从N 2 n 分布 所以Z服从N 0 1 分布 由 得置信区间 Z 2 Z1 2 1 2 2 例 设 总体X服从已知N 0 09 抽取4个观测值x1 x2 x3 x4 求总体均值 的95 的置信区间 解 由已知 1 0 95 0 3 n 4根据 得到 查表得z0 025 1 96 于是置信区间为 X 0 294 X 0 294 置信度为95 也就是说 总体均值 以95 的概率在该区间内 3 总体均值的置信区间 总体方差未知 设 总体X服从已知N 2 2未知 抽取n个观测值x1 x2 xn 求总体均值 的100 1 95 的置信区间 首先构造 可得置信区间 由 将n个观测值x1 x2 xn代入上式得到置信区间 4 总体方差的置信区间 未知总体均值 设 总体X服从已知N 2 未知 抽取n个观测值x1 x2 xn 求总体方差 2的100 1 95 的置信区间 首先构造 得到置信区间 由 将n个观测值x1 x2 xn代入上式得到置信区间 5 总体比例的置信区间Letpdenotetheobservedproportionof successes inarandomsampleofnobservationsfromapopulationwithaproportion ofsuccesses Then ifnislargeenoughthat n 1 9 thena100 1 confidenceintervalforthepopulationproportionisgivenby orequivalently wherethemarginoferror thesamplingerror orbound B isgivenbyandZ 2 isthenumberforwhichastandardnormalvariableZsatisfies 总体方差的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表7所示 已知产品重量的分布服从正态分布 以95 的置信水平建立该种食品重量方差的置信区间 总体方差的区间估计 例题分析 解 已知n 25 1 95 根据样本数据计算得s2 93 21 2置信度为95 的置信区间为 该企业生产的食品总体重量标准差的的置信区间为7 54克 13 43克 总体均值的区间估计 例题分析 例 已知某种灯泡的寿命服从正态分布 现从一批灯泡中随机抽取16只 测得其使用寿命 小时 如下 建立该批灯泡平均使用寿命95 的置信区间 总体均值的区间估计 例题分析 解 已知 N 2 n 16 1 95 t 2 2 131 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该种灯泡平均使用寿命的置信区间为1476 8小时 1503 2小时 对比总体参数和样本统计量 区间估计 总体参数值很可能落在区间估计所包括的数值范围内 使我们知道被估计值可能产生多大的误差边际 给出估计的信赖程度 或置信度 对比总体参数和样本统计量 定义 与区间估计相联系的信赖程度 常常用 1 100 来表示 置信水平 置信区间 指某一指定置信水平下的区间估计 该区间包括了总体参数的真值 置信水平高 置信区间就宽 对比总体参数和样本统计量 对比总体参数和样本统计量 x 2 对比总体参数和样本统计量 解释95 的置信区间表达了什么含义 95 的置信水平意味着 如果从总体中随机抽取容量为n的所有可能样本 并相应计算这些样本的置信区间 则在计算之后有95 的区间将包括总体参数的真值 总体均值的置信区间 已知 1 无论样本容量为多少 原有总体服从正态分布 或者 2 原有总体不服从正态分布 但样本容量n 30 服从均值 标准差为的正态分布 而且 总体均值的置信区间 已知 1 100 水平下的置信区间 即 因此 总体均值的置信区间 已知 举例 根据以前获得的经验 我们知道某台机器在生产训练用的钢管时 其直径的标准差为0 135厘米 如果从中抽取30根管子作为一个简单随机样本 则这些管子的平均直径为3 6厘米 请问在95 的置信水平下 这些管子的平均直径的置信区间是多少 根据中心极限定理 近似服从正态分布 总体均值的置信区间 已知 在95 水平下的置信区间是 而且 3 6 1 96 0 02465 3 55 3 65 在95 的置信水平下 由这台机器生产的训练用管子 其平均直径应当在3 55厘米至3 65厘米范围之内 如果总体的 未知 则的抽样分布服从自由度为n 1的t分布 即 如果样本容量足够大 我们可以用正态分布而不是t分布 总体均值的置信区间 未知 总体均值的置信区间 未知 如果是大样本 n 30 则在 1 100 水平下 的置信区间是 如果是小样本 n 30 并且原有总体近似服从正态分布 则在 1 100 水平下 的置信区间是 总体均值的置信区间 未知 一家邮购公司在圣诞节前的一周内会接听大量的订购电话 过去经验表明 由于工作人员每天可能要接听几千个电话 因此为了及时处理打入的电话数量 有必要增加销售人员人数 为此 这家公司记录了75 的员工在每8小时之内接听电话的数量 结果发现他们平均要接听89 6个电话 而且标准差为17 32 请问在90 的置信水平下 被接听电话的平均数量的置信区间是多少 举例 总体均值的置信区间 未知 s 17 32 n 75 大样本 的抽样分布近似服从以下参数的正态分布 在90 水平下 的置信区间 而且 89 6 1 645 2 86 31 92 89 总体均值的置信区间 未知 举例 一家会计公司想要设立一项时间标准 以便其工作人员能及时完成某类审计工作 它抽取了18名初级审计员作为一个样本并记录了他们的审计时间 结果发现这些人员的平均审计时间为3 2个小时 标准差为1 6个小时 请问在95 的置信水平下 当完成某类审计工作时其平均审计时间的置信区间是多少 总体均值的置信区间 未知 s 1 6 n 18 小样本 的抽样分布服从自由度为17的t分布 在95 水平下 的置信区间 而且 3 2 2 11 0 377 2 404 3 996 总体均值的置信区间 样本容量 在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 早教色彩画画课件
- 汉语四声八调的发音规则与运用技巧:汉语语音知识教学教案
- 早产儿知识培训总结
- 2025年三支一扶考试公共基础知识详解试卷
- 强基联盟数学试卷
- 全国竞赛物理数学试卷
- 去年江西中考数学试卷
- 2024年保定市博物馆招聘笔试真题
- 南阳市批改初中数学试卷
- 庆元教师招聘数学试卷
- GB/T 26520-2011工业氯化钙
- GB/T 18983-2017淬火-回火弹簧钢丝
- GB/T 15972.1-1998光纤总规范第1部分:总则
- GB/T 14691-1993技术制图字体
- 《夯实法治基石》设计 省赛一等奖
- 食材配送服务及应急保障方案
- 常见婚姻家庭纠纷及调解技巧课件
- 中国老年人功能性消化不良诊治共识解读专家版
- 2023年8月17日云南省临沧市遴选公务员笔试真题及解析
- 飞机火灾教案课件
- ISO37000-2021组织治理-指南(雷泽佳译2022)
评论
0/150
提交评论