已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
区间估计 1 区间估计 区间估计的概念 定义设 是总体的一个参数 其参数空间为 x1 x2 xn是来自该总体的样本 对给定的一个 0 1 若有两个统计量和 若对任意的 有则称为 的置信度为1 的置信区间 分别称为置信下限和置信上限 2 例设x1 x2 x10是来自N 2 的样本 则 的置信水平为1 的置信区间为其中 s分别为样本均值和样本标准差 这里用它来说明置信区间的含义 若取 0 10 则t0 95 9 1 8331 上式化为 3 现假定 15 2 4 则我们可以用随机模拟方法由N 15 4 产生一个容量为10的样本 如下即是这样一个样本 14 8513 0113 5014 9316 9713 8017 953313 3716 2912 38由该样本可以算得从而得到 的一个区间估计为该区间包含 的真值 15 现重复这样的方法100次 可以得到100个样本 也就得到100个区间 我们将这100个区间画在图6 5 1上 4 由图6 5 1可以看出 这100个区间中有91个包含参数真值15 另外9个不包含参数真值 图6 5 1 的置信水平为0 90的置信区间 5 取 0 50 我们也可以给出100个这样的区间 见图6 5 2 可以看出 这100个区间中有50个包含参数真值15 另外50个不包含参数真值 图6 5 2 的置信水平为0 50的置信区间 6 定义沿用定义1的记号 如对给定的 0 1 对任意的 有称为 的1 同等置信区间 同等置信区间是把给定的置信水平1 用足了 常在总体为连续分布场合下可以实现 7 定义若对给定的 0 1 和任意的 有 则称为 的置信水平为1 的 单侧 置信下限 假如等号对一切 成立 则称为 的1 同等置信下限 若对给定的 0 1 和任意的 有 则称为 的置信水平为1 的 单侧 置信上限 若等号对一切 成立 则称为1 同等置信上限 单侧置信限是置信区间的特殊情形 因此 寻求置信区间的方法可以用来寻找单侧置信限 8 枢轴量法 构造未知参数 的置信区间的最常用的方法是枢轴量法 其步骤可以概括为如下三步 1 设法构造一个样本和 的函数G G x1 x2 xn 使得G的分布不依赖于未知参数 一般称具有这种性质的G为枢轴量 2 适当地选择两个常数c d 使对给定的 0 1 有P c G d 1 3 假如能将c G d进行不等式等价变形化为则 是 的1 同等置信区间 9 关于置信区间的构造有两点说明 满足置信度要求的c与d通常不唯一 若有可能 应选平均长度达到最短的c与d 这在G的分布为对称分布场合通常容易实现 实际中 选平均长度尽可能短的c与d 这往往很难实现 因此 常这样选择c与d 使得两个尾部概率各为 2 即P Gd 2 这样的置信区间称为等尾置信区间 这是在G的分布为偏态分布场合常采用的方法 10 例设x1 x2 xn是来自均匀总体U 0 的一个样本 试对给定的 0 1 给出 的1 同等置信区间 解 1 取x n 作为枢轴量 其密度函数为p y nyn 0 y 1 2 x n 的分布函数为F y yn 0 y 1 故P c x n d dn cn 因此我们可以适当地选择c和d满足dn cn 1 11 3 利用不等式变形可容易地给出 的1 同等置信区间为 x n d x n c 该区间的平均长度为 不难看出 在0 c d 1及dn cn 1 的条件下 当d 1 c 时 取得最小值 这说明是 的置信水平1 为最短置信区间 12 单个正态总体参数的置信区间 一 已知时 的置信区间在这种情况下 枢轴量可选为 c和d应满足P c G d d c 1 经过不等式变形可得该区间长度为 当d c u1 2时 d c达到最小 由此给出了的同等置信区间为 6 5 8 这是一个以为中心 半径为的对称区间 常将之表示为 13 例用天平秤某物体的重量9次 得平均值为 克 已知天平秤量结果为正态分布 其标准差为0 1克 试求该物体重量的0 95置信区间 解 此处1 0 95 0 05 查表知u0 975 1 96 于是该物体重量 的0 95置信区间为 从而该物体重量的0 95置信区间为 15 3347 15 4653 14 例设总体为正态分布N 1 为得到 的置信水平为0 95的置信区间长度不超过1 2 样本容量应为多大 解 由题设条件知 的0 95置信区间为其区间长度为 它仅依赖于样本容量n而与样本具体取值无关 现要求 立即有n 2 1 2 2u21 2 现1 0 95 故u1 2 1 96 从而n 5 3 21 962 10 67 11 即样本容量至少为11时才能使得 的置信水平为0 95的置信区间长度不超过1 2 15 二 2未知时 的置信区间 这时可用t统计量 因为 因此t可以用来作为枢轴量 完全类似于上一小节 可得到 的1 置信区间为此处是 2的无偏估计 16 例假设轮胎的寿命服从正态分布 为估计某种轮胎的平均寿命 现随机地抽12只轮胎试用 测得它们的寿命 单位 万公里 如下 4 684 854 324 854 615 025 204 604 584 724 384 70此处正态总体标准差未知 可使用t分布求均值的置信区间 经计算有 4 7092 s2 0 0615 取 0 05 查表知t0 975 11 2 2010 于是平均寿命的0 95置信区间为 单位 万公里 17 在实际问题中 由于轮胎的寿命越长越好 因此可以只求平均寿命的置信下限 也即构造单边的置信下限 由于由不等式变形可知 的1 置信下限为将t0 95 11 1 7959代入计算可得平均寿命 的0 95置信下限为4 5806 万公里 18 三 2的置信区间 取枢轴量 由于 2分布是偏态分布 寻找平均长度最短区间很难实现 一般都用等尾置信区间 采用 2的两个分位数 2 2 n 1 和 21 2 n 1 在 2分布两侧各截面积为 2的部分 使得由此给出 2的1 置信区间为 19 例某厂生产的零件重量服从正态分布N 2 现从该厂生产的零件中抽取9个 测得其重量为 单位 克 45 345 445 145 345 545 745 445 345 6试求总体标准差 的0 95置信区间 解 由数据可算得s2 0 0325 n 1 s2 8 0325 0 26 查表知 20 025 8 2 1797 20 975 8 17 5345 代入可得 2的0 95置信区间为从而 的0 95置信区间为 0 1218 0 3454 20 在样本容量充分大时 可以用渐近分布来构造近似的置信区间 一个典型的例子是关于比例p的置信区间 6大样本置信区间 21 设x1 xn是来自b 1 p 的样本 有对给定 通过变形 可得到置信区间为其中记 u21 2 实用中通常略去 n项 于是可将置信区间近似为 22 例6 对某事件A作120次观察 A发生36次 试给出事件A发生概率p的0 95置信区间 解 此处n 120 36 120 0 3而u0 975 1 96 于是p的0 95 双侧 置信下限和上限分别为故所求的置信区间为 0 218 0 382 23 例6 某传媒公司欲调查电视台某综艺节目收视率p 为使得p的1 置信区间长度不超过d0 问应调查多少用户 解 这是关于二点分布比例p的置信区间问题 由 6 5 11 知 1 的置信区间长度为这是一个随机变量 但由于 所以对任意的观测值有 这也就是说p的1 的置信区间长度不会超过 现要求p的的置信区间长度不超过d0 只需要即可 从而 6 5 12 24 这是一类常见的寻求样本量的问题 比如 若取d0 0 04 0 05 则 这表明 要使综艺节目收视率p的0 95置信区间的长度不超过0 04 则需要对2401个用户作调查 25 两个正态总体下的置信区间 设x1 xm是来自N 1 12 的样本 y1 yn是来自N 2 22 的样本 且两个样本相互独立 与分别是它们的样本均值 和分别是它们的样本方差 下面讨论两个均值差和两个方差比的置信区间 26 一 1 2的置信区间 1 12和 22已知时的两样本u区间2 12 22 2未知时的两样本t区间 27 3 22 12 已知时的两样本t区间 28 4 当m和n都很大时的近似置信区间5 一般情况下的近似置信区间其中 29 例为比较两个小麦品种的产量 选择18块条件相似的试验田 采用相同的耕作方法作试验 结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量 单位 千克 亩 分别为 甲品种628583510554612523530615乙品种535433398470567480498560503426假定亩产量均服从正态分布 试求这两个品种平均亩产量差的置信区间 0 05 30 解 以x1 x8记甲品种的亩产量 y1 y10记乙品种的亩产量 由样本数据可计算得到 569 3750 sx2 2140 5536 m 8 487 0000 sy2 3256 2222 n 10下面分两种情况讨论 31 1 若已知两个品种亩产量的标准差相同 则可采用两样本t区间 此处故 1 2的0 95置信区间为 32 2 若两个品种亩产量的方差不等 则可采用近似t区间 此处s02 2110 5536 8 3256 2222 10 589 4414 s0 24 2784于是 1 2的0 95近似置信区间为 31 3685 133 3815 33 二 12 22的置信区间由于 m 1 sx2 12 2 m 1 n 1 sy2 22 2 n 1 且sx2与sy2相互独立 故可仿照F变量构造如下枢轴量 对给定的1 由经不等式变形即给出 12 22的如下的置信区间 34 例某车间有两台自动机床加工一类套筒 假设套筒直径服从正态分布 现在从两个班次的产品中分别检查了5个和6个套筒 得其直径数据如下 单位 厘米 甲班 5 065 085 035 005 07乙班 4 985 034 974 995 024 95试求两班加工套筒直径的方差比 甲2 乙2的0 95置信区间 解 由数据算得sx2 0 00037 sx2 0 00092 故置信区间 0 0544 3 7657 35 36 2 4区间估计点估计能给未知参数 一个明确的数量 但不能给出精度 区间估计可弥补其不足 2 4 1区间估计的概念 36 37 置信度1 反映了区间估计的可信度 能够包含未知参数 的概率为1 怎样理解置信区间的置信水平 置信度 为1 在所给定的一组样本观察值之下 可得到一个确定的区间 如果独立地再取一个样本 又会得到另外一个区间 即反复抽样多次 由每组样本观察值可以确定一个区间 这个区间或许已包含了参数 的真值 或许没有包含参数 的真值 若置信度为1 在这些置信区间中 约有1 的区间包含参数 的真值 仅有 的区间没有包含参数 的真值 如1 95 约有95 的区间包含参数 的真值 5 不包含参数 的真值 37 38 3 4 2枢轴量法构造未知参数 的置信区间的一个常用方法是枢轴量法 具体步骤如下 其次 适当选取两个常数c d 使对给定的 有 注 上式中的大于等于号是专门为离散分布而设置的 为连续分布时 上式取等号 38 39 如何确定C d 当的分布为单峰时的常用方法 方法1 当的分布为对称时 如标准正态分布 取d使其满足 39 40 这样得到的置信区间为等尾置信区间 5 4 3正态均值 的置信区间 已知 构造统计量 枢轴量 当讨论总体均值 的置信区间时 首先应该从总体均值的点估计量出发 由于总体X服从正态分布 则 40 41 41 42 例1某保险公司欲了解某险种投保人的平均年龄 随机抽取了24人 计算出24人的平均年龄为39岁 试以95 的置信度估计该险种投保人的平均年龄 设投保人的年龄 总体标准差 7 2岁 解 由于总体X服从正态分布 则 有 42 43 还需进一步讨论的问题 43 44 例2某地区在夏粮收割期间 随机抽割了400亩小麦 测得平均亩产为350公斤 标准差为70公斤 试以90 的置信度估计该地区小麦平均亩产的区间范围和小麦总产量的区间范围 设该地区的小麦播种面积共有20000亩 44 45 2 样本容量 的确定 置信区间的区间长度L 置信上限 置信下限 L反映了区间估计的精确度 当L愈长 估计区间包含真值 的可能性就愈大 但是估计也愈不精确 对给定的置信度1 总体均值 的置信区间的长度为 45 46 46 47 注2 为了提高区间估计的精确度 需要减小置信区间的长度 当 已知时 置信区间的长度L是样本容量n的单调 减 函数 可通过增加样本容量n来达到提高的精度的目的 如给定区间长度 47 48 例3某食品厂要检验本月生产的10 000袋某产品的重量 根据上月资料 这种产品每袋重量的标准差为25克 要求在95 45 的概率保证程度下 置信区间长度L0 10 应抽查多少袋产品 要求在95 45 的概率保证程度下 置信区间长度L0 10 应抽查100袋产品 48 49 2 4 4正态均值 的置信区间 未知 在第四章我们曾对以上结论进行过证明 复习 49 50 50 51 51 52 52 53 例4为了解某地区18周岁以上成年人用于购烟的月平均支出 随机抽出28人调查 得 S 31 试以95 的置信度估计该地区18周岁以上吸烟者用于购烟的月平均支出 设购烟的月平均支出服从正态分布 以95 的置信度估计 该地区18岁以上吸烟者用于购烟的月平均支出在65 98 90 02元之间 53 54 54 55 55 56 56 57 例5某食品厂加工了一批罐头 担心罐头重量的差异太大 随机抽出15个罐头称其重量 单位 克 样本方差 假设总体呈正态分布 试估计罐头重量方差 标准差 的95 的置信区间 57 58 58 59 5 4 6两个正态均值差的置信区间 59 60 60 61 61 62 62 63 63 64 64 65 近似服从N 0 1 分布 65 66 66 67 例6一个企业的某种实验中 一部分由40个工人用第一种方法完成 另一部分由30个工人用第二种方法完成 结果得下列数据 假定两种方法所需时间都服从正态分布 方差未知 的置信度为95 的置信区间 67 68 68 69 69 70 例7将例6中的资料换成 一个企业的某种实验中 一部分由12个工人用第一种方法完成 另一部分由9个工人用第二种方法完成 分别就以下情况求的置信度为95 的置信区间 1 假定两种方法所需时间都服从正态分布 方差未知 但相等 2 两种方法所需时间都服从正态分布 方差未知 但不相等 解 1 X Y的方差未知 但相等 70 71 71 72 2 若X Y的方差未知 但不相等 72 73 73 74 5 4 7 两个正态方差比的置信区间 上一章已经对F分布进行过讨论 复习F分布的定义 1 F分布 74 75 75 76 2 两个正态方差比的置信区间 定理5 4 3设X Y是两个正态总体 均值分别为方差 76 77 且两者独立 由F发布的定义知 得正态总体方差之比的置信度为1 的置信区间为 77 78 正态总体标准差之比的置信度为1 的置信区间为 78 79 例8职工家计调查结果为 甲地抽取121户 户均年消费支出 标准差SX 400元 乙地抽取61户 户均年消费支出 标准差SY 400元 试求 甲 乙两城市年消费支出标准差之比的置信度为0 90的置信区间 79 80 5 5单侧置信限5 5 1单侧置信限的概念在某些实际问题中 我们往往关心某些未知参数的下限 上限 80 81 5 5 1倒推法 根据区间估计的枢轴量进行倒推 81 82 82 83 例1为研究某种汽车轮胎的磨损情况 随机地选择16只轮胎进行磨损检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030水泥机械市场行业市场深度研究与战略咨询分析报告
- 2025新能源交通工具行业市场现状供需研宄及产业发展方向规划报告
- 2025新型防锈材料行业市场需求技术创新市场竞争力技术创新市场需求市场分析报告
- 2025新型纺织材料应用市场分析生产成本需求分析环保趋势预测技术投资规划分析报告
- 2025新型玻璃制造行业市场供需分析及投资评估规划分析研究报告
- 2025新加坡电子商务市场供需分析及投资潜力评估报告
- 保险科技与金融科技的深度融合-洞察及研究
- 纳米结构光热转换效率提升-洞察及研究
- 漂移基因多态性研究-洞察及研究
- 吡喹酮对线粒体能量代谢的干扰研究-洞察及研究
- 体育安全教育题库及答案
- 雨课堂学堂在线学堂云《爱性与健康》单元测试考核答案
- 创伤急救模拟教学中的重症创伤模拟教学优化
- 错题逆袭:从绊脚石到提分引擎
- 2026九师联盟高三11月质量检测生物试题(含答案)
- 加油站冬季安全培训课件
- (一诊)泸州市高2023级(2026届)高三第一次教学质量诊断性考试历史试题(含答案)
- 2026-2031中国国债市场竞争现状研究报告
- 工商企业管理毕业设计
- 贲门失弛缓症护理查房
- 新疆团员考试试卷及答案
评论
0/150
提交评论