第4章用样本推断总体 华南理工大学 工程硕士统计学教学课件_第1页
第4章用样本推断总体 华南理工大学 工程硕士统计学教学课件_第2页
第4章用样本推断总体 华南理工大学 工程硕士统计学教学课件_第3页
第4章用样本推断总体 华南理工大学 工程硕士统计学教学课件_第4页
第4章用样本推断总体 华南理工大学 工程硕士统计学教学课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章用样本推断总体 主要内容 4 1怎样进行推断 4 2总体参数估计4 3总体假设检验2 4 1怎样进行推断 人们通常关心总体的某个特征值 平均成本 平均价格 产品合格率 次品率 一批产品销售价格的标准差 产品成本的标准差等等要得到这些指标 不可能把所有的产品都测试一遍根据样本值推断和估计总体的特征值用估计量估计总体参数估计量 是样本的函数 其中并不含有任何未知参数 4 1怎样进行推断 用估计量估计总体参数的基本方法1 点估计法估计的结果只是一个确定的值 用样本指标直接替代总体指标 如 2 区间估计法估计的结果是一个区间 该区间由点估计值加上或减去估计误差而得到 点估计法 例 设某批产品的寿命服从均匀分布 但是参数未知 随机地抽取五个产品 测得寿命分别是1265小时 1257小时 1276小时 1269小时和1266小时 试求总体均值和标准差 解 样本平均寿命和标准差分别是 区间估计法 区间估计法的步骤 1 确定未知总体参数落在某区间内的概率1 介于0 1之间2 1 称为置信水平 是参数不落在区间内的概率3 置信水平1 通常取值为99 95 90 即 0 01 1 0 05 5 0 10 10 区间估计法 90 样本 95 样本 99 样本 影响区间宽度的因素 影响因素 1 数据离散度 数据越离散 区间越宽2 样本容量n 样本容量越大 区间越窄3 置信水平 1 置信水平越大 区间越大 估计量的优劣标准 估计总体参数的估计量有许多个用好的估计量去估计总体参数好的估计量的标准是 1 无偏性 样本均值 样本比例 样本方差是总体特征值的无偏估计2 有效性 在所有无偏估计量中 方差最小的是有效的3 一致性 随着样本量的增大 点估计量的值越来越接近总体参数的真实值 4 2总体参数估计 1 一个总体均值的区间估计2 两个总体均值之差的区间估计 一个总体均值的区间估计 1 假设已知总体的标准差总体服从正态分布如果不是正态 可被正态分布逼近 样本n 30 2 置信区间 一个总体均值的区间估计 总体均值区间估计的计算步骤 1 确定置信水平1 a 2 根据置信水平 确定其临界值Za 2值 3 实际抽样 并计算样本均值和抽样标准误差4 确定置信区间 例4 1 一个总体均值的区间估计 X未知且小样本 假设 总体服从正态分布总体标准差未知 用样本标准差s代替总体标准差 用t分布代替标准正态分布 t分布的自由度为n 1置信区间 例4 2 为临界值 两个总体均值之差的区间估计 独立样本 Independentsample 两个样本是从两个总体中独立地抽取的 即一个样本中的元素与另一个样本中的元素相互独立 1 大样本条件下 1 在两个总体的方差 12和 22均已知的情况下 两个总体均值之差的置信区间为 两个总体均值之差的区间估计 1 大样本条件下 2 在两个总体的方差 12和 22均未知的情况下 可用两个样本的方差s12和s22代替 这时 两个总体均值之差的置信区间为 两个总体均值之差的区间估计 这时 两个样本均值之差经标准化后服从自由度为的t分布 两个总体均值之差的置信区间为 2 小样本条件下 1 当两个总体的方差均已知时 可建立两个总体均值之差的置信区间 2 当两个总体的方差 12和 22均未知 且 12 22时 可用两个样本的方差s12和s22计算总体方差的合并估计量sp2 两个总体均值之差的区间估计 配对样本 Matchedsample 即一个样本中的数据与另一个样本中的数据相对应 1 大样本条件下 两个总体均值之差的置信区间为 2 小样本条件下 两个总体均值之差的置信区间为 其中 d 为各差值的均值 当总体标准差未知时 可以用样本差值的标准差替代 两个总体均值之差的区间估计 为比较分析北京市同一地区不同年份二手房价格的差异 某房地产中介公司从中关村地区2007年第四季度的二手房交易中 抽取了8个交易作为样本 并根据2008年当月市场行情 分别对这8个房源进行重新估价 得到二手房价格如下表所示 单位 万元 假定二手房价格服从正态分布 且方差相等 试以95 置信水平估计中关村地区2008年第一季度和2007年第四季度的二手房平均价格差值的置信区间 两个总体均值之差的区间估计 已知n 8 总体方差未知 计算得 由于1 0 95 在95 置信水平下的置信区间为 即 10 172 6 604 结果表明 在置信水平为95 时 总体平均价格的差异介于 10 17万元 6 60万元之间 即认为中关村地区2008年第一季度比2007年第四季度的二手房平均价格有显著提高 总体比例的区间估计 1 单一总体比例的区间估计2 两个总体比例之差的区间估计 单一总体比例的区间估计 1 假设总体服从二项分布可以用正态分布近似估计np 5且n 1 p 52 置信区间估计 P为总体比例 若总体比例未知 用样本比例代替 两个总体比例之差的区间估计 1 假设总体服从二项分布可以用正态分布近似估计np1 5且n 1 p1 5 np2 5且n 1 p2 52 置信区间估计 两个总体比例之差的区间估计 根据前面的数据 整理得出2008年第一季度与2007年第四季度交易价格在43万元以上的二手房交易数量及所占比例 试在95 置信水平下估计这两个时期 交易价格在43万元以上的二手房交易所占比例的差值的置信区间 整理数据如下 两个总体比例之差的区间估计 已知在95 置信水平下的置信区间为 即 38 5 4 62 结果表明 当置信水平为95 时 两个年份价格在43万元以上的二手房交易所占比例的差异介于 38 50 到4 62 之间 本例中 所求置信区间包含0 说明我们没有足够的理由认为2008年第一季度与2007年第四季度价格在43万元以上的二手房交易所占比例存在显著差异 总体方差的区间估计 1 假设总体服从正态分布2 用分布 自由度为n 13 置信区间 总体方差的区间估计 假定二手房的交易价格服从正态分布 试在95 的置信水平下估计二手房交易价格方差的置信区间 总体方差的区间估计 计算得由a 0 05在95

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论