已阅读5页,还剩99页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第4章抽样分布与参数估计 4 1一个总体抽样分布4 2参数估计的一般问题4 3一个总体的参数估计4 4两个总体抽样分布4 5两个总体的参数估计 2 学习目标 理解抽样分布的意义了解抽样分布的形成过程理解抽样分布的性质了解评价估计量优良性的标准掌握一个总体参数的区间估计方法掌握两个总体参数的区间估计方法掌握抽样样本容量的确定方法 2020 4 25 3 4 1一个总体的抽样分布 一 抽样分布的概念二 样本均值的抽样分布三 样本比率的抽样分布四 样本方差的抽样分布 2020 4 25 4 案例1 风险分析案例 祝贺你 你刚才在一个有奖问答比赛中获胜了 现在你将有机会来抽取一个大奖 一个旋转的圆桶里有6个一模一样的信封混杂在一起 每个信封有一张支票 分别是10 20 30 40 50 60 单位 千美元 的大奖你有三种选择机会抽取一个信封获得里面的奖金依次有放回抽取两个信封获得其平均数的奖金无放回抽取两个信封获得其平均数的奖金你该怎么做 2020 4 25 5 重复抽样的所有可能样本组合的样本均值 2020 4 25 6 所有可能样本均值的概率分布表 2020 4 25 7 所有可能样本均值的概率分布图 均值奖金的均值 期望值 35均值奖金的方差 145 5 6获得奖金至少有5万美金的概率 1 6 2020 4 25 8 不重复抽样的样本均值的概率分布 均值奖金的均值 期望值 35均值奖金的方差 116 2 3获得奖金至少有5万美金的概率 2 15 2020 4 25 9 奖金总体的概率分布 奖金的均值 期望值 35奖金的方差 291 2 3获得奖金至少有5万美金的概率 2 6 2020 4 25 10 三种选择所获奖金的均值都是35方差从小到大依次是不重复选择 重复选择 一次选择对于风险规避者而言 选择不重复抽取信封 较为稳妥对于风险爱好者而言 选择一次抽取信封 11 样本统计量的概率分布 是一种理论分布在重复选取容量为n的样本时 由该统计量的所有可能取值形成的相对频数分布 样本统计量是随机变量样本均值 样本比例 样本方差等结果来自样本容量相同的所有可能样本提供了样本统计量长远而稳定的信息 是进行推断的理论基础 也是抽样推断科学性的重要依据 一 抽样分布的概念 samplingdistribution 12 在重复选取容量为n的样本时 由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值 的理论基础 二 样本均值的抽样分布 13 设总体有N个单位 其均值为 的 方差为 从中抽取样本容量为n的样本样本均值的数学期望样本均值的方差重复抽样不重复抽样 1 样本均值抽样分布的数学特征 数学期望与方差 N n 20时 两者近似相等 14 2 样本均值的抽样分布与中心极限定理 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的数学期望为 方差为 2 n 即 x N 2 n 15 中心极限定理 centrallimittheorem 中心极限定理 设从均值为 方差为 2的一个任意总体中抽取容量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为 2 n的正态分布 16 中心极限定理 centrallimittheorem x的分布趋于正态分布的过程 17 案例1抽样分布的数字特征 18 3 标准误 standarderror 样本统计量的抽样分布的标准差 称为统计量的标准误 也称为标准误差 也称抽样标准差 标准误衡量的是统计量的离散程度 它测度了用样本统计量估计总体参数的精确程度以样本均值的抽样分布为例 在重复抽样条件下 样本均值的标准误为 19 估计的标准误 standarderrorofestimation 当计算标准误时涉及的总体参数未知时 用样本统计量代替计算的标准误 称为估计的标准误以样本均值的抽样分布为例 当总体标准差 未知时 可用样本标准差s代替 则在重复抽样条件下 样本均值的估计标准误为 20 三 样本比率的抽样分布 比率是指总体 或样本 中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品 或不合格品 与全部产品总数之比总体比例可表示为样本比例可表示为 21 在重复选取容量为n的样本时 由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时 样本比例的抽样分布可用正态分布近似推断总体比例 的理论基础 样本比例的抽样分布 22 样本比例的数学期望样本比例的方差重复抽样不重复抽样 样本比例的抽样分布 数学期望与方差 23 四 样本方差的抽样分布 在重复选取容量为n的样本时 由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本 则比值的抽样分布服从自由度为 n 1 的 2分布 即 24 由阿贝 Abbe 于1863年首先给出 后来由海尔墨特 Hermert 和卡 皮尔逊 K Pearson 分别于1875年和1900年推导出来设 则令 则Y服从自由度为1的 2分布 即当总体 从中抽取容量为n的样本 则 2分布 Chi squareddistribution 25 分布的变量值始终为正分布的形状取决于其自由度n的大小 通常为不对称的正偏分布 但随着自由度的增大逐渐趋于对称期望为E 2 n 方差为D 2 2n n为自由度 可加性 若U和V为两个独立的服从 2分布的随机变量 U 2 n1 V 2 n2 则U V这一随机变量服从自由度为n1 n2的 2分布 2分布 性质和特点 2020 4 25 26 4 3参数估计的一般问题 一 估计量与估计值二 点估计与区间估计三 评价估计量的标准 27 估计量 用于估计总体参数的随机变量如样本均值 样本比率 样本方差等例如 样本均值就是总体均值 的一个估计量参数用 表示 估计量用表示估计值 估计参数时计算出来的统计量的具体值如果样本均值 x 80 则80就是 的估计值 一 估计量与估计值 estimator estimatedvalue 28 二 点估计和区间估计1 点估计 pointestimate 用样本的估计量直接作为总体参数的估计值例如 用样本均值直接作为总体均值的估计例如 用两个样本均值之差直接作为总体均值之差的估计没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法 顺序统计量法 最大似然法 最小二乘法等 29 2 区间估计 intervalestimate 在点估计的基础上 给出总体参数估计的一个区间范围 该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如 某班级平均分数在75 85之间 置信水平是95 30 三 评价估计量的标准 无偏性有效性一致性 31 无偏性 unbiasedness 无偏性 估计量抽样分布的数学期望等于被估计的总体参数 32 有效性 efficiency 有效性 对同一总体参数的两个无偏点估计量 有更小标准差的估计量更有效 33 一致性 consistency 一致性 随着样本容量的增大 估计量的值越来越接近被估计的总体参数 34 一个总体参数的区间估计 35 4 4一个总体参数的区间估计 一 总体均值的区间估计二 总体比率的区间估计三 总体方差的区间估计 2020 4 25 36 为什么要进行区间估计 我从家到良乡校区的可能路径 家公交车站六里桥东地铁站9号线房山线良乡大学城出租车家公交车站六里桥东公交站832公交步行至上课地家出租车中关村校区校车至良乡哪一条是我的最佳路径 2020 4 25 37 有多少比例的成年女性是染发的 谁会关心这个比例 染发剂制造销售商美发店社会学者流行病学家 2020 4 25 38 区间估计可以弥补点估计的不足告诉我们估计的误差范围提醒我们所做的估计并不完全有把握告诉你这个估计的可靠程度 39 如何构造一个区间 2020 4 25 40 置信水平 在抽样估计中 这个概率1 叫置信度或置信水平 表明抽样估计的有把握程直观含义 将构造置信区间的步骤重复很多次 置信区间包含总体参数真值的次数所占的比率是1 为是区间未包含总体参数的比率 常用的置信水平值有99 95 90 相应的 为0 01 0 05 0 10 41 由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种概率程度上确信这个区间会包含真正的总体参数 所以给它取名为置信区间用一个具体的样本所构造的区间是一个特定的区间 我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个 但它也可能是少数几个不包含参数真值的区间中的一个 置信区间 confidenceinterval 2020 4 25 42 以均值的区间估计为例 2020 4 25 43 标准正态分布 0 44 标准正态分布分位数 0 z a 0 01 za 2 2 58 a 0 05 za 2 1 96 a 0 10 za 2 1 65 45 区间估计的图示 46 影响区间宽度的因素 总体数据的离散程度 用 来测度样本容量 置信水平 1 影响za 2的大小有精度还是要可信度 在其它条件不变情况下 区间估计可靠性越大 则区间越宽 所允许的极限误差越大 精度越低 47 一 总体均值的区间估计 大样本 假定条件总体服从正态分布如果不是正态分布 可由正态分布来近似 n 30 使用正态分布统计量z 总体均值 在1 置信水平下的置信区间为 48 总体均值的区间估计 案例分析 在JournalofMarketing的一篇文章里 作者Bayus研究了在耐用品更换购买时 早期更换购买者 与 晚期更换购买者 的区别 早期更换购买者 在产品使用寿命的早期就进行更换购买晚期更换购买者 在产品使用寿命的晚期才进行更换购买他研究了汽车的更换购买 当汽车车龄小于3年且里程不高于35000英里时 就更换汽车 则该消费者属于 早期更换购买者 超过7年且里程高于73000英里的消费者属于 晚期更换购买者 1 从一个随机抽取的800位早期更换购买者的样本里 得到走访车行的平均个数是3 3 假定标准差 0 71 计算早期更换购买者走访车行个数总体均值的99 置信区间 2 从一个随机抽取的500位晚期更换购买者的样本里 得到的走访车行的平均个数是4 3 样本标准差是0 66 计算走访车行个数总体均值95 的置信区间 49 1 已知 N 0 712 n 800 1 99 z 2 2 58 根据样本数据计算得总体均值 在1 置信水平下的置信区间为 早期更换购买者走访车行个数总体均值的99 置信区间 3 235 3 365 2 2020 4 25 50 在MarketingScience上的一篇文章中 作者Silk和Berndt调查了广告公司的产量 他们将广告公司的产量描述成是来自各种媒体类型 如 电视网 电视宣传专栏 报纸 广播电台 等等 的营业额的市场份额 1 他们随机抽取了400家美国广告公司作为样本 来自电视网营业额的平均市场份额为7 46 样本标准差是1 42 来自电视宣传专栏的营业额的平均市场份额是12 44 标准差是1 55 用此样本的数据估计全美广告公司中来自电视网营业额及电视宣传专栏营业额的平均市场份额 构造95 的置信区间 2 美国广告公司中来自电视宣传营业额的市场份额要高于来自电视网营业额的市场份额吗 为什么 总体均值的区间估计 案例分析 2020 4 25 51 2020 4 25 52 某校的学生们做过一次调查 他们想了解该校学生谈恋爱持续的最长时间及其影响因素 并试图比较理工科学生与经管文史类学生在恋爱持续时间上的差异 他们随机抽取了该校124位理工科学生及96位经管文史类学生作为样本 调查结果显示 理工科学生恋爱持续最长时间平均为5 6个月 标准差为5个月 经管文史类学生恋爱持续最长时间平均为5 8个月 标准差为5 2个月 他们构造了95 的置信区间用以估计全校理工类学生与经管文史类学生的恋爱平均时间 53 二 总体均值的区间估计 小样本 1 假定条件总体服从正态分布 且方差 未知小样本 n 30 使用t分布统计量 总体均值 在1 置信水平下的置信区间为 54 t分布 t分布是类似正态分布的一种对称分布 它通常要比正态分布平坦和分散 一个特定的分布依赖于称之为自由度的参数 随着自由度的增大 分布也逐渐趋于正态分布 55 航空交通控制案例 航空交通控制人员的中心任务是确保飞机不会相撞 为了做到这一点 当两架飞机在同一时间要进入同样的空间时 他们必须迅速地辨明情况 有跟踪飞机位置的电视屏幕帮助他们 当两架飞机的飞行路线要重合时 立刻会对控制人员发出警告 现在使用的电视屏幕平均警告时间是15秒 即两架飞机开始进入碰撞路线的一瞬间与控制人员开始要求飞机改道时之间的时间长度 目前 一种新的人工智能电视屏幕已经研发出来 它能给空管人员提供更早的警告 研发人员希望能将平均警告时间缩短至小于8秒 为了测试这种新的屏幕 随机抽取了15位空管人员 记录下他们在模拟碰撞课程里的警告时间 秒 分别是 7 2 7 5 8 0 6 8 7 2 8 4 5 3 7 3 7 6 7 1 9 4 6 4 7 9 6 2 8 7 1 样本均值为7 4 s 1 026 求出平均警告时间 的95 置信区间 2 我们能够有95 的把握确信 短于8秒吗 2020 4 25 56 置信区间小于8 我们有理由相信新屏幕缩短了警告时间 57 58 三 总体比率的区间估计 1 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量z 总体比率 在1 置信水平下的置信区间为 59 总体比率的区间估计 例题分析 例 优信咨询公司 Universum 随机对美国2221个MBA学生进行的调查结果显示 只有20 的学生预期会在他的第一份工作里呆5年或5年以上 求出这个比例的95 的置信区间 根据这个区间是否有很强的证据表明所有的美国MBA学生中预期不会跳槽的比例不到1 4 解 已知n 2221 p 20 1 95 z 2 1 96 没错 这个比例区间低于25 60 四 总体方差的区间估计 1 估计一个总体的方差或标准差2 假设总体服从正态分布3 总体方差 2的点估计量为s2 且 4 总体方差在1 置信水平下的置信区间为 61 总体方差的区间估计 图示 2 21 2 总体方差1 的置信区间 自由度为n 1的 2分布 62 总体方差的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表所示 已知产品重量的分布服从正态分布 以95 的置信水平建立该种食品重量方差的置信区间 63 总体方差的区间估计 例题分析 解 已知n 25 1 95 根据样本数据计算得s2 93 21 2置信度为95 的置信区间为 该企业生产的食品总体重量标准差的的置信区间为7 54g 13 43g 64 4 5两个总体的抽样分布 一 两个样本均值之差的抽样分布二 两个样本比例之差的抽样分布三 两个样本方差比的抽样分布 65 1 两个总体都为正态分布 即 独立从两个总体中分别抽样2 两个样本均值之差的抽样分布服从正态分布 其分布的数学期望为两个总体均值之差3 方差为各自的方差之和 一 两个样本均值之差的抽样分布 66 两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本 当两个样本都为大样本时 两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和 二 两个样本比例之差的抽样分布 67 三 两个样本方差比的抽样分布 两个总体都为正态分布 即X1 N 1 12 X2 N 2 22 从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布 服从分子自由度为 n1 1 分母自由度为 n2 1 的F分布 即 68 由统计学家费希尔 R A Fisher 提出的 以其姓氏的第一个字母来命名设若U为服从自由度为n1的 2分布 即U 2 n1 V为服从自由度为n2的 2分布 即V 2 n2 且U和V相互独立 则称F为服从自由度n1和n2的F分布 记为 F分布 Fdistribution 69 F分布 图示 不同自由度的F分布 70 4 6两个总体参数的区间估计 一 两个总体均值之差的区间估计二 两个总体比率之差的区间估计三 两个总体方差比的区间估计 71 一 两个总体参数的区间估计 72 一 两个总体均值之差的估计 独立大样本 1 假定条件两个总体都服从正态分布 1 2 已知若不是正态分布 可以用正态分布来近似 n1 30和n2 30 两个样本是独立的随机样本2 使用正态分布统计量z 73 两个总体均值之差的估计 大样本 3 1 2 已知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 4 1 2 未知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 74 两个总体均值之差的估计 例题分析 例 一所大学试图证明学生拥有汽车不利于学习 随机抽取了100个没有汽车的学生 其平均GPA是2 68 另外100名拥有汽车的学生 他们的平均GPA是2 55 假定独立性的假设成立 1表示没有汽车学生的平均GPA 2表示没有汽车学生的平均GPA 1 使用这些数据计算95 的置信区间 2 能否证明 1大于 2 75 两个总体均值之差的估计 例题分析 解 两个总体均值之差在1 置信水平下的置信区间为 这个区间中含有0 所以有车学生的GPA与无车学生的GPA并无显著差异 2020 4 25 76 某校的学生们做过一次调查 他们想了解该校学生谈恋爱持续的最长时间及其影响因素 并试图比较理工科学生与经管文史类学生在恋爱持续时间上的差异 他们随机抽取了该校124位理工科学生及96位经管文史类学生作为样本 调查结果显示 理工科学生恋爱持续最长时间平均为5 6个月 标准差为5个月 经管文史类学生恋爱持续最长时间平均为5 8个月 标准差为5 2个月 他们构造了95 的置信区间用以分析全校理工类学生与经管文史类学生的平均最长恋爱时间是否存在显著差异 2020 4 25 77 此区间含有0 我们可以认为该校理工类学生与经管文史类学生的恋爱持续时间不存在显著差异 78 二 两个总体均值之差的估计1 小样本 12 22 1 假定条件两个总体都服从正态分布两个总体方差未知但相等 1 2 两个独立的小样本 n1 30和n2 30 2 总体方差的合并估计量 估计量 x1 x2的抽样标准差 79 两个总体均值之差的估计 小样本 12 22 1 两个样本均值之差的标准化 两个总体均值之差 1 2在1 置信水平下的置信区间为 80 两个总体均值之差的估计 例题分析 例 为了促进学生节约用水 学校更换了新的洗澡系统 采用刷卡付费形式 每分钟0 2元 新的系统在很大程度上改变了学生们的洗澡习惯 为了了解学生在春季的洗澡时间及其影响因素 某校的学生们做了一项调查 随机抽取47名同学作为样本 其中男生22人 女生25人 样本结果显示 男生洗澡平均时间为8分钟 标准差为5 3分钟 女生平均洗澡时间为11分钟 标准差为3 5分钟 据此推断全校男生与女生的平均洗澡时间 并构造两者之差的95 的置信区间 分析两者是否有显著差异 2020 4 25 81 假设男生洗澡时间的方差等于女生洗澡时间的方差 该区间不包含0 表明两者差异显著 82 两个总体均值之差的估计2 小样本 12 22 1 假定条件两个总体都服从正态分布两个总体方差未知且不相等 1 2 两个独立的小样本 n1 30和n2 30 使用统计量 83 两个总体均值之差的估计 小样本 12 22 两个总体均值之差 1 2在1 置信水平下的置信区间为 84 两个总体均值之差的估计 例题分析 例 为了促进学生节约用水 学校更换了新的洗澡系统 采用刷卡付费形式 每分钟0 2元 新的系统在很大程度上改变了学生们的洗澡习惯 为了了解学生在春季的洗澡时间及其影响因素 某校的学生们做了一项调查 随机抽取47名同学作为样本 其中男生22人 女生25人 样本结果显示 男生洗澡平均时间为8分钟 标准差为5 3分钟 女生平均洗澡时间为11分钟 标准差为3 5分钟 据此推断全校男生与女生的平均洗澡时间 并构造两者之差的95 的置信区间 分析两者是否有显著差异 2020 4 25 85 假设男生洗澡时间的方差不等于女生洗澡时间的方差 该区间不包含0 表明两者差异显著 86 三 两个总体均值之差的估计 匹配大样本 假定条件两个匹配的大样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 87 两个总体均值之差的估计 匹配小样本 假定条件两个匹配的大样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 88 两个总体均值之差的估计 例题分析 例 由10名学生组成一个随机样本 让他们分别采用A和B两套试卷进行测试 结果如下表 试建立两种试卷分数之差 d 1 295 的置信区间 89 两个总体均值之差的估计 例题分析 解 根据样本数据计算得 两种试卷所产生的分数之差的置信区间为6 33分 15 67分 90 假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的两个总体比率之差 1 2在1 置信水平下的置信区间为 二 两个总体比率之差的区间估计 91 两个总体比率之差的估计 例题分析 例 在Journalofadvertising的一篇文章里Weinberger比较了美国和英国电视广告使用的幽默情况 英国的400个随机电视广告里有142个使用了幽默 而美国的500个随机广告里有122个使用了幽默 计算英国广告使用幽默比例与美国广告使用幽默比例的差异的95 的置信区间 并说明 两者之间的差异是否显著 英国的广告使用幽默比例更高 92 三 两个总体方差比的区间估计 1 比较两个总体的方差比用两个样本的方差比来判断如果S12 S22接近于1 说明两个总体方差很接近如果S12 S22远离1 说明两个总体方差之间存在差异2 总体方差比在1 置信水平下的置信区间为 93 两个总体方差比的区间估计 图示 2020 4 25 94 例 为了促进学生节约用水 学校更换了新的洗澡系统 采用刷卡付费形式 每分钟0 2元 新的系统在很大程度上改变了学生们的洗澡习惯 为了了解学生在春季的洗澡时间及其影响因素 某校的学生们做了一项调查
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026重庆市两江新区教育事业单位面向应届高校毕业生考核招聘20人备考题库(综合题)附答案详解
- 2026浙江台州市人力资源开发有限公司招聘劳务派遣人员30人笔试题库及参考答案详解【综合题】
- 人工智能生成内容审核
- 汽车租赁合同书样本
- 二保培训焊工考试题及答案
- 电子政务原理与应用试题及答案
- 南方初一上语文考试题目及答案
- 地理八下测试题及答案
- 2026北京大学未来技术学院招聘科研秘书1名参考题库及答案详解(名师系列)
- 六年级语文s版奥赛试题及答案
- 2026年法院书记员考试试题云南及答案解析
- 2026年平顶山市煤业集团职业病防治院医护人员招聘笔试备考题库及答案解析
- 小学道德与法治质量分析报告
- 雨课堂学堂在线学堂云《中国马克思主义与当代(北京航空航天)》单元测试考核答案
- 2026教资笔试考前速记考点|精简背诵版(中小学+高分必背)
- 深海生态脆弱性评估与保护策略体系研究
- 雨课堂学堂在线学堂云《艺术品经济学(西安美术学院)》单元测试考核答案
- 2026年重症医学专业考核通关试卷及完整答案详解【全优】
- 2026年高考(福建卷)物理试题及答案
- 充电桩模块电路教学文稿
- 诊所输液工作制度
评论
0/150
提交评论