




已阅读5页,还剩124页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章抽样分布与参数估计 第一节抽样调查的基本概念与方法一 抽样调查的概念和作用 一 抽样调查 是指从所要研究的总体中 按照随机原则 抽取部分单位进行调查 并将调查整理得出的数量特征 用以推断总体综合数量特征的一种调查组织形式 二 抽样调查的作用 二 抽样调查中的几个基本概念 1 全及总体2 样本3 总体参数 主要有 总体平均数总体比例总体比例的期望总体比例方差总体方差总体标准差 二 抽样调查中的几个基本概念 4 统计量 主要有 样本平均数样本比例样本方差样本标准差5 样本容量和样本个数样本容量是指一个样本所包含的单位数 即n 样本个数又称样本可能数目 是从一个总体中可能抽取多少个样本 三 抽样方法有二种 1 重复抽样 是指从N个总体单位中 抽取一个单位进行观察 纪录后 放回去 然后再抽取下一个单位 这样连续抽取n个单位组成样本的方法叫重复抽样 也叫重置抽样 2 不重复抽样 是指从N个总体单位中 抽取一个单位进行观察 纪录后 不再放回去 再抽取下一个单位 这样连续抽取n个单位组成样本的方法叫不重复抽样 也叫不重置抽样 样本统计量的概率分布 频率分布 是一种理论概率分布随机变量是样本统计量样本均值 样本比例 样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远我们稳定的信息 是进行推断的理论基础 也是抽样推断科学性的重要依据 第二节抽样分布 samplingdistribution 抽样分布 samplingdistribution 一 样本均值的抽样分布 样本均值的抽样分布 例题分析 例 设一个总体 含有4个元素 个体 即总体单位数N 4 4个个体分别为x1 1 x2 2 x3 3 x4 4 总体的均值 方差及分布如下 均值和方差 样本均值的抽样分布 例题分析 现从总体中抽取n 2的简单随机样本 在重复抽样条件下 共有42 16个样本 所有样本的结果为 样本均值的抽样分布 例题分析 计算出各样本的均值 如下表 并给出样本均值的抽样分布 样本均值的分布与总体分布的比较 例题分析 2 5 2 1 25 总体分布 即 即比较及结论 1 样本均值的均值 数学期望 等于总体均值2 样本均值的方差等于总体方差的1 n 样本均值的数学期望样本均值的方差重复抽样不重复抽样 样本均值的抽样分布 数学期望与方差 均值的抽样标准误 所有可能的样本均值的标准差 测度所有样本均值的离散程度小于总体标准差计算公式为 二 样本比例的抽样分布 样本比例的数学期望样本比例的方差重复抽样不重复抽样 样本比例的抽样分布 数学期望与方差 第三节正态分布和正态逼近 一 正态分布 f x 随机变量X的频数 正态随机变量X的均值 正态随机变量X的方差 3 1415926 e 2 71828x 随机变量的取值 x 密度函数是描述概率分布情况的 正态分布的密度函数为 正态分布的概率 概率是曲线下的面积 二 标准正态分布 standardizethenormaldistribution 标准正态分布的概率密度函数 随机变量具有均值为0 标准差为1的正态分布任何一个一般的正态分布 可通过下面的线性变换转化为标准正态分布 标准正态分布的分布函数 标准正态分布 标准正态分布表的使用 为了应用上的方便 是将z从0 5的概率编成正态分布表 直接查表求得概率 对于标准正态分布 即Z N 0 1 有P a Z b b a P Z z 对于负的z 可由 z z 得到对于一般正态分布 即X N 有 常用的概率分布表 在统计推断中 常常要求变量落在 z z 区间的概率 即 P Z z 2 z 1常用的概率分布表 标准化的例子P 5 X 6 2 标准化的例子P 2 9 X 7 1 正态分布 例题分析 例 定某公司职员每周的加班津贴服从均值为50元 标准差为10元的正态分布 那么全公司中有多少比例的职员每周的加班津贴会超过70元 又有多少比例的职员每周的加班津贴在40元到60元之间呢 解 设 50 10 X N 50 102 三 关于正态分布的定理 一 正态分布再生定理 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 X也服从正态分布 X的数学期望为 方差为 2 n 即 X N 2 n 二 中心极限定理 centrallimittheorem 中心极限定理 设从均值为 方差为 2的一个任意总体中抽取容量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为 2 n的正态分布 样本比例的抽样分布 总体比例是服从0 1分布 因此中心极限定理也适用于样本比例的分布 具体说 从任一总体比例为 方差为的0 1分布总体中 抽取容量为n的样本 其样本比例p的分布随着样本单位数n的增大而趋近于平均数方差的正态分布 在实际工作中 总体变量的分布通常是不知道的 样本平均数或比例的分布是否接近于正态 可接近到什么程度 取决于样本容量 样本容量越大 样本平均数或比例的分布也越接近正态 一般认为样本单位数不少于30的是大样本 抽样分布就接近于正态分布 例6 2 一汽车蓄电池商声称其生产的电池具有均值为54个月 标准差为6个月的寿命分布 现假设某消费团体决定检验该厂的说法是否准确 为此购买了50个该厂生产的电池进行寿命试验 假设厂商声称是正确的 试描述50个电池的平均寿命的抽样分布 假设厂商声称正确 则50个电池的平均寿命不超过52个月的概率为多少 解 根据中心极限定理 当厂商假定正确时 50个电池的平均寿命近似服从正态分布 有 即 四 样本方差的抽样分布 对于来自正态总体的简单随机样本 则比值的抽样分布服从自由度为 n 1 的 2分布 即 分布的变量值始终为正分布的形状取决于其自由度n的大小 通常为不对称的正偏分布 但随着自由度的增大逐渐趋于对称期望为 E 2 n 方差为 D 2 2n n为自由度 可加性 若U和V为两个独立的 2分布随机变量 U 2 n1 V 2 n2 则U V这一随机变量服从自由度为n1 n2的 2分布 2分布 性质和特点 c2分布 图示 课堂练习 1 某公司决定对职员增发 销售代表 奖 计划根据过去一段时期内的销售状况对月销售额最高的5 的职员发放该奖金 已知这段时期每人每个月的平均销售额 单位 元 服从均值为40000 方差为360000的正态分布 那么公司应该把 销售代表 奖的最低发放标准定为多少元 2 今年有一家大保险公司启动了一项为未利用的病休日向推销员们实行补偿的计划 该公司决定对每一个未利用的病休日向每一名推销员支付一份津贴 在以前的若干年中 每名推销员每年的病休日数目具有均值为9 2和标准差为1 8的相对频数分布 为了确定这项补偿计划是否有效地减少了被利用的平均病休日数目 该公司随机抽选了81名推销员并在年终时将每个人的病休日数目记录下来 a假定这项补偿计划对减少被利用的平均病休日数无效 试求81名被随机选出的推销员所产生的样本均值小于8 76天的概率 提示 如果补偿计划无效 那么这一年被每名推销员利用的病休日数目的相对频数分布就具有与前些年相同的平均值和标准差 即9 2 1 8 b 如果被利用的病休日的样本平均数算出是 8 76天 有无充分证据说补偿计划是有效的 或这一年每名推销员所用病休日的真正平均数小于前些年的平均数9 2 3 假定我们所选的一个随机样本由40份最近颁发的以改进现有住宅结构为目的的建筑许可证组成 已记录下每份许可证的价值x 以往的经验表明 在某个特定的县内 这种建筑许可证价值的相对频数分布具有平均值8000美元和标准差1500美元 a以代表由上述40份许可证组成的样本的平均价值 试描述的抽样分布 b样本中许可证的平均价值小于7500美元的概率是多少 c样本中许可证的平均价值在7500美元和8500美元之间的概率是多少 课堂练习参考答案 1 某公司决定对职员增发 销售代表 奖 计划根据过去一段时期内的销售状况对月销售额最高的5 的职员发放该奖金 已知这段时期每人每个月的平均销售额 单位 元 服从均值为40000 方差为360000的正态分布 那么公司应该把 销售代表 奖的最低发放标准定为多少元 解 2 P2617 27 今年有一家大保险公司启动了一项为未利用的病休日向推销员们实行补偿的计划 该公司决定对每一个未利用的病休日向每一名推销员支付一份津贴 在以前的若干年中 每名推销员每年的病休日数目具有均值为9 2和标准差为1 8的相对频数分布 为了确定这项补偿计划是否有效地减少了被利用的平均病休日数目 该公司随机抽选了81名推销员并在年终时将每个人的病休日数目记录下来 a假定这项补偿计划对减少被利用的平均病休日数无效 试求81名被随机选出的推销员所产生的样本均值小于8 76天的概率 提示 如果补偿计划无效 那么这一年被每名推销员利用的病休日数目的相对频数分布就具有与前些年相同的平均值和标准差 即9 2 1 8 0 0139 b 如果被利用的病休日的样本平均数算出是 8 76天 有无充分证据说补偿计划是有效的 或这一年每名推销员所用病休日的真正平均数小于前些年的平均数9 2 证据充分 3 假定我们所选的一个随机样本由40份最近颁发的以改进现有住宅结构为目的的建筑许可证组成 已记录下每份许可证的价值x 以往的经验表明 在某个特定的县内 这种建筑许可证价值的相对频数分布具有平均值8000美元和标准差1500美元 a以代表由上述40份许可证组成的样本的平均价值 试描述的抽样分布 8000 237 172 b样本中许可证的平均价值小于7500美元的概率是多少 0 0174 c样本中许可证的平均价值在7500美元和8500美元之间的概率是多少 0 9652 作业 统计学 第四版 P1545 17P1736 1 参数估计在统计方法中的地位 第四节总体参数估计 统计推断的过程 一 参数估计概述 科学的抽样估计方法要具备三个基本条件1 要有合适的统计量作为估计量 比如 从一个样本可以计算平均数 中位数 众数等等 用哪个来作为总体平均数的估计量呢 2 要有合理的允许误差范围 允许误差范围又称抽样极限误差 指样本统计量与被估计总体参数离差的绝对值可允许变动的上限或下限 p P由于统计量本身也是随机变量 所以要使估计完全没有误差是难以做到 但是误差太大 这种估计也没有意义 误差太小势必增加人力物力和财力以及时间 这样抽样调查也失去了意义 所以要规定一定的误差范围 只要误差在允许的误差范围内的估计都是有效的 一 参数估计概述 3 要有一个可接受的置信度 估计置信度又称估计推断的概率保证程度 这是估计的可靠性问题 如果我们愿意冒10 的风险 这表示如果进行多次重复估计 则平均每100次估计将有10次是错误的 90次是正确的 90 就称为置信度或称为概率保证程度 要求估计的置信度达到100 是不可能的 但置信度太低 也没有意义 所以要有一个可接受的置信度 参数估计的基本方法有点估计和区间估计两种 二 点估计1 概念 点估计就是直接以样本指标代表总体指标 例如从某灯泡厂抽100只灯泡检验 其平均耐用时间为1100小时 产品合格率为90 就推断该厂生产的灯泡平均耐用时间为1100小时 产品合格率为90 此法的缺点是既没有说明这种推断的准确程度 也无法说明其可靠程度 只是一种粗略的估计 但是它又不同于拍脑袋的瞎猜 它是有科学根据的 对那些要求不太高的判断和分析 此法还是可以采用的 二 点估计2 优良估计量的三个标准 估计总体参数 未必只能用一个统计量 也可以用其他统计量 例如估计总体平均数 可以用样本平均数 也可以用样本中位数等等 应该用哪一个呢 就应该有一个标准 优良估计量有三个标准 无偏性即样本统计量的期望值 平均数 等于被估计的总体参数 前已证明 样本算术平均数作为总体平均数的估计量是符合无偏性要求的 即 一致性 即当样本的单位数充分大时 样本统计量也充分靠近总体参数 可以证明 以样本平均数估计总体平均数时 也符合一致性的要求 即存在下列关系式 有效性 即作为优良估计量的方差应该比其他估计量的方差小 例如用样本平均数或用总体任一变量来估计总体平均数都是无偏估计 但是样本平均数的方差比总体方差小 所以 样本平均数是更为有效的估计量 即 类似的有 样本比例是 0 1 分布平均数的表现形式 所以也完全符合优良估计量的标准 不是所有的估计量都符合以上标准 可以说符合以上标准的统计量比不符合或不完全符合以上标准的统计量更为优良 二战中的点估计 德军有多少辆坦克 二战期间 盟军非常想知道德军总共制造了多少辆坦 德国人在制造坦克时是墨守成规的 他们把坦克从1开始进行了连续编号 在战争过程中 盟军缴获了一些敌军坦克 并记录了它们的生产编号 那么怎样利用这些号码来估计坦克总数呢 在这个问题中 总体参数是未知的坦克总数N 而缴获坦克的编号则是样本 假设我们是盟军手下负责解决这个问题的统计人员 制造出来的坦克总数肯定大于等于记录的最大编号 为了找到它比最大编号大多少 我们先找到被缴获坦克编号的平均值 并认为这个值是全部编号的中点 因此样本均值乘以2就是总数的一个估计 当然要特别假设缴获的坦克代表了所有坦克的一个随机样本 这种估计N的公式的缺点是 不能保证均值的2倍一定大于记录中的最大编号 二战中的点估计 德军有多少辆坦克 N的另一个点估计公式是 用观测到的最大编号乘以因子1 1 n 其中n是被俘虏坦克个数 假如你俘虏了10辆坦克 其中最大编号是50 那么坦克总数的一个估计是 1 1 10 50 55 此处我们认为坦克的实际数略大于最大编号 从战后发现的德军记录来看 盟军的估计值非常接近所生产的坦克的真实值 记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目 统计学家们做得比间谍们更漂亮 资料来源 GUDMUNDR IVERSEN和MARYGERGRN著 吴喜之等译 统计学 基本概念和方法 高等教育出版社 施普林格出版社 2000 三 区间估计 区间估计 是根据样本统计量 去推断总体参数的可能范围 例如 估计总体参数在样本统计量加减一个抽样标准差范围内 即 概率为68 27 概率为95 45 可见 区间估计既说清了估计结果的准确性 又同时表明了它的可靠程度 是一种更为科学的估计 第五节一个总体参数的区间估计一 总体均值的区间估计 一 正态总体 方差已知 或非正态总体 大样本1 理论利用正态分布的有关定理 此时样本平均数服从或趋近于正态分布 即 重复抽样情况下 不重复抽样情况下 因此可以利用正态分布来近似地估计样本平均数在某个区间的概率 即 1时 P 标准化 区间估计的图示 2 误差范围 概率度 叫误差范围 也叫估计误差或允许误差 是一个系数 系数越大 样本统计量出现的概率或保证程度越大 反之亦反 其对应概率可查正态分布概率表 可见 样本统计量出现的概率大小 与该系数有关 故被称为概率度 是事先确定的概率值 也称为风险值 是估计出错的概率 1 称为置信水平 3 区间估计的方法 在这里是以总体平均数为中心来推断样本平均数所在的区间及其出现的概率 在实际中 正好相反 是以样本指标为中心去推断总体平均所在的区间和概率的 也就是要把上面的式子改为 实际上这二个式子是等价的 请大家自己推导 3 区间估计的方法 如果总体服从正态分布但未知 或总体并不服从正态分布 只要是在大样本条件下 公式中的总体方差可用样本方差S2代替 这时总体均值在1 置信水平下的置信区间可以写为 例子见教材P182 总体均值的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 为对产量质量进行监测 企业质检部门经常要进行抽检 以分析每袋重量是否符合要求 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表所示 已知产品重量的分布服从正态分布 且总体标准差为10克 试估计该批产品平均重量的置信区间 置信水平为95 总体均值的区间估计 例题分析 解 已知 N 102 n 25 1 95 z 2 1 96 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该食品平均重量的置信区间为101 44克 109 28克之间 总体均值的区间估计 例题分析 例 一家保险公司收集到由36投保个人组成的随机样本 得到每个投保人的年龄 周岁 数据如下表 试建立投保人年龄90 的置信区间 总体均值的区间估计 例题分析 解 已知n 36 1 90 z 2 1 645 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 投保人平均年龄的置信区间为37 37岁 41 63岁 二 正态总体 未知 小样本 1 假定条件总体服从正态分布 且方差 未知小样本 n 30 使用t分布统计量 总体均值 在1 置信水平下的置信区间为 t分布 分布是类似正态分布的一种对称分布 它通常要比正态分布平坦和分散 一个特定的分布依赖于称之为自由度的参数 随着自由度的增大 分布也逐渐趋于正态分布 总体均值的区间估计 例题分析 例 已知某种灯泡的寿命服从正态分布 现从一批灯泡中随机抽取16只 测得其使用寿命 小时 如下 建立该批灯泡平均使用寿命95 的置信区间 总体均值的区间估计 例题分析 解 已知 N 2 n 16 1 95 t 2 2 131 根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该种灯泡平均使用寿命的置信区间为1476 8小时 1503 2小时 二 总体比例的区间估计 1 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 3 总体比例 在1 置信水平下的置信区间为 总体比例的区间估计 例题分析 例 某城市想要估计下岗职工中女性所占的比例 随机抽取了100个下岗职工 其中65人为女性职工 试以95 的置信水平估计该城市下岗职工中女性比例的置信区间 解 已知n 100 p 65 1 95 z 2 1 96 该城市下岗职工中女性比例的置信区间为55 65 74 35 三 总体方差的区间估计 1 估计一个总体的方差或标准差2 假设总体服从正态分布总体方差 2的点估计量为S2 且 4 总体方差在1 置信水平下的置信区间为 总体方差的区间估计 图示 总体方差的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表7所示 已知产品重量的分布服从正态分布 以95 的置信水平建立该种食品重量方差的置信区间 总体方差的区间估计 例题分析 解 已知n 25 1 95 根据样本数据计算得s2 93 21 2置信度为95 的置信区间为 该企业生产的食品总体重量标准差的置信区间为7 54克 13 43克 课堂练习 1 进入学院或大学的成人大学生的数量不断增加 而且有很多人专修市场营销学 曾经进行过一项研究 旨在确定目前从事市场营销工作的人对当初在校学习时自己班上成人大学生的看法 从美国市场营销学会会员名录中随机抽选了一个由290名市场营销人员组成的样本 让样本中人员对一系列反映看法的说法表示态度 第一种说法是 成人大学生 年龄达24岁或更大的本科生 对参加班上的讨论比年龄较小的学生更积极 态度按5分制来测量 1 非常同意 2 同意 3 没有意见 4 不同意 5 很不同意 对于成人进大学的看法 样本的平均态度分是1 94 标准差为0 92 a 用98 置信区间估计市场营销人员对成人大学生参加课堂学习的真正平均态度分 b 怎样才能减小a中的置信区间宽度 2 许多北美城市已经建成或正在考虑建设轻型铁路运输 1ightrailtransit 缩作LRT 系统 以取代使用大型载客列车和地下铁道列车的重型铁路运输系统 LRT系统有点像19世纪初的有轨电车 只是车身更长 噪音更小 速度更快 而且比较舒适 在一项研究工作中 考察了已经建成或正在规划建设LRT系统的10个城市中LRT的运行特点 对都市规划人员来说 有一个重要特征是将客运收入除以运行费用所得出的票箱回收率 由10个城市组成的一个样本给出平均票箱回收率为0 604 标准差为0 163 a 试对北美城市中LRT系统的真正平均票箱回收率构造95 置信区间 b 如果样本容量从n 10增加到n 20 置信区间的宽度会发生什么变化 3 当你选购一种产品时 考虑得最多的是什么 是价格还是质量 RoperStarchWorldwide调查了2000名成年美国人 结果有64 的人说他们主要根据价格作出购买决策 a 试对根据价格而不是根据产品质量作出购买决策的成年美国人的真正百分率构造99 置信区间 b 对此区间作出解释 c 如将置信系数从o 99降到o 95 a中置信区间的宽度将发生什么变化 课堂练习参考答案 1 进入学院或大学的成人大学生的数量不断增加 而且有很多人专修市场营销学 曾经进行过一项研究 旨在确定目前从事市场营销工作的人对当初在校学习时自己班上成人大学生的看法 从美国市场营销学会会员名录中随机抽选了一个由290名市场营销人员组成的样本 让样本中人员对一系列反映看法的说法表示态度 第一种说法是 成人大学生 年龄达24岁或更大的本科生 对参加班上的讨论比年龄较小的学生更积极 态度按5分制来测量 1 非常同意 2 同意 3 没有意见 4 不同意 5 很不同意 对于成人进大学的看法 样本的平均态度分是1 94 标准差为0 92 a 用98 置信区间估计市场营销人员对成人大学生参加课堂学习的真正平均态度分 1 815 2 065 b 怎样才能减小a中的置信区间宽度 增大n或减小概率系数 2 许多北美城市已经建成或正在考虑建设轻型铁路运输 1ightrailtransit 缩作LRT 系统 以取代使用大型载客列车和地下铁道列车的重型铁路运输系统 LRT系统有点像19世纪初的有轨电车 只是车身更长 噪音更小 速度更快 而且比较舒适 在一项研究工作中 考察了已经建成或正在规划建设LRT系统的10个城市中LRT的运行特点 对都市规划人员来说 有一个重要特征是将客运收入除以运行费用所得出的票箱回收率 由10个城市组成的一个样本给出平均票箱回收率为0 604 标准差为0 163 a 试对北美城市中LRT系统的真正平均票箱回收率构造95 置信区间 0 6040 117 b 如果样本容量从n 10增加到n 20 置信区间的宽度会发生什么变化 变窄 3 当你选购一种产品时 考虑得最多的是什么 是价格还是质量 RoperStarchWorldwide调查了2000名成年美国人 结果有64 的人说他们主要根据价格作出购买决策 a 试对根据价格而不是根据产品质量作出购买决策的成年美国人的真正百分率构造99 置信区间 0 640 028 b 对此区间作出解释 c 如将置信系数从o 99降到o 95 a中置信区间的宽度将发生什么变化 变窄 作业 统计学 第三版 P204 7 17 87 117 19 1 第六节两个总体参数的区间估计 一 两个总体参数推断时样本统计量的抽样分布 两个样本均值之差的抽样分布 两个样本比例之差的抽样分布 两个样本方差比的抽样分布二 两个总体参数的区间估计 两个总体都为正态分布 即 两个样本均值之差的抽样分布服从正态分布 其分布的数学期望为两个总体均值之差方差为各自的方差之和 一 两个总体参数推断时样本统计量的抽样分布 两个样本均值之差的抽样分布 两个样本均值之差的抽样分布 两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本 当两个样本都为大样本时 两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和 两个样本比例之差的抽样分布 三 两个样本方差比的分布 两个总体都为正态分布 即X1 N 1 12 X2 N 2 22 从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布 服从分子自由度为 n1 1 分母自由度为 n2 1 的F分布 即 由统计学家费舍 R A Fisher 提出的 以其姓氏的第一个字母来命名则设若U为服从自由度为n1的 2分布 即U 2 n1 V为服从自由度为n2的 2分布 即V 2 n2 且U和V相互独立 则称F为服从自由度n1和n2的F分布 记为 F分布 Fdistribution F分布 图示 不同自由度的F分布 F分布的查表 一般F分布表只列出值 但根据F分布的性质 有 6 5 例 二 两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例的之差区间估计 两个总体方差比的区间估计 两个总体参数的区间估计 两个总体均值之差的区间估计 独立大样本 1 假定条件两个总体都服从正态分布 1 2 已知若不是正态分布 可以用正态分布来近似 n1 30和n2 30 两个样本是独立的随机样本使用正态分布统计量Z 两个总体均值之差的区间估计 独立大样本 1 1 2 已知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 1 2 未知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差 为此在两所中学独立地抽取两个随机样本 有关数据如下表 建立两所中学高考英语平均分数之差95 的置信区间 两个总体均值之差的估计 例题分析 解 两个总体均值之差在1 置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为5 03分 10 97分 两个总体均值之差的区间估计 独立小样本 12 22 1 假定条件两个总体都服从正态分布两个总体方差未知但相等 1 2 两个独立的小样本 n1 30和n2 30 总体方差的合并估计量 估计量 X1 X2的抽样标准差 两个总体均值之差的区间估计 独立小样本 12 22 两个样本均值之差的标准化 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 为估计两种方法组装产品所需时间的差异 分别对两种不同的组装方法各随机安排12个工人 每个工人组装一件产品所需的时间 分钟 下如表 假定两种方法组装产品的时间服从正态分布 且方差相等 试以95 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个总体均值之差的估计 例题分析 解 根据样本数据计算得合并估计量为 两种方法组装产品所需平均时间之差的置信区间为0 14分钟 7 26分钟 两个总体均值之差的估计 小样本 12 22 第一种情况 两个样本容量相等即1 假定条件两个总体都服从正态分布两个总体方差未知且不相等 1 2 两个独立的小样本 n1 30和n2 30 且使用统计量 两个总体均值之差的估计 小样本 12 22 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 小样本 12 22 第二种情况 两个样本容量不相等即1 假定条件两个总体都服从正态分布两个总体方差未知且不相等 1 2 两个独立的小样本 n1 30和n2 30 且使用统计量 两个总体均值之差的估计 小样本 12 22 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 沿用前例 假定第一种方法随机安排12个工人 第二种方法随机安排8个工人 即n1 12 n2 8 所得的有关数据如表 假定两种方法组装产品的时间服从正态分布 且方差不相等 以95 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个总体均值之差的估计 例题分析 解 根据样本数据计算得自由度为 两种方法组装产品所需平均时间之差的置信区间为0 192分钟 9 058分钟 两个总体均值之差的区间估计 匹配样本 两个总体均值之差的估计 匹配大样本 假定条件两个匹配的大样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 匹配小样本 假定条件两个匹配的小样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 由10名学生组成一个随机样本 让他们分别采用A和B两套试卷进行测试 结果如下表 试建立两种试卷分数之差 d 1 295 的置信区间 STATISTICS 两个总体均值之差的估计 例题分析 解 根据样本数据计算得 两种试卷所产生的分数之差的置信区间为6 33分 15 67分 1 假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2 两个总体比例之差 1 2在1 置信水平下的置信区间为 两个总体比例之差的区间估计 两个总体比例之差的估计 例题分析 例 在某个电视节目的收视率调查中 农村随机调查了400人 有32 的人收看了该节目 城市随机调查了500人 有45 的人收看了该节目 试以95 的置信水平估计城市与农村收视率差别的置信区间 两个总体比例之差的估计 例题分析 解 已知n1 500 n2 400 p1 45 p2 32 1 95 z 2 1 96 1 2置信度为95 的置信区间为 城市与农村收视率差值的置信区间为6 68 19 32 两个总体方差比的区间估计 1 比较两个总体的方差比用两个样本的方差比来判断如果S12 S22接近于1 说明两个总体方差很接近如果S12 S22远离1 说明两个总体方差之间存在差异总体方差比在1 置信水平下的置信区间为 两个总体方差比的区间估计 图示 两个总体方差比的区间估计 例题分析 例 为了研究男女学生在生活费支出 元 上的差异 在某大学各随机抽取25名男学生和25名女学生 得到下面的结果 男学生 女学生 试以90 置信水平估计男女学生生活费支出方差比的置信区间 两个总体方差比的区间估计 例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉服许愿活动策划方案
- 沃尔沃品鉴活动方案
- 跨平台SAX解析技术探讨-洞察阐释
- 量子材料的电声效应研究-洞察阐释
- 数字孪生影视场景构建-洞察阐释
- 肘管综合征分子药物研究新进展-洞察阐释
- 2025七年级数学上册第二章有理数的运算2.3有理数的乘方专题二有理数的混合运算作业课件新版新人教版
- 2025年岩土工程师工程地质勘察报告编制知识点练习
- 4.银川经开区六盘山路电缆通道工程施工深基坑专项施工方案
- 公司股权激励方案(完整版)
- 2025至2030中国柔性直流输电行业运营规划及发展前景深度分析报告
- 安全产风险管理制度
- 深化国有企业改革调研提纲
- 小学骑车安全课件
- 公司个人独资章程范本
- 《中国酒类企业ESG披露指南》
- 2025年航空安全管理专业考试试卷及答案
- 2025至2030年中国玉米淀粉行业市场现状分析及前景战略研判报告
- 安徽省2025年普通高校招生志愿预填表(普通类)
- 2025高考全国一卷语文真题
- 诈骗谅解书和退赔协议书
评论
0/150
提交评论