




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章统计量及其抽样分布 第6章统计量及其抽样分布 学习目标 了解统计量及其分布的几个概念了解由正态分布导出的几个重要分布理解样本均值的分布与中心极限定理掌握单样本比例和样本方差的抽样分布 6 1统计量 6 1 1参数和统计量 1 参数参数是总体参数的简称 是反映总体数量特征的指标 其数值是唯一的 确定的 但往往是未知的 最常用的参数有总体均值 记为 总体比率 记为 和总体方差 记为 2 统计量统计量是样本统计量的简称 是由样本中单位的变量值计算得到的反映样本数量特征的指标 其数值是不确定的 随机的 最常用的统计量有样本平均数 记为 样本比率 记为p 样本方差 记为 统计量 statistic 设X1 X2 Xn是从总体X中抽取的容量为n的一个样本 如果由此样本构造一个函数T X1 X2 Xn 不依赖于任何未知参数 则称函数T X1 X2 Xn 是一个统计量样本均值 样本比例 样本方差等都是统计量统计量是样本的一个函数统计量是统计推断的基础 6 2关于分布的几个概念 6 2 1抽样方法6 2 2抽样分布6 2 3抽样分布的形态与中心极限定理 6 2 1抽样方法 重复抽样和不重复抽样 重复抽样 是指从N个总体单位中 抽取一个单位进行观察 记录后放回去 然后再抽取下一个单位 这样连续抽取n个单位组成样本的方法 也称回置式抽样 M N 不重复抽样 是指从N个总体单位中 抽取一个单位进行观察 记录后 不再放回去 再抽取下一个单位 这样连续抽取n个单位组成样本的方法 n 例如 从A B C D四个单位中 抽出两个单位构成一个样本 问可能组成的样本数目是多少 重复抽样 A A AC AD B A BB BC BD AB C A CB CC CD D A DB DC DD N n 42 16 个样本 1 抽样分布的概念某个统计量对应的频率分布或概率分布称为该统计量的抽样分布 常用的抽样分布有样本平均数的抽样分布 样本比率的抽样分布 样本方差的抽样分布 6 2 2抽样分布 samplingdistribution 例 假设一个总体包含6个单位 分别是 采取重复抽样的方法 从中抽取2个单位组成样本 试描述的抽样分布 解 首先考虑总体的分布情况 显然总体服从均匀分布 1 样本平均数的抽样分布 总体均值为 总体方差为 采取重复抽样的方法从N 6个单位中抽取n 2个单位组成样本 一共可以抽取个样本 对应的可以计算出36个 表所有容量为2的样本及其平均数 表8 2的抽样分布 频数 频率p 我们分别绘制总体分布图和抽样分布图 P x x x的分布 P 的分布 从这两个分布图中我们可以看到 在本例中 虽然总体服从均匀分布 但经过抽样平均后 样本平均数的抽样分布是对称的有了抽样分布的基本印象后 我们还可以进一步探索的数量特征 分布的形态以及抽样平均误差 1 的数学期望 2 的方差 3 的抽样平均误差 4 修正系数上述结论是在重复抽样的条件下得到的 如果是有限总体且不重复抽样 当样本容量超过总体容量的5 时 要对样本方差进行修正 修正系数为 这时样本方差为 的抽样平均误差为 此公式说明 抽样平均误差与总体标准差成正比 与样本容量成反比 当总体标准差未知时 可用样本标准差代替 例 某讨论小组有A B C D四名同学 其统计学作业分数分别为80 90 70 60分 现从中有放回地随机抽取两名同学 试计算样本平均分数的抽样平均误差解 总体均值和总体方差分别为因此 抽样平均误差为 不重复抽样的平均误差一定会小于重复抽样的平均误差 为什么 采用不重复抽样 公式表明 抽样平均误差不仅与总体变异程度 样本容量有关 而且与总体单位数的多少有关 例题1 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样平均误差 解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 N 2000 n 400 s 300 x 4800 6 2 3抽样分布的形态与中心极限定理 中心极限定理 centrallimittheorem x的分布趋于正态分布的过程 由 例 我们自然会做出如下合理的推测 当总体中包含的单位非常多 我们抽取的样本容量足够大时 的抽样分布会越来越趋近于正态分布 大量的试验表明 无论总体服从什么分布 只要总体方差已知 样本容量足够大 样本平均数近似服从正态分布 这个结论就是著名的中心极限定理 其中 样本平均数的数学期望 样本平均数的方差 数学表达式表示为 理解中心极限定理时注意点 1 已知 正态分布 未知 t分布2 总体分布 总体服从正态分布 条件加强总体偏斜 样本容量大3 样本容量足够大 大于30 大样本 小于30 小样本 标准化变换 大样本 总体方差已知条件下 标准正态分布的分布函数记为 它有三个重要的性质 某汽车电瓶商声称其生产的电瓶具有均值为60个月 标准差为6个月的寿命分布 现假设质监部门决定检验该厂的说法是否正确 为此随机抽取50个该厂生产的电瓶进行寿命试验 则 1 假定厂商声称是正确的 试描述50个电瓶的平均寿命的抽样分布 2 假定厂商声称是正确的 则50个样品组成的样本的平均寿命不超过57个月的概率是多少 例题 6 5 解 则根据中心极限定理可以推出50个电瓶的平均寿命的分布服从正态分布 即 2 如果厂方声称是正确的 则观察得到的50个电池的平均寿命不超过57个月的概率为 结论 即如果厂方的说法正确 则50个电瓶的平均寿命不超过57个月的概率为0 0002 这是一个不可能事件 根据小概率事件原理 观察到50个电瓶的平均寿命小于或等于57个月的事件是不可能的 反之 如果真的观察得到50个电瓶的平均寿命低于57个月 则有理由怀疑厂方说法的正确性 即可认为厂方的说法是不正确的 6 3样本比例的抽样分布 1 只表现为是与否 有或无的标志 称为是非标志 也称为交替标志 成数 总体中 交替标志只有两种表现 我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数 N1表示具有某种标志的单位数 N0表示不具有某种标志的单位数P和q分别表示具有与不具有某种标志的成数P q 1或q 1 p 成数 是非标志的方差与标准差 交替标志的平均数 6 3样本比例的抽样分布 总体 或样本 中具有某种属性的单位数与单位总数之比 1 总体比例 2 样本比例 当较大时 样本比例近似服从平均数为 方差为的正态分布 即近似有 6 12 6 13 一般情况下 如果X是一随机变量 C为一常数 则CX与X有相同的分布形状 设则 例6 6 例6 7 设某统计人员在其填写的报表中有2 至少会有一处错误 如果检查了一个由600份报表组成的随机样本 其中至少有一处错误的报表所占的比例在0 025 0 070之间的概率是多少 解 由于 得 根据中心极限定理则近似有 于是 即该统计人员所填写的报表中至少有一处错误的报表所占的比例在0 025 0 070之间的概率为19 02 6 4两个样本平均数和比例之差的分布 前面讨论一个样本平均数和比例的分布 有时需要比较两个总体的平均数和比例 例如 要比较人们的购买行为中喜欢产品甲的比例与喜欢产品乙的比例 比较两种不同投资项目的预期回报等 从而需要讨论两个样本平均数和比例之差的分布 两个样本平均数之差的分布 例6 8 设有甲 乙两所著名高校在某年录取新生时 甲校的平均数为655分 标准差为20分 而乙校的平均数为625分 标准差为25分 且都服从正态分布 现从甲 乙两校各随机抽取8名新生计算其平均分数 出现甲校比乙校的平均分低的可能性有多大 解 已知 则甲校样本平均数低于乙校样本平均数的概率为 因为两个总体均为正态分布 所以8个新生的平均成绩也分别为正态分布 也为正态分布 且 两个样本比例之差的分布 例6 9 一项抽样调查表明甲城市有15 消费者用过 圣洁 牌矿泉水 乙城市有8 消费者用过该品牌矿泉水 设甲城市随机抽取120人 乙城市随机抽取140人 两个样本相互独立 求不低于0 08的概率 解 已知 的抽样分布可认为近似服从正态分布 即 于是 6 5关于样本方差的分布 只讨论总体为正态总体时样本方差的分布 6 5 1样本方差的抽样分布 6 5 2两个样本方差比的抽样分布 设两个总体都服从正态分布 即 且两个随机样本相互独立 则 6 19 由正态分布导出的几个重要分布 总体为正态分布时的重要抽样分布有分布 分布和分布等 2分布 数学期望和方差 设 则 t分布 6 2 t 分布 t distribution 提出者是WilliamGosset 也被称为学生分布 student st t分布是类似正态分布的一种对称分布 通常要比正态分布平坦和分散 一个特定的分布依赖于称之为自由度的参数 随着自由度的增大 分布也逐渐趋于正态分布 数学期望和方差 设 则 F分布 6 5 F分布是统计学家费希尔首先提出的 方差分析 回归方程的显著性检验 数学期望和方差 F分布与t分布的关系 设 则 t 分布 用Excel计算t分布的概率和临界值 利用Excel中的 TDIST 统计函数 可以计算给定值和自由度时分布的概率值语法 TDIST x degrees freedom tails 利用 TINV 函数则可以计算给定概率和自由度时的相应语法 TINV probability degrees freedom 计算t分布的临界值 Excel 不同自由度的c2 分布 c2 分布 用Excel计算c2分布的概率 利用Excel提供的 CHIDIST 统计函数 计算c2分布右单尾的概率值语法 CHIDIST x degrees freedom 其中df为自由度 x 是随机变量的取值利用 CHIINV 函数则可以计算给定右尾概率和自由度时相应的反函数值语法 CHIINV probability degrees freedom 计算c2分布的概率 Excel 不同自由度的F分布 F 分布 用Excel计算F分布的概率和临街值 利用Excel提供的 FDIST 统计函数 计算分布右单尾的概率值语法 FDIST x degrees freedom1 degrees freedom2 利用 FINV 函数则可以计算给定单尾概率和自由度时的相应语法 FINV probability degrees freedom1 degrees freedom2 计算F分布的概率 Excel 结束 THANKS p的抽样平均误差 其中 样本比率的抽样平均误差 抽样成数平均误差的计算方法 采用重复抽样 采用不重复抽样 例题二 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 例题三 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 例题二解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 例题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电脑维修买卖协议书
- 电梯租赁安全协议书
- 离婚分居挽留协议书
- 海外代购质保协议书
- 直播基地运营协议书
- 珠宝挂件合作协议书
- 物料采购技术协议书
- 瓦工装修合同协议书
- 烟囱加固专利协议书
- 狗狗看病补偿协议书
- 华侨城文旅项目商业计划书
- 老年人误吸的预防团体标准试题
- 电缆管廊敷设施工方案及流程
- 中风的早期识别和急救处理方法
- pets5历年真题(口语)
- 2024年广东省中山市教学共进联盟中考一模数学试题(含答案)
- 2024年司法考试真题及答案
- 口腔护士进修总结汇报
- 2023年11月2024中咨公司校园公开招聘笔试历年高频考点-难、易错点荟萃附答案带详解
- 软件项目投标技术方案
- 成人气管切开拔管中国专家共识解读
评论
0/150
提交评论