




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章样本及其分布第一节简单随机样本 本章转入课程的第二部分 数理统计 数理统计的特点是应用面广 分支较多 社会的发展不断向统计提出新的问题 计算机的诞生与发展 为数据处理提供了强有力的技术支持 数理统计与计算机的结合是必然的发展趋势 学习统计无须把过多时间化在计算上 可以更有效地把时间用在基本概念 方法原理的正确理解上 国内外著名的统计软件包 SAS SPSS MATLAB STAT等 都可以让你快速 简便地进行数据处理和分析 从历史的典籍中 人们不难发现许多关于钱粮 户口 地震 水灾等等的记载 说明人们很早就开始了统计的工作 但是当时的统计 只是对有关事实的简单记录和整理 而没有在一定理论的指导下 作出超越这些数据范围之外的推断 到了十九世纪末二十世纪初 随着近代数学和概率论的发展 才真正诞生了数理统计学这门学科 数理统计学 数理统计学是一门应用性很强的学科 它是研究怎样以有效的方式收集 整理和分析带有随机性的数据 以便对所考察的问题作出推断和预测 直至为采取一定的决策和行动提供依据和建议 数理统计不同于一般的资料统计 它更侧重于应用随机现象本身的规律性进行资料的收集 整理和分析 由于大量随机现象必然呈现出它的规律性 因而从理论上讲 只要对随机现象进行足够多次观察 被研究的随机现象的规律性一定能清楚地呈现出来 但客观上只允许我们对随机现象进行次数不多的观察试验 也就是说 我们获得的只是局部观察资料 数理统计的任务就是研究怎样有效地收集 整理 分析所获得的有限的资料 对所研究的问题 尽可能地作出精确而可靠的结论 现实世界中存在着形形色色的数据 分析这些数据需要多种多样的方法 因此 数理统计中的方法和支持这些方法的相应理论是相当丰富的 概括起来可以归纳成两大类 参数估计 根据数据 用一些方法对分布的未知参数进行估计 假设检验 根据数据 用一些方法对分布的未知参数进行检验 它们构成了统计推断的两种基本形式 这两种推断渗透到了数理统计的每个分支 在统计学中 将我们研究的问题所涉及的对象的全体称为总体 而把总体中的每个成员称为个体 例如 我们想要研究一家工厂的某种产品的废品率 这种产品的全体就是我们的总体 而每件产品则是个体 一 总体与个体 注意 实际上 我们真正关心的并不是总体或个体的本身 而是其某项数量指标 比如某家工厂的一种产品的使用寿命这样一项数量指标 因此 我们应该把总体理解为那些研究对象上的某项数量指标的全体 为了评价一家工厂的某种产品的质量的好坏 通常的做法是从它的全部产品中随机地抽取一些样品 在统计学上称为样本 同上道理 我们实际是把样本理解为样品上的数量指标 因此 今后当我们说到总体和样本时 既指研究对象又指它们的某项数量指标 例1 研究某地区N个农户的年收人 在这里 总体既指这N个农户 又指我们关心的数量指标 他们的年收入的N个数字 如果我们从这N个农户中随机地抽出n个农户作为调查对象 那么 这n个农户以及我们关心的数量指标 他们的年收入这n个数字就是样本 例2 用一把尺子去量一个物体的长度 假定n次测量值为X1 X2 Xn显然 在这个问题中 我们把测量值X1 X2 Xn看成了样本 但是 总体是什么呢 分析 事实上 这里没有一个现实存在的个体的集合可以作为我们的总体 可是 我们可以这样考虑 既然n个测量值X1 X2 Xn是样本 那么总体就应该理解为一切所有可能的测量值的全体 对一个总体 如果我们用X表示它的数量指标 那么X的值对不同的个体取不同的值 因此 如果我们随机地抽取个体 则X的值也就随着抽取的个体的不同而不同 所以X是一个随机变量 既然总体是随机变量X 自然就有其概率分布 我们把X的分布称为总体的分布 总体的特性是由总体分布来刻画的 因此 我们常把总体和总体分布视为同义语 二 简单随机样本 为了解总体X的分布 需要从中随机抽取一定数量的个体进行观测 这些被抽取的部分个体 称为总体的一个样本 样本中个体的数量称为样本容量 当样本还未抽取时 容量为n的样本是一个n维随机变量 X1 X2 Xn 若抽样已经实现 则称为容量为n的样本值 x1 x2 xn 为样本观测值 并称xi为Xi的一个观测值 为保证抽取的样本能较好的反映总体的特征 样本需满足 1 样本具有代表性 即样本中的每个个体Xi都与总体X具有相同的分布 2 样本中的各个个体X1 X2 Xn相互独立 称满足以上两个条件的样本为简单随机样本 称获得简单随机样本的抽样方法为简单随机抽样 样本是一个随机变量 样本的分布可以由总体的分布确定 设总体X的分布函数为F x 则样本 X1 X2 Xn 的联合概率分布函数为 由样本值去推断总体情况 需要对样本值进行 加工 这就要构造一些样本的函数 它把样本中所含的 某一方面 的信息集中起来 三 统计量 这种不含任何未知参数的样本的函数称为统计量 它是完全由样本决定的量 定义 设 X1 X2 Xn 是来自总体X的一个样本 g X1 X2 Xn 是 X1 X2 Xn 的函数 若g是连续函数 且g中不含任何未知参数 则称g X1 X2 Xn 为一个统计量 若 x1 x2 xn 是样本 X1 X2 Xn 的一个观测值 则g x1 x2 xn 是统计量g X1 X2 Xn 的一个观测值 几个常见统计量 样本均值 样本方差 它反映了总体均值的信息 它反映了总体方差的信息 S称为样本标准差 样本k阶原点矩 样本k阶中心矩 k 1 2 它反映了总体k阶矩的信息 它反映了总体k阶中心矩的信息 若 x1 x2 xn 为样本 X1 X2 Xn 的观测值 则 S2 Ak Sk 的观测值分别为 第二节抽样分布 统计量既然是依赖于样本的 而后者又是随机变量 故统计量也是随机变量 因而就有一定的分布 这个分布叫做统计量的 抽样分布 抽样分布就是通常的随机变量函数的分布 只是强调这一分布是由一个统计量所产生的 研究统计量的性质和评价一个统计推断的优良性 完全取决于其抽样分布的性质 抽样分布 精确抽样分布 渐近分布 小样本问题中使用 大样本问题中使用 定理 设X1 X2 Xn是来自均值为 方差为 2的总体X的一组样本 则当n充分大时 近似地有 回顾中心极限定理 可以得到如下结论 所以接下来的所有结论都是以正态分布为基础进行讨论的 或者说是讨论在正态总体下的抽样分布问题 首先介绍抽样分布中的三大分布 记为 定义 设相互独立 都服从正态分布N 0 1 则称随机变量 所服从的分布为自由度为n的分布 分布是由正态分布派生出来的一种分布 分布的密度函数为 分布的性质 应用中心极限定理可得 若 的分布近似正态分布N 0 1 则可以求得 E X n Var X 2n 若 n2分布的密度函数的图形如上图 n2分布的上 分位点可以查附表5 P268 2分布的分位点 对于 0 1 给定 称满足条件 的点 n2 为 n2分布的上 分位点 T的密度函数为 所服从的分布为自由度为n的t分布 二 t分布 记为T 具有自由度为n的t分布的随机变量T的数学期望和方差为 E T 0 Var T n n 2 对n 2 当n充分大时 其图形类似于标准正态分布密度函数的图形 t分布的密度函数关于x 0对称 且 T tn 对于 0 1 给定 称满足条件 t分布的分位点 的点tn 为t分布的上 分位点 t分布的上 分位点可以查附表4 P266 三 F分布 即它的数学期望并不依赖于第一自由度n1 F分布的数学期望为 若n2 2 若X X的概率密度为 F Fm n 对于 0 1 给定 称满足条件 F分布的分位点 的点Fm n 为F分布的上 分位点 F分布的上 分位点可以查附表6 P271 当总体为正态分布时 教材上给出了几个重要的抽样分布定理 这里我们不加证明地叙述 四 几个重要的抽样分布定理 定理1 样本均值的分布 n取不同值时样本均值的分布 定理2 样本方差的分布 n取不同值时的分布 定理3 定理4 两总体样本均值差的分布 定理5 满足方差齐性的两总体样本均值差的分布 定理6 两总体样本方差比的分布 假设某物体的实际重量为 但它是未知的 现在用一架天平去称它 共称了n次 得到X1 X2 Xn 假设每次称量过程彼此独立且没有系统误差 则可以认为这些测量值都服从正态分布N 2 方差 2反映了天平及测量过程的总精度 通常我们用样本均值试讨论样本均值与实际重量的偏差 根据基本定理 例1 例如 0 1时 若取n 10 则 下面讨论估计值 即样本均值与真值 的偏差 于是根据第二章讲过 随着称量次数n的增加 这个偏差界限 还是 0 1时 若取n 100 则 越来越小 在设计导弹发射装置时 重要事情之一是研究弹着点偏离目标中心的距离的方差 对于一类导弹发射装置 弹着点偏离目标中心的距离服从正态分布N 2 这里 2 100米2 现在进行了25次发射试验 用S2记这25次试验中弹着点偏离目标中心的距离的样本方差 求 S2超过50米2的概率 例2 根据基本定理 查表得到 解 设和分别是取自正态总体 的容量为n的两个样本和的样本均值 试确定n使两个样本均值之差超过 的概率等于0 01 例3 据题意 故 解 故 故 于是 反查附表3 可得 故 所以应作14次试验 例4 已知 证明 证明 不妨设 其中 则 显然 故 例5 为简
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度二手房购房合同样本(含合同争议处理)
- 二零二五年窗帘行业联盟标准制定与执行合同
- 二零二五年度数据中心机房租赁合同
- 2025版河砂、碎石绿色环保材料供应合同
- 2025版担保合同风险管理框架与工具
- 2025版新疆棉纱购销合同范本
- 2025版无人驾驶技术研发合伙人合作协议合同
- 2025版燃气管道安装与安全监管合同
- 2025版钢材贸易结算合同标准范本
- 二零二五版护坡施工劳务管理服务合同范本
- 混凝土裂缝控制技术
- 《文化研究导论》课件
- 公共管理研究方法 课件 第11、12章 定性比较分析、写作
- 融资入股合作协议
- 上门按摩项目创业计划书
- 模块三 环境感知技术
- 基本无害的计量经济学:实证研究者指南
- 锦联铝材自治区
- 2021起重设备安装工程施工及验收标准
- 中药制剂检验技术题库+参考答案
- DSM-V美国精神疾病诊断标准
评论
0/150
提交评论