「统计学6抽样和抽样分【学习材料】」.ppt_第1页
「统计学6抽样和抽样分【学习材料】」.ppt_第2页
「统计学6抽样和抽样分【学习材料】」.ppt_第3页
「统计学6抽样和抽样分【学习材料】」.ppt_第4页
「统计学6抽样和抽样分【学习材料】」.ppt_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样和抽样分布 第一节抽样及抽样组织形式第二节常见的概率分布第三节抽样分布 1 课件精选 几个概念 总体 将要调查或研究的事物或现象的全体 个体 组成总体的每个元素 容量 总体中所含个体的个数 例如 某个城市居民家庭收入情况 总体这个城市所有家庭的收入个体这个城市每个家庭的收入容量这个城市所有家庭户数 2 课件精选 抽样 从总体中按一定的抽样技术抽取若干个个体的过程 样本 所抽取的部分个体样本量 所抽取的个体的个数如 某个城市居民家庭收入情况 抽取1000户进行调查 1000户为一个样本 样本量为1000 3 课件精选 第六章抽样和抽样分布 第一节抽样及抽样组织形式一 抽样的几个基本概念 一 全及总体和样本总体全及总体全及总体的单位总数用N表示 称作总体容量 当确定了研究目标时 它具有唯一性 总体容量 4 课件精选 第六章抽样和抽样分布 样本总体样本单位 单元 从全及总体中抽出的部分单位 每个单位称作样本单位 样本容量 样本总体的单位总数 样本总体不具有唯一性 它的可能个数与N n及抽样方法有关 通常n 30称为小样本 n 30称为大样本 5 课件精选 第六章抽样和抽样分布 例 某养猪场共有存栏肉猪10000头 现欲了解这批肉猪平均每头的毛重 从中抽取100头称其重量 计算这100头的平均每头毛重 以达到我们期望的目的 可能的样本数量 种 不考虑顺序的不重置抽样 全及总体 样本容量 6 课件精选 第六章抽样和抽样分布 二 总体参数和样本统计量总体参数根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标 由于全及总体唯一确定 所以称为总体参数 样本统计量根据样本总体各单位变量值计算的反映样本总体某数量特征的综合指标 由于样本不具唯一性 故称为样本统计量 它是一个随机变量 7 课件精选 第六章抽样和抽样分布 表 总体参数和样本统计量符号 总体平均数 样本平均数 总体标准差 总体方差 8 课件精选 第六章抽样和抽样分布 二 抽样组织形式基本的抽样组织方式有以下几种 简单随机抽样类型抽样等距抽样整群抽样多阶段抽样 9 课件精选 第六章抽样和抽样分布 一 简单随机抽样1 简单随机抽样的概念简单随机抽样也称单纯随机抽样 它是指从总体的所有单位中按照随机原则抽取样本单位的方式 分为重置抽样和不重置抽样 例 掷骰子 总体中每个单位被抽取的机会是均等的 10 课件精选 第六章抽样和抽样分布 1 重置 复 抽样又称放回抽样 抽样安排 对每次被抽到的单位经登记后再放回总体 重新参与下一次抽选的抽样方法 在每次的抽取中样本单位被抽中的概率都等于1 N 统计中称这样的抽样为相互独立的实验 从总体中随机抽取一个单位并把结果记录下来称为一次试验 11 课件精选 第六章抽样和抽样分布 从总体N个单位 抽取样本容量为n个单位的重置试验 可能抽取的样本个数称为可重置的排列数 被抽中样本的概率为例1 考虑从包含有1 6的点数的总体中抽取n 2的样本 掷2个骰子具有相同点数 的概率 12 课件精选 第六章抽样和抽样分布 2 不重置 复 抽样又称为不放回抽样 抽样安排 对每次抽到的单位登记后不再放回总体 不参加下一次抽选 下一次继续从总体中余下的单位抽取样本单位 这样连续进行n次试验的抽样方法 13 课件精选 第六章抽样和抽样分布 从总体N个单位 抽取样本容量为n个单位的试验 可能抽取的样本点个数称为不重置的组合数举例 例2 考虑从包含有1 6的点数的总体中抽取n 2的样本 掷2个骰子具有相同点数 的概率 14 课件精选 第六章抽样和抽样分布 2 简单随机抽样的实施简单随机抽样的抽取样本的方法多种多样 首先必须先把总体各单位全部编号 然后利用摇号 掷骰子或随机数表的方法抽取样本 例5 3使用随机数表p116 随数表的使用 15 课件精选 第六章抽样和抽样分布 简单随机抽样的局限性 p117 1 必须有包含所有单元的一个完整抽样框 而当N很大时很难有完整的抽样框 2 抽得的样本很分散 难以找到每个样本单元并实施调查 3 当总体单位间所研究的数量特征值的差异较大时 抽样效果不理想 16 课件精选 第六章抽样和抽样分布 二 分层随机抽样p118如果总体可以分为互不重叠且穷尽的若干个子总体 即每个单元必须属于且仅属于一个子总体 则称这样的子总体为层 抽样在每一层中独立进行 总的样本由各层的样本组成 所得的样本称为分层样本 如果每层中的抽样都是按简单随机抽样进行 那么这种抽样就称为分层随机抽样 所得的样本称为分层随机样本 也称类型抽样 17 课件精选 第六章抽样和抽样分布 分层随机抽样的特点 p118 1 各层样本不仅可用于总体参数的估计外 还可用来对层的参数进行估计 2 分层抽样实施灵活方便 便于组织 3 与简单随机样本比较 分层样本在总体中的分布更均匀 4 分层抽样能较大的提高调查精度 仅取决于各层内的方差 与层与层之间的差异无关 注 分层抽样包括等比例抽样和不等比例抽样 18 课件精选 第六章抽样和抽样分布 三 整群抽样整群抽样又称为分群抽样或集团抽样 将总体划分为若干个群 然后以群为单位从中间按简单随机抽样的方式或等距抽样的方式抽取部分群 对中选群中的所有单位一一进行调查的抽样组织方式 19 课件精选 第六章抽样和抽样分布 注意 整群抽样和分层抽样的区别 整群抽样的缺点 在相同的条件下 抽样误差较大 代表性较低 影响全及总体中各单位分配的均匀性 20 课件精选 第六章抽样和抽样分布 四 等距抽样系统抽样也称机械抽样 它是将总体中的单位按某种顺序排列 在规定的范围内随机抽取起始单位 然后按一套规则确定其他样本单元的一种抽样方法 等距抽样是先将总体各单位按某一标志顺序排列 然后按照固定的顺序和相同的间隔来抽取样本单位的抽样组织方式 有关标志排序 对总体个单位的变异情况有所了解 如 职工家计按照职工人均工资排序 最简单的系统抽样 包括无关标志排序抽样和有关标志排序抽样 21 课件精选 第六章抽样和抽样分布 五 多阶段抽样阶段抽样又称为多级抽样 它是一种将抽取样本单位的过程划分为几个阶段 然后逐阶段抽取样本单位的抽样组织方式 单阶段抽样 抽出的样本单位直接是总体单位 二阶段抽样 将总体进行分组 从中随机抽出一些组 然后再从中选组中随机抽取总体单位 多阶段抽样 如我国农产量调查 22 课件精选 第六章抽样和抽样分布 二阶及多阶段抽样的特点 1 样本单元相对集中 与简单随机抽样相比 实施方便 每个基本单元的调查费用较低 2 能充分发挥抽样的效率 23 课件精选 第六章抽样和抽样分布 多阶段抽样的优点 p121 1 便于组织 2 可以获得各阶段单元的调查资料 3 多阶段抽样的方式比较灵活 24 课件精选 第六章抽样和抽样分布 第二节常见的概率分布一 随机变量用大写字母X Y Z等表示随机变量 用相应的小写字母表示随机变量的取值 例如随机变量X的取值表示为 某次试验结果的数值性描述 称为随机变量 包括 离散型随机变量 连续型随机变量 25 课件精选 第六章抽样和抽样分布 定义 离散型随机变量只能取有限个或可数个值的随机变量 称为离散型随机变量 discreterandomvariable 定义 连续型随机变量可以取一个或多个区间中任何值的随机变量 称为连续型随机变量 continuousrandomvariable 26 课件精选 第六章抽样和抽样分布 两种随机变量举例 27 课件精选 第六章抽样和抽样分布 二 离散型随机变量 一 离散型随机变量的概率分布定义 离散型随即变量的概率分布列出随机变量X的所有可能值 以及取每个值的概率 并用表格的形式表现出来 称为离散型随机变量的概率分布 28 课件精选 第六章抽样和抽样分布 表 离散型随机变量的分布 1 2 也称概率分布 29 课件精选 第六章抽样和抽样分布 离散型概率分布具有以下性质 1 2 30 课件精选 第六章抽样和抽样分布 例题3 投掷一颗骰子后出现的点数X是一个离散型随机变量 写出掷一颗骰子出现的点数的概率分布 例题4 一部电梯在一周内发生故障的次数X及相应的概率如下表所示 1 确定的a值 2 求正好发生2次故障的概率 3 求故障次数不超过2次的概率 4 故障次数多于1次的概率 0 100 250 35 31 课件精选 第六章抽样和抽样分布 二 离散型随即变量的数学期望和方差1 数学期望定义 离散型随机变量X的数学期望是X所有可能取值 1 2 与其相应的概率 1 2 的乘积之和 用或表示 即 32 课件精选 第六章抽样和抽样分布 2 方差定义 离散型随机变量X的方差等于与其相应的概率的乘积之和 用和D X 表示 即 D X 方差或标准差放映了随机变量取值的离散程度 33 课件精选 第六章抽样和抽样分布 例题5 一家电脑配件供应商声称 他所提供的配件100个中拥有次品的个数X及概率分布如表所示 表 每100个配件中的次品数及概率分布求该供应商提供的配件的次品数的数学期望和标准差 次品数 概率 34 课件精选 第六章抽样和抽样分布 三 常用的离散型概率分布1 两点分布最简单的随机试验是只有两种可能结果的试验 称之为伯努利试验 若定义一次伯努利试验成功的次数为离散型随机变量X 它的概率分布就是最简单的一个分布类型 即两点分布 亦称伯努利分布 35 课件精选 第六章抽样和抽样分布 定义 如果随机变量X只可能取0和1两个值 它的概率分布为则称X服从参数为的两点分布 也称0 1分布 36 课件精选 第六章抽样和抽样分布 二 二项分布 补充 二项分布与伯努利有关 若将伯努利试验独立地重复n次 n是一个固定数值 则该试验称为n重伯努利试验 具体说 n重伯努利试验满足下列条件 1 一次试验只有两种可能结果 2 一次试验 成功 的概率为p 失败 的概率为q 1 p 而且概率对每次试验都相同 3 试验是相互独立的 4 试验可以重复n次 5 在次试验中 成功 的次数对应一个离散型随机变量X 这样 在n次试验中 出现 成功 的次数的概率分布就是二项分布 37 课件精选 第六章抽样和抽样分布 定义 在n次试验中 出现 成功 的次数的概率为则称随机变量X服从参数 n p 的二项分布 记作 二项分布的数学期望和方差分别为 38 课件精选 第六章抽样和抽样分布 例题6 已知一批产品的次品率为4 从中有放回地抽取5个 求5个产品中 1 没有次品的概率是多少 2 恰好有1个次品的概率是多少 3 有三个以下次品的概率是多少 39 课件精选 第六章抽样和抽样分布 三 连续型随机变量 一 概率密度函数设X是一连续随机变量 它代表某一区间或多个区间中的任意数值 它的概率分布通过概率密度函数来表述 记作 概率密度函数的函数值不是真正意义上的取值概率 40 课件精选 概率密度函数 密度函数f x 表示X的所有取值x及其频数f x 41 课件精选 概率密度函数 在平面直角坐标系中画出f x 的图形 则对于任何实数x1 x2 P x1 X x2 是该曲线下从x1到x2的面积 概率是曲线下的面积 42 课件精选 第六章抽样和抽样分布 连续型随机变量的分布函数对于随机变量X 设为任意实数 则函数 称为随机变量X的分布函数 分布函数F在处的取值就是随机变量X的取值落在区间上的概率 43 课件精选 二 正态分布 normaldistribution 由C F 高斯 CarlFriedrichGauss 1777 1855 作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述可用于近似离散型随机变量的分布例如 二项分布经典统计推断的基础 44 课件精选 第六章抽样和抽样分布 1 正态分布如果随机变量X的密度函数为则称X为正态随机变量 或称X服从参数为 的正态分布 记作 f x 随机变量X的频数 正态随机变量X的均值 正态随机变量X的方差 3 1415926 e 2 71828 自然对数 x 随机变量的取值 x 45 课件精选 第六章抽样和抽样分布 不同的值和不同的值 对应不同的正态分布 正态分布密度曲线的位置 正态分布密度曲线的形状 46 课件精选 第六章抽样和抽样分布 正态曲线的性质 P123图形是关于x 对称的钟形曲线 且峰值在x 处均值 和标准差 一旦确定 分布的具体形式也惟一确定 不同参数正态分布构成一个完整的 正态分布族 均值 可取实数轴上的任意数值 决定正态曲线的具体位置 标准差决定曲线的 陡峭 或 扁平 程度 越大 正态曲线扁平 越小 正态曲线越陡峭当X的取值向横轴左右两个方向无限延伸时 曲线的两个尾端也无限渐近横轴 理论上永远不会与之相交正态随机变量在特定区间上的取值概率由正态曲线下的面积给出 而且其曲线下的总面积等于1 47 课件精选 和 对正态曲线的影响 48 课件精选 正态分布的概率 49 课件精选 第六章抽样和抽样分布 正态分布的概率分布函数为 50 课件精选 第六章抽样和抽样分布 2 标准正态分布定义 如果正态分布的随机变量具有均值为0 标准差为1的特征 则称该随机变量服从标准正态分布 记为N 0 1 51 课件精选 第六章抽样和抽样分布 标准正态分布的概率密度函数用表示 即标准正态分布的分布函数 52 课件精选 第六章抽样和抽样分布 标准正态分布的转化 任何一个服从一般正态分布的随机变量都可通过Z转换成标准正态分布N 0 1 转换公式为 Z是一个服从标准正态分布的随机变量 即Z N 0 1 53 课件精选 第六章抽样和抽样分布 对于随机变量Z N 0 1 设其分布函数为 则标准正态变量在任何一个区间上的概率可表示为 54 课件精选 第六章抽样和抽样分布 对于服从一般正态分布的随机变量X 取值在某一区间上的概率都可以通过标准正态分布求得 P124准正态分布 常用概率 p125 表326 55 课件精选 第六章抽样和抽样分布 例题7 1 假定某公司职员每周加班津贴服从均值为50元 标准差为10元的正态分布 那么全公司中有多少比例的职员每周加班津贴会超过70元 又有多少比例的职员每周加班津贴在40元到60元之间 56 课件精选 第六章抽样和抽样分布 第三节抽样分布一 三种不同性质的分布 一 总体分布 populationdistribution 总体中各元素 单位 的观察值所形成的频数分布 称为总体分布 57 课件精选 第六章抽样和抽样分布 二 样本分布 sampledistribution 从总体中抽取一个容量为n的样本 由这n个观察值形成的相对频数分布称为样本分布 58 课件精选 第六章抽样和抽样分布 三 抽样分布 samplingdistribution 某个样本统计量的抽样分布 从理论上说就是在重复选取容量为n的样本时 由该统计量的所有可能取值形成的相对频数分布 59 课件精选 第六章抽样和抽样分布 二 抽样推断的理论基础大数定律 大数法则 p131如果随机变量总体存在着有限的平均数和方差 则对于充分大的抽样单位数n 可以以几乎的趋近于1的概率 使抽样平均数与总体平均数的绝对离差的期望为任意小 描述当实验次数很大时所呈现的概率性质定律 如 掷硬币 中心极限定理p132设从均值为 方差为 有限 的任意一个总体中抽取样本量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为 n的正态分布 60 课件精选 第六章抽样和抽样分布 三 一个总体参数推断时的样本均值 样本比例的抽样分布 一 样本均值的抽样分布在重复选取容量为n的样本时 由样本均值的所有可能取值形成的相对频数分布 称为样本均值的抽样分布 61 课件精选 第六章抽样和抽样分布 1 抽样分布的形成过程例 设一个总体含有4个个体 即N 4 4个个体的取值分别为 x1 1 x2 2 x3 3 x4 4 从总体中采取重复抽样的方法抽取容量为n 2的随机样本 写出的抽样分布 62 课件精选 16个可能的样本即样本均值和标准差 63 课件精选 样本均值的分布 64 课件精选 第六章抽样和抽样分布 样本均值抽样分布的形成过程 65 课件精选 第六章抽样和抽样分布 2 抽样分布的形状 66 课件精选 第六章抽样和抽样分布 3 抽样分布的特征设总体共有N个单位 其均值为 方差为 从中抽取容量为n的样本 样本均值的数学期望 即样本均值的均值 记为 样本均值的方差记为 67 课件精选 第六章抽样和抽样分布 当总体服从正态分布N 2 时 来自该总体的所有容量为n的样本的均值 x也服从正态分布 x的数学期望为 方差为 2 n 即 x N 2 n 68 课件精选 第六章抽样和抽样分布 中心极限定理 设从均值为 方差为 2的一个任意总体中抽取容量为n的样本 当n充分大时 样本均值的抽样分布近似服从均值为 方差为 2 n的正态分布 69 课件精选 例 某酒店电梯中质量标注明最大载重为18人 1350kg 假定该酒店游客及其携带行李的平均重量为70kg 标准差为6kg 试问随机进入电梯18人 总重量超重的概率是多少 70 课件精选 第六章抽样和抽样分布 样本均值的数学期望样本均值的方差重复抽样不重复抽样 样本均值的抽样分布 数学期望与方差 71 课件精选 第六章抽样和抽样分布 比较及结论 1 样本均值的均值 数学期望 等于总体均值2 样本均值的方差等于总体方差的1 n 样本均值的抽样分布 数学期望与方差 72 课件精选 第六章抽样和抽样分布 所有可能的样本均值的标准差 测度所有样本均值的离散程度 也称标准误差 小于总体标准差 计算公式为 均值的抽样标准误差 73 课件精选 第六章抽样和抽样分布 二 样本比例的抽样分布在重复选取容量为n的样本时 由样本比例的所有可能取值形成的频数分布 称为样本比例抽样分布 74 课件精选 第六章抽样和抽样分布 总体 或样本 中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品 或不合格品 与全部产品总数之比总体比例可表示为样本比例可表示为 75 课件精选 第六章抽样和抽样分布 在重复选取容量为的样本时 由样本比例的所有可能取值形成的相对频数分布 就是样本比例的抽样分布 当样本容量很大时 样本比例的抽样分布可用正态分布近似 76 课件精选 第六章抽样和抽样分布 样本比例的数学期望样本比例的方差重复抽样不重复抽样 77 课件精选 例 某产品仓库有一批钢轴 10000个 用不重置抽样方法从中抽出400个检查是否生锈 经查发现80个生锈 求该批钢轴生锈率的抽样标准差 抽样平均误差 78 课件精选 第六章抽样和抽样分布 四 样本方差的抽样分布定义 在重复选取容量为n的样本时由样本方差所有可能取值形成的相对频数分布 称为样本方差的抽样分布 79 课件精选 第六章抽样和抽样分布 在重复选取容量为n的样本时 由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本 则比值的抽样分布服从自由度为 n 1 的 2分布 即 80 课件精选 第六章抽样和抽样分布 由阿贝 Abbe 于1863年首先给出 后来由海尔墨特 Hermert 和卡 皮尔逊 K Pearson 分别于1875年和1900年推导出来设 则令 则Y服从自由度为1的 2分布 即当总体 则 81 课件精选 第六章抽样和抽样分布 分布的变量值始终为正分布的形状取决于其自由度n的大小 通常为不对称的正偏分布 但随着自由度的增大逐渐趋于对称期望为 E 2 n 方差为 D 2 2n n为自由度 可加性 若U和V为两个独立的 2分布随机变量 U 2 n1 V 2 n2 则U V这一随机变量服从自由度为n1 n2的 2分布 2分布的性质和特点 82 课件精选 第六章抽样和抽样分布 c2分布 图示 83 课件精选 第六章抽样和抽样分布 五 两个总体参数推断时样本统计量的抽样分布 一 两个样本均值之差的抽样分布 二 两个样本比例之差的抽样分布 三 两个样本方差之比的抽样分布 84 课件精选 第六章抽样和抽样分布 一 两个样本均值之差的抽样分布定义 从两个总体中分别独立地抽取容量为n1和n2的样本 在重复选取容量为n1和n2的样本时 由两个样本均值之差所有可能取值形成的相对频数分布 称为两个样本均值之差的抽样分布 85 课件精选 第六章抽样和抽样分布 两个总体都为正态分布 即 两个样本均值之差的抽样分布服从正态分布 其分布的数学期望为两个总体均值之差方差为各自的方差之和 86 课件精选 第六章抽样和抽样分布 两个样本均值分布 图示 87 课件精选 第六章抽样和抽样分布 二 两个样本比例之差的抽样分布定义 从服从二项分布的两个总体中 分别独立地抽取容量为n1和n2的样本 在重复选取容量为n1和n2的样本时 由两个样本比例之差所有可能取值形成的相对频数分布 称为两个样本比例之差的抽样分布 88 课件精选 第六章抽样和抽样分布 两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本 当两个样本都为大样本时 两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和 89 课件精选 第六章抽样和抽样分布 三 两个样本方差比的抽样分布定义 从两个正态总体分别独立地抽取容量为n1和n2的样本 在重复选取容量为n1和n2的样本时 由两个样本方差之比所有可能取值形成的相对频数分布 称为两个样本方差之比的抽样分布 90 课件精选 第六章抽样和抽样分布 两个总体都为正态分布 即X1 N 1 12 X2 N 2 22 从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布 服从分子自由度为 n1 1 分母自由度为 n2 1 的F分布 即 91 课件精选 第六章抽样和抽样分布 由统计学家费希尔 R A Fisher 提出的 以其姓氏的第一个字母来命名则设若U为服从自由度为n1的 2分布 即U 2 n1 V为服从自由度为n2的 2分布 即V 2 n2 且U和V相互独立 则称F为服从自由度n1和n2的F分布 记为 F分布 92 课件精选 第六章抽样和抽样分布 不同自由度的F分布 F分布 图示 93 课件精选 1 已知一批产品的次品率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论