第四篇抽样和分布1药学.ppt_第1页
第四篇抽样和分布1药学.ppt_第2页
第四篇抽样和分布1药学.ppt_第3页
第四篇抽样和分布1药学.ppt_第4页
第四篇抽样和分布1药学.ppt_第5页
免费预览已结束,剩余22页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计学 通过抽取总体中的部分 样本 进行观察获得数据 抽样 并通过这些数据对总体进行推断 一 数理统计研究的问题 1 怎样设计试验 决定观察的数目 2 怎样利用试验观察的结果作出一个 好 的推断等 第一个问题是怎样进行抽样 使抽得的样本更合理 并有更好的代表性 这是抽样方法和试验设计问题 第二个问题是怎样从取得的样本去推断总体 这种推断具有多大的可靠性 这是统计推断问题 统计方法具有 部分推断整体 的特征 因为从一小部分样本观察值去推断全体对象 总体 即由部分推断全体 这里使用了 归纳推理 的方法 它不同于数学中的 演绎推理 归纳推理 根据观察到的大量个别情况 归纳推断总体 演绎推理 从一些假设 命题 已知的事实等出发 按一定的逻辑推理得出结果 二 数理统计方法的特点 例如 在几何学中要证明 等腰三角形底角相等 只须从 等腰 这个前提出发 运用几何公理 一步一步推出这个结论 这是演绎推理 而一个习惯于统计思想的人 可能这样推理 做很多大小形状不一的等腰三角形 实地测量其底角 看差距如何 根据所得资料看看可否作出 底角相等 的结论 这样做就是归纳式的方法 问题 用局部观察对总体下结论 有没有片面性 结论是否可靠 显然这不仅依赖于进行局部观察的 样本 是否具有总体的代表性 也依赖于对从这些样本得到数据的合理加工 分析并得出论断 事实上 如果一切都建立在可靠的科学基础上 则对总体下结论是可能的 也是可靠的 但也应记住 毕竟是由 局部 推断 整体 因而仍可能犯错误 结论往往是在某个 可靠性水平 之下得出的 概率论是数理统计的基础 而数理统计是概率论的重要应用 但它们是并列的两个数学学科 并无从属关系 学习数理统计无须把过多时间化在计算上 可以更有效地把时间用在基本概念 方法原理及方法适用对象的正确理解上 国内外著名的统计软件包 SAS SPSS STAT等 都可以让你快速 简便地进行数据处理和分析 第四章随机抽样和抽样分布 4 1抽样的基本概念和方法 一 总体 Population 与个体 Sample 一个统计问题总有它明确的研究对象 总体 研究对象的全体 或集合 总体 个体 总体中每个对象 或元素 每个个体具有的数量指标的全体就是总体 总体通常以一个概率分布描述 实例研究某地区12岁儿童生长发育情况 总体和个体应为什么 显然 总体为该地区的全体儿童个体为每一个儿童 当然 衡量儿童生长发育情况要通过诸如身高 体重等数量指标进行 所以对总体的研究实际上是对该地区的全体儿童的这些指标值概率分布进行研究 根据研究指标的多少 总体分为一维总体 研究一项描述指标 常用随机变量X表示 多维总体 研究多项描述指标 常用随机向量表示 如二维总体 X Y 根据含个体数量多少 总体分为有限总体和无限总体 二 简单随机样本 simplerandomsample 研究总体通常有两种方法 一是全面地观察统计 普查 二是从总体中抽取一部分个体观察统计 抽样 抽样 sampling 从总体中抽取部分个体的过程 样本 sample 在一维总体中 抽取得到的n个体 样本容量 sampleSize 样本中所含个体的数量 注意 1 一维总体的每个个体的描述指标常用一个随机变量表达 所以容量为n的样本一般用n个随机变量X1 X2 Xn表达 2 一维总体X的取值 是每个个体对应的指标数据x 而样本X1 X2 Xn的取值 是指每抽取一次样本所对应n个个体的指标数据 称为样本观察值 简称样本值 记作x1 x2 xn 总体 样本 样本值的关系 样本是联系二者的桥梁 简单随机样本 在随机抽样中 与总体X有相同概率分布 且相互独立的样本X1 X2 Xn 简单随机样本的性质 1 随机性Xi的取每个个体的概率相等 2 独立性X1 X2 Xn的相互独立 其样本观察值互不影响 3 代表性X1 X2 Xn与总体X有相同概率分布 后面提到的样本如不说明 都是指简单随机样本 一般地 对有限总体 应采用有放回抽样 对无限总体 或数量较多 可采用无放回抽样 近似看作有放回 否则违背独立性 简单随机抽样具体实施的方法 抽签法随机数法 三 统计量 Statistic 样本是对总体的代表和反映 抽样的目的是利用样本值对总体进行统计推断 而对总体进行统计推断 常根据需要的不同 利用样本构造一些包含所需要的多种信息的量 就是关于样本X1 X2 Xn的一些函数 这些函数统称为统计量 统计量实际上表示样本的数字特征 若X1 Xn为总体X的一个样本 g X1 X2 Xn 是一个不包含任何未知参数的函数 则g X1 Xn 称为一个统计量 统计量定义 统计量的特点 1 统计量是样本中n个随机变量X1 X2 Xn的函数 它是完全由样本决定的量 仍是一个随机变量 2 统计量不包含任何未知参数 几种常用统计量 用于反映总体均值的信息 注意与总体数学期望的区别和联系 用于反映总体方差的信息 注意与总体方差的区别和联系 分母为n 1的原因 SD与SE的区别 SD是描述个体观察值变异程度的大小 样本标准差越小 样本均数对一组样本观察值的代表性就越好 SE是描述样本均数变异程度和抽样误差的大小 样本标准误越小 用样本均数估计总体均数的可靠性就越高 在实际中 一般用样本标准差与样本均数结合 用于描述样本观察值的分布范围 样本标准误与样本均数结合 用于估计总体均数可能出现的范围 五 变异系数见课本P49 P49案例4 1 四 常用抽样方法 抽样方法就是获取样本的方法 1 单纯随机抽样 是一种等概率抽样 即总体中每个个体都有相等的机会被抽取 对有限总体 应采用有放回抽样 对无限总体 或数量较多 可采用无放回抽样 近似看作有放回 例 从某年级1000名学生抽查100名调查上网情况 该法是其他抽样方法的基础 优点是均数及标准差 误 计算简单 且抽得的样本是简单随机样本 缺点是总体量较大时 编号及随机抽取工作量大 把学号后4位作为编号 做成签 充分混合后 从中摸出100个 则把这100位同学作为样本 或用微机随机产生 常用实施方法 抽签法和随机数法 2 系统抽样 机械抽样 按一定顺序和间隔从总体中抽取样本的方法 步骤 编号分段确定起始编号获取样本 例 从某年级1000名学生抽查100名调查上网情况 该法优点是简单易行 样本观察值在总体中分布均匀 缺点是样本观察值总按一定周期趋势得到 易产生偏性 可把学号的后4位作为编号 把个位数0 9做成签 充分混合后 从中摸1个数 如摸得6 则把这1000位同学中个位数字为6的100位同学作为样本 3 分层抽样 按某种特征将总体分成若干互不重叠组别 类型或区域等 称为分层 再从各层中随机抽样组成样本 例 调查某校同学上网情况 该法要求各层间差异尽可能大 才能得到有较好代表性的样本 并便于各层间分析比较 可采用以年级分层抽样的方法 但上面例子则不适用 因差异较小 4 整群抽样 先将总体分成若干互不重叠部分 称为群 再从各群中随机抽取某群或几群作为样本 例 调查某年级学生上网情况 该法适用于大规模调查 易于组织 节省人力物力 但误差较大 适于群体差异较小的调查对象 可把每班作为一群 从中随机抽取一班或几班作为样本 5 多阶段抽样 先将总体分成若干互不重叠组 再将各组分成几个亚组 各亚组再分成几个小组等 每一分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论