第3章实验数据分析理论分布与抽样分布_第1页
第3章实验数据分析理论分布与抽样分布_第2页
第3章实验数据分析理论分布与抽样分布_第3页
第3章实验数据分析理论分布与抽样分布_第4页
第3章实验数据分析理论分布与抽样分布_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 理论分布与抽样 分布 n理解统计分析的基本原理,正确掌握和应用统计分析 方法, n概率论中最基本的两个概念 事件 概率 n常用的几种随机变量的概率分布 正态分布 、二项分 布、波松分布以及 样本平均数的抽样分布 和 t分布 。 下一张 主 页 退 出 上一张 1 事件与 概率 1.1 事 件 1.1.1 必然现象与随机现象 在自然界与生产实践和科学试验中,人 们会观察到各种各样的现象,把它们归纳起 来,大体上分为两大类: 下一张 主 页 退 出 上一张 必然现象: 可预言其结果的,即在保持条件 不变的情况下,重复进行试验,其结果总是确 定的,必然发生的(或必然不发生)。这类现 象称为 必然现象 ( inevitable phenomena) 或 确定性现象 ( definite phenomena)。 随机现象: 另一类是事前不可预言其结果的 ,即在保持条件不变的情况下,重复进行试验 ,其结果未必相同。这类在个别试验中其结果 呈现偶然性、不确定性现象,称为 随机现象 ( random phenomena ) 或 不确定性现 象 ( indefinite phenomena)。 下一张 主 页 退 出 上一张 随机现象 或不确定性现象,有如下 特点 : n 在一定的条件实现时,有 多种可能的结果 发 生,事前人们不能预言将出现哪种结果; n对 一次或少数几次 观察或试验而言,其 结果呈 现偶然性、不确定性 ; n但在相同条件下进行 大量重复试验 时,其试验 结果却呈现出某种固有的、特定的规律性 频率的稳定性 ,通常称之为 随机现象的统计规 律性 。 下一张 主 页 退 出 上一张 1.1.2 随机试验与随机事件 1 随机试验 通常我们把根据某一 研究目的 , 在 一定条件下 对 自然现象 所进行的 观察或试验 统称为 试验 ( trial)。 下一张 主 页 退 出 上一张 当一个试验如果满足下述三个特性 , 则 称 其 为 一个 随机试验 ( random trial),简称 试验 。 ( 1)试验可以在相同条件下 多次重复 进行; ( 2)每次试验的 可能结果不止一个 ,并且 事先 知道 会有哪些可能的结果; ( 3)每次试验总是恰好出现这些可能结果中的一 个 , 但在一次试验之前却不能肯定这次试验会出 现哪一个结果。 下一张 主 页 退 出 上一张 2 随机事件 随机试验的每一种可能结果,在一定条件下 可能发生,也可能不发生,称为 随机事件 ( random event), 简称 事 件 (event), 通 常用 A、 B、 C等来表示。 ( 1)基本事件 我 们 把 不 能 再 分的事件称为 基本事件 ( elementary event) , 也 称为 样本点 ( sample point)。 下一张 主 页 退 出 上一张 例如,从编号为 1、 2、 3、 、 10 的十个篮 球中随机抽取 1个篮球,有 10种不同的可能结果: “ 取 得 一 个 编 号 是 1” 、 “ 取得一个编 号是 2”、 、 “取得一个编号 是 10”,这 10个事 件都是不可能再分的事件,它们都是基本事件。 由若干个基本事件组合而成的事件称为 复合 事件 ( compound event)。 如 “取得一个编 号是 2的倍数 ”是一个复合事件,它由 “ 取得一 个编号是 2 ”、 “ 是 4”、 “是 6、 “是 8”、 “是 10” 5个基本事件组合而成。 下一张 主 页 退 出 上一张 ( 2)必然事件 把在一定条件下必然会发生的事件称为 必然事件 ( certain event), 用 oumige表示。 例如,一个大气压下,水加热 到 100C, 水会沸腾;种瓜得瓜、种豆得豆 下一张 主 页 退 出 上一张 ( 3)不可能事件 在一定条件下不可能发生的事件称为 不可能事件 ( impossible event), 用 fai表示。例如,在满足一定孵化条 件下,从石头孵化出小鸡,就是一个不可能事件。 必然事件与不可能事件实际上是确定性现象,它们不是随机 事件, 但 是 为了方便起见,我们把它们看作为两个特殊的随 机事件。 1.2 概 率 1.2.1 概率统计定义 n研究随机试验,仅知道可能发生哪些随机事件是不够 的,还需了解各种随机事件发生的可能性大小,以揭 示这些事件的 内在的统计规律性 ,从而指导实践。 n这就要求有一个能够 表示事件发生可能性大小的数量 指标 ,这个指标应该是事件本身所固有的,且不随人 的主观意志而改变,人们 称之为概率 ( probability )。 事件 A的概率记为 P( A)。 下一张 主 页 退 出 上一张 概率:表示随机事件发生可能性大小的数量概率:表示随机事件发生可能性大小的数量 指标指标 概率的统计定义: 在相同条件下进行 n次重复 试验,如果随机事件 A发生的次数为 m, 那么 m/n称为随机事件 A的 频率( frequency); 当 试验重复数 n逐渐增大时,随机事件 A的频率越来 越稳定地接近某一数值 p , 那么就把 p称为随机 事件 A的 概率 。 下一张 主 页 退 出 上一张 如此定义的概率称为如此定义的概率称为 统计概率统计概率 ( statistics probability),或者称后),或者称后 验概率(验概率( posterior probability)。)。 表 3-1 抛掷一枚硬币发生正面朝上的试验记录 下一张 主 页 退 出 上一张 例如 为了确定抛掷一枚硬币出现正面朝上这个事件的 概率 ,历史上有人作过成千上万次抛掷硬币的试验。 在表 31 中列出了他们的试验记录。 从表 3-1可看出,随着实验次数的增多, 正面朝上这个事件发生的频率越来越稳定地接 近 0.5,我们就把 0.5作为这个事件的概率。 在一般情况下,随机事件的概率 p是不可能 准确得到的。通常以试验次数 n充分大 时随机事 件 A的频率作为该随机事件概率的近似值。 即 P( A) =pm/n ( n充分大 ) ( 3-1) 下一张 主 页 退 出 上一张 1.2.2 概率的性质 ( 1)对于任何事件 A,有 0P( A) 1; ( 2) 必然事件的概率为 1,即 P( ) =1; ( 3) 不可能事件的概率为 0,即 P( ) =0。 2 概率 分布 事件的概率表示了一次试验某一个结果 发生的可能性大小。若要全面了解试验,则 必须知道试验的 全部可能结果及各种可能结 果发生的概率 ,即必须知道随机试验的概率 分布 (probability distribution)。 为了 深入研究随机试验 ,我 们 先引入随机变量 (random variable)的概念。 下一张 主 页 退 出 上一张 2.1 随机变量 下一张 主 页 退 出 上一张 2004年奶粉事件年奶粉事件 “大头娃大头娃 ” 描述随机事件的变量称为随机变量描述随机事件的变量称为随机变量 。 作一次试验,其结果有多种可能。每一种可能结作一次试验,其结果有多种可能。每一种可能结 果都可用一个数来表示,把这些数作为果都可用一个数来表示,把这些数作为 变量变量 x的取的取 值值 ,则试验结果可用变量,则试验结果可用变量 x来表示。来表示。 随机变量的取值在一次试验前不能确定,具有随随机变量的取值在一次试验前不能确定,具有随 机性。机性。 【 例例 】 对对 10种品牌袋装奶粉进行质量检测,其种品牌袋装奶粉进行质量检测,其 可能结果是可能结果是 “0种合格种合格 ”、 “1种合格种合格 ”、 “2种合格种合格 ”、 “”、 “10种袋装奶粉都合格种袋装奶粉都合格 ”。若用。若用 x表示表示 袋装奶粉合格品牌数,则袋装奶粉合格品牌数,则 x的取值为的取值为 0、 1、 2、 、 10。 【 例 】 食品加工中高温杀菌可能结果只有两种, 即 “全部杀死细菌 ”与 “未能全部杀死细菌 ”。 若用 变量 x表示试验的两种结果,则可令 x=0表示 “未 能全部杀死细菌 ”, x=1表示 “全部杀死细菌 ”。 【 例 】 测定关中地区不同小麦品种的蛋白质含量 ,其蛋白质含量在 9.3-13.5之间,如用 x表示 测定结果,那么 x值可以是这个范围内的任何实数 。 下一张 主 页 退 出 上一张 离 散 型 随 机 变 量: 如果表示试验结果的 变量 x, 其可能取值为 可数 个 ,且 以各种确定 的概率取这些不同的值 , 则 称 x 为 离 散 型 随 机 变 量 ( discrete random variable); 连续 型 随 机 变 量: 如果表示试验结果的变 量 x , 其可能取值为 某范围内的任何数值 ,且 x 在其取值范围内的任一 区间 中取值时,其概率是 确定的,则称 x为 连续 型 随 机 变 量 ( continuous random variable)。 下一张 主 页 退 出 上一张 试验结果和取此结果的概率可以一一列出。试验结果和取此结果的概率可以一一列出。 不能列出试验结果和取此结果的概率不能列出试验结果和取此结果的概率 ,只能给出一定范围和在此范围内取,只能给出一定范围和在此范围内取 值的概率。值的概率。 2.2 离散型随机变量的概率分布 要了解离散型随机变量 x的统计规律,就必 须 知 道它的一切可能值 xi及取每种可能值的概 率 pi。 如果我们将离散型随机变量 x的一切可能取 值 xi ( i=1, 2 , ), 及其对应的概率 pi, 记作 P(x=xi)=pi i=1,2, (33) 则称 ( 33 )式为 离散型随机变量 x的概 率分布或分布 。常用 分 布 列 (distribution series)来表示: 下一张 主 页 退 出 上一张 x1 x2 xn . p1 p2 pn 从 分布列 可以一目了然看出随机变量 X的可能取值 及取这些值的概率。 离散型随机变量的概率分布具有 pi0和 pi=1这 两个基本性质。 2.3 连续型随机变量的概率分布 连续型随机变量 (如身高、体重等 )的概率分布不 能用 分布列 来表示, 因为其可能取值是不可数的,不 能一一列出。改用随机变量 x在某个 区间 内取值的概率 P(ax2) ( df1) t分布密度曲线如 图 3-11 所示 图图 3-11 不同自由度的不同自由度的 t分布分布 ( 1) t分布受自由度的制约,每一个自由度都有一条 t分布密度曲线。 ( 2) t分布密度曲线以纵轴为对称轴,左右对称,且 在 t 0时,分布密度函数取得最大值。 ( 3)与标准正态分布曲线相比, t分布曲线顶部略低 ,两尾部稍高而平。 df越小这种趋势越明显。 df越大 , t分布越趋近于标准正态分布。当 n 30时, t分布 与标准正态分布的区别很小; n 100时, t分布基本 与标准正态分布相同; n 时, t 分布与标准正态分 布完全一致。 下一张 主 页 退 出 上一张 t分布的特点是:分布的特点是: t分布的概率分布函数为: (3-29) 因而 t在区间( t1, +) 取值的概率 右 尾概率为 1-F t (df)。 由于 t分布左右对称, t在 区间( -, -t1) 取值的概率也为 1-F t df)。 于是 t 分布 曲线 下由 -到 - t 1和由 t 1到 + 两 个 相 等 的 概 率 之和 两尾概率为 2(1-F t (df)。 对于不同自由度下 t分布的两尾 概率及其对应的临界 t值已编制成附表 3,即 t分 布表。 TDIST 下一张 主 页 退 出 上一张 例如,当 df=15时,查附表 3得两尾概率等于 0.05的临界 t值为 =2.131,其意义是: P(-30时,时, 分布已趋向于正态分布已趋向于正态 分布。分布。 下一张 主 页 退 出 上一张 设设 为来自正态总体为来自正态总体 的一个随机的一个随机 样本,样本方差为样本,样本方差为 S12 , 为来自为来自 正态总体正态总体 的一个随机样本,样本方差为的一个随机样本,样本方差为 S22 ,且这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论