概率论与数理统计课件:第15讲 总体与样本_第1页
概率论与数理统计课件:第15讲 总体与样本_第2页
概率论与数理统计课件:第15讲 总体与样本_第3页
概率论与数理统计课件:第15讲 总体与样本_第4页
概率论与数理统计课件:第15讲 总体与样本_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 前五章讲述了概率论的最基本的内容,概括起来主要是随机变量的概率分布。那里通常我们假定概率分布是已知的。但是,在实际中,随机变量的分布往往是未知的,或者有未知的成分。解决的办法:对随机变量进行多次观察。 例如:某地区一个月内交通事故的发生次数服从泊松分布 ,希望了解月平均事故次数 ,以便采取应对策略。数理统计引言 从理论上讲,只要对随机现象进行足够多次的观察,随机现象的规律性就一定能够清楚地呈现出来。 但是,客观上只允许我们对随机现象进行次数不多的观察或试验,也就是说:我们获得的只能是局部的或有限的观察资料。 统计学的任务就是研究怎样有效地收集、整理和分析所获得的有限资料,并对所研究的问题尽可

2、能地给出精确而可靠的推断。 现实世界中存在着形形色色的随机数据,分析这些数据需要多种多样的方法。因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的。我们主要介绍如下两大类: 参数估计: 根据数据,对分布中的未知参数 进行估计; 假设检验: 根据数据,对分布的未知参数的 某种假设进行检验。 参数估计与假设检验构成了统计推断的两种基本形式,这两种推断渗透到了数理统计的每个分支。6.1 总体与样本 在数理统计中,称研究问题所涉及对象的全体为总体,总体中的每个成员为个体。 例如: 研究某工厂生产的某种产品的废品率,则这种产品的全体就是总体,而每件产品都是一个个体。6.1.1 总体、个体与样本

3、实际上,我们真正关心的并不一定是总体或个体本身,而真正关心的是总体或个体的某项数量指标。 如:某电子产品的使用寿命,某天的最高气温,加工出来的某零件的长度等数量指标。因此,有时也将总体理解为那些研究对象的某项数量指标的全体。 为评价某种产品质量的好坏,通常的做法是:从全部产品中随机(任意)地抽取一些样品进行观测(检测),统计学上称这些样品为一个样本。 同样,我们也将样本的数量指标称为样本。因此,今后当我们说到总体及样本时,既指研究对象又指它们的某项数量指标。例1:研究某地区 N 个农户的年收人。 在这里,总体既指这 N 个农户,又指我们所关心的 N个农户的数量指标他们的年收入( N 个数字)。

4、 如果从这 N 个农户中随机地抽出 n 个农户作为调查对象,那么,这 n 个农户以及他们的数量指标年收入( n个数字)就是样本。 注意:上例中的总体是直观的,看得见、摸得着的。但是,客观情况并非总是这样。例2:用一把尺子测量一件物体的长度。 假定 n 次测量值分别为X1,X2 ,Xn。显然,在该问题中,我们把测量值X1,X2 ,Xn看成样本。但总体是什么呢? 事实上,这里没有一个现实存在的个体的集合可以作为上述问题的总体。可是,我们可以这样考虑,既然 n 个测量值 X1,X2,Xn 是样本,那么,总体就应该理解为一切所有可能的测量值的全体。又如:为研究某种安眠药的药效,让 n 个病人同时服用这

5、种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数 X1,X2,Xn,则这些数字就是样本。 那么,什么是总体呢? 设想让某个地区(或某国家,甚至全世界)所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。 对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则X的值也就随着抽取个体的不同而不同。 所以,X是一个随机变量! 既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。 总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。.6.1.2 总体分布例 3 (例 l 续)

6、:在例 l中,若农户年收入以万元计,假定 N户的收入X只取以下各值: 0.5, 0.8, l.0, 1.2和1.5。取上述值的户数分别n1, n2, n3, n4和n5 (n1+n2+n3+n4+n5=N)。则X为离散型分布,分布律为:例4 ( 例2续 ):在例2中,假定物体真实长度为(未知)。一般说来,测量值X就是总体,取 附近值的概率要大一些,而离 越远的值被取到的概率就越小。 如果测量过程没有系统性误差,则X取大于 和小于 的概率也会相等。 在这种情况下,人们往往认为X 服从均值为,方差为2 的正态分布。2反映了测量的精度。于是,总体X的分布为 N(,2)。 说明:这里有一个问题,即物体

7、长度的测量值总是在其真值 的附近,它不可能取负值。 而正态分布取值在(-,)上。那么,怎么可以认为测量值X服从正态分布呢? 回答这个问题,有如下两方面的理由。(1).在前面讲过,对于XN(,2), P-3X0,当样本大小 n 增大时,上面的概率也随之增大;n 趋于无穷时,上式趋近于 1。任给c 0,总有例1:用机器向瓶子里灌装液体洗涤剂,规定每瓶装 毫升。但实际灌装量总有一定波动。假定灌装量的方差 2=1,如果每箱装这样的洗涤剂 25 瓶。求这 25 瓶洗净剂的平均灌装量与标定值 相差不超过0.3毫升的概率;又如果每箱装50瓶时呢?解:记一箱中 25 瓶洗净剂灌装量为 X1,X2, X25 是来自均值为 , 方差为1的总体的随机样本。根据抽样分布定理1,近似地有 当 n=50时,同样可算出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论