第6章样本及抽样分布1随机样本与直方图ppt课件_第1页
第6章样本及抽样分布1随机样本与直方图ppt课件_第2页
第6章样本及抽样分布1随机样本与直方图ppt课件_第3页
第6章样本及抽样分布1随机样本与直方图ppt课件_第4页
第6章样本及抽样分布1随机样本与直方图ppt课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 前面五章我们讲述了概率论的基本内容 ,随后的三章将讲述数理统计数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的带有随机性的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断 数理统计的内容包括:如何收集、整理数据资料;如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断后者就是我们所说的统计推断问题。本书只讲述统计推断的基本内容。第六章我们介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布第六章 样本及抽样分布第一节 总体与样本第二节 直方图第三节 抽样分布第一节第一节 总体与样本总体与样本一、总体

2、和表征总体的随机变量一、总体和表征总体的随机变量 例如例如 研究某企业生产的一批电视机显象管的平研究某企业生产的一批电视机显象管的平均使用寿命,那么这一批显象管的全体就组成一均使用寿命,那么这一批显象管的全体就组成一个总体,其中每一只显象管就是一个个体。个总体,其中每一只显象管就是一个个体。总体总体研究对象的全体研究对象的全体个体个体每一个对象每一个对象例如例如 研究某大学一年级学生的身高情况,这时一研究某大学一年级学生的身高情况,这时一年级大学生的全体就是总体;每个大学生就是一年级大学生的全体就是总体;每个大学生就是一个个体。个个体。 某工厂某工厂10月份生产的灯泡寿命所组成的月份生产的灯泡

3、寿命所组成的总体中总体中, 个体的总数就是个体的总数就是10月份生产的灯泡数月份生产的灯泡数, 这是一个有限总体这是一个有限总体; 而该工厂生产的所有灯泡寿而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体命所组成的总体是一个无限总体, 它包括以往生它包括以往生产和今后生产的灯泡寿命产和今后生产的灯泡寿命.有限总体和无限总体有限总体和无限总体例如例如 当有限总体包含的个体的当有限总体包含的个体的总数很大时总数很大时, 可近似地将它看可近似地将它看成是无限总体成是无限总体. 在实际中我们真正所关心的是总体的某种数在实际中我们真正所关心的是总体的某种数量指标,例如显象管的寿命指标量指标,例如显象

4、管的寿命指标X,学生的身高,学生的身高指标指标Y,它们都是,它们都是r.v.(意思是:从中任取一只显(意思是:从中任取一只显象管,其寿命是不能预先确定的,可看作是象管,其寿命是不能预先确定的,可看作是X的的可能取值)。称这样的可能取值)。称这样的r.v.为表征总体的随机变为表征总体的随机变量。量。 为了方便起见,我们就将表征总体的随机变为了方便起见,我们就将表征总体的随机变量的所有可能取值的全体看作总体。量的所有可能取值的全体看作总体。若若X的分布函数为的分布函数为F(x),则称总体的分布函数为,则称总体的分布函数为F(x) 。总体总体 r.v.XY)二、样本二、样本 对总体进行研究时,对总体

5、中每个个体逐一对总体进行研究时,对总体中每个个体逐一进行考察,这在实际中往往是行不通的,一是试进行考察,这在实际中往往是行不通的,一是试验具有破坏性,二是需花费大量的人力物力;验具有破坏性,二是需花费大量的人力物力; 常用的方法是:从总体中随机地抽取若干个常用的方法是:从总体中随机地抽取若干个个体,根据对这部分个体的研究结果推断总体某个体,根据对这部分个体的研究结果推断总体某方面的特征。方面的特征。 定义定义 从总体从总体X X中随机地抽取中随机地抽取n n个个体,称之为个个体,称之为总体总体X X的一个样本容量为的一个样本容量为n n的样本。的样本。 假设抽样满足下述两个条件:(1随机性 为

6、了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到 。(2独立性 各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。从总体中抽取若干个个体的过程称为抽样从总体中抽取若干个个体的过程称为抽样例如例如 总体总体X是一批显象管的使用寿命,现从总是一批显象管的使用寿命,现从总体体X中抽取中抽取n个显象管,个显象管, Xi表示抽到的第表示抽到的第i个显象个显象管的使用寿命,管的使用寿

7、命,i=1, 2, ,n ;由于抽取的随机性,;由于抽取的随机性,显然,每一个显然,每一个Xi 都是随机变量,并且有着和总体都是随机变量,并且有着和总体X相同的分布。另外,由于抽取的独立性,相同的分布。另外,由于抽取的独立性, 相互独立。相互独立。nXXX,21记记 为总体为总体X的一个样本容量为的一个样本容量为n的样本。的样本。其中其中Xi表示第表示第i个个体的某个数量指标,是一个个个体的某个数量指标,是一个r.v.。且且 独立同分布与总体独立同分布与总体X同分布)。同分布)。nXXX,21nXXX,21 从总体从总体X中抽取一个个体,就是对中抽取一个个体,就是对X进行一次试进行一次试验或观

8、测),得到一个试验数据或观测值)。验或观测),得到一个试验数据或观测值)。因此对于一次具体的抽样观测结果,我们将得到一因此对于一次具体的抽样观测结果,我们将得到一组数据,记作组数据,记作 ,称之为样本的一次观,称之为样本的一次观测值样本值)。测值样本值)。nxxx,21例如例如 从某厂生产的显象管中随机抽取从某厂生产的显象管中随机抽取10个显象管,个显象管,测得寿命如下单位千小时):测得寿命如下单位千小时):4.8,3.4,5.2,4.7,5.5,4.2,4.5,3.9,5.0, 4.9 这十个数据就是样本容量为这十个数据就是样本容量为10的样本的样本 的一组观测值的一组观测值 。1021,X

9、XX1021,xxx若将样本若将样本 , , 看作是一看作是一n维随机变维随机变量量 ,那么那么 (1)当总体当总体 是离散型随机变量是离散型随机变量,若记其分布若记其分布律为律为 ,则样本则样本的联合分布律为:的联合分布律为: 1X2XnX nXXX,21 )(xfxXP nXXX,21X niinnnnnnxfxfxfxfxXPxXPxXPxxxfxXxXxXP1212211212211)()()()(,),(记记作作(1)(2)当总体当总体 是连续型随机变量是连续型随机变量,且具有概率且具有概率密度函数密度函数 时时 ,则样本则样本 的联的联合概率密度为合概率密度为 xf nXXX,21

10、 niinnxfxfxfxfxxxf12121)(,X(2)1212 (0) ,(,),(,).nnXX XXX XX 设总体服从参数为的指数分布是来自总体的样本 求样本的概率密度解解的概率密度为的概率密度为总体总体 X 1e,0,( )0,0,xxf xx的的概概率率密密度度为为所所以以),( 21nXXX)(),(121 niinxfxxxf11 1e,0,0,.niixinx其他例例1 11 11,0,0,.inxiiex其他.),(,),(, 10), 1(2121的的分分布布律律求求样样本本是是来来自自总总体体的的样样本本其其中中服服从从两两点点分分布布设设总总体体nnXXXXXXp

11、pBX 解解的分布律为的分布律为总体总体 X nixxiipp11)1()1, 0( k的的分分布布律律为为所所以以),( 21nXXX例例2 2)(),(121 niinxfxxxf niiniixnxpp11)1(.1 , 0,21中中取取值值在在集集合合其其中中nxxxkkppkXP 1)1( 事实上我们抽样后得到的资料都是具体的事实上我们抽样后得到的资料都是具体的、确定的值、确定的值. 如我们从某班大学生中抽取如我们从某班大学生中抽取10人人测量身高测量身高,得到得到10个数,它们是样本取到的值个数,它们是样本取到的值而不是样本而不是样本. 我们只能观察到随机变量取的我们只能观察到随机

12、变量取的值而见不到随机变量值而见不到随机变量.总体、样本、样本值的关系总体、样本、样本值的关系总体理论分布)总体理论分布) ? 样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断总样本值,去推断总体的情况体的情况-总体分布总体分布F(x)的性质的性质. 总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体. 样本是联系二者的桥梁样本是联系二者的桥梁 由样本值去推断总体情况,需要对样本值进由样本值去推断总体情况,需要对样本值进行行“加工加工

13、”,这就要构造一些样本的函数,它把,这就要构造一些样本的函数,它把样本中所含的某一方面的信息集中起来样本中所含的某一方面的信息集中起来. 统计量及其分布统计量及其分布如何对样本进行加工?如何对样本进行加工?一、频数与频率分布表一、频数与频率分布表 数据的采集:从总体中随机地抽取一个样本,对样数据的采集:从总体中随机地抽取一个样本,对样本进行一次观测,得到一组数据。本进行一次观测,得到一组数据。例例 从某地一次数学统测的成绩中,随机抽从某地一次数学统测的成绩中,随机抽取取30个学生的成绩如下:个学生的成绩如下: 90 77 71 96 68 61 83 74 80 87 88 76 73 83

14、63 81 94 82 78 88 76 82 77 79 91 72 71 66第二节 直方图v 排序从小到大);排序从小到大);v 63 66 68 71 71 72 73 74 76v 77 77 78 79 80 81 82 82 83 v 83 85 87 88 88 90 91 94 95 96 (1找出最大值,最小值,并计算极差找出最大值,最小值,并计算极差R; R = 最大值最大值 最小值最小值 = 96 61 = 35。 极差极差R反映了数据波动的幅度。反映了数据波动的幅度。(2对数据进行分组等区间分组),确定分组对数据进行分组等区间分组),确定分组 的个数的个数k;选取适当

15、的区间长度组距;选取适当的区间长度组距d;n = 30,取,取 k = 6,那么,那么 。6635kRd(3确定各组的上、下限每组不含上限);确定各组的上、下限每组不含上限);(4列表得各组的组频数;列表得各组的组频数; 数出数据落入各个组区间中的个数。数出数据落入各个组区间中的个数。(5计算各组的组频率。计算各组的组频率。组频率组频率=组频数组频数数据总数数据总数得到频率分布表得到频率分布表组号组区间组频数组频率60.566.5 0.166.572.5 0.13372.578.5 0.23378.584.5 0.23394.590.5 0.16690.596.5 0.133总计301表表1二、频数与频率直方图二、频数与频率直方图 在平面坐标上,在平面坐标上,x x 轴表示所考察的变量,轴表示所考察的变量,y y 轴轴表示频数,表示频数, 以表以表1 1为例,在横轴上标出为例,在横轴上标出6 6个等长的个等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论