




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章样本及抽样分布本章转入课程的第二部分
———数理统计数理统计的特点是应用面广,分支较多。社会的发展不断向统计提出新的问题。从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。数理统计学是一门应用性很强的学科。它是研究怎样以有效的方式收集、整理和分析受随机影响的数据,并对所考察的问题作出推断和预测,直至为采取决策和行动提供依据和建议。
数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的、局部的资料,对所研究问题的整体,尽可能地作出精确而可靠的结论。在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息。因而由此获得的结论必然包含不肯定性。所以,在数理统计中必然要用到概率论的理论和方法。由此也可以说:概率论是数理统计的基础,而数理统计是概率论的重要应用。但它们是并列的两个学科,并无从属关系。需要强调说明一点:统计方法具有“部分推断整体”的特征。
因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体。这里使用的推理方法是“归纳推理”。这种归纳推理不同于数学中的“演绎推理”。
它在作出结论时,是根据所观察到的大量个别情况,“归纳”起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑推理去得出来的。但此时还应记住毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往又是在某个“可靠性水平”之下得出的。§6.1随机样本1.总体与个体
一个统计问题总有它明确的研究对象。研究对象的全体称为总体(母体),总体中每个成员称为个体。然而在统计计研究中,,人们关心心总体仅仅仅是关心其其每个个体体的一项(或几项)数量指标和该数量指指标在总体体中的分布情况。这时时,每个个个体具有的的数量指标标的全体就就是总体。。该批灯泡寿寿命的全体体就是总体某品牌轿车车百公里耗耗油量的全全体就是总体某批灯泡的寿命某品牌轿车百公里耗油量由于每个个个体的出现现是随机的的,所以相相应的数量量指标的出出现也带有有随机性。。从而可以以把这种数数量指标看看作一个随随机变量,,因此随机机变量的分分布就是该该数量指标标在总体中中的分布。。这样,总体就可以以用一个随随机变量及及其分布来来描述。统计的任务务,是根据从总总体中抽取取的样本,去推断总体体的性质。由于我们关关心的是总总体中的个个体的某项项指标(如人的身高高、体重,,灯泡的寿寿命,汽车的耗油油量…),所谓总体的的性质,无非就是这这些指标值值的集体的的性质。而概率分布布正是刻划这这种集体性性质的适当当工具。因因此在理论论上可以把总体与概概率分布等等同起来。在数理统计计中,总体体这个概念念的要旨是是:———总体就是一一个概率分分布。-500050010001500200005101520252.样本为推断总体体分布及各各种特征,,按一定规规则从总体体中抽取若若干个体进进行观察试试验,以获获得有关总总体的信息息,这一抽抽取过程称称为“抽样”,所抽取的的部分个体体称为样本。样本中所所包含的个个体数目称称为样本容量。。从某品牌轿车中抽5辆进行耗油量试验样本容量为为5容量为n的样本(也称为子样)可以看作
n维随机变量:(X1,X2,…,Xn)但是,一旦旦取定一组组样本,得得到的是n个具体的数数(x1,x2,…,xn),称为样本本的一次观观察值,简简称样本观察值值。由于抽样的的目的是为为了对总体体进行统计计推断,为为了使抽取取的样本能能很好地反反映总体的的信息,必必须考虑抽抽样方法。。最常用的一一种抽样方方法叫作“简单随机机抽样”,它要求抽抽取的样本本满足下面面两点:1.代表性:X1,X2,…,Xn中每一个与与所考察的的总体有相相同的分布布。2.独立性:X1,X2,…,Xn是相互独立立的随机变变量。由简单随机机抽样得到到的样本(子样)称为为简单随机样样本(子样样)。用(X1,X2,…,Xn)表示。简单随机样样本是应用用中最常见见的情形,,今后,当当说到(X1,X2,…,Xn)是取自某总总体的样本本时,若不不特别说明明,就指简单随机样样本。3.总体、样本本、样本值值的关系总体(理论论分布)样本样本值总体分布决决定了样本本取值的概概率规律,,也就是样样本取到样样本值的规规律,因而而可以由样样本值去推推断总体。。§6.2抽样分布一、样本数数据的处理理办法1、频数频率率分布表;;2、图形显示示:直方图图(频率))、箱线图图3、计算经验验分布函数数来近似总总体的分布布函数4、构造统计计量获得对总体体各种参数数的认识3、经验分布布函数设为取自总体体X的一个样本本,分布函函数F(x)未知若将样本观观测值由小小到大进行行排列为则用有序样本定义义如下函数数:称为有序样样本则是一非负又又连续函数数,且满足足称为经验分布布函数。说明:对对每一个个x,是样本中中事件发生的频频率当n固定时,,样本的函函数,它它是一个个随机变变量*由伯努利利达数定定理:只只要n相当大,,以概率收收敛于F(x)Glivenko定理:设是取自总总体X分布函数数为F(x)的样本,,是其经验验分布函函数表明:当n相当大时时,来自自样本的的经验分分布函数数是总体体分布函函数F(x)的一个良良好近似似,故经典统统计学中中一切统统计推断断都已样样本为依依据。例某食品厂厂生产听听装饮料料,现从从生产线线上随机机抽取5听饮料,,称得净净重为((单位g)351、347、355、344、351,经排序序得容量量为5的有序样样本:344、347、351、351、355,其经验验分布函函数为4、统计量量由样本值值去推断断总体情情况,需需要对样样本值进进行“加工””,这就要要构造一一些样本本的函数数,它把把样本中中所含的的(某一一方面))的信息息集中起起来。这种不含任何何未知参参数的样样本的函函数称为统计量。。它是完全全由样本本决定的的量。统统计量的的分布称称为抽样样分布。。例如是统计量量当未知时,,等均不是是统计量量二、常见见统计量量极其抽抽样分布布样本均值值反映了总总体均值值的信息息相应观察察值为样本中数数据与样样本均值值的偏差差之和为为0定理:设是来自某总体的样本,为样本均值。(1)若总体分布为N(μ,σ2),
则的精确分布为N(μ,σ2/n)
;(2)若总体分布未知或不是正态分布,则的极限分布为N(μ,σ2/n)
;样本方差差与样本本标准差差定理设设总总体X具有二阶阶矩,EX=μμ,DX=σσ2<+∞,设X1,X2,…,Xn是从该总总体得到到的样本本,则::样本k阶原点矩矩它反映了了总体k阶矩的信息样本k阶中心矩矩k=1,2,…它反映了了总体k阶中心矩的的信息统计量既既然是依依赖于样样本的,,而后者者又是随随机变量量,故统计量也也是随机机变量,因而就就有一定定的分布布,这个个分布叫叫做统计计量的““抽样分布布”.三大抽样样分布分布1、定义:设相互独立,都服从正态分布N(0,1),
则称随机变量:
所服从的分布为自由度为
n
的分布.记为:Person分布的密度函数为:来定义.其中伽玛函数通过积分由分布的定义,不难得到:1.
设相互独立,都服从正态分布则2.设且X1,X2相互独立,则这个性质叫分布的可加性.若则可以求得得,EX=n,DX=2n应用中心心极限定定理可得得,若
,则当n充分大时,的分布近似正态分布N(0,1).2、t分布
定义:设X~N(0,1),Y~,且X与Y相互独立,则称变量所服从的分布为自由度为n的t分布。记为:T~t(n).StudentT的密度函函数为::具有自由由度为n的t分布的随随机变量量T的数学期期望和方方差为:E(T)=0;D(T)=n/(n-2),对n>2不难看到到,当n充分大时时,t分布近似似N(0,1)分布。但但对对于较小小的n,t分布与N(0,1)分布相差差很大。。3、F分布定义:设X与Y相互独立,则称统计量服从自由度为n1及n2的F分布,n1称为第一自由度,n2称为第二自由度,记作:
F~F(n1,n2).由定义可可见,~F(n2,n1)若X~F(n1,n2),X的概率密密度为X的数学期期望为:若n2>2即它的数数学期望望并不依依赖于第第一自由由度n1.分位点1.6452.326-2.3262.4469-2.446914.4401.2379.20一般地,,=0.1605四、几个个重要的的抽样分分布定理理定理1(样本均值值的分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村新型合作经营体系建设协议
- 时间单位的换算说课课件
- 骆驼祥子人物分析:名著阅读与生活实践教案
- 一年级写景作文望雪250字(13篇)
- 人教版三年级下册期末考试数学试卷(含答案)2024-2025学年广东省汕头市潮南区
- 健康医疗信息服务平台建设合同
- 早教知识培训名称大全课件
- 写人作文大头男孩500字8篇
- 沧桑800字初三话题作文(15篇)
- 日记战胜困难500字13篇
- 初中全册英语常用3500词分类大全
- 工程质量通病防治措施专项施工方案
- 电视摄像与画面编辑第1章课件
- 设备检修管理流程图
- 堤防工程重点难点
- 卸料平台(落地搭设)验收记录表
- 2022版义务教育英语课程标准之学业质量标准与考试评价解读PPT
- 新媒体研究方法教学ppt课件(完整版)
- 监理工作流程图及监理工作制度
- 《文殊真实名经》
- 二年级上册口算表内乘法练习50道x20份
评论
0/150
提交评论