版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二部分数理统计编辑ppt
从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,这说明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。
数理统计的客观背景编辑ppt
到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。
同时随着计算机的诞生与发展,为数据处理提供了强有力的技术支持,这就导致了数理统计与计算机结合的必然的发展趋势。
目前国内外著名的统计软件包:R,
SAS,SPSS,STAT等,都提供了快速、简便地进行数据处理和分析的方法与工具。编辑ppt
数理统计学是一门应用性很强的学科,它是研究怎样以有效的方式收集、整理和分析所获得的有限的资料,以便对所考察的问题尽可能地作出精确而可靠的推断和预测,直至为采取一定的决策和行动提供依据和建议。
数理统计研究的对象---带有随机性的数据
数理统计的任务编辑ppt
数理统计的特征---数理统计方法具有“部分推断整体”的特征
在数理统计中,不是对所研究的对象全体(称为
总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。由于在数理统计中是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体.所以这里使用的推理方法是“归纳推理”。▲▲编辑ppt
在概率论中所研究和讨论的随机变量,它的分布都是已知的,在这前提下去进一步的研究它的性质、特点和规律性。而在数理统计中所研究和讨论的随机变量,它的分布是未知的或不完全知道的。于是就必须通过对所研究和讨论的随机变量进行重复独立的观察和试验,得到许多观察值(数据),对这些数据进行分析后才能对其分布作出种种判断。得到这些数据最常用的方法是----随机抽样法。随机抽样法编辑ppt要较好地反映所研究和讨论的随机变量整体的特性,就必须研究:(1)如何抽样,抽多少,怎么抽
如何对抽样的结果进行合理分析,作出科学的判断.统计推断问题抽样方法问题今后所讨论的统计问题主要属于下面这种类型:从所研究的随机变量的某个集合中抽取一部分元素,对这部分元素的某些数量指标进行试验与观察,根据试验与观察获得的数据来推断这集合中全体元素的数量指标的分布情况或数字特征。编辑ppt数理统计抽样分布
统计推断常用的统计量四个重要分布参数估计假设检验正态总体的样本均值与方差的分布(重要统计量的分布)矩估计法点估计
区间估计极大似然估计法均值的区间估计方差的区间估计均值的检验方差的检验单个总体两个总体正态总体编辑ppt
一.总体和个体定义将研究对象的某项数量指标的值的全体称为总体(母体);将总体中的每个元素称为个体例1.当研究某地区中职工收入平均水平时,这地区所有职工的月收入组成了总体;而每个职工月收入就是个体。(1)(2)研究某批灯泡的质量,则该批灯泡寿命的全体就组成了总体;而每个灯泡的寿命就是个体。…
总体
第6.1节随机样本编辑ppt(3)研究某国产轿车每公里平均耗油量时,则该国产轿车每公里耗油量的全体就是总体;而该国产轿车每公里耗油量就是个体。注:因此,X所有可能取的值的分布为总体X的分布,记为F(x),称其为总体X的分布函数。研究对象的某项数量指标X是一个随机变量;这是由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布。
总体可以用一个随机变量及其分布来描述编辑ppt研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用一维随机变量
X表示,或用其分布函数F(x)表示。某批灯泡的寿命总体寿命X可用一概率分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体,如总体X或总体F(x)。F(x)例2.(1)编辑ppt
在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,现用X和Y分别表示身高和体重,则此总体可用二维随机变量
(X,Y)或其联合分布函数F(x,y)来表示。总体依其包含的个体总数分为有限总体(个体的个数是有限)和无限总体(个体的个数是无限的)。但当有限总体它所含的个体的个数很大时也可视其为无限总体。(2)注:▲在数理化统计中,总体这个概念的要旨是:
▲总体就是一个概率分布.编辑ppt
二.抽样和样本为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本,样本中所包含的个体数目称为样本容量。从某批国产轿车中抽5辆进行耗油量试验。这一过程即为“抽样”这5辆轿车为一个样本,其样本容量为5抽样例如:编辑ppt定义1.从总体中抽取一部分个体进行观察,被抽出的部分个体称为总体的一个样本。为了了解总体的分布,我们从总体中随机地抽取n个个体,记其指标值为则称为总体的一个样本。由于每一次观测所取得的观测值具有随机性。因此,从另一个角度来讲,样本是一个随机变量。注:▲即样本具有双重性: (1)是一个n维随机变量; (2)是n个具体的观察数值。编辑ppt对于有限总体和无限总体都可以通过放回抽样的方式得到简单随机样本。当个体的总数N比要得到的样本容量n大得多时,可将不放回抽样近似地当作放回抽样来处理。▲▲通常,是相互独立的并与总体X具有相同的分布。一般称其为来自总体X的一个简单随机样本。编辑ppt
三.简单随机样本定义2设X是具有分布函数F的随机变量,若是具有同一分布函数F的、相互独立的随机变量,则称为总体X(或从总体F或从分布函数F)得到的容量为
n
的简单随机样本简称样本它们的观察值称为X的n个独立的观察值。为样本值,又样本是随机变量,但它具有二重性。▲注:编辑ppt若为总体X的一个样本,X的分布函数为F(x),概率密度为f(x),则:联合概率密度为:▲可视样本为一个随机向量,记为此时,相应的样本值可记为:▲联合分布函数为:从而,容量为n的样本可以看作n维随机变量。编辑ppt
在上节所介绍内容中已经知道:样本是进行统计推断的依据。但在实际应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断。
第二节抽样分布
问题的提出
亦即样本去推断总体情况,需要对样本进行一定的“加工”,这就要构造一些样本的适当函数,它把样本中所含的(某一方面)的信息集中起来。
这种不含任何未知参数的样本的函数称为统计量。它是完全由样本决定的量。编辑ppt1.定义设是来自总体X的一个样本,是的函数。若g是连续函数且g中不含任何未知参数,则称是一个统计量。一.统计量的定义
注:
▲▲▲
统计量是完全由样本确定的量。统计量是样本的函数,所以也具有双重性。(1)当样本是随机变量时,统计量也是随机变量;(2)当样本为观测值时,统计量是一个具体数值。
统计量的构造总是有目的的。编辑ppt
2.几个常用的统计量样本均值:样本方差:它反映了总体均值的信息它反映了总体方差的信息(1).(2).(3).样本标准差:(4).样本k阶原点矩:(5).样本k阶中心矩:
k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息编辑ppt注:~(5)均是随机变量,实际上它们是样本函数的数字特征;它们的观察值是具体的实数值,仍称为样本均值、样本方差、样本k阶原点距与样本k阶中心距。▲▲若总体X的k
阶原点距存在,则当时有:这个结论表明:样本的k阶距依概率收敛到总体的k阶距。这也是参数估计中的矩估计法的理论根据。编辑ppt▲设总体X的均值为μ,方差为σ2,X1,X2,…,Xn为取自总体X的样本,则3.抽样分布统计量作为随机变量,因而就有一定的分布,这个分布就称为统计量的“抽样分布”。故有:统计量的分布称为抽样分布编辑ppt
二.几个重要的分布设是来自正态分布N(0,1)的样本,则称统计量:为服从自由度为
n
的分布.定义.分布1.记为:注:自由度n是指中所包含独立变量的个数▲编辑ppt分布的密度函数为:来定义。其中:伽玛函数通过积分:其图形如下:▲编辑ppt若,则n=2n=1n=4n=6n=11xf(x)0(参见教材P163图6—1)▲编辑ppt相互独立,则分布的上分位点:称满足:对于给定的为分布的上分位点。分布的可加性:若且其图形如下:▲▲的点编辑ppt面积=xf(x)0对于不同的与,有表可查(见教材P386的附表5)
一般:当时可直接查表当时可用近似公式:编辑ppt例如:费歇R.AFisher证明是正态分布的上分位点或:编辑ppt记为T~t(n)为服从自由度为
n的
t分布.设X~N(0,1),Y~,且X与Y相互独立,则称随机变量:t分布2.
定义.
注:t分布是英国统计学家哥塞特(G0sset)首先发现的,并以学生(student)的笔名在英国的《Bi0metrike》杂志上发表的一篇文章中提出了他的研究结果,故t分布也称为学生分布。▲编辑pptt分布的概率密度函数为:它非常象正态分布图形,关于y轴对称▲xt(x)0n=2n=25n=(参见教材P140图6—8)其图形如下:编辑pptT分布的上分位点:对于给定的,称满足条件:▲当充分大时,即当充分大时,t分布可以近似看作是标准正态分布;但当较小时,t分布与正态分布的差异是不能忽略的。▲若T~t(n),则有:当时当时▲的点为t分布的上分位点。编辑ppt0面积=对于不同的与,有表可查(见教材P392的附表7)
一般:当时可直接查表当时可用近似公式:(用正态分布近似)编辑ppt例如:由上分位点定义及h(t)对称性得:▲编辑pptF分布
设X与Y相互独立,则称统计量:为服从自由度n1及n2的F分布,记作:
F~F(n1,n2)若F~F(n1,n2),则F的概率密度为:注:3.定义.▲编辑pptx0其图形如下:(参见教材P141图6—10)▲若则编辑ppt▲若则:当时,当时,▲称满足条件:F分布的上分位点:对于给定的,的点为F分布的上分位点。),(21nnFa编辑pptx0面积=对于不同的与,有表可查(见教材P387的附表6)
例如:编辑ppt
正态分布▲分布的上分位的性质:4.(请复习其图形及性质等)编辑ppt三.正态分布的样本均值与样本方差的分布
定理1
(样本均值和样本方差的分布)设X1,X2,…,Xn是取自正态总体的样本,是其样本均值和样本方差则和相互独立只证(1),(2)与(3)的证明见教材P145—P147编辑ppt证明:(1)因为若则有:由已知又则:即编辑ppt定理二的样本,设是总体分别为样本均值和样本方差,则有相互独立①②分析???(证略)编辑pptn取不同值时样本均值的分布编辑pptn取不同值时的分布编辑ppt推论.注:推论的实质是把服从一般正态分布的随机变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025《窦娥冤》戏剧冲突课件
- 从业人员健康管理和培训管理制度培训
- 2026年广西国际商务职业技术学院单招综合素质考试题库附参考答案详解(研优卷)
- 2026年广西国际商务职业技术学院单招职业适应性考试题库附参考答案详解(完整版)
- 2026年山西省长治市单招职业适应性测试题库附答案详解
- 2026年崇左幼儿师范高等专科学校单招职业适应性考试题库附参考答案详解(综合题)
- 2026年广东岭南职业技术学院单招职业适应性考试题库有完整答案详解
- 2026年山西管理职业学院单招职业倾向性考试题库含答案详解
- 2026年山西运城农业职业技术学院单招职业技能考试题库及答案详解参考
- 2026年岳阳现代服务职业学院单招职业技能测试题库附参考答案详解(预热题)
- 徐州工业职业技术学院单招职业技能测试参考试题库(含答案)
- 秦皇岛地质考察报告
- 抖音取消实名认证申请函(个人)-抖音取消实名认证申请函
- 0~3岁婴幼儿营养与喂养(高职)全套教学课件
- 新闻写作的真实性原则
- 产业经济学-王俊豪主编
- 海岸工程海岸防护概论
- 静态与动态分析指标
- 《铁路技术管理规程》普速铁路部分
- YS/T 690-2009天花吊顶用铝及铝合金板、带材
- GB/T 4937.3-2012半导体器件机械和气候试验方法第3部分:外部目检
评论
0/150
提交评论