版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数理统计的基础知识讲解第1页,共69页。
数理统计是研究统计工作一般原理和方法的科学,它主要阐述搜集、整理、分析统计数据,并据以对研究对象进行统计推断的理论和方法,是统计学的核心和基础。数理统计的任务就是在概率论的基础上研究怎样以有效的方式收集、整理和分析可获得的、有限的、带有随机性的数据资料,对所考察问题的统计规律性尽可能作出精确而可靠的推断或预测,为采取一定的决策和行动提供依据和建议。第2页,共69页。
数理统计与概率论是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象。但在研究问题的方法上有很大区别:概率论——已知随机变量服从的分布规律,寻求分布的性质、数字特征、及其应用;
数理统计
——通过对实验数据的统计分析,寻找所服从的分布和数字特征,从而推断整体的规律性.
数理统计的核心问题——由样本推断总体第3页,共69页。统计推断数理统计的一般步骤:数据资料的收集数据的整理、分析第4页,共69页。4.1总体与样本4.2统计量4.3常用的统计分布4.4抽样分布第5页,共69页。§4.1总体与样本一、总体与总体分布
二、样本与样本分布
三、统计推断问题简述
第6页,共69页。一、总体与样本研究某批灯泡的质量…考察国产轿车的质量总体总体1、总体与个体;总体分布具有一定的共同属性的研究对象全体.总体:总体中每个对象或成员。个体:第7页,共69页。
然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.
该批灯泡寿命的全体就是总体。灯泡的寿命国产轿车每百公里的耗油量
所有国产轿车每百公里耗油量的全体就是总体。第8页,共69页。
由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量,我们用一个随机变量或其分布来描述总体。第9页,共69页。一、总体与总体分布定义4
1(总体与总体分布)
统计学中称随机变量(或向量)X为总体
并把随机变量(或向量)X的分布称为总体分布
(1)表示总体的X既可以是随机变量
也可以是随机向量
如果当事者关心的不是个体的一项数量指标
而是两项或两项以上的数量指标时
X便是随机向量
但为简化讨论
本书只限于考察一项数量指标的情形
这样
今后总体指的皆是随机变量
说明第10页,共69页。一、总体与总体分布
(2)有时个体的特性本身不是直接由数量指标来描述的
我们仍可用一个随机变量X来表示
个体的定性指标皆可转化成一个数量指标
从而也就可设定一个随机变量来表示所研究的总体
定义4
1(总体与总体分布)
统计学中称随机变量(或向量)X为总体
并把随机变量(或向量)X的分布称为总体分布
说明第11页,共69页。一、总体与总体分布
(3)总体分布就是设定的表示总体的随机变量X的分布
总体的分布
一般说来是未知的
已知总体分布的类型
但不知这些分布中所含的参数有时甚至连分布所属的类型也不能肯定
统计学的主要任务正是要对总体的未知分布进行推断
定义4
1(总体与总体分布)
统计学中称随机变量(或向量)X为总体
并把随机变量(或向量)X的分布称为总体分布
说明第12页,共69页。二、样本与样本分布定义4
2(简单随机样本)
称(X1
X2
Xn)为总体X的简单随机样本
若X1
X2
Xn是独立同分布的随机变量
且与总体X同分布
样本中所含分量的个数n称为该样本的容量
代表性:要求样本中的每一分量Xi与总体X同分布
表明抽样观察时
每一个体都是从同一总体中抽取的
独立性:要求样本中诸分量是独立的
则表明每一观察结果既不影响其他观察结果
也不受其他观察结果的影响
获得上述简单随机样本的方法称为简单随机抽样
说明第13页,共69页。样本与样本值
在未观察具体的抽样结果时
应把样本(X1
X2
Xn)视为一个随机向量
在观察具体的抽样结果后
样本便理解为所得的一组具体的观察值(x1
x2
xn)
今后约定
以大写的英文字母Xi表示随机变量
而以相应的小写英文字母xi表示它的观察值
并称样本(X1
X2
Xn)的一组具体的观察值(x1
x2
xn)为样本值
全体样本值组成的集合称为样本空间
(总体规模很大)第14页,共69页。样本分布
设总体X的分布函数为F(x)
则样本(X1
X2
Xn)的分布函数为称之为样本分布
若总体X为连续型随机变量
其密度函数为f(x)
则样本的密度函数为样本与样本值
在未观察具体的抽样结果时
应把样本(X1
X2
Xn)视为一个随机向量
在观察具体的抽样结果后
样本便理解为所得的一组具体的观察值(x1
x2
xn)
第15页,共69页。
若总体X为离散型随机变量
概率分布为p(x)
P{X
x}
x取遍X所有可能取值
则样本的概率分布为样本分布
设总体X的分布函数为F(x)
则样本(X1
X2
Xn)的分布函数为称之为样本分布
样本与样本值
在未观察具体的抽样结果时
应把样本(X1
X2
Xn)视为一个随机向量
在观察具体的抽样结果后
样本便理解为所得的一组具体的观察值(x1
x2
xn)
第16页,共69页。
例4
1称总体X为正态总体
如它服从正态分布
设总体X服从正态分布N(
2)
则样本(X1
X2
Xn)的密度函数为第17页,共69页。
例4
2称总体X为伯努利总体
如果它服从以p(0
p
1)为参数的伯努利分布
即
P{X
1}
p
P{X
0}
1
p
则样本(X1
X2
Xn)的概率分布为其中ik(1
k
n)取1或0
而sn
i1
i2
in
它恰等于样本中取值为1的分量之总数
第18页,共69页。
例4
3设总体X服从参数为
的泊松分布
则样本(X1
X2
Xn)的概率分布为
其中ik(1
k
n)取非负整数
而sn
i1
i2
in
第19页,共69页。三、统计推断问题简述
统计学要解决的问题是借助总体X的一个样本(X1
X2
Xn)
对总体X的未知分布进行推断
我们把这类问题统称为统计推断问题
为利用样本对未知的总体分布进行推断
我们需借助样本构造样本的适当的函数
正是利用这些函数所反映的总体分布的信息来对:总体分布所属的类型总体分布中所含的未知参数作出统计推断
第20页,共69页。§4.2统计量一、统计量的定义二、常用的统计量三、枢轴量
第21页,共69页。一、统计量的定义定义4.3(统计量)
设(X1
X2
Xn)为总体X的一个样本
称此样本的任一不含总体分布未知参数的函数为该样本的统计量
例4
4设(X1
X2
Xn)为正态分布总体X~N(5
2)的一个样本
2未知
但U不是该样本的统计量
则Sn与X均为样本(X1
X2
Xn)的统计量
令第22页,共69页。是不是补充例1设(X1,X2,X3)是来自总体N(μ,σ2)的一个样本,其中μ已知,σ2未知,判断下列各式哪些是统计量,哪些不是?第23页,共69页。二、常用的统计量1
样本均值2
样本方差
设(X1
X2
Xn)为总体X的一个样本
令2和S2分别为样本的未修正样本方差和修正样本方差
并称S0第24页,共69页。3
样本标准差
设(X1
X2
Xn)为总体X的一个样本
样本标准差S定义为样本方差的算术平方根
即4
样本原点矩
设(X1
X2
Xn)为总体X的一个样本
记并称Ak为样本的k阶原点矩
显然
一阶原点矩即为样本均值
因此可把样本原点矩视为样本均值概念的推广
第25页,共69页。5
样本中心矩
显然
二阶中心矩即为未修正样本方差
因此可把样本中心矩视为未修正样本方差概念的推广
设(X1
X2
Xn)为总体X的一个样本
记并称Bk为样本的k阶中心矩
第26页,共69页。样本矩具有下列性质:性质第27页,共69页。6
顺序统计量第28页,共69页。三、枢轴量
例4
5设总体X~N(
0)
其中
0已知
未知
(X1
X2
Xn)为总体X的一个样本
2
2则样本函数U是一枢轴量
令
设(X1
X2
Xn)为总体X的样本
为总体中一个未知参数
我们把一个仅含未知参数
并且其分布已知的样本函数U(X1
X2
Xn
),称为枢轴量
第29页,共69页。§4
3常用的统计分布一、分位数
二、
2分布
三、F分布
四、t分布
第30页,共69页。一、分位数
定义4
4(上侧分位数)
设随机变量X的分布函数为F(x)
给定实数
(0
1)
如果实数F
满足
P{X
F
}
(4
6)即1
F(F
)=
或F(F
)=1-
(4.7)则称F
为随机变量X的分布的水平为
的上侧分位数.或直接称为分布函数F(x)的水平
的上侧分位数
第31页,共69页。
如果F(x)是严格单调递增的,那么其水平
的上侧分位数F
为:
F
=F-1(1-
)(4.8)
当X是连续型随机变量时
设其密度函数为f(x)
则其水平
的上侧分位数F
满足两个等式:第32页,共69页。一、分位数
第33页,共69页。由于对称性(见教材45页第13题,或习题四的第6题)对于具有对称密度函数的分布函数的上侧分位数,恒有第34页,共69页。标准正态分布的分位数用u
表示标准正态分布N(0
1)的水平
的上侧分位数
则u
满足
1
0(u
)
即
0(u
)
1
(4
9)
例4
6设
0
05
求标准正态分布的水平0
05的上侧分位数和双侧分位数
水平0
05的上侧分位数为u0
05
它满足
0(u0
05)
1
0
05
0
95
查附表2得u0
05
1
645
解第35页,共69页。标准正态分布的分位数用u
表示标准正态分布N(0
1)的水平
的上侧分位数
则u
满足
1
0(u
)
即
0(u
)
1
(4
9)
例4
6设
0
05
求标准正态分布的水平0
05的上侧分位数和双侧分位数
解
水平0
05的双侧分位数为u0
025
它满足
0(u0
025)
1
0
025
0
975
查附表2得
u0
025
1
96
第36页,共69页。二、
2分布
命题4
1
如果随机变量X的密度函数由上式给出
则称X服从以n为自由度的
2分布
第37页,共69页。定义4
6(
2分布)
如果随机变量X的密度函数为则称X服从以n为自由度的
2分布
记作X~
2(n)
根据命题4
1
若X1
X2
Xn是n个相互独立的标准正态随机变量
则说明第38页,共69页。第39页,共69页。说明见教材71~72页例2.29见教材73~74页练习2-5的第6题第40页,共69页。教材上说:为什么?请读者思考中心极限定理第41页,共69页。命题4
2(1)
2分布的可加性:若X~
2(m)
Y~
2(n)
且X与Y相互独立
则X
Y~
2(m
n)
(2)若X~
2(n)
则EX
n
DX
2n
第42页,共69页。第43页,共69页。
2分布的分位数
附表3中对自由度n
45的
2分布给出了水平
的上侧分位数之值
当X~
2(n)时
有
例如
设X~
2(10)
取水平
0
05
查表可知
P{X
18
307}
P{X
3
940}
0
05
P{3
247
X
20
483}
0
95
第44页,共69页。
当自由度n充分大时
2分布可近似地看作正态分布
于是由正态分布的分位数可近似地求得
2分布的分位数
2分布的分位数
附表3中对自由度n
45的
2分布给出了水平
的上侧分位数之值
当X~
2(n)时
有第45页,共69页。第46页,共69页。三、F分布
命题4
3
设X~
2(m)
Y~
2(n)
且X与Y相互独立
记则Z的密度函数为
如果随机变量X的密度函数由(4
20)给出
则称X服从第一自由度为m
第二自由度为n的F分布
第47页,共69页。定义4
7(F分布)
如果随机变量X的密度函数为则称X服从第一自由度为m
第二自由度为n的F分布
记作X~F(m
n)
由命题4
3不难推知
若X~F(m
n)
则X
1~F(n
m)
第48页,共69页。
由于X为非负随机变量,其密度函数自然不是对称函数。因此,对F分布而言,也不存在双侧分位数。但在统计推断中常使用如下关系式:第49页,共69页。
当X~F(m
n)时
有
P{X
F
(m
n)}
P{X
F1
(m
n)}
附表4中对一些充分小的
值列出了F分布的水平
的上侧分位数F
(m
n)之值
F分布的分位数
例如
设X~F(5
10)
查表4知
P{X
3
33}
0
05
P{X
4
24}
0
025
又设Y~F(10
5)
查表可得
P{Y
4
74}
0
05
P{Y
6
62}
0
025
第50页,共69页。
当X~F(m
n)时
有
P{X
F
(m
n)}
P{X
F1
(m
n)}
附表4中对一些充分小的
值列出了F分布的水平
的上侧分位数F
(m
n)之值
F分布的分位数由(4
21)式知
当
接近于1时
可利用下式求出所需的上侧分位数第51页,共69页。
当X~F(m
n)时
有
P{X
F
(m
n)}
P{X
F1
(m
n)}
附表4中对一些充分小的
值列出了F分布的水平
的上侧分位数F
(m
n)之值
F分布的分位数
当
接近于1时
可利用下式求出所需的上侧分位数
例如
当X~F(5
10)时
查表可知第52页,共69页。四、t分布
命题4
4
设X~N(0
1)
Y~
2(n)
且X与Y相互独立
记则T的密度函数为
如果随机变量的密度函数由(4
23)给出
则称其为服从自由度为n的t分布
第53页,共69页。定义4
8(t分布)
如果随机变量X的密度函数为则称X服从自由度为n的t分布
记作X~t(n)
当自由度n很大时
t分布接近于标准正态分布
这是因为第54页,共69页。(A)Y~
2(n)
(B)Y~
2(n
1)
(C)Y~F(n
1)
(D)Y~F(1
n)
由于X
2~F(1
n)
故
解
答(C)
第55页,共69页。t分布的分位数附表5对于一些充分小的
值给出了t分布的水平
的上侧分位数t
(n)之值
当X~t(n)时
有
P{X
t
(n)}
P{X
t
(n)}
例如
设X~t(8)
0
05
查表可知
t
(8)
1
860
t
/2(8)
2
306
故有
P{|X|
2
306}
0
05
P{X
1
860}
P{X
1
860}第56页,共69页。t分布的分位数附表5对于一些充分小的
值给出了t分布的水平
的上侧分位数t
(n)之值
当
接近1时
可按下式求出相应的上侧分位数
t
(n)
t1
(n)
(4
24)
当X~t(n)时
有
P{X
t
(n)}
P{X
t
(n)}
此外
由于自由度n充分大时
t分布近似于标准正态分布
故有t
(n)
u
第57页,共69页。§4
4抽样分布一、正态总体的抽样分布
二、一般总体抽样分布的极限分布
第58页,共69页。一、正态总体的抽样分布
定理4
1
设总体X~N(
2)
(X1
X2
Xn)是其容量为n的一个样
有了正态总体的样本均值与样本方差的抽样分布
便可容易地构造出单正态总体与双正态总体中样本的一些统计量(或枢轴量)
并使之服从确定的已知分布
第59页,共69页。说明定理4
2(单正态总体的抽样分布)
设(X1
X2
Xn)为正态总体X~N(
2)的样本
X与S2分别为该样本的样本均值与样本方差
则有
当
与
2都已知时
定理4
2中提及的三个样本函数方可视为样本的统计量
第60页,共69页。说明定理4
2(单正态总体的抽样分布)
设(X1
X2
Xn)为正态总体X~N(
2)的样本
X与S2分别为该样本的样本均值与样本方差
则有为一枢轴量
它们可用于对未知参数
与
2作统计推断
第61页,共69页。
结论(1)是定理4
1(1)的直接推论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年南京市白下区事业单位人员招聘考试备考题库及答案详解
- 随州中考历史试题及答案
- 特种经济动物繁育员操作管理知识考核试卷含答案
- 三烷氧基硅烷生产工操作知识考核试卷含答案
- 软膏剂工岗前纪律考核试卷含答案
- 《慢性肝病肝淀粉样变性|肝病教案》
- 精准:胆囊癌靶向护理查房:一例HER2突变
- 2026及未来5年中国三叶轮水波纹胎市场数据分析研究报告
- 查房烧伤科慢性溃疡修复难点专项|手把手教学规避临床失分点
- 2026及未来5年中国LED拖车灯行业发展研究报告
- 民法典继承编解读
- 惊恐患者的护理
- 入党申请书专用纸-A4单面打印
- 部编版语文三年级上册写字表生字笔顺字帖-三年级写字表笔顺
- 四川省成都树德中学2024年八年级物理第二学期期末达标检测试题及答案解析
- MOOC 3D工程图学应用与提高-华中科技大学 中国大学慕课答案
- 幼儿园中班音乐活动《小老鼠和泡泡糖》课件
- 吉利汽车服务站运营手册
- 有偿培训服务协议
- 沥青MSDS安全技术说明书
- 译林版(三起)英语五年级下册Unit-5-Helping-our-parents复习课件
评论
0/150
提交评论