版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章概率分布与抽样分布随机变量及其概率分布
抽样及抽样分布
一、随机变量及其概率分布(一)随机变量
1.随机现象、随机事件与样本空间随机现象:一种现象,在有几种可能结果的情况下,一种结果可能出现,也可能不出现;如果出现,可能这样发生,也可能那样发生;可能是一种结果,也可能是几种结果,但这都无法预知,这种现象也称为偶然现象。为了研究随机或偶然现象的统计规律性,需要进行各种科学试验或对事物某种特征进行观测。通常具备以下三个特征的试验称为随机试验:(1)试验可以在相同条件下重复进行;(2)每次试验的可能结果不止一个,并且能在实验之前明确知道所有可能出现的结果。(3)每次试验之前不能肯定会出现哪个结果,但可以肯定每次试验总会出现这些可能结果中的一个。
随机事件:随机试验中可能出现或可能不出现的事情。每一个可能结果称为基本事件;由若干个基本事件组合而成的事件称为复合事件;每次试验一定发生的事件称为必然事件;而每次试验一定不发生的事件称为不可能事件,记为F。样本空间:在一项试验中,我们把试验中所有可能结果的集合定义为样本空间,记为W。样本空间中每一特定的试验结果,称为样本点,记为w,显然W=(w1,w2....wk)。以下表7.1中的几例,说明样本空间和样本点:试验
样本空间W
=(w)
投一枚硬币观察正面H和反面T出现的情况W
=(H
,T)将一枚硬币投三次,观察出现正面H的次数W
=(0,1,2,3)掷一颗骰子,观察出现的点数
W
=(0,1,2,3,4,5,6)2.随机事件的概率在概率论中随机事件发生可能性大小的数值称为随机事件的概率,记作P(A)。假定在相同条件下,重复进行次试验,事件发生了次,则事件发生的概率可以记为:【例7.1】某集团公司所属三个子公司员工人数资料如表7.2所示:
子公司男员工女员工合计甲子公司乙子公司丙子公司203025303025506050合计7585160若以A表示”抽中的职工为男性”,以B表示”抽中的员工为甲子公司职工”,则:
表7.2某集团公司所属子公司员工人数统计3.随机变量及其分布(1)随机变量随机实验结果的变量;一个取值对应随机试验的一个可能结果;随着试验结果不同而变化;一般用希腊字母x、h、V大写字母如X、Y、Z...来表示。按其取值情况可以把随机变量分为两类:离散型随机变量:有限个或无限可列个值。非离散型随机变量:可以在整个数轴上取值,或至少有一部分值取某实数区间的全部值。
(2)随机变量的分布函数随机变量分布函数的定义及性质
设X是一个随机变量,x是任意实数,函数F(x)=P{X≤x}称为X的分布函数。其中{X≤x}表示X取小于等于x的每一个值所对应的基本事件的和事件。
分布函数是定义在(-∞,+∞)上的一个函数,它具有如下性质:F(x)是一个不减函数;0≤F(x)≤1,F(+∞)=1,F(-∞)=-1;F(x)是右连续的,即F(x+0)=F(x)
对任意的实数a<b,有
离散型随机变量的概率分布设离散型随机变量
X所有可能取的值为xk(k
=1,2,…),X取各个可能值的概率,即事件{X=xk}发生的概率为
:
P{X=xk}=pk,k=1,2,…我们将上式称为离散型随机变量X的概率分布或者分布律,即下表7.3所示:
一分钟内呼叫电话的次数是离散型随机变量Xx1x2……xkpkp1p2……pk表7.3离散性随机变量的概率分布容易知道,分布律具有如下性质:
pk≥0,k=1,2,...;【例7.2】仍然以掷骰子为例,将出现的点数记作随机变量,其概率分布如表7.4所示:表7.4
掷一颗骰子出现点数的概率分布X123456p1/61/6
1/6
1/6
1/6
1/6
连续型随机变量的概率分布如果对于随机变量X的分布函数
F(x),存在非负函数f(x),对于任意实数x,有
则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称为概率密度。概率密度具有如下性质:
若f(x)在点x处连续,则有(二)随机变量的数字特征
1.随机变量的数学期望设X的分布列为pk
=P{X=xk},k
=1,2,…,若级数绝对收敛,则称级数为X的数学期望,记为:
【例7.3】假设有十只相同的电器元件,其中有两只废品。装配仪器时,从这批元件中任取一只,如果是废品,则扔掉重新任取一只;如果仍是废品,则扔掉再取一只。试求在取到正品之前,已取出的废品数的分布和数学期望。解:设X表示取到正品之前已取出的废品数,显然X是一个离散型的随机变量,其所有可能取值为0,1,2。且
X的分布律如表7.5所示:表7.5离散型随机变量X的概率分布X012p4/58/451/45所以,废品数的数学期望为:(1)连续型随机变量的数学期望设X的密度函数为f(x),如果积分绝对收敛,则称此积分为X的数学期望,即【例7.4】设随机变量的概率密度为求随机变量X的数学期望E(X)。
解:(2)随机变量函数的数学期望设X为随机变量,则称h=g(X)为随机变量X的函数,显然h也是随机变量。其数学期望为:
X为离散,且h
=g(X),则X为连续,且h
=g(X),则【例7.5】不妨再考虑例7.3,求废品数(离散型随机变量)平方的数学期望E(X2)
解:【例7.6】试求例7.4中连续型随机变量的平方的数学期望E(X2)
解:(3)数学期望的性质E(c)=c(c为常数);E(aX)=aE(X);E(X+b)=E(X)+b;E(aX+b)=aE(X)+b;【例7.7】设随机变量X及X2的数学期望分别为E(X)=1,E(X2)=7/6,试求E(X+3),E(X2+3X+1)解:根据数学期望的性质,可以求得2.方差(1)方差的定义设X为随机变量,若E[X-E(X)]2存在,则称它为X的方差,记为:D(X)=E[X-E(X)]2并且称为X的标准差。为了方便,方差和标准差也可以用s和s2表示。方差的计算方法:
X为离散型,则X为连续型,则简捷计算公式为
【例7.8】根据例7.3和例7.4,分别计算其中涉及到的随机变量的方差。解:根据前面得出的结果,对于例7.3,E(X)=2/9,E(X2)=4/15由方差的定义和计算公式,可以求得该离散型随机变量X的方差为:对于例7.4,E(X)=1,E(X2)=7/6,从而该连续型随机变量的方差为:(2)方差的性质若X具有期望E(X)及方差D(X),则X的标准化随机变量具有期望Eh=0,方差Dh=1。
3.协方差及相关系数(1)协方差与相关系数的定义量E{[X-E(X)][Y-E(Y)]}成为随机变量X与Y的协方差,记为,即Cov(X,Y),即而称为随机变量X与Y的相关系数。(2)协方差的性质思考一下如何证明【例7.9】设随机变量X和Y的相关系数为0.9,若Z=X-0.4,试求Y与Z的相关系数rYZ。解:因Z=X-0.4,所以
(三)常见随机变量的概率分布及数字特征
1.常见离散型随机变量的概率分布及数字特征常用的离散型概率分布包括两点分布、二项分布、泊松分布。两点分布(0-1)分布质量不合格×质量合格√只有两种可能结果的随机试验,称之为伯努利试验。比如检查一件产品的质量(要么合格,要么不合格)、抛一枚硬币(要么出现正面,要么出现反面)等。一般地,把两个试验结果分别看作是“成功”与“失败”,用数值“1”和“0”表示。将一次伯努利试验成功的次数定义为一个离散型随机变量,它的概率分布就是最简单的分布类型,即两点分布。设随机变量X只可能取0和1两个值,它的概率分布为:如表7.6所示:X01pk1-pp则称X服从两点分布,也称为0-1分布。两点分布的数学期望和方差为:p是指一次伯努利试验中成功地可能性大小二项分布n重伯努利试验
一次试验只有两种可能结果,即“成功”和“失败”;一次试验“成功”的概率为p
,“失败”的概率为q=1-p,而且概率p对每次试验都是相同的;试验是独立重复地进行了n次;在n次试验中,“成功”的次数对应一个离散型随机变量,用X来表示。在n重贝努里试验中,“成功”的次数X服从参数为n、p的二项分布,记为X
~B(n,p)。二项分布的概率函数:二项分布适用于放回摸球、掷硬币、产品检查、婴儿性别调查等,当时二项分布就是两点分布。二项分布的数学期望和方差为:【例7.9】已知一批产品的次品率为4%,从中有放回(抽取后再放回去)地抽取5个。求5个产品中(1)没有次品的概率;(2)恰好有一个次品的概率。解:根据题意,该问题相当于5重伯努利试验,每次试验若把“抽取次品”当作“成功”,那么p=4%。设X为抽取的次品数,显然有X~B(5,0.04),从而根据定义就有:
泊松分布
X服从泊松分布,记为X~P(λ):泊松分布的概率函数为:泊松分布的数学期望和方差为:2.常见连续型随机变量的概率分布及数字特征均匀分布
分布函数为:概率密度为:期望和方差为:密度函数为:分布函数为:期望和方差为:指数分布正态分布
一般正态分布
密度函数为:密度函数的两个特殊的性质:f(x)处处连续;曲线f(x)关于x=m对称;分布函数为:期望和方差为:标准正态分布密度函数为:
分布函数为:标准正态分布具有以下性质:若X~N(m,s
2)
,则随机变量服从标准正态分布,即X~N(0,1)若X~N(m,s
2),要求P(x1<X<x2),可转化为求“3s”原则|X-m|>3s
的概率很小,因此可认为正态随机变量的取值几乎全部集中在[m-3s,m+3s
]区间内。一般正态分布与标准正态分布的关系二、抽样及抽样分布(一)抽样方法抽样的基本概念总体又称为全及总体或者母体,是由具有某种特定性质的许多个别事物组成的整体,也就是我们所要调查研究的现象的全体。组成总体的每个个别事物叫总体单位,总体单位数通常用N表示。样本也称为子样,是由从总体中按照随机原则抽取的一部分单位所构成的集合体。样本种单位数的多少称为样本容量,通常用n表示。一般来说,当n大于等于30时,所取样本就成为大样本;反之,就称为小样本。总体指标
总体指标是指反映总体数量特征的综合指标,又称总体参数。在一个总体中,总体指标是唯一确定的量,而且是一个未知的量,需要通过样本进行推算。常用的总体指标有总体平均数、总体标准差、总体成数和总体成数的标准差等,分别用m,s,P
,sp来表示。
总体标准差的计算公式为:总体成数标准差的计算公式为:X表示总体单位的某数量标志值
P总体中具有某一标志表现的单位数在总体单位数中所占的比重。样本指标反映样本数量特征的综合指标,又称为样本统计量。样本指标有样本平均数、样本标准差、样本成数和样本成数的标准差,分别用表示。
样本标准差的计算公式为:
样本成数标准差的计算公式为:x表示样本总体单位的某数量标志值
p表示样本成数,即样本中具有某一标志表现的单位数在样本单位数中所占的比重。抽样方法概率抽样非概率抽样重复抽样不重复抽样简单随机抽样等距抽样分层抽样整群抽样多级抽样即放回抽样。比如,要从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个单位,把这看作是一次试验,将结果记录后放回总体中,重新参加下一次的抽取;将此过程连续进行n次即不放回抽样,是指从总体中抽取的单位不再放回去,只从剩下的单位中进行抽取等距抽样也称为系统抽样,它是按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则)先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查(二)抽样分布
1.抽样分布的基本类型c2分布概率密度函数为:期望和方差为:t分布
概率密度函数为:根据G函数的性质,有
即当n足够大时,t分布近似于标准正态分布N(0,1)。F分布
概率密度函数为:
2.常见的抽样分布样本均值的抽样分布(1)重复抽样条件下样本均值的抽样分布①单个样本均值的抽样分布如果抽取的样本是大样本,样本均值的概率分布趋近于期望为m,方差为s2/n的正态分布,即将样本均值这一随机变量标准化,得到一个数学期望为0且方差为1的标准正态变量,即此标准正态变量为z,则有:
②两个样本均值之差的抽样分布假设X1、X2是两个相互独立的正态总体,现从两个总体中分别抽取容量为n1和n2的两个简单随机样本,则两个样本均值之差
的抽样分布仍然服从正态分布,其数学期望为:方差为:如果X1、X2是两个相互独立的非正态总体,只要样本容量足够大(n1,n2≥30),两个样本均值之差的抽样分布近似服从正态分布,其数学期望和方差不变。(2)不重复抽样条件下样本均值的抽样分布不重复抽样与重复抽样条件下的情况基本相同,惟一不同的是样本方差不再是s2/n,而是等于重复抽样的样本均值的方差乘以修正因子。所以只要样本的容量足够大,样本均值的概率分布趋近于期望为m,方差为的正态分布,即
样本成数的抽样分布
(1)重复抽样条件下样本成数的抽样分布①单个样本成数的抽样分布
大样本条件下样本成数p近似地服从均值为总体成数P,方差为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北造价员试题及答案
- 福建商学院《画法几何》2025-2026学年期末试卷
- 东华理工大学《教育学原理》2025-2026学年期末试卷
- 南昌工学院《临床检验基础》2025-2026学年期末试卷
- 长治学院《旅游学》2025-2026学年期末试卷
- 安徽艺术职业学院《道路勘测设计》2025-2026学年期末试卷
- 安徽邮电职业技术学院《农村经济管理》2025-2026学年期末试卷
- 厦门演艺职业学院《会计信息系统》2025-2026学年期末试卷
- 福建技术师范学院《超声影像学》2025-2026学年期末试卷
- 福州软件职业技术学院《档案管理学》2025-2026学年期末试卷
- 天津市十二区重点学校2025-2026学年高三下学期毕业联考-语文试卷
- 茶叶加工车间工作制度
- 2026年全国社会工作者职业资格证考试模拟试卷及答案(共六套)
- 公路危大工程监理实施细则
- 2026安徽省供销集团有限公司集团本部招聘7人笔试参考题库及答案解析
- 农村人居环境整治长效管护模式研究课题申报书
- 2026年山西药科职业学院单招综合素质考试题库及答案详解(基础+提升)
- 福利院食品卫生安全制度
- 餐饮后厨消防安全考试题
- 5G通信网络规划与优化-课程标准
- 肾单位模型改进课件
评论
0/150
提交评论