应用统计chapter 5_第1页
应用统计chapter 5_第2页
应用统计chapter 5_第3页
应用统计chapter 5_第4页
应用统计chapter 5_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章:概率与概率分布,随机事件的几个基本概念,试验(experiment),对试验对象进行一次观察或测量的过程掷一颗骰子,观察其出现的点数从一副52张扑克牌中抽取一张,并观察其结果(纸牌的数字或花色)试验的特点可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果,事件(event),事件:试验的每一个可能结果(任何样本点集合)掷一颗骰子出现的点数为3用大写字母A,B,C,表示随机事件(randomevent):每次试验可能出现也可能不出现的事件掷一颗骰子可能出现的点数,事件(event),简单事件(simpleevent):不能被分解成其他事件组合的基本事件抛一枚均匀硬币,“出现正面”和“出现反面”必然事件(certainevent):每次试验一定出现的事件,用表示掷一颗骰子出现的点数小于7不可能事件(impossibleevent):每次试验一定不出现的事件,用表示掷一颗骰子出现的点数大于6,样本空间与样本点,样本空间(sampleSpace)一个试验中所有结果的集合,用表示例如:在掷一颗骰子的试验中,样本空间表示为:1,2,3,4,5,6在投掷硬币的试验中,正面,反面样本点(samplepoint)样本空间中每一个特定的试验结果用符号表示,事件的概率,事件的概率(probability),事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能性大小的数值事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率定义,事件的概率(probability),事件A的概率是一个介于0和1之间的一个值,用以度量试验完成时事件A发生的可能性大小,记为P(A)当试验的次数很多时,概率P(A)可以由所观察到的事件A发生次数(频数)的比例来逼近在相同条件下,重复进行n次试验,事件A发生了m次,则事件A发生的概率可以写为,事件的概率,例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数n的增大,出现正面和反面的频率稳定在1/2左右,概率的性质与运算法则,离散型随机变量及其分布,随机变量,随机变量(randomvariables)一次试验的结果的数值性描述一般用X,Y,Z来表示例如:投掷两枚硬币出现正面的数量根据取值情况的不同分为离散型随机变量和连续型随机变量,离散型随机变量,离散型随机变量(discreterandomvariables).随机变量X取有限个值或所有取值都可以逐个列举出来x1,x2,以确定的概率取这些不同的值离散型随机变量的一些例子,连续型随机变量,连续型随机变量(continuousrandomvariables)可以取一个或多个区间中任何值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子,离散型随机变量的概率分布,列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示,P(X=xi)=pi称为离散型随机变量的概率函数pi0;,例题分析,【例】一部电梯在一周内发生故障的次数X及相应的概率如下表,一部电梯一周发生故障的次数及概率分布,(1)确定的值(2)求正好发生两次故障的概率(3)求故障次数多于一次的概率(4)最多发生一次故障的概率,例题分析,解:(1)由于0.10+0.25+0.35+=1所以,=0.30(2)P(X=2)=0.35(3)P(X2)=0.10+0.25+0.35=0.70(4)P(X1)=0.35+0.30=0.65,离散型随机变量的数学期望,【引例】某手表厂在出厂产品中,抽查了N100只抽表的日走时误差,其数据如下:,这时,抽到的这100只手表的平均日走时误差为:,离散型随机变量的数学期望,离散型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和描述离散型随机变量取值的集中程度记为或E(X)计算公式为,随机变量X的每一个取值与期望值的离差平方和的数学期望,记为2或D(X)描述离散型随机变量取值的分散程度计算公式为方差的平方根称为标准差,记为或D(X),离散型随机变量的方差,数学期望及方差的性质,数学期望的基本性质1)E(c)=c,c为常数;2)E(cX)=cE(X);3)E(X+Y)=E(X)+E(Y);4)若X和Y独立,则E(XY)=E(X)E(Y).方差的性质D(C)=0,其中C为常数。D(CX)=C2D(X),C为常数。若X和Y独立,则D(X+Y)D(X)+D(Y),离散型数学期望和方差(例题分析),【例】一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表,每100个配件中的次品数及概率分布,求该供应商次品数的数学期望和标准差,常用离散型概率分布,二项试验(伯努利试验),二项分布与伯努利试验有关伯努利试验满足下列条件一次试验只有两个可能结果,即“成功”和“失败”“成功”是指我们感兴趣的某种特征一次试验“成功”的概率为p,失败的概率为q=1-p,且概率p对每次试验都是相同的试验是相互独立的,并可以重复进行n次在n次试验中,“成功”的次数对应一个离散型随机变量X,二项分布,重复进行n次试验,出现“成功”的次数的概率分布称为二项分布,记为XB(n,p)设X为n次重复试验中出现成功的次数,X取x的概率为,二项分布,对于P(X=x)0,x=1,2,n,有同样有当n=1时,二项分布化简为,二项分布,【例】已知一批产品的次品率为4%,从中任意有放回地抽取5个。求5个产品中:(1)没有次品的概率是多少?(2)恰好有1个次品的概率是多少?(3)有3个以下次品的概率是多少?,二项分布,数学期望方差二项分布的形态n较小且很小的情况下,二项分布是有偏斜的,且随n或的减小而偏斜度增大;当,不论n大小,二项分布是对称分布;当,随着n增多,二项分布接近对称分布。实际应用中只要,可将二项分布的形态视为对称分布。,二项分布,二项分布,【例】消费者投诉某食品加工厂生产的一种速冻饺子每袋重量不够标明的500克净重,然而该厂声称其产品最多有10不足这个重量。现在技术监督部门随机抽查了100袋,发现其中有20袋达不到500克,是否可认为厂方声称的小于等于10是不可靠的?,成功比率的数字特征,二项分布的正态近似,当n很大时,二项随机变量X近似服从正态分布Nnp,np(1-p)对于一个二项随机变量X,当n很大时,X取某一特定值的概率可用正态分布近似为,X取某一区间a,b的概率可用正态分布近似为,二项分布的正态近似,泊松分布,1837年法国数学家泊松(D.Poisson,17811840)首次提出用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一定路段内,路面出现大损坏的次数一定时间段内,放射性物质放射的粒子数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数,泊松分布,给定的时间间隔、长度、面积、体积内“成功”的平均数e=2.71828x给定的时间间隔、长度、面积、体积内“成功”的次数,泊松分布,【例】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?,解:设X=10分钟内航空公司预订票处接到的电话次数,数学期望:E(X)=方差:D(X)=,超几何分布,采用不重复抽样,各次试验并不独立,成功的概率也互不相等总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布概率分布函数为,超几何分布,超几何分布的数学期望和方差,有限总体校正系数,【例】某企业年终进行财务清查,已知在全年100个业务帐单中,30有拖欠款项。现随机抽取5个帐单,其中有2个拖欠款的概率是多大?,超几何分布,解:应用超几何分布,应用二项分布,超几何分布的数学期望和方差分别为:,几何分布的数学期望和方差分别为:,超几何分布中比率的数字特征,连续型随机变量的概率分布,连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用概率密度函数的形式和分布函数的形式来描述,概率密度函数probabilitydensityfunction,设X为一连续型随机变量,x为任意实数,X的概率密度函数记为f(x),它满足条件,f(x)不是概率,概率密度函数,密度函数f(x)表示X的所有取值x及其频数f(x),值,(值,频数),频数,f(x),a,b,x,概率密度函数,在平面直角坐标系中画出f(x)的图形,则对于任何实数x1x2,P(x1Xx2)是该曲线下从x1到x2的面积,概率是曲线下的面积,分布函数(distributionfunction),连续型随机变量的概率可以用分布函数F(x)来表示分布函数定义为,根据分布函数,P(aXb)可以写为,分布函数与密度函数的图示,密度函数曲线下的面积等于1分布函数是曲线下小于x0的面积,连续型随机变量的期望和方差,连续型随机变量的数学期望方差,常用连续型分布,正态分布,由C.F.高斯(CarlFriedrichGauss,17771855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述可用于近似离散型随机变量的分布例如:二项分布经典统计推断的基础,概率密度函数,f(x)=随机变量X的频数=正态随机变量X的均值=正态随机变量X的方差=3.1415926;e=2.71828x=随机变量的取值(-x),正态分布函数的性质,图形是关于x=对称钟形曲线,且峰值在x=处均值和标准差一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”均值可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的“陡峭”或“扁平”程度。越大,正态曲线扁平;越小,正态曲线越高陡峭当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1,和对正态曲线的影响,正态分布的概率,概率是曲线下的面积,标准正态分布,标准正态分布的概率密度函数,随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的分布函数,标准正态分布,标准正态分布表的使用,对于标准正态分布,即ZN(0,1),有P(aZb)baP(|Z|a)2a1对于负的z,可由(-z)z得到对于一般正态分布,即XN(,),有,标准化的例子P(5X6.2),标准化的例子P(2.9X7.1),正态分布(例题分析),【例】设XN(0,1),求以下概率:(1)P(X2);(3)P(-12)=1-P(X2)=1-0.9973=0.0227(3)P(-1X3)=P(X3)-P(X-1)=(3)-(-1)=(3)1-(1)=0.9987-(1-0.8413)=0.84(4)P(|X|2)=P(-2X2)=(2)-(-2)=(2)-1-(2)=2(2)-1=0.9545,正态分布(例题分析),【例】设XN(5,32),求以下概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论