概率论与数理统计ppt课件.ppt_第1页
概率论与数理统计ppt课件.ppt_第2页
概率论与数理统计ppt课件.ppt_第3页
概率论与数理统计ppt课件.ppt_第4页
概率论与数理统计ppt课件.ppt_第5页
已阅读5页,还剩437页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章:随机事件及其概率,概率论与数理统计是数学的一个重经分支,它是研究随机现象统计规律的一门学科,广泛应用于科学研究、工程技术、经济及管理等各个领域。本章通过随机试验介绍概率论中随机事件的关系及其运算、概率的性质及其计算方法。,3,1.确定性(或必然)现象和随机(或不确定性、偶然)现象.,2.随机现象:在一定条件下可能发生也可能不发生,在个别观察中其结果呈现出不确定性(或称为偶然性或随机性),在大量重复观察中其结果又具有统计规律性.,1随机事件及其计算,3.对某种现象或对某个事物的某个特征的观察(测)以及各种各样的科学实验统称为实验。随机现象的基本特征是,在一定条件下单次实验的可能结果不止一个,每次实验只能出现其中之一,但预先无法预知,但大量多次重复实验,出现各种结果的比例数又具体统计规律性。,一、随机现象与随机实验,4,E1:抛一枚硬币,观察正(H)反(T)面的情况.,E2:将一枚硬币抛三次,观察正反面出现的情况.,E3:将一枚硬币抛三次,观察出现正面的情况.,举例:,我们将对自然现象的一次观察或进行一次科学试验称为试验。,E4:电话交换台一分钟内接到的呼唤次数.,E5:在一批灯泡中任取一只,测试它的寿命.,E6:在一批产品中任意抽取若干件,以检验产品的合格率.,5,基本特征(1)可在相同的条件下重复试验;(2)每次试验的可能结果不止一个,且能事先明确所有可能的结果;(3)每次实验只能出现可能结果中的一个,但一次试验前不能预先确定到底会出现哪个结果.,在相同条件下,大量重复进行的这类试验,称为随机实验:,6,二、样本空间:定义随机试验E的所有可能的结果组成的集合称为E的样本空间,记为S.样本空间的元素,也就是最简单的每一个直接结果称为样本点,用表示.,样本空间的分类:,1.离散样本空间:样本点为有限个或可列个.例E1,E2等.,2.无穷样本空间:样本点在区间或区域内取值.例灯泡的寿命t|t0.,基本事件,7,三、随机事件,定义样本空间S的子集称为随机事件,简称事件.在一次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生.它是满足某些条件的样本点的集合。,基本事件:,复合事件:,必然事件:,不可能事件:,由一个样本点组成的单点集.如:H,T.,由两个或两个以上的基本事件复合而成的事件为复合事件.如:E3中出现正面次数为奇数.,样本空间S是自身的子集,在每次试验中总是发生的,称为必然事件。,空集不包含任何样本点,它在每次试验中都不发生,称为不可能事件。,8,例1.试确定试验E2中样本空间,样本点的个数,并给出如下事件的元素:事件A1=“第一次出现正面”、事件A2=“恰好出现一次正面”、事件A3=“至少出现一次正面”.,9,四、事件间的关系与运算,1.包含关系和相等关系:,若事件A发生必然导致事件B发生,则称件B包含事件A,记作AB.若AB且AB,即A=B,则称A与B相等.,10,2.和事件:,3.积事件:事件AB=x|xA且xB称A与B的积,即事件A与B同时发生.AB可简记为AB.,类似地,事件为可列个事件A1,A2,.的积事件.,11,4.差事件:事件A-B=x|xA且xB称为A与B的差.当且仅当A发生但B不发生时事件A-B发生.即:,显然:A-A=,A-=A,A-S=,12,5.事件的互不相容(互斥):,13,6.对立事件(逆事件):,14,7.事件的运算律:,交换律:,结合律:,对偶律:,分配律:,15,例.甲、乙、丙三人各射击一次,事件A1,A2,A3分别表示甲、乙、丙射中,试说明下列事件所表示的结果:,乙没有射中;,乙丙至少一人射中;,甲乙没有都射中,甲乙都没有射中,甲乙都射中但丙没射中,至少有两人都射中,16,2.随机事件的概率,一.概率统计定义:,1.频率若在相同的条件下,共进行了n次试验,,事件A发生的次数nA,称为A的频数,比值nA/n称为事件A发生的频率,记为fn(A).即:,17,频率的特性:波动性和稳定性.,18,2.概率的统计定义,设有随机实验E,若试验重复次数n充分大时,事件A发生的频率fn(A)总是在区间0,1上的一个确定的常数p附近微波摆动,并逐渐稳定于p,则称常数p为事件发生的概率,记作P(A),即:P(A)=数p.,概率的性质:,19,二.概率的古典定义:,古典概型的两个特点:,例如:掷一颗骰子,观察出现的点数.,等可能概型的两种类型:古典概型(样本空间有有限集)和几何概型(样本空间为无限集),(1)样本空间中的元素只有有限个,即,(2)试验中每个基本事件发生的可能性相同,即,20,概率的古典定义:对于古典概型,样本空间S1,2,n,设事件A包含S的m个样本点,则事件A的概率定义为,概率的性质:,21,古典概型概率的计算步骤:,(1)选取适当的样本空间S,使它满足有限等可能的要求,且把事件A表示成S的某个子集.,(2)计算样本点总数n及事件A包含的样本点数k.,(3)用下列公式计算:,22,例1.袋中装有4只白球和2只红球.从袋中摸球两次,每次任取一球.有两种式:(a)放回抽样;(b)不放回抽样.求:(1)两球颜色相同的概率;(2)两球中至少有一只白球的概率.,解:(a)放回抽样,(b)不放回抽样,23,例2.设一袋中有编号为1,2,9的球共9只,现从中任取3只,试求:(1)取到1号球的概率,(事件A)(2)最小号码为5的概率.(事件B),解:,24,例3.某接待站在某一周曾接待过12次来访,且都是在周二和周四来访.问是否可以推断接待时间是有规定的?,如果没有规定,则该事件发生的概率只有:,25,古典概率计算中用到的主要排列组合公式,不重复的排列公式:从n个元素中取m个元素按照一定的顺序排列成一列,可重复排列公式:从n个不同元素中有放回地抽取m个元素按照一定的顺序排成一列,其排列数为,组合公式:从n个不同元素中取出m个元素,不计顺序组成一组,其组合数为,26,加法原理:如果完成一项工作有m种不同方法,其中任何一种方法都可以一次完成这项工作,假设第I种方法有ni(i=1,2,3,m)个方案,则完成该项工作的全部方案有种。,乘法原理:如果完成一项工作需先后m个步骤,其中第i个步骤有ni(i=1,2,3,m)个方案,则完成该项工作的全部方案共有种。,例:设袋中有外形相同的10个有色球,其中6个白球和4个红球。现从袋中任意取(或随机地取)3个,试求:取出的3个球都是红色球的概率;取出的3个球恰好有一个是白球的概率。,27,解:设想把10个球进行编号,把它们理解为10个不同的球,那么从中任意取3个球,共有种不同的取法,每种取法都对应一个的样本点,所以该试验样本空间的样本总数为,设A=取出的3个球都是红色球,则事件A包含了个样本点,因此:,设B=取出3个球中恰好有一个白球,而事件B的发生方法应该是:从4个白球中任取一个,有种取法;再从6个红球中任意取2个,有种取法,红球白球谁先取得与结果无妨。因此。事件B的发生共有种方式。因此,28,抽样问题:所谓抽样,是指从待查的整批产品中抽出部分产品。抽出的这部分称为样本或子样,样本中的每件产品称为样品,样本中所包含的样品件数称为样本容量,而待查整批次产品叫做总体或母体。随机抽样是指总体中每件产品,都等可能地被抽作样本中的样品。,例:设一批产品共计100件,其中有3件次品,其余均为正品,按下列两种方法随机抽取2件产品:有放回抽样,即第一次任取一件产品,测试后放回原来的产品中,第二次再从中任意抽取一件产品;无放回抽样:即第一次任取一件产品,测试后不再放回原来的产品中,第二次再从第一次测试后其余的产品中任意抽取一件。试求上述两种情况下的,分别求取出的2件产品中恰好有一件产品的概率。,29,先分析事件A=取出的2件产品中恰好有一件次品包含的样本点数.,事件A的发生有两种方式:先取得一件次品后取得一件正品或先取得一件正品后取得一件次品。因此所包含的样本点数为:,放回抽样:每次抽取样品都是从100件产品中任意抽取,都有100种取法,因此样本空间的样本点数为n=1002.故,无放回抽样:第一次是从100件产品中任意抽取一件,第二次是从剩余的99件产品中任意抽取一件,因此样本空间的样本点数为:n=10099=,故,30,无放回抽样问题,可以看作是一次任取若干样品,其样品空间会发生改变,样本空间的样本点数和事件A所包含的样本点数等都要发生相应的改变,它们要用组合公式进行计算:,例:设有一批产品有N件,其中M件次品,其余都是正品。现从该批产品中随机抽取n件,试求恰好取到件次品的概率。,解:,31,例:设袋中有a个白球和b个红球。现按无放回取样,依次把球一个个取出来,试求第k(1ka)次取得的球是白球的概率。,解法一:依题意试验是从袋中把a+b个球无放回地把球一个个取出来,依次排队,共有(a+b)!种不同的排法,则相应的样本总数为n=(a+b)!。设A=第k次取得的球是白球。对事件A发生有利的排法是:先从a个白球中任取一个排在第k个位置上,两把其余的a+b-1个排在其余a+b-1个位置上,共有(a+b-1)!种不同的排法。所以事件包含的样本数为,从而:,32,解法二:只考虑前k次取球。试验可以看作一次取k个球进行排队,共有种不同的取法,相应的样本点总数为,事件A如解法1所设,则对事件A发生有利的排法是:先a从个白球中任取一个排在第k位置上,而后从其余a+b-1个球中任取k-1个排在其余k-1个位置上,共有种不同的排法。所以事件包含的样本点数为,故:,抽签原理:以上计算结果表明,事件A=第k次取得的球是白球的概率P(A)与k无关,即A发生的概率与取球的先后次序无关,这就是“抽签原理”.无论从日常经验,还通过概率计算,抽签原理都表明,是否抽到“签”与抽签的先后次序无关,人人均值机会均等。因此,该原理常常常常用于体育比赛和其他机会均等的活动中。,33,例:设有n个不同的质点,每个质点等可能地落入N(nN)个格子中的每一个格子内,又假设每个格子可以容纳的质点数没有限制,试球下列事件的概率:A=某指定的n个格子各有一个质点;B=任意n个格子各有一个质点C=指定的一个格子中恰好有m(mn)个质点,解:样本空间的总样本点数:Nn,对事件A发生有利的的落入方法是,n个质点在n个格子进行全排列,共有n!种不同的落入方法。因此,A相应地包含了n!个样本点,故,34,对事件B发生有利的落法是:从N个格子中任意选中其中的n个,有种不同的选法,对于每一种选法再按(1)使n个质点落入选中的格子中,有n!落入方式。因此共有n!不同的落入方法。因此B相应地包含了n!个样本点,对事件C发生有利的落入方法是:从n个质点中任意选中m个,让它们落入指定的一个格子中,共有种选法,而其余n-m个质点落入剩余N-1的格子中,有种不同的落法,因此共有种不同的落法,C也相应地包含了个样本点。故:,典型问题:分房问题;排座位问题;不同生日的人员聚会问题,35,概率论与数理统计第一周作业习题1-1(p8)A组:1.;2.;3、;4.;5.B组:1.;2.;3.(II);4.;习题1-2(1)P17A组:1、3、5、7B组:2、4,36,三、概率的几何定义:,1.几何概型实验:试验的样本空间是直线上某个有限空间,或平面上、空间内某个有限度量的区域,从而包含了无限多个样本点。每个样本点的出现具有等可能性。该实验的每个样本点可以看作是等可能地落入内的随机点。,37,2.概率的几何定义当试验的样本点是等可能地落入空间某个区域的随机点,而且随机事件A对应于随机点等可能地落入上述区域的某子区域,则事件A发生的概率可定义为,说明当古典概型的试验结果为连续无穷多个时,就归结为几何概率.,38,例:设在一个5万平方公里的海域,有表面积40平方公里的大陆架蕴藏着石油。假如在该海域任意选一点进行石油钻探。问:能钻到石油的概率?,解:,例:某人发现自己的表停了,想通过听收音机报时来进行对表,试问他等待时间不超过10分钟的概率。,解:,39,例1甲、乙两人相约在0到T这段时间内,在预定地点会面.先到的人等候另一个人,经过时间t(t0)的一些平行直线,现向此平面任意投掷一根长为l(0,则有P(ABC)=P(A)P(B|A)P(C|AB).,推广,61,例:设某种机器按设计要求使用寿命要超过30年的概率为0.8,超过40年概率为0.5,试求该机器使用30年后,将在10年损坏的概率。,解:设A=该种机器使用寿命超过30年,B=该种机器使用寿命超过40年,则,令该种机器使用30年后,将在10年内损坏它与事件是互斥事件。因此,62,例:设某批产品共有90件,其中10件次品,其余为正品,现从中无放回地抽样3次,每次抽取1件,求第3才抽到正品的概率。,解:,例:某人忘记了电话号码的最后一位数字,因而任意地按最后一个数字,试求:,不超过4次打通电话的概率;,若已知最后一位数字是偶数,则不超过3次打通电话的概率.,63,解:,64,例(抽签抓奖问题):设袋中有n个字条,其中n-1个写着“谢谢您的参与!”,1个写着“恭喜您中奖啦!”现n个人依次从袋中各随机取一个条,并且每人取出后不再放回,试求第k个人取得中奖字条的概率。,65,二、全概率公式和贝叶斯公式:,1.样本空间的划分,注,(1)若B1,B2,Bn是样本空间S的一个划分,则每次试验中,事件B1,B2,Bn中必有一个且仅有一个发生.,66,2.全概率公式:,称为全概率公式.,证明:因为对任意事件A,有,67,例:一商店新进一批由3个分厂生产的同一型号的空调,而从这三个分厂的进货比例为3:1:2,它们的次品率分别为0.01,0.12,0.05.某顾客从该商店任意选购了一台空调,问该空调为次品的概率?;在已知该空调为次品的情况下,它是哪个分厂生产的可能性大?,解:设B=顾客见到不合格空调,68,3.贝叶斯公式:,69,例.对以往数据分析结果表明,当机器调整得良好时,产品的合格率为90%,而当机器发生某一故障时,其合格率为30%,每天早晨机器开动时机器调整良好的概率为75%,试求已知某日早上第一件产品是合格品时,机器调整得良好的概率是多少?,解:设,70,例:一商店销售10台收音机,其中3台为次品,其余为正品。某顾客选购时已经售出2台,该顾客从余下的8台收音机中任选一台。问:该顾客购得正品的概率;若已知该顾客购得正品,则已售出的2台都是次品的概率是多少?,解:B=该顾客购得正品Ai=售出的2台中有i台次品(i=0,1,2),71,例:临床诊断记录表明,利用某项检验检查癌症具有如下效果:对癌症患者进行检验结果95%呈阳性;对非癌症患者进行检验结果96%呈阴性。现在利用这项技术对某市市民进行癌症普查,如果该市癌症患者约占市民总数的0.4%,求试验结果呈阳性的被检查者患癌症的概率;试验结果呈阴性的被检查者确实未患癌症的概率;,解:设A=实验结果为阳性;B=被检查者确实患有癌症,72,由全概率分式得,由贝叶斯公式,73,1.6独立性,设A,B是试验E的两事件,当P(A)0,可以定义P(A|B).,一般地,P(A|B)P(B),但当A的发生对B的发生的概率没有影响时,有P(B|A)=P(B),由乘法公式有P(AB)=P(A)P(B|A)=P(A)P(B).,例如设试验E为掷甲、乙两枚硬币,观察正反面出现情况.设A“甲币出现H”,B“乙币出现H”,试求:B发生的条件下,A发生的概率;,1.两个事件相互独立性:设A,B是两事件,如果满足等式P(AB)=P(A)P(B),则称事件A与事件B是相互独立的事件.,4随机事件的独立性,74,定理1(相互独立事件的充要条件):设A,B是两事件,且P(A)0,则A,B相互独立的充要条件是:P(B|A)=P(B).,定理2:下列4个命题等价,证明:此处证明与的等价性当成立时,由事件的关系与运算与概率的性质可知:,75,当成立时,即当时,则有,1)零概率事件与任何事件都是相互独立的.,2)由对称性,A,B相互独立,必有B,A相互独立.,推论:,2.两两相互独立:,设有任意事件A1,A2,An,1ijn,满足P(AiAj)=P(Ai)P(Aj),则称这n个事件两两相互独立.,76,如果对于任意的k(kn),任意的1i1i2ikn都有:P(Ai1Ai2Aik)=P(Ai1)P(Ai2)P(Aik),则称这n个事件相互独立.,3.n个事件相互独立:,注,n个事件相互独立保证了其中的任意两个事件相互独立,即两两相互独立;但两两相互独立不能保证这n个事件相互独立.,三.利用独立性计算古典概率:,1.计算相互独立的积事件的概率:若已知n个事件A1,A2,An相互独立,则P(A1A2An)=P(A1)P(A2)P(An),2.计算相互独立事件的和的概率:若已知n个事件A1,A2,An相互独立,则,77,例:设甲乙两个射手,他们射出命中的概率分别为0.8和0.7,现两人同时向一目标射出一次,求,目标的命中率;现已知目标被命中,则它是甲命中的概率。,解:设A=甲命中目标;B=乙命中目标;C=目标被命中,78,例.两架飞机依次轮番对同一目标投弹,每次投下一颗炸弹,每架飞机各带3颗炸弹,第1架扔一颗炸弹击中目标的概率为0.3,第2架的概率为0.4,求炸弹未完全耗尽而击中目标的概率。,解:设,则:,79,80,81,82,伯努力概型及二项分布,1、n重伯努力概型:研究n次独立实验中某随机实验发生的次数,例:某射手每射击一发子弹命中目标的概率为p(0p1)。现对同一目标重复射击3次,试求恰好射中2发的概率。,解:,2、二项式概率公式,定理:设在每次试验中,事件A发生的概率均为p(0p1),即,而,则重伯努力实验中,事件恰好发生k次的概率为:,83,例:已知某车间有5台某型号的机床,每台机床由于种种原因时常需要停机。设各台机床停机开机是相互独立的。若每台在任一机床时刻处于停机状态的概率均为1/3,试求在任一时刻:,(1)恰好有一台机床处于停机状态的概率;(2)至少有一台机床处于停机状态的概率;(3)至多有一台机床处于停机状态的概率。解:(1)(2)(3),84,85,第一章习题课,一、主要内容:,样本空间,随机事件,概率定义及性质,古典概型,条件概率,全概率公式,Bayes公式,事件的独立性,86,二、课堂练习:,1.选择题:(1)当事件A与B同时发生,事件C必发生,则有()(A)P(C)=P(AB)(B)P(C)=P(AB)(C)P(C)P(A)+P(B)-1(D)P(C)P(A)+P(B)-1,87,2.填空题:,(2)设两个事件A,B相互独立,A,B都不发生的概率为1/9,A发生而B不发生的概率与B发生而A不发生的概率相等,则P(A)=_.,3.计算题:,88,设甲箱中有a只白球,b只黑球,乙箱中有c只白球,d只黑球,从甲箱中任取一球放入乙箱中,然后从乙箱中任取一球,试求从乙箱中取得白球的概率。有n个不同(可辨别)的球,每个球都以同样的概率1/N被投到N(nN)个箱子中的每一箱中,试求下列事件的概率:(1)某指定的n个箱子中各一球(A)(2)恰有n个箱,其中各有一球(B)(3)某指定箱中恰有m(mn)个球(C)(4)恰有k个箱子,其中有m个球(D).3.在一个盒子中混有新旧两种乒乓球,新的有白球40个,红球30个,旧球中有白球20个,红球10个,在这个盒子中任取一球,发现是新的,求这个球是白球的概率.,89,第二章随机变量及其分布,2.1随机变量,即X(e)是定义在样本空间S上的一个实函数,对于不同的试验结果e,X取不同的值,由于试验前不能预料e的取值,因而X取1还是取0也是随机的,故称X(e)为随机变量。,90,1.定义:设随机试验E的样本空间是S=e,若对于每一个eS,有一个实数X(e)与之对应,即X(e)是定义在S上的单值实函数,称为随机变量。简记为r.v.,注,(1)可用随机变量X描述事件.,反过来,X的一个变化范围表示一个随机事件:“2Xx1,F(x2)-F(x1)=Px1Xx20.,(2)0F(x)1,F(-)=0,F(+)=1.,(3)F(x)至多有可列个间断点,而在其间断点上也是右连续的,F(x+0)=F(x).,104,结论,反之,若已知分布函数求分布律用如下公式求解:,105,106,3.连续型随机变量及其概率密度,则称X为连续型r.v.f(x)称为X概率密度函数,简称概率密度.,107,例1.一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能击中靶,以X表示弹着点与圆心的距离.试求X的分布函数.,解:已知,108,109,定义,3.关于连续型r.v.的一个重要结论:,定理:设X为连续型r.v.它取任一指定的实数值a的概率均为0.即PX=a=0.,110,4.几个常用的连续型r.v.分布,(一)均匀分布:,则称随机变量X在(a,b)上服从均匀分布,记作XU(a,b).,分布函数为:,111,(二)正态分布:,112,性质:,113,(2)标准正态分布:,114,引理:,3.一般正态分布的标准化及其计算,115,结论,116,例设某商店出售的白糖每包的标准全是500克,设每包重量X(以克计)是随机变量,XN(500,25),求:(1)随机抽查一包,其重量大于510克的概率;(2)随机抽查一包,其重量与标准重量之差的绝对值在8克之内的概率;(3求常数c,使每包的重量小于c的概率为0.05.,117,服从正态分布N(,2)的r.v.X之值基本上落入-2,+2之内,几乎全部落入-3,+3内.,118,(3)标准正态分布的上分位点:,119,(三)负指数分布:,120,性质(4)的直观意义可解释如下:若令X表示某种器件的寿命,性质(4)意味着它已经使用了s小时未损坏的器件能够再继续使用t小时以上的概率,与一个新器件能够使用t小时以上的寿命相同。,这意味着器件的衰老作用可以忽略。器件的损坏主要由偶然因素所致。,121,122,(四)伽玛分布:,123,4.随机变量的函数的分布,一、X为离散型r.v.(列表法),解:,124,(2)若g(x1),g(x2),中不是互不相等的,则应将那些相等的值分别合并,并根据概率加法公式把相应的pi相加,就得到了Y的概率分布律.,125,二、X为连续型r.v.,1.“分布函数法”:,(3)对y求导得到Y的概率密度:,126,127,128,若f(x)在有限区间a,b以外等于零,则只需假设在a,b上g(x)严格单调,选取=min(g(a),g(b),=max(g(a),g(b).,2.公式法:定理:设X是连续型r.v.,具有概率密度f(x),设y=g(x)是x的严格单调函数,且反函数x=h(y)具有连续的导函数.当g(x)严格增加时,记=g(-),=g(+);当g(x)严格减少时,记=g(+),=g(-),则Y的概率密度为:,说明,(2)定理中条件y=g(x)是X的严格单调函数是相当苛刻的,许多常见的函数都不能满足,因此,求随机变量的函数的分布时,只能按“分布函数法”直接求解.,129,定理.r.v.XN(,2),证明X的线性函数Y=aX+b(a0)也服从正态分布.,130,6二维随机变量及其联合分布函数,一、二维随机变量的概念,二、二维随机变量的(联合)分布函数:,本质上,二维随机变量就是定义在同一样本空间上的一对随机变量。类似地也可定义多维随机变量。,131,若将(X,Y)看成平面上随机点的坐标,则分布函数F(x,y)的值为(X,Y)落在阴影部分的概率(如图1),图1,图2,132,三、联合分布函数的性质,边缘分布,只要知道了联合分布,两个变量的边缘分布也就随之确定。一般而言,仅知道边缘分布,往往不能确定联合分布。,133,134,135,7二维离散型随机变量,一、联合分布律,136,例:设有一个装有4个红球、1个白球的袋子,现每次从中随机抽取一个,取后放回,连续抽取两次,令:,137,138,二、边缘分布律,Y的分布律,X的分布律,139,三、条件分布律,140,第4周作业习题2-1:A组3,6,9;B组2,5;习题2-2:A组1,4;B组2;习题2-3:A组2;B组3;习题2-4:A组2,5,8,11;B组2,4;习题2-5:A组2,5;B组2;习题2-6:A组1;B组2;习题2-7:A组2;B组2.,141,8二维连续型随机变量,一、联合概率密度,142,143,144,145,146,二、边缘概率密度:,147,三、两种重要二维连续型分布,1、二维均匀分布,G,G,x+y/2=1,x,y,148,解:易见区域面积等于1,于是(X,Y)的联合概率密度为,149,150,2.二维正态分布,151,152,定理,注意!,153,四、条件概率密度,首先引入条件分布函数,然后得到条件概率密度.,154,进一步可以化为:,155,156,解:,157,例3.设数X在区间(0,1)上随机地取值,当观察到X=x(01,X1,X2,Xn都相互独立,且具有相同的分布,则称X1,X2,Xn为全同独立分布的随机变量序列。,定义2:概率收敛性,定义3,225,提法二:强大数定律,即证明:,定理2.切比雪夫大数定律的特殊情况,设r.v.X1,X2,Xn,相互独立,且具有相同的数学期望和方差:,226,性质:,227,2.中心极限定理,中心极限定理(centrallimittheorem),x的分布趋于正态分布的过程,231,一.中心极限定理:,对于独立随机变量序列1,2,n,假定E(i),D(i)存在,令,232,1.独立同分布的中心极限定理:,设r.v.Xk(k=1,2,)相互独立,服从同一分布(i.i.d.)且具有有限的数学期望和方差:,233,2.李雅普诺夫定理:,234,3.德莫佛-拉普拉斯定理:,235,例1:某单位内部有260部电话分机,每部分机有4%的概率使用外线,各分机是否使用外线是相互独立的,问:总机至少要有多少条外线才能有95的把握保证各部分机使用时不必等候?,解:,236,例2.设某车间有200台车床,每台车床由于种种原因出现停车,且每台车床开车的概率为0.6,假定每台车床停或开车是相互独立的.若每台车床开车时需消耗1000W电能,问要以99.9%的概率保证这个车间不致因供电不足而影响生产,需供应多少电能?,解,237,例3,一加法器同时收到20个噪声电压Vk(k=1,2,20),设这20个电压是独立产生的,均服从区间(0,10)的均匀分布。若,238,解:由于Vk均服从(0,1)上的均匀分布,迥有,由全同分布的中心极限定理知,239,例3,在一家保险公司有10000个人参加了寿命保险,每人每年付12元保险费,已知在一年内一个人的死亡概率为0.6%。其死亡时家属可向保险公司领取1000元。问:保险公司亏损的概率有多大?,解:设X表示一年内的死亡人数,则XB(n,p),其中n=10000,P=0.6%。设Y表示公司一年的利润,则Y=1210000-1000X,于是由德莫佛拉普拉斯中心极限定理,有,240,第三章作业:习题:3-2P125A组2,4;B组1,3习题3-3P132A组:1,3;B组2,4第四章作业:习题:4-1P145A组1,3;B组2习题4-2P132A组:1,3;B组2,3,241,练习:1.抽样检查产品质量时,如果发现次品多于10个,则认为这批产品不能接受,问应检查多少个产品,可使次品率为10%的一批产品不能被接受的概率达到0.9?(147个)2.一个复杂的系统,由n个相互独立起作用的部件组成,每个部件的可靠度为0.9,且必须至少有80%的部件工作才能使整个系统工作,问n至少为多少才能使系统的可靠度为0.95?(25个)3.设某电话总机要为2000个用户服务,在最忙时,平均每户有3%的时间占线,假设各户是否打电话是相互独立的,问若想以99%的可能性满足用户的要求,最少需要多少条线路?(79条),242,第五章样本及抽样分布,1.总体与随机抽样,一.定义:在统计学中,我们把所研究的全部元素组成的集合称作母体或总体,总体中的每一个元素称为个体.(可分为有限总体和无限总体).,二.定义:设X是具有分布函数F的r.v.,若X1,X2,Xn是具有同一分布函数F的相互独立的r.v.,则称为从分布函数F(或总体F或总体X)得到的容量为n的简单随机样本,简称样本,它们的观察值x1,x2,xn称为样本值,又称为X的n个独立的观察值.,243,结论,244,2.统计量与抽样分布,一.定义:设X1,X2,Xn是来自总体X的一个样本,又设g(X1,X2,Xn)是一个连续函数,如果g中不含有未知参数,则称g(X1,X2,Xn)为统计量.,245,二.常用的统计量:,246,定义:统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.,注,结论,247,三.几种常用的统计分布:,248,249,250,2.分布与2(n)分布的关系:,251,252,253,注,3.2(n)分布的性质:,254,255,256,(二)t-分布:,说明,257,注,258,(四)F分布:,259,260,例题,0.1,261,四.正态总体样本的均值与样本方差的分布:,结论,重要定理,262,263,一、样本频数分布表与频率分布表,3总体分布的近似描述,样本容量为72088,“正面向上”记为0,“反面向上”记为1,35964,36124,1,抛掷硬币随机试验,0.5011,0.4989,设总体X是离散型随机变量,且有一组样本值,x1,x2,xn,样本频数是指样本值中不同数值在样本中出现的次数;而样本频率则是指不同数值在样本值中出现的比例。,注意点:,各直方长条的宽度要相同,宽窄与频率无关;,相邻长条之间的间隔要适当;,条形图的高度就是频率;,二、频率直方图,1.频率分布与总体分布的关系:通过样本的频数分布、频率分布可以估计总体的概率分布.研究总体概率分布往往可以研究其样本的频数分布、频率分布.2.总体分布:总体取值的概率分布规律在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确,例,1.在100名学生中,每人参加一个运动队,其中参加田径队的有13人,参加体操队的有10人,参加足球队的有24人,参加篮球队的有27人,参加排球队的有15人,参加乒乓球队的有11人.,(1)列出学生参加各运动队的频率分布表;,(2)画出表示频率分布的条形图.,解:频率分布表如下:,频率分布条形图如下:,频率,结果,例某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做哪些工作?,思考:由上表,大家可以得到什么信息?,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:,1.求极差(即一组数据中最大值与最小值的差),2.决定组距与组数,组数=,4.3-0.2=4.1,3.将数据分组,0,0.5),0.5,1),4,4.5,组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,,4.列频率分布表,100位居民月平均用水量的频率分布表,注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。,为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图用面积表示概率。,5.画频率分布直方图,小长方形的面积,组距,频率,=,注意:,这里的纵坐标不是频率,而是频率/组距;,某个区间上的概率用这个区间的面积表示;,直方图,思考:所有小长方形的面积之和等于?,探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数:组距=极差/组数,三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,利用样本频分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线。,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,连续随机变量总体分布的估计,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线,总体在区间内取值的概率,S,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,三、经验分布函数,分布函数是随机变量的一个重要特征,既然总体可以用随机变量来表示,而样本又可对总体的信息进行提取。因此,怎样用样本(X1,Xn)估计总体X的分布函数F(x)?,任意给定自变量x,则F(x)=P(Xx)用事件X0是一未知参数,求的极大似然估计.,解设(x1,x2,xn)是样本(X1,X2,Xn)的一组观测值.于是似然函数,两边取对数得,从而得出的极大似然估计量为,解这一方程得,解,总体X服从参数为的指数分布,则有,所以似然函数为,取对数,令,解得的极大似然估计值为,极大似然估计量为,例:设(X1,X2,Xn)是来自正态总体N(,2)的一个样本,其中,2是未知参数,参数空间=-0.求与2的极大似然估计.,解正态分布的似然函数为,两边取对数得,由微积分知识易验证以上所求为与2的极大似然估计.,分别求关于与2的偏导数,得似然方程组,解这一方程组得,例:设总体X具有均匀分布,其概率密度函数为,求未知参数的极大似然估计.,解设(X1,X2,Xn)是来自总体X的一个样本.似然函数为,要使L(;x1,x2,xn)达到最大,就要使达到最小,由于,所以的极大似然估计值为:,参数的极大似然估计量为:,2估计量的评选标准,对于总体的同一个未知参数,由于采用的估计方法不同,可能会产生多个不同的估计量。这就提出了一个问题,当总体的同一个参数存在不同的估计量时,究竟采用哪一个更好?这涉及到用什么样的标准来评价估计量的好坏问题,对此,我们介绍几个常用的评价标准:无偏性、有效性和一致性。,一、无偏性,在评价一个估计量的好坏时,我们当然希望估计量与被估参数越接近越好.但估计量是一个随机变量,它的取值随样本的观测值而变,有时与被估参数的真值近些,有时远些,我们只能从平均意义上看估计量是否与被估参数尽量接近,最好是等于被估参数.于是有无偏估计量的概念.,例:设总体X具有均匀分布,其密度函数为,解,用矩法估计得,求的无偏估计.,总体X的均值,例:设总体X的k阶矩E(Xk)存在,证明样本的k阶矩是E(Xk)的无偏估计.,证明,所以,证明样本的k阶矩是E(Xk)的无偏估计.,因为,例:设总体的方差D(X)存在,试证样本二阶中心矩B2是总体方差D(X)的有偏估计.,证明,所以,B2是总体方差D(X)的有偏估计.,注:,二、有效性,一个参数的无偏估计量不是唯一的,假若参数有两个无偏估计量,我们认为其观测值更密集在参数真值附近的一个较为理想。由于方差是随机变量取值与其数学期望的偏离程度的度量,所以无偏估计以方差小者为好。这就引出了估计量的有效性这一概念。,证明,由于总体服从泊松分布,故,于是有,同理,但是,例:设(X1,X2,X3)是来自总体X的一个样本,证明下面的三个估计量都是总体均值E(X)的无偏估计量,证明,三、一致性,估计量的无偏性和有效性都是在样本容量固定的前提下提出的。我们自然希望随着样本容量的增大,一个估计量的值稳定于待估参数的真值。这就对估计量提出了一致性的要求。,3参数的区间估计,点估计有使用方便、直观等优点,但他并没有提供关于估计精度的任何信息,为此提出了未知参数的区间估计法.,例对明年小麦的亩产量作出估计为:,即,若设X表示明年小麦亩产量,则估计结果为,P(800X1000)=80%,明年小麦亩产量八成为800-1000斤.,区间估计,这时必有,333,334,一、正态总体均值的区间估计,1.1方差已知时均值的区间估计,由总体服从正态分布可得,得到,从而,例:设轴承内环的锻压零件的平均高度X服从正态分布N(,0.42).现在从中抽取20只内环,其平均高度为32.3毫米.求内环平均高度的置信度为95%的置信区间.,解,解,经计算可得,查表得,从而,故所求置信区间为,例:已知幼儿身高服从正态分布,现从56岁的幼儿中随机地抽查了9人,其高度分别为:115,120,131,115,109,115,115,105,110cm;,解,例:用仪器测量温度,重复测量7次,测得温度分别为:115,120,131,115,109,115,115,105,110cm;设温度,解,1.2方差未知时均值的区间估计,解,经计算得,查表可得,从而,所以的置信度为0.99置信区间是,例:用仪器测量温度,重复测量7次,测得温度分别为:115,120,131,115,109,115,115,105,110cm;设温度,解,二、正态总体方差的区间估计,2.1均值已知时方差的区间估计,2.2均值未知时方差的区间估计,解,由题意得,查表得,算得,所求置信区间为,(0.038,0.506),解,三、两个正态总体均值差的区间估计,由于样本函数,其中,对于给定的置信度1-有,即,置信区间为,解,求得,由于样本函数,解,求得,四、两个正态总体方差之比的区间估计,解,求得,查表得,计算得,五、单侧置信区间,解,此时,于是,365,第七章假设检验,1.假设检验,一.基本思想:,例1:某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常,随机地抽取它所包装的9袋,称得净重分别为(公斤)0.4970.5060.5180.5240.4980.5110.5200.5150.512问机器是否正常?,先假设再检验!,7.1假设检验中的基本问题,7.1.1假设检验中的小概率原理7.1.2假设检验的一些基本概念7.1.3假设检验的步骤,7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论