(03)第3章概率、概率分布与抽样分布_第1页
(03)第3章概率、概率分布与抽样分布_第2页
(03)第3章概率、概率分布与抽样分布_第3页
(03)第3章概率、概率分布与抽样分布_第4页
(03)第3章概率、概率分布与抽样分布_第5页
已阅读5页,还剩156页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

125第3章概概率率、概概率分分布与抽样样分布布3-23.1事件及及其概概率3.2随机变变量及及其概概率分分布3.3常用的的抽样样方法法3.4抽样分分布3.5中心极极限定定理的的应用用3-3学习目目标掌握事事件的的定义义及其其概率率的计计算。。熟悉常常用的的几种种离散散型和和连续续型随随机变变量及及其概概率分分布。。了解常常用的的抽样样方法法掌握样样本均均值、、比率率和方方差的的抽样样分布布。熟练运运用中中心极极限定定理。。3-43.1事件及及其概概率3.1.1试验、、事件件和样样本空空间3.1.2事件的的概率率3.1.3概率的的性质质和运运算法法则3.1.4条件概概率与与事件件的独独立性性3.1.5全概公公式与与逆概概公式式3.1.1试验、、事件件和样样本空空间3-53-61)对试试验对对象进进行一一次观观察或或测量量的过过程掷一颗颗骰子子,观观察其其出现现的点点数从一副副52张扑克克牌中中抽取取一张张,并并观察察其结结果(纸牌的的数字字或花花色)2)试验验的特特点可以在在相同同的条条件下下重复复进行行每次试试验的的可能能结果果可能能不止止一个个,但但试验验的所所有可可能结结果在在试验验之前前是确确切知知道的的在试验验结束束之前前,不不能确确定该该次试试验的的确切切结果果1.试验验3-72.事件1)事件:试验的每每一个可可能结果果(任何样本本点集合合)掷一颗骰骰子出现现的点数数为3用大写字字母A,B,C,…表示2)随机事件件(randomevent):每次试验验可能出出现也可可能不出出现的事事件掷一颗骰骰子可能能出现的的点数3-83)简单事事件:不不能被分分解成其其他事件件组合的的基本事事件抛一枚均均匀硬币币,“出现正面面”和“出现反面面”4)必然事事件:每次试验验一定出出现的事事件,用用表示掷一颗骰骰子出现现的点数数小于75)不可能能事件:每次试验验一定不不出现的的事件,,用表示掷一颗骰骰子出现现的点数数大于64-96)事件的的关系和和运算事件的关关系有::包含和和相等;;事件的运运算有::和(并并),差差,交((积),,逆。(1)包含::关系式式表示“若若A出现,则B也出现””(反之则则未必)),称作“B包含A”,或“A导致B”。ABBA4-10(3)和(并并):运运算式A+B或A∪B读作“A加B”,称作““A与B的和(并并)”,,表示““A和B至少出现现一个””。对于于多个事事件或表表示“诸事件件中至少少出现一一个”。。BAA+B(2)相等::关系式式A=B表示二事事件A和B要么都出出现,要要么都不不出现,,称作““事件A等于事件件B”或“事件件A和B等价”。。(4)差:运运算式A-B或A\B读作“A减B”,称作““A与B的差”,,表示““事件A出现但B不出现。。”4-11A-BAB(5)交(积积):运运算式AB或A∩B,称作““A与B的交(或或积)””,表示示“事件件A和B同时出现现”。对对于多个个事件表示“诸诸事件同同时出现现”。4-12ABAB(6)逆事件件:={A不出现},称作A的对立事事件或逆逆事件。。显然A和互互为为对立事事件,它它们之间间有下列列关系::,A∩==ØØ。4-13A

A4-14(7)不相容容(互斥斥):若若AB=ØØ,即A与B不可能同同时出现现,则称称A和B不相容。。AB3-153.样本空间间与样本本点1)样本空空间一个试验验中所有有结果的的集合,,用表示例如:在在掷一颗骰骰子的试试验中,,样本空空间表示示为:{1,2,,3,4,5,,6}在投掷硬硬币的试试验中,,{正面,反反面}2)样本点点样本空间间中每一一个特定定的试验验结果用符号表示3.1..2事件的概概率3-163-171.定义:概率是对对随机事事件发生生可能性性大小的的度量.2.事件A的概率是是一个介介于0和1之间的一一个值,,用以度度量试验验完成时时事件A发生的可可能性大大小,记记为P(A)3.概率的计计算:1)古典概概率特征:(1)试验的的基本事事件总数数是有限限的;(2)每个基基本事件件出现的的可能性性都相同同。计算方法法:2)统计概概率当试验的的次数很很多时,,概率P(A)可以由所所观察到到的事件件A发生次数数(频数)的比例来来逼近在相同条条件下,,重复进进行n次试验,,事件A发生了m次,则事事件A发生的概概率可以以写为3-183、主观概概率对未来某某一事件件,既不不能通过过可能事事件个数数来计算算,也不不能根据据大量试试验的频频率来估估计,只只有根据据经验、、专业知知识、对对事件发发生的众众多条件件或影响响因素的的分析等等,对其其进行估估计从而而作出相相应决策策3-193-203.1..3概率的性性质和运运算法则则3-21互斥事件件及其概概率(mutuallyexclusiveevents)在试验中中,两个个事件有有一个发发生时,,另一个个就不能能发生,,则称事件件A与事件B是互斥事件件,(没有公共样本本点)AB互斥事件件的文氏氏图(Venndiagram)3-22【例】在一所城城市中随随机抽取取600个家庭,,用以确确定拥有有个人电电脑的家家庭所占占的比例例。定义义如下事事件:A:600个家庭中中恰好有有265个家庭拥拥有电脑脑B:恰好有有100个家庭拥拥有电脑脑C:特定户户张三家家拥有电电脑说明下列列各对事事件是否否为互斥斥事件,,并说明明你的理理由(1)A与B(2)A与C(3)B与C3-23解:(1)事件A与B是互斥事事件。因因为你观观察到到恰好好有265个家庭拥拥有电脑脑,就不不可可能恰好好有100个家庭拥拥有电脑脑(2)事件A与C不是互斥斥事件。。因为张张三也也许许正是这这265个家庭之之一,因因而事件件与有可可能同时时发生(3)事件B与C不是互斥斥事件。。理由同同(2)3-24【例】同时抛掷掷两枚硬硬币,并并考察其其结果。。恰好有有一枚正正面朝上上的概率率是多少少?解:用H表示正面面,T表示反面面,下标标1和2表示硬币币1和硬币2。该项试试验会有有4个互斥事事件之一一发生(1)两枚硬币币都正面面朝上,,记为H1H2(2)1号硬币正正面朝上上而2号硬币反反面朝上上,记为为H1T2(3)1号硬币反反面朝上上而2号硬币正正面朝上上,记为为T1H2(4)两枚硬币币都是反反面朝上上,记为为T1T23-25由于每一一枚硬币币出现正正面或出出现反面面的概率率都是1/2,当抛掷掷的次数数逐渐增增大时,,上面的的4个简单事事件中每每一事件件发生的的相对频频数(概率)将近似等等于1/4。因为仅仅当H1T2或T1H2发生时,,才会恰恰好有一一枚硬币币朝上的的事件发发生,而而事件H1T2或T1H2又为互斥斥事件,,两个事事件中一一个事件件发生或或者另一一个事件件发生的的概率便便是1/2(1/4+1//4)。因此,,抛掷两两枚硬币币,恰好好有一枚枚出现正正面的概概率等于于H1T2或T1H2发生的概概率,也也就是两两种事件件中每个个事件发发生的概概率之和和3-26互斥事件件加法规规则1)若两个个事件A与B互斥,则则事件A发生或事事件B发生的概概率等于于这两个个事件各各自的概概率之和和,即P(A∪B)=P(A)+P(B)2)事件A1,A2,…,An两两两互互斥斥,,则则有有P(A1∪A2∪…∪An)=P(A1)++P(A2)++…++P(An)3-27解::掷一一颗颗骰骰子子出出现现的的点点数数(1,2,3,4,5,6)共有有6个互互斥斥事事件件,,而而且且每每个个事事件件出出现现的的概概率率都都为为1//6,根据据互互斥斥事事件件的的加加法法规规则则,,得得【例】抛掷掷一一颗骰子子,,并并考考察察其其结结果果。。求求出出其其点点数数为为1点或或2点或或3点或或4点或或5点或或6点的的概概率率3-28概率率的的性性质质(小结结)1)非非负负性性:对任任意意事事件件A,有有P02)规规范范性性:一个个事事件件的的概概率率是是一一个个介介于于0与1之间间的的值值,,即即对对于于任任意意事事件件A,有0P13)必必然然事事件件的的概概率率为为1;不不可可能能事事件件的的概概率率为为0。即P()==1;P()==04)可可加加性性:若A与B互斥斥,,则则P(A∪B)==P(A)++P(B)推广广到到多多个个两两两两互互斥斥事事件件A1,A2,…,An,有有P(A1∪A2∪…∪An)==P(A1)++P(A2)++…++P(An)3-29事件件的的补补及及其其概概率率事件件的的补补(complement)事件件A不发发生生的的事事件件,,称称为为事事件件A的补补事事件件(或称称逆逆事事件件),记记为为A。它是是样样本本空空间间中中所所有有不不属属于于事事件件A的样样本本点点的的集集合合AAP(A)==1--P(A)3-30广义义加加法法公公式式广义义加加法法公公式式对任任意意两两个个随随机机事事件件A和B,它它们们和和的的概概率率为为两两个个事事件件分分别别概概率率的的和和减减去去两两个个事事件件交交的的概概率率,,即即P(A∪B)=P(A)+P(B)-P(A∩B)两个事件的的并两个事件的的交3-31广义加法公公式(事件的并或或和)事件A或事件B发生的事件件,称为事事件A与事件B的并。它是是由属于事事件A或事件B的所有样本本点的集合合,记为A∪B或A+BBAA∪B3-32广义加法公公式(事件的的交或或积)ABA∩B事件A与事件件B同时发发生的的事件件,称称为事事件A与事件件B的交,,它是是由属属于事事件A也属于于事件件B的所有有公共共样本本点所所组成成的集集合,,记为为B∩A或AB3-33解:设A=员工离离职是是因为为对工工资不不满意意B=员工离离职是是因为为对工工作不不满意意依题意意有::P(A)=0.40;P(B)=0.30;P(AB)=0.15P(A+B)=P(A)+P(B)-P(AB)=0.40++0..30-0.15==0.55【例】一家计计算机机软件件开发发公司司的人人事部部门最最近做做了一一项调调查,,发现现在最最近两两年内内离职职的公公司员员工中中有40%%是因为为对工工资不不满意意,有有30%%是因为为对工工作不不满意意,有有15%%是因为为他们们对工工资和和工作作都不不满意意。求求两年年内离离职的的员工工中,,离职职原因因是因因为对对工资资不满满意、、或者者对工工作不不满意意、或或者二二者皆皆有的的概率率。3.1.4条件概概率与与事件件的独独立性性3-351.条件概概率在事件件B已经发发生的的条件件下事事件A发生的的概率率,称称为已已知事事件B时事件件A的条件件概率率,记记为P(A|B)P(B)P(AB)P(A|B)=事件B及其概率P(B)事件AB及其概率P(AB)事件A

事件B一旦事件B发生3-36解:设A=顾客购购买食食品,,B=顾客购购买其其他商商品依题意意有::P(A)=0.80;P(B)=0.60;P(AB)=0.35【例】一家超超市所所作的的一项项调查查表明明,有有80%%的顾客客到超超市是是来购购买食食品,,60%%的人是是来购购买其其他商商品,,35%%的人既既购买买食品品也购购买其其他商商品。。求::(1))已知某某顾客客购买买食品品的条条件下下,也也购买买其他他商品品的概概率(2))已知某某顾客客购买买其他他的条条件下下,也也购买买食品品的概概率3-37【例】一家电电脑公公司从从两个个供应应商处处购买买了同同一种种计算算机配配件,,质量量状况况如下下表所所示从这200个配件件中任任取一一个进进行检检查,,求(1))取出的的一个个为正正品的的概率率(2))取出的的一个个为供供应商商甲的的配件件的概概率(3))取出一一个为为供应应商甲甲的正正品的的概率率(4))已知取取出一一个为为供应应商甲甲的配配件,,它是是正品品的概概率甲乙两个供应商提供的配件正品数次品数合计供应商甲

84690供应商乙

1028110合计186142003-38解:设A=取出的的一个个为正正品B=取出的的一个个为供供应商商甲供供应的的配件件(1))(2))(3))(4))3-391)用来来计算算两事事件交交的概概率2)以条条件概概率的的定义义为基基础3)设A,B为两个个事件件,若若P(B)>0,则P(AB)=P(B)P(A|B)或P(AB)=P(A)P(B|A)2.乘法公公式3-40【例】一家报报纸的的发行行部已已知在在某社社区有有75%%的住户户订阅阅了该该报纸纸的日日报,,而且且还知知道某某个订订阅日日报的的住户户订阅阅其晚晚报的的概率率为50%%。求某某住户户既订订阅日日报又又订阅阅晚报报的概概率解:设A=某住户户订阅阅了日日报B=某住户户订阅阅了晚晚报依题意意有:P(A)=0..75;P(B|A)=0.50P(AB)=P(A)·P(B|A)=0.75××0..5==0.3753-41【例】从一个个装有有3个红球球2个白球球的盒盒子里里摸球球(摸出后后球不不放回回),求连连续两两次摸摸中红红球的的概率率解:设A=第2次摸到到红球球B=第1次摸到到红球球依题意意有:P(B)=3//5;P(A|B)=2/4P(AB)=P(A)·P(B|A)=3/5×2/4=0.33-423.独立事事件1)若P(A|B)=P(A)或P(B|A)=P(B),则称称事件件A与B事件独独立,,或称称独立立事件件2)若两两个事事件相相互独独立,,则这这两个个事件件同时时发生生的概概率等等于它它们各各自发发生的的概率率之积积,即即P(AB)=P(A)·P(B)3)若事事件A1,A2,,An相互独独立,,则P(A1,A2,,An)=P(A1)·P(A2)··P(An)3-43【例】一个旅旅游经经景点点的管管理员员根据据以往往的经经验得得知,,有80%%的游客客在古古建筑筑前照照相留留念。。求接接下来来的两两个游游客都都照相相留念念的概概率解:设A=第一个个游客客照相相留念念B=第二个个游客客照相相留念念两个游游客都都照相相留念念是两两个事事件的的交。。在没没有其他他信息息的情情况下下,我我们可可以假假定事事件A和事件件B是相互互立的的,所所以有有P(AB)=P(A)·P(B)=0.80××0..80=0.643-44【例】假定我我们是是从两两个同同样装装有3个红球球2个白球球的盒盒子摸摸球。。每个个盒子子里摸摸1个。求求连续续两次次摸中中红球球的概概率解:设A=从第一一个盒盒子里里摸到到红球球B=从第二二个盒盒子里里摸到到红球球依题意意有:P(A)=3//5;P(B)=3/5P(AB)=P(A)·P(B)=3/5×3/5=0.364-45独立性性与互互不相相容的的区别别:独立性性是指指两个个事件件的发发生互互不影影响。。互不相相容是是指两两个事事件不不能同同时发发生。。两个不相相容事件件一定是是统计相相依的,,两个独独立事件件一定是是相容的的(除非非其中有有一个事事件的概概率为0)。3.1..5全概率公公式与逆逆概率公公式3-471.全概率公公式B2B5B4B1B3完备事件件组3-48【例】假设在n张彩票中中只有一一张中奖奖奖券,,那么第第二个人人摸到奖奖券的概概率是多多少?解:设A=第二个人人摸到奖奖券,B=第一个人人摸到奖奖券依题意有有:P(B)=1/n;P(B)=(n-1)//nP(A|B)=0P(A|B)=1//n-13-492.逆概率公公式(贝叶斯公公式)P(Bi)是没有加加入其它它信息的的概率,,被称为事事件Bi的先验概概率P(Bi|A)被称为事事件Bi的后验概概率B2B5B4B1B33-50【例】某考生回回答一道道四选一一的考题题,假设设他知道道正确答答案的概概率为1/2,而他不不知道正正确答案案时猜对对的概率率应该为为1/4。考试结结束后发发现他答答对了,,那么他他是知道道正确答答案情况况下做对对的概率率是多大大呢?解:设A=该考生答答对了,,B=该考生知知道正确确答案依题意有有:P(B)=1/2;P(B)=1--1/2=1/2P(A|B)=1//4P(A|B)=13.2随机变量量及其概概率分布布3.2..1随机变量量3.2..2离散型随随机变量量的概率率分布3.2..3离散型随随机变量量的数学学期望和和方差3.2..4几种常用用的离散散型概率率分布3.2..5概率密度度函数与与连续型型随机变变量3.2..6常见的连连续型概概率分布布3.2..1随机变量量4-531.随机变量量就是其其取值带带有随机机性的变变量,一般用X、Y、Z等表示。。在给定的的条件下下,这种种变量取取任何值值事先不不能确定定,只能能由随机机试验的的结果来来定,并并且随试试验的结结果而变变。例如:投投掷两两枚硬币币出现正正面的数数量4-542.随机变量量的种类类如果随机机变量的的全体可可能取值值能够一一一列举举出来,,这样的的随机变变量称作作离散型型随机变变量(如如掷一枚枚硬币首首次出现现正面向向上所需需要的投投掷次数数);如果随机机变量的的全体可可能取值值不能一一一列举举,其可可能的取取值在数数轴上是是连续的的,则该该变量称称为连续续型随机机变量((如可能能出现的的测量误误差)。3-55离散型随随机变量量的一些些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为13-56连续型随随机变量量的一些些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00

X100X03.2..2离散型随随机变量量的概率率分布1.离散型随随机变量量的分布布离散型随随机变量量X的所有可可能取值值x1、x2、x3、……、xn和这些值值的概率率p(x1)、p(x2)、p(x3)、……、p(xn)就称为离离散型随随机变量量的概率率分布。。即:离散型随随机变量量概率分分布的性性质变量Xx1x2x3……xn概率Pp(x1)p(x2)p(x3)……p(xn)离散型随随机变量量的概率率分布【例】投掷一枚枚骰子,,出现的的点数是是个离散散型随机机变量,,其概率率分布为为X=xi123456P(X=xi)=pi1/61/61/61/61/61/601/6P(x)1x234563-61【例】一部电梯梯在一周周内发生生故障的的次数X及相应的的概率如如下表故障次数X=xi0123概率P(X=xi)pi0.100.250.35一部电梯梯一周发发生故障障的次数数及概率率分布(1)确定的值(2)求正好发发生两次次故障的的概率(3)求最多发发生两次次故障的的概率(4)求故障次数数多于一一次的概概率3-62解:(1)由于0.10+0..25++0.35+=1所以,=0.30(2)P(X=2)==0.35(3)P(X2)=0.10+0..25++0.35=0.70(4)P(X1)=0..35++0.30=0.653.2..3离散型随随机变量量的数学期望望和方差差3-641.离散型随随机变量量的数学学期望1)离散型型随机变变量X的所有可可能取值值xi与其取相相对应的的概率pi乘积之和和2)描述离离散型随随机变量量取值的的集中程程度3)记为或E(X)4)计算公公式为3-652.离散型随随机变量量的方差差1)随机变变量X的每一个个取值与与期望值值的离差差平方和和的数学学期望,,记为2或D(X)2)描述离离散型随随机变量量取值的的分散程程度3)计算公公式为4)方差的的平方根根称为标标准差,,记为或D(X)3-66【例】一家电脑脑配件供供应商声声称,他他所提供供的配件件100个中拥有有次品的的个数及及概率如如下表次品数X=xi0123概率P(X=xi)pi0.750.120.080.05每100个配件中中的次品品数及概概率分布布求该供应应商次品品数的数数学期望望和标准准差3.2..4几种常用用的离散散型概率率分布3-68常用离散散型概率率分布离散型概率分布二项分布两点分布泊松分布超几何分布3-691.二项分布布1)二项分分布与伯伯努利试试验有关关2)伯努利利试验满满足下列列条件一次试验验只有两两个可能能结果,,即“成功”和“失败”“成功”是指我我们感感兴趣趣的某某种特特征一次试试验““成功功”的的概率率为p,失败败的概概率为为q=1--p,且概率率p对每次次试验验都是是相同同的试验是是相互互独立立的,,并可以重重复进进行n次在n次试验验中,,“成功”的次数数对应应一个个离散散型随随机变变量X3-703)重复复进行行n次试验验,出出现““成功功”的的次数数的概概率分分布称称为二二项分分布,,记为为X~B(n,p)4)设X为n次重复复试验验中出出现成成功的的次数数,X取x的概率率为5)二项项分布布的期期望与与方差差:3-71对于P(X=x)0,x=1,,2,,…,,n,有同样有有3-72【例】已知一一批产产品的的次品品率为为4%,从中中任意意有放放回地地抽取5个。求求5个产品品中::(1))没有次次品的的概率率是多多少??(2))恰好有有1个次品品的概概率是是多少少?(3))有3个以下下次品品的概概率是是多少少?3-732.两点分分布((0-1分布)随机变变量X只取0和1两个可可能的的值。。两点分分布的的期望望为p,方差差为pq。当n=1时,二二项分分布退退化为为两点点分布布:或3-74【例】已知一一批产产品的的次品品率为为p=0.04,合格格率为为q=1--p=1--0..04=0.96。并指指定废废品用用1表示,,合格格品用用0表示。。则任任取一一件为为废品品或合合格品品这一一离散散型随随机变变量,,其概概率分分布为为X=xi01P(X=xi)=pi0.960.040.5011xP(x)3-753.泊松分分布1)1837年法国国数学学家泊泊松(D..Poisson,1781—1840))首次提提出2)用于于描述述在一一指定定时间间范围围内或或在一一定的的长度度、面面积、、体积积之内内每一一事件件出现现次数数的分分布3)泊松松分布布的例例子一定时时间段段内,,某航航空公公司接接到的的订票票电话话数一定时时间内内,到到车站站等候候公共共汽车车的人人数一定路路段内内,路路面出出现大大损坏坏的次次数一定时时间段段内,,放射射性物物质放放射的的粒子子数一匹布布上发发现的的疵点点个数数一定页页数的的书刊刊上出出现的的错别别字个个数3-76—给定的的时间间间隔隔、长长度、、面积、体体积内内“成成功””的平均数数e==2.71828x—给定的时间间间隔、长长度、面积、体积内内“成功””的次数4)概率分布布函数X~P()5)泊松分布布的期望和和方差均为为3-77【例】假定某航空空公司预订订票处平均均每小时接接到42次订票电话话,那么10分钟内恰好好接到6次电话的概概率是多少少?解:设X=10分钟内航空空公司预订订票处接到到的电话次次数3-78(1)当试验的的次数n很大,成功功的概率p很小时,可可用泊松分分布来近似似地计算二二项分布的的概率,即即(2)实际应用用中,当P0.05,n>20,近似效果果良好6)泊松分布布作为二项项分布的近近似3-794.超几何分布布1)采用不重重复抽样,,各次试验验并不独立立,成功的的概率也互互不相等2)总体元素素的数目N很小,或实实验次数n相对于N来说较大时时,样本中中“成功”的次数则服服从超几何何概率分布布3)概率分布布函数为4)3-80【例】假定有10支股票,其其中有3支购买后可可以获利,,另外7支购买后将将会亏损。。如果你打打算从10支股票中选选择4支购买,但但你并不知知道哪3支是获利的的,哪7支是亏损的的。求:(1)有3支能获利的的股票都被被你选中的的概率有多多大?(2)3支可获利的的股票中有有2支被你选中中的概率有有多大?解:设N=10,M=3,n=43.2.5概率密度函函数与连续型随机机变量1.连续型随机机变量的特特点1)连续型随随机变量可可以取某一一区间或整整个实数轴轴上的任意意一个值2)它取任何何一个特定定的值的概概率都等于于03)不能列出出每一个值值及其相应应的概率4)通常研究究它取某一一区间值的的概率5)用概率密密度函数的的形式和分分布函数的的形式来描描述2.概率密度函函数1)设X为一连续型型随机变量量,x为任意实数数,X的概率密度度函数记为为f(x),它满足条条件2)f(x)不是概率密度函数f(x)表示X的所有取值值x及其频数f(x)值(值,频数)频数f(x)abx在平面直角角坐标系中中画出f(x)的图形,则则对于任何何实数a<b,P(a<Xb)是该曲线下下从a到b的面积f(x)xab概率是曲线下的面积3.分布函数1)连续型随随机变量的的概率可以以用分布函函数F(x)来表示2)分布函数数定义为3)根据分布函数数,P(a<X<b)可以写为4.分布函数与与密度函数数的图示1)密度函数数曲线下的的面积等于于12)分布函数数是曲线下下小于x0的面积f(x)xx0F(x0

)5.连续型随机机变量的数数学期望和和方差1)连续型随随机变量的的数学期望望2)方差3.2.6常见的连续续型随机变变量的概率分布布1.正态分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作为描述误误差相对频频数分布的的模型而提提出。描述连续型型随机变量量的最重要要的分布。。许多现象都都可以由正正态分布来来描述。可用于近似似离散型随随机变量的的分布。例如:二二项分布经典统计推推断的基础础。xf(x)(1)概率密度度函数f(x)=随机变量X的频数=正态随机变变量X的均值=正态随机变变量X的方差=3.1415926;e==2.71828x=随机变量的的取值(-<x<)(2)正态分分布函数的的性质图形是关于于x=对称的钟形形曲线,且且峰值在x=处均值和标准差一旦确定,,分布的具具体形式也也惟一确定定,不同参参数正态分分布构成一一个完整的的“正态分分布族”均值可取实数轴轴上的任意意数值,决决定正态曲曲线的具体体位置;标标准差决定定曲线的““陡峭”或“扁平”程度。越大,正态态曲线扁平平;越小,正态态曲线越陡陡峭当X的取值向横横轴左右两两个方向无无限延伸时时,曲线的的两个尾端端也无限渐渐近横轴,,理论上永永远不会与与之相交正态随机变变量在特定定区间上的的取值概率率由正态曲曲线下的面面积给出,,而且其曲曲线下的总总面积等于于1和对正态曲线的的影响xf(x)CAB=1/212=1(3)正态分布布的概率概率是曲线下的面积!abxf(x)(4)对称钟形形分布中的的3σ法则3σ法则——关于钟形分分布的一个个近似的或或经验的法法则:变量值落在在[-3σ,+3σ]范围以外的的情况极为为少见。因因此通常将将落在区间间[-3σ,+3σ]之外的数据据称为异常常数据或称称为离群点点。x99.73%68.27%95.45%切比雪夫定定理对于任意意一个数数据集中中,至少少有75%的数据位位于平均均数2个标准差差范围内内。至少少有89%的数据位位于平均均数3个标准差差范围内内。3-97(5)标准正正态分布布a)标准正正态分布布的概率密密度函数数作变换::b)标准正正态分布布的分布函函数可将一般般形式的的正态分布布转化为为标准正正态分布布Xms一般正态分布

=1Z标准正态分布(6)标准正正态分布布表的使使用a)对于标标准正态态分布,,即Z~N(0,1),有P(aZb)baP(|Z|a)2a1b)对于负负的z,可由(-z)z得到c)对于一一般正态态分布,,即X~N(,),有标准化的的例子P(5X6.2))X=5=10一般正态分布6.2

=1Z标准正态分布00.120.0478标准化的的例子P(2.9X7.1))5s

=102.97.1X一般正态分布标准正态分布0

s=1-.21Z.210.1664.0832.0832【例】假定某公公司职员员每周的的加班津津贴服从从均值为为50元、标准准差为10元的正态态分布,,那么全全公司中中有多少少比例的的职员每每周的加加班津贴贴会超过过70元,又有有多少比比例的职职员每周周的加班班津贴在在40元到60元之间呢呢?解:设=50,=10,X~N(50,,102)3-1042.均匀分布布1)若随随机变量量X的概率密密度函数数为则称X在[a,b]上服从均均匀分布布,记为为X~U[a,b]2)数学期期望和方方差3-105随机变量量X在某取值值范围[a,b]的任一子子区间[c,d]上取值的的概率为为同样有::3-106【例】某公共汽汽车站从从早上6时起每隔隔15分钟开出出一趟班班车,假假定某乘乘客在6点以后到到达车站站的时刻刻是随机机的,所所以有理理由认为为他等候候乘车的的时间长长度X服从参数数为a=0,b=15的均匀分分布。试试求该乘乘客等候候乘车的的时间长长度少于于5分钟的概概率解:概率密度度函数为为落入区间间[0,15]的任一子子区间[0,d]的概率是是,,等候候乘车的的时间长长度少于于5分钟即有有d=5,因此该该事件发发生的概概率等于于5/15=1//33-1073.指数分布布若随机变变量X的概率密密度函数数为称X服从参数数为的指数数分布,记记为X~E()数学期望望和方差差3-108指数分布布(概率计算算)随机变量量X取小于或或等于某某一特定定值x的概率为为随机变量X落入任一一区间(a,b)的概率为为3-109指数分布布(例题分析析)【例】假定某加加油站在在一辆汽汽车到达达之后等等待下一一辆汽车车到达所所需要的的时间(单位:分分钟)服从参数数为1/5的指数分分布,如如果现在在正好有有一辆汽汽车刚刚刚到站加加油,试试分别求求以下几几个事件件发生的的概率::(1)一辆汽车车到站前前需要等等待5分钟以上上(2)一辆汽车车到站前前需要等等待5~10分钟解:3.3常用的抽抽样方法法大多数的的实际应应用当中中真实的的均值与与方差等等的参数数是未知知的,需需要通过过抽样调调查,用用样本统统计量去去推断人人们所关关心的总总体参数数。简单随机机抽样分层抽样样系统抽样样整群抽样样3-1113.3..1简单随机机抽样从总体N个单位中中随机地地抽取n个单位作作为样本本,使得每一一个总体体单位都都有相同同的机会会(概率)被抽中抽取元素素的具体体方法有有重复抽抽样和不不重复抽抽样特点简单、直直观,在在抽样框框完整时时,可直直接从中中抽取样样本用样本统统计量对对目标量量进行估估计比较较方便局限性当N很大时,,不易构构造抽样样框抽出出的的单单位位很很分分散散,,给给实实施施调调查查增增加加了了困困难难没有有利利用用其其他他辅辅助助信信息息以以提提高高估估计计的的效效率率3-1123..3..2分层层抽抽样样将总总体体单单位位按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层,,然然后后从从不不同同的的层层中中独独立立、、随随机机地地抽抽取取样样本本优点点保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,,从从而而提提高高估估计计的的精精度度组织织实实施施调调查查方方便便既可可以以对对总总体体参参数数进进行行估估计计,,也也可可以以对对各各层层的的目目标标量量进进行行估估计计3-1133..3..3系统统抽抽样样将总总体体中中的的所所有有单单位位(抽样样单单位位)按一一定定顺顺序序排排列列,,在在规规定定的的范范围围内内随随机机地地抽抽取取一一个个单单位位作作为为初初始始单单位位,,然然后后按按事事先先规规定定好好的的规规则则确确定定其其他他样样本本单单位位先从从数数字字1到k之间间随随机机抽抽取取一一个个数数字字r作为为初初始始单单位位,,以以后后依依次次取取r+k,r+2k…等单单位位优点点::操操作作简简便便,,可可提提高高估估计计的的精精度度缺点点::对对估估计计量量方方差差的的估估计计比比较较困困难难3-1143..3..4整群群抽抽样样将总总体体中中若若干干个个单单位位合合并并为为组组(群),,抽样样时时直直接接抽抽取取群群,,然然后后对对中中选选群群中中的的所所有有单单位位全全部部实实施施调调查查特点点抽样样时时只只需需群群的的抽抽样样框框,,可可简简化化工工作作量量调查查的的地地点点相相对对集集中中,,节节省省调调查查费费用用,,方方便便调调查查的的实实施施缺点点是是估估计计的的精精度度较较差差3..4抽样样分分布布3..4..1抽样样分分布布的的概概念念3..4..2样本本均均值值抽抽样样分分布布的的形形式式3..4..3样本本均均值值抽抽样样分分布布的的特特征征3..4..4样本本比比率率的的抽抽样样分分布布3..4..5样本本方方差差的的抽抽样样分分布布3..4..6两个个样样本本统统计计量量的的抽抽样样分分布布若将将样样本本指指标标的的取取值值分分别别记记为为其其相相应应的的概概率率记记为为P1,P2,…Pn,将它们们按顺顺序排排列起起来,,可得得如下下概率率分布布表。。

…………3.4.1抽样分分布的的概念念从总体体中随随机地地抽取取许多多样本本,所得到到的所有可可能的的样本本观测测值及及其所所对应应的概概率便便是抽抽样分分布。。因此此,抽抽样分分布也也可以以称为为样本本统计计量的的概率率分布布。3-117样本统统计量量的概概率分分布,,是一种种理论论分布布在重复复选取取容量量为n的样本本时,,由该该统计计量的的所有有可能能取值值形成成的相相对频频数分分布随机变变量是是样本统统计量量样本均均值,样本方方差等等结果来来自容量相相同的所有可能样样本提供了了样本本统计计量长长远而而稳定定的信信息,,是进进行推推断的的理论论基础础,也也是抽抽样推推断科科学性性的重重要依依据抽样分分布(samplingdistribution)【例5-2】设一个个总体体,含含有4个元素素(个体),即总总体单单位数数N=4。4个个体体分别别为x1=1,x2=2,x3=3,x4=4。总体体的均均值、、方差差及分分布如如下总体分布14230.1.2.3均值3.4.2样本均均值的的抽样样分布布方差现从总总体中中抽取取n=2的简单单随机机样本本,在在重复复抽样样条件件下,,共有有42=16个样本本。所所有样样本的的结果果为:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)计算出出各样样本的的均值值,如如下表表。并并给出出样本本均值值的抽抽样分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)5-121x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5X11.522.533.54p1/162/163/164/163/162/161/16样本均均值的的分布布与总总体分分布的的比较较=2.5σ2=1..25总体分分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5样本均均值抽抽样分分布的的形成成过程程3-1233-124样本均均值的的抽样样分布布3.4.2样本均均值抽抽样分分布的的形式式x的分布布趋于于正态态分布布的过过程3-126总体分分布正态分分布非正态态分布布大样本本小样本本正态分分布正态分分布非正态态分布布3-127样本均均值的的数学学期望望样本均均值的的方差差重复抽抽样不重复复抽样样当N趋于无无穷大大或N很大n很小时时,不不重复复抽样样可以以用重重复抽抽样公公式计计算3.4.3样本均均值抽抽样分分布的的特征征3-128样本均均值的的抽样样分布布(总体数数学期期望与与方差差)比较及及结论论:1.样本均均值的的均值值(数学期期望)等于于总总体体均均值值2..样本本均均值值的的方方差差等等于于总总体体方方差差的的1//nt分分布布3-129t分分布布在实实际际问问题题中中所所有有可可能能的的样样本本数数是是难难以以一一一一列列举举的的,,这这时时可可以以通通过过反反复复进进行行抽抽样样模模拟拟,,记记录录下下统统计计量量取取不不同同数数值值时时的的百百分分比比,,这这是是可可以以发发现现样样本本均均值值的的抽抽样样分分布布服服从从与与自自由由度度为为((n--1)的的t分布布3-130t分布布t分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。。依依赖赖于于称称之之为为自自由由度度的的参参数数。。随随着着自自由由度度的的增增大大,,分分布布也也逐逐渐渐趋趋于于正正态态分分布布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zt分分布布与与正正态态分分布布的的异异同同点点相同同点点1,都都是是均均数数位位于于中中间间;;2,t曲线线与与正正态态曲曲线线都都是是关关于于μ点对对称称,,形形状状相相似似;;3,总总面面积积都都是是1..不同同点点1,t曲线线会会随随n的大大小小变变化化而而变变化化,,不不是是一一条条而而是是多多条条;;2,随随着着n的增增加加,,t分布布逐逐渐渐接接近近标标准准正正态态分分布布,,当当n=∞∞时时,,完完全全成成为为标标准准正正态态分分布布3-1323-133样本本比比率率的的抽抽样样分分布布3-134比率率(proportion))3-135在重重复复选选取取容容量量为为n的样样本本时时,,由由样样本本比比率率的的所所有有可可能能取取值值形形成成的的相相对对频频数数分分布布,,称称为为样样本本比比率率抽抽样样分分布布一种种理理论论概概率率分分布布当样样本本量量很很大大时时((np≥5或n(1--p)≥≥5),,样样本本比比率率的的抽抽样样分分布布可可用用正正态态分分布布近近似似推断断总总体体比比率率的理理论论基基础础样本本比比率率的的抽抽样样分分布布3-136样本比率率的数学学期望样本比率率的方差差重复抽样样不重复抽抽样样本比率率的抽样样分布(数学期望望与方差差)重复抽样样不重复抽抽样【例5-4】】从某地区区6000名适龄儿儿童中用用不放回回抽样方方法抽取取400名儿童,,其中有有320名儿童入入学,求求样本入入学率的的标准差差。解:5-1383.4..5样本方差差的抽样样分布在重复选选取容量量为n的样本时时,由样样本方差差的所有有可能取取值形成成的相对对频数分分布对于来自自正态总总体的简简单随机机样本,,则比值值的抽样分分布服从从自由度度为(n-1)的2分布,即即(1)由阿贝贝(Abbe)于1863年首先给给出,后后来由海海尔墨特特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出出来(2)设,,则(3)令,,则Y服从自由由度为1的2分布,即即(4)当总总体,,从中抽抽取容量量为n的样本,,则2分布(1)分分布的变变量值始始终为正正(2)分分布的形形状取决决于其自自由度n的大小,,通常为为不对称称的正偏偏分布,,但随着着自由度度的增大大逐渐趋趋于对称称(4)可可加性::若U和V为两个独独立的服服从2分布的随随机变量量,U~2(n1),V~2(n2),则U+V这一随机机变量服服从自由由度为n1+n2的2分布2分布的性性质和特特点c2分布图示示选择容量为n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论