数学建模概率模型ppt课件_第1页
数学建模概率模型ppt课件_第2页
数学建模概率模型ppt课件_第3页
数学建模概率模型ppt课件_第4页
数学建模概率模型ppt课件_第5页
已阅读5页,还剩184页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,2.随机事件及其概率,3.随机变量及其分布,第四讲概率模型,4.随机变量的数字特征,5.统计方法的基本概念,6.参数估计法,1.概率论的诞生及应用,7回归分析法,.,2,1654年,一个名叫梅累的骑士就“两个赌徒约定赌若干局,且谁先赢c局便算赢家,若在一赌徒胜a局(ac),另一赌徒胜b局(bc)时便终止赌博,问应如何分赌本”为题求教于Pascal(帕斯卡,法),帕斯卡与Fermat(费玛)通信讨论这一问题,并用组合的方法给出了正确的解答。,1657年Huygens(惠更斯,荷)发表的论赌博中的计算是最早的概率论著作,论著中第一批概率论概念(如数学期望)与定理(如概率加法、乘法定理)标志着概率论的诞生。,起源博弈,1概率论的诞生及应用,.,3,18世纪初,Bernoulli(伯努利,法)、De.Moivre(棣莫费,法)、蒲丰、Laplace(拉普拉斯,法)、Gauss(高斯,德)和泊松等一批数学家对概率论作了的奠基性的贡献。,1812年,Laplace(拉普拉斯,法)概率的分析理论实现了实现了从组合技巧向分析方法的过渡,开辟了概率论发展的新时期。,19世纪(1866),Chebyhev(切比雪夫,俄)中心极限理论。是概率论理论的又一次飞跃,为后来数理统计的产生和应用奠定了基础。,.,4,20世纪(1933),kolmogorov(柯尔莫哥洛夫,俄)概率公理化定义得到了数学家们的普遍承认。由于公理化,概率论成为一门严格的演绎科学,取得了与其他数学学科同等的地位,并通过集合论与其他数学分支密切的联系。,在公理化的基础上,现代概率论不仅在理论上取得了一系列突破,在应用上也取得了巨大的成就,其应用几乎遍及所有的科学领域,例如天气预报、地震预报、产品的抽样调查、经济研究等,在通讯工程中概率论可用以提高信号的抗干扰性、分辨率等等.,.,5,在一定条件下必然发生的现象称为确定性现象.,“太阳不会从西边升起”,(1)确定性现象(必然现象),“水从高处流向低处”,实例,自然界所观察到的现象:,确定性现象,随机现象,2.随机事件及其概率2.1随机事件,.,6,在一定条件下可能出现也可能不出现的现象即在相同条件下重复进行试验,每次结果未必相同,实例1在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况.,(2)随机现象(偶然现象),结果有可能出现正面也可能出现反面.,确定性现象的特征,条件完全决定结果,随机现象的特征,条件不能完全决定结果,.,7,(2)随机现象在一次观察中出现什么结果具有偶然性,但在大量试验或观察中,这种结果的出现具有一定的统计规律性,概率论就是研究随机现象规律性的一门数学学科.,随机现象是通过随机试验来研究的.,问题什么是随机试验?,如何来研究随机现象?,说明,(1)随机现象揭示了条件和结果之间的非确定性联系,其数量关系无法用函数加以描述.,.,8,(1)可以在相同的条件下重复地进行;,(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;,(3)进行一次试验之前不能确定哪一个结果会出现.,在概率论中,把具有以下三个特征的试验称为随机试验.,2.1.1随机试验定义,.,9,说明,(1)随机试验简称为试验,是一个广泛的术语.它包括各种各样的科学实验,也包括对客观事物进行的“调查”、“观察”或“测量”等.,实例“抛掷一枚硬币,观察字面,花面出现的情况”.,分析,(2)随机试验通常用E来表示.,(1)试验可以在相同的条件下重复地进行;,.,10,(1)抛掷一枚骰子,观察出现的点数.,(2)从一批产品中,依次任选三件,记录出现正品与次品的件数.,同理可知下列试验都为随机试验.,(2)试验的所有可能结果:,正面、反面;,(3)进行一次试验之前不能确定哪一个结果会出现.,故为随机试验.,.,11,定义随机试验E的所有可能结果组成的集合称为E的样本空间,记为.,样本空间的元素,即试验E的每一个结果,称为样本点,常用表示.,实例1抛掷一枚硬币,观察正面,反面出现的情况.,2.1.2样本空间样本点,.,12,实例2抛掷一枚骰子,观察出现的点数.,实例3从一批产品中,依次任选三件,记录出现正品与次品的情况.,.,13,2.同一试验,若试验目的不同,则对应的样本空间也不同.,例如对于同一试验:“将一枚硬币抛掷三次”.,若观察正面H、反面T出现的情况,则样本空间为,若观察出现正面的次数,则样本空间为,说明1.试验不同,对应的样本空间也不同.,.,14,3.建立样本空间,事实上就是建立随机现象的数学模型.因此,一个样本空间可以概括许多内容大不相同的实际问题.,例如只包含两个样本点的样本空间,它既可以作为抛掷硬币出现正面或出现反面的模型,也可以作为产品检验中合格与不合格的模型,又能用于排队现象中有人排队与无人排队的模型等.,.,15,在具体问题的研究中,描述随机现象的第一步就是建立样本空间.,.,16,通俗地讲随机事件是指随机试验中可能发生也可能不发生的事件,(1)基本概念,2.2随机事件,它们分别可以对应了样本空间=1,2,3,4,5,6的子集1,2,3,4和2,4,6,根据这个说法不难发现随机事件和样本空间的子集有一一对应关系!,“点数不大于4”,“点数为偶数”等都为随机事件.,反过来,的每个子集都对应了该试验的一个随机事件,.,17,随机事件的定义,当且仅当子集中某个样本点出现时,称事件发生,随机试验E的样本空间的子集称为E的随机事件,简称事件.(即;某一可观察特征的随机试验的结果),.,18,实例上述试验中“点数不大于6”就是必然事件.,必然事件随机试验中必然发生的事件,不可能事件随机试验中不可能发生的事件.,实例上述试验中“点数大于6”就是不可能事件.,实例“出现1点”,“出现2点”,“出现6点”.,基本事件由一个样本点组成的单点集,特别地:,.,19,(2)几点说明,例如抛掷一枚骰子,观察出现的点数.,可设A=“点数不大于4”,B=“点数为奇数”等等.,1)随机事件可简称为事件,并以大写英文字母A,B,C,来表示事件,.,20,2)随机试验、样本空间与随机事件的关系,每一个随机试验相应地有一个样本空间,样本空间的子集就是随机事件.,样本空间作为自身最大的子集包含所有的样本点(基本事件),表示必然事件,空集不含任何样本点表示不可能事件,.,21,2)随机试验、样本空间与随机事件的关系,每一个随机试验相应地有一个样本空间,样本空间的子集就是随机事件.,样本空间作为自身最大的子集包含所有的样本点(基本事件),表示必然事件,空集不含任何样本点表示不可能事件,.,22,(1)子事件,若事件A出现,必然导致B出现,则称事件B包含事件A,也称A是B的子事件.,实例“长度不合格”必然导致“产品不合格”,所以“产品不合格”,包含“长度不合格”.,图示B包含A.,B,2.2.1随机事件间的关系及运算,.,23,(2)A等于B若则称事件A与事件B相等,记作A=B.,(3)事件A与B和事件,实例某种产品的合格与否是由该产品的长度与直径是否合格所决定,因此“产品不合格”是“长度不合格”与“直径不合格”的并.,图示事件A与B的并.,A,.,24,(4)事件A与B积事件,.,25,和事件与积事件的运算性质,.,26,(5)事件A与B互不相容(互斥),若事件A的出现必然导致事件B不出现,B出现也必然导致A不出现,即A与B不能同时出现,则称事件A与B互不相容或互斥,即,实例抛掷一枚硬币,“出现花面”与“出现字面”是互不相容的两个事件.,.,27,“骰子出现1点”“骰子出现2点”,图示A与B互斥.,实例抛掷一枚骰子,观察出现的点数.,注意基本事件是两两互斥的.,.,28,(6)事件A与B的差,由事件A出现而事件B不出现所组成的事件称为事件A与B的差.记作A-B.,图示A与B的差.,A,B,实例设“长度合格但直径不合格”,“长度合格”,“直径合格”.,.,29,设A表示“事件A出现”,则“事件A不出现”称为事件A的对立事件或逆事件.记作,实例“骰子出现1点”“骰子不出现1点”,图示A与B的对立.,B,若A与B对立,则有,(7)事件A的对立事件,.,30,对立事件与互斥事件的区别,B,A、B对立(互逆),A、B互斥(互不相容),互斥,对立,.,31,(2)概率论与集合论之间的对应关系,.,32,.,33,概率的可列可加性,.3事件的概率(概率的公理化定义),.,34,证明,由概率的可列可加性得,概率的性质,.,35,证明,.,36,证明,.,37,证明,由图可得,又由性质3得,因此得,.,38,解,.,39,.,40,(1)定义,2.4古典概率模型(等可能概型),.,41,设试验E的样本空间由n个样本点(基本事件)构成,A为E的任意一个事件,且包含k个样本点(基本事件),则事件A出现的概率记为:,(2)古典概型中事件概率的计算公式,称此为概率的古典定义.,.,42,解,.,43,(3)古典概型的基本模型:摸球模型,摸球模型是指从n个可辨认的球中按照不同的要求(是否放回,是否计序),一个一个地从中任取m个,从而得到不同的样本空间,然后在各自的样本空间中计算某事件的概率.,摸球模型一般可分为四种情况,各种情况的基本事件数如下表:,.,44,.,45,在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.,如在事件发生的条件下求事件发生的概率,将此概率记作P(|).,一般P(|)P(),,那么P(|)?,2.5条件概率,.,46,同理可得,为事件B发生的条件下事件A发生的条件概率.,(2)定义,.,47,(3)性质,.,48,2.5.1乘法公式,.,49,(1)样本空间的划分,2.5.2全概率公式与贝叶斯公式,.,50,有三个罐子,1号装有2红1黑球,2号装有3红1黑球,3号装有2红2黑球.某人从中随机取一罐,在从中任意取出一球,求取得红球的概率.,引例:,如何求取得红球的概率?,.,51,(2)全概率公式,全概率公式,.,52,某一事件A的发生有各种可能的原因Bi(i=1,2,n),如果A是由原因Bi所引起,则A发生的概率是,每一原因Bi都可能导致A发生,故A发生的概率是各原因引起A发生概率的总和,即全概率公式.,我们还可以从另一个角度去理解全概率公式:,.,53,引例:,某人从任一罐中任意摸出一球,发现是红球,求该球是取自1号罐的概率.,这是“已知结果求原因”的问题是求一个条件概率.,下面就介绍为解决这类问题而引出的Bayes(贝叶斯)公式,.,54,称此为贝叶斯公式.,(3)贝叶斯公式,贝叶斯资料,.,55,(1)条件概率,全概率公式,贝叶斯公式,小结,乘法定理,.,56,.,57,事件A与事件B相互独立,是指事件A的发生与事件B发生的概率无关.,说明,(2)定义,.,58,两事件相互独立,两事件互斥,例如,由此可见两事件相互独立,但两事件不互斥.,两事件相互独立与两事件互斥的关系.,请同学们思考,.,59,由此可见两事件互斥但不独立.,.,60,3.1随机变量概念,在实际问题中,随机试验的结果可以用数量来表示,也可以用非数量表示,随机变量是随试验结果变化的量!,在研究随机试验的结果时,可能关心的不是样本空间的各个样本点本身,而是对于与样本点联系着的某个数感兴趣。,3随机变量及其分布,.,61,随机变量的定义,.,62,随机变量随着试验的结果不同而取不同的值,由于试验的各个结果的出现具有一定的概率,因此随机变量的取值也有一定的概率规律.,(2)随机变量的取值具有一定的概率规律,随机变量是一个函数,但它与普通的函数有着本质的差别,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数).,说明,(1)随机变量与普通的函数不同,.,63,实例设某射手每次射击打中目标的概率是0.8,现该射手不断向目标射击,直到击中目标为止,则,是一个随机变量.,且X(e)的所有可能取值为:,实例设盒中有5个球(2白3黑),从中任抽3个,则,是一个随机变量.,且X(e)的所有可能取值为:,.,64,而表示随机变量所取的值时,一般采用小写字母x,y,z等.,随机变量通常用大写字母X,Y,Z或希腊字母,等表示,.,65,有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,3.2引入随机变量的意义,例如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.,事件收到不少于1次呼叫X1,没有收到呼叫X=0,.,66,随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.,事件及事件概率,随机变量及其取值规律,.,67,3.3随机变量的分类,离散型,(1)离散型随机变量所取的可能值是有限多个或无限可列个,叫做离散型随机变量.,观察掷一个骰子出现的点数.,随机变量X的可能值是:,随机变量,连续型,实例1,1,2,3,4,5,6.,非离散型,其它,.,68,实例2随机变量X为“测量某零件尺寸时的测量误差”.,则X的取值范围为(a,b).,实例1随机变量X为“灯泡的寿命”.,(2)连续型随机变量所取的可能值可以连续地充满某个区间,叫做连续型随机变量.,则X的取值范围为,.,69,3.4离散型随机变量的分布律,定义,.,70,1.,2.,则称,为随机变量X的,概率分布律,简称分布律.,X的分布律也可用如下的表格形式来表示:,.,71,3.5三种重要的离散型随机变量的概率分布,(1)两点分布,设随机变量X只可能取a与b两个值,它的分布律为,则称X服从两点分布,(其中0p1),.,72,当a=0,b=1时两点分布称为(01)分布,即:设随机变量X只可能取0与1两个值,它的分布律为,则称X服从(01)分布或伯努利分布.,(其中0p1),.,73,两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象,比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等,都属于两点分布.,说明,.,74,(2)二项分布,1)重复独立试验,将试验E重复进行n次,若各次试验的结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是相互独立的,或称为n次重复独立试验.,.,75,2)n重伯努利试验,伯努利资料,.,76,实例1抛一枚硬币观察得到正面或反面.若将硬币抛n次,就是n重伯努利试验.,实例2抛一颗骰子n次,观察是否“出现1点”,就是n重伯努利试验.,3)二项概率公式,.,77,且两两互不相容.,.,78,称这样的分布为二项分布.记为,.,79,注意:贝努里概型对试验结果没有等可能的要求,但有下述要求:,(1)每次试验条件相同;,二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.,(2)每次试验只考虑两个互逆结果A或,,且P(A)=p,;,(3)各次试验相互独立.,.,80,(3)泊松分布,泊松资料,.,81,泊松分布的背景及应用,二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的粒子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X服从泊松分布.,.,82,电话呼唤次数,交通事故次数,商场接待的顾客数,地震,火山爆发,特大洪水,在生物学、医学、工业统计、保险科学及公用事业的排队等问题中,泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等,都服从泊松分布.即:实际问题中的许多现象都服从或近似服从泊松分布.,.,83,(4)泊松定理设随机变量X服从二项分布,其分布律为,k=0,1,2,n.又设np=,(是常数),则有,二项分布与泊松分布有以下的关系.,该定理于1837年由法国数学家泊松引入!,.,84,单击图形播放/暂停ESC键退出,可见,当n充分大,p又很小时,可用泊松分布来近似二项分布!,.,85,由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.,我们把在每次试验中出现概率很小的事件称作稀有事件.如地震、火山爆发、特大洪水、意外事故等等,.,86,设X是随机变量,如果存在定义在整个实数轴上的函数f(x),满足条件,1.,2.,对于任意的,3.,则称X是连续型随机变量,称为X的概率密度函数,简称概率密度.,(2)连续型随机变量的定义,.,87,概率密度函数的性质,1),2),这两条性质是判定一个函数f(x)是否为某个随机变量X的概率密度函数的充要条件.,3)X落入区间a,b内的概率,.,88,注意对于任意可能值a,连续型随机变量取a的概率等于零.即,连续型随机变量取值落在某一区间的概率与区间的开闭无关,由此可得,这是因为,.,89,故X的密度f(x)在x这一点的值,恰好是X落在区间上的概率与区间长度之比的极限.这里,如果把概率理解为质量,f(x)相当于线密度.,()对f(x)的进一步理解,.,90,3.6三种重要的连续型随机变量,()均匀分布,.,91,均匀分布的意义,事实上,若XU(a,b),则对于满足,的c,d,总有,.,92,(2)指数分布,.,93,指数分布的重要性质:“无记忆性”.,证明,.,94,而,于是,指数分布的无记忆性是使其具有广泛应用的重要原因!,.,95,指数分布在可靠性理论中描绘设备工作的可靠时间.有些系统的寿命分布也可用指数分布来近似,当电子产品的失效是偶然失效时,其寿命服从指数分布.在排队论中它被广泛地用于描绘等待时间,如电话通话时间、各种随机服务系统的服务时间、等待时间等.在更新和维修问题中描绘设备的寿命和维修时间.指数分布是伽玛分布和威布尔分布的特殊情况.一般地,当随机质点流中在长t的时间内出现的质点数服从参数为t的泊松分布时,其相继出现两个质点的事件间就服从参数为的指数分布.,.,96,(3)正态分布(或高斯分布),高斯资料,.,97,正态概率密度函数的几何特征,.,98,.,99,.,100,标准正态分布的概率密度表示为,3.标准正态分布,标准正态分布的分布函数表示为,.,101,标准正态分布的图形,.,102,由标准正态分布概率密度图形的对称性易知:,即,.,103,正态分布是最常见最重要的一种分布,例如测量误差,人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.一般来说,一个随机变量如果受许多随机因素影响,而其中的每一个因素都不起主导作用,则他服从正态分布.这是正态分布在实践中得以广泛应用的原因.,正态分布的应用与背景,.,104,前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.,但在实际问题中,概率分布一般是较难确定的.而且在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.,4随机变量的数字特征,.,105,主要应看这批灯泡的平均寿命和灯泡寿命相对于平均寿命的偏差平均寿命越长,灯泡的质量就越好,灯泡寿命相对于平均寿命的偏差越小,灯泡的质量就越稳定,因此,在对随机变量的研究中,确定某些数字特征是重要的.,下面我们来学习随机变量的数字特征,例如,评定一批灯泡的质量,.,106,随机变量的数学期望是概率论中最重要的概念之一.它的定义来自习惯上的平均值概念.,引例将一枚骰子掷100次,各点数出现的次数与频率如下,求每次投掷的平均点数,4.1数学期望的概念,(1)离散型变量数学期望的定义,.,107,几点说明:,.,108,(2)数学期望E(X)是一个常数,而非变量它既不是随机变量所有可能取值的算术平均值,也不是随机变量的有限次观测值的算术平均值它是一种以概率为权的加权平均值,它从本质上体现了随机变量X取可能值的真正的平均值,具有重要的统计意义,请看下面的例子和实验_,随机变量X的算术平均值为,假设,X的期望为,.,109,试问哪个射手技术较好?,实例1谁的技术比较好?,解,故甲射手的技术比较好.,.,110,实例如何确定投资决策方向?,某人有10万元现金,想投资于某项目,预估成功的机会为30%,可得利润8万元,失败的机会为70%,将损失2万元若存入银行,同期间的利率为5%,问是否作此项投资?,解,设X为投资利润,则,存入银行的利息:,故应选择投资.,.,111,定义,4.2连续型随机变量数学期望的定义,.,112,设已知随机变量X的分布,一种方法是:g(X)也是随机变量,它的分布可以由已知的X的分布求出来.一旦知道了g(X)的分布,就可以按照期望定义把Eg(X)计算出来.,下面的定理指出答案是肯定的.,是否可以不先求g(X)的分布而只根据X的分布求得Eg(X)呢?,如何计算X的某个函数g(X)的期望?,43随机变量函数的数学期望,.,113,设X是一个随机变量,Y=g(X)(g为连续函数),定理,.,114,(1)设C是常数,则E(C)=C;,(4)设X、Y独立,则E(XY)=E(X)E(Y);,(2)若C是常数,则E(CX)=CE(X);,(3)E(X1+X2)=E(X1)+E(X2);,(诸Xi独立时),注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立,4.4数学期望的性质,.,115,.常用分布的数学期望,.,116,(1)概念的引入,4.5随机变量方差的概念,前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征.,但是在一些场合,仅仅知道平均值是不够的.,.,117,为此需要引进另一个数字特征,用它来度量随机变量取值在其中心附近的离散程度.,这个数字特征就是我们接下来要介绍的,方差,.,118,(2)方差的定义,(2)由于标准差与X具有相同的度量单位,在实际问题中经常使用.,说明(1)方差刻划了随机变量的取值对于其数学期望的离散程度,方差越小,X的取值集中在均值的附近;方差越大,X的取值越分散,.,119,离散型随机变量的方差,连续型随机变量的方差,(3)方差的计算,1)利用定义计算,.,120,证明,2)利用公式计算,.,121,证明,3方差的性质(设D(X),D(Y)存在),(1)设C是常数,则有,(2)设X是一个随机变量,C是常数,则有,证明,.,122,(3)设X,Y是两个随机变量,则有,证明,.,123,推广,其中i为常数,i=1,2,n.,.,124,即D(X)=0P(X=C)=1,这里C=E(X),.,125,分布,参数,数学期望,方差,两点分布,二项分布,泊松分布,均匀分布,指数分布,正态分布,(3)重要概率分布的期望和方差,.,126,现在转入课程的第二部分,数理统计,数理统计的特点是应用面广,分支较多,社会的发展不断向统计提出新的问题。,.,127,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。,但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。,.,128,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,数理统计学,.,129,数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,.,130,计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.,学习统计无须把过多时间花在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:SAS,SPSS,STAT等,都可以让你快速、简便地进行数据处理和分析.,.,131,概率论与数理统计是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象.,但在研究问题的方法上有很大区别:,概率论已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;,数理统计通过对试验数据的统计分析,寻找所服从的分布和数字特征,从而推断总体的规律性.,数理统计的核心问题由样本推断总体,.,132,总体容量有限的称为有限总体,总体,一个统计问题总有它明确的研究对象.,(1)总体,研究对象的全体称为总体(母体),,总体中每个对象称为个体.,总体、个体和样本的概念,研究某批灯泡的质量,总体,考察国产轿车的质量,在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.,该批灯泡寿命的全体就是总体,灯泡的寿命,每公里的耗油量,所有国产轿车每公里耗油量的全体就是总体,这时,每个个体具有的数量指标的全体就是总体.,称总体中所含个体的数目为总体容量,总体容量无限的称为无限总体.,.,133,并常用随机变量的记号或用其分布函数表示总体.比如说总体X或总体F(x).,很自然地,我们就用随机变量X来表示所考察的总体.,设该大学一年级学生的年龄分布如下,若从该大学一年级学生中任意抽查学生的年龄,,X的概率分布是:,可见,X的概率分布反映了总体中各个值的分布情况.,考察某大学一年级学生的年龄,某大学一年级全体学生的年龄构成问题的总体,也就是说,总体可以用一个随机变量X或其分布来描述.,所得结果为一随机变量,记作X.,X,概率,X的分布函数和数字特征就是总体的分布函数和数字特征.,今后不必区分总体和其相应的随机变量.,.,134,那么,此总体就可用描述其寿命的随机变量X或用其分布函数F(x)表示.,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,总体概念的要旨:总体就是一个随机变量或一个概率分布!,再如,若研究某地区中学生的营养状况时,关心的数量指标是身高和体重,,如研究某批灯泡的寿命时,关心的数量指标就是寿命,.,135,它要求抽取的样本X1,X2,Xn满足下面两点:,它可以用与总体同分布的n个相互独立的随机变量X1,X2,Xn表示.,2.代表性:Xi(i=1,2,n)与所考察的总体X同分布.,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作简单随机抽样,1.独立性:X1,X2,Xn是相互独立的随机变量;,抽样的目的是为了对总体进行统计推断,,由简单随机抽样得到的样本称为简单随机样本,,.,136,今后,说到“X1,Xn是来自某总体的样本”时,若不特别说明,就指简单随机样本.,则其简单随机样本的联合分布函数为,F(x1,x2,xn)=,简单随机样本是应用中最常见的情形,若总体X的分布函数为F(x),若总体X的概率密度为f(x),则其简单随机样本的联合概率密度为,F(x1)F(x2)F(xn),.,137,1.统计量的定义,5.3统计量,样本是总体的代表,但抽取样本后,并不直接利用样本的观察值进行推断,而是把样本中所包含的有关信息集中起来进行研究,这便是针对所研究的问题构造样本点某种函数,称之为样本函数,这种函数也称之为统计量。,.,138,2.几个常用统计量的定义,(1)样本均值,(2)样本方差,其观察值,其观察值,.,139,其观察值,(3)样本标准差,其观察值,极差:样本中最大值与最小值之差,即:,.,140,(4)样本k阶(原点)矩,其观察值,(5)样本k阶中心矩,其观察值,.,141,6.参数估计6.1定义:所谓的参数估计就是对总体X的分布函数由样本()构造一些统计量()来估计X中参数(或数字特征),这样的统计量称为估计量,这种方法称为参数估计法。参数估计法可以分为点估计法和区间估计法两类。,.,142,6.2点估计问题的提法,设总体X的分布函数形式已知,但它的一个或多个参数为未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为点估计问题.,例1,.,143,解,用样本均值来估计总体的均值E(X).,.,144,点估计问题的一般提法,.,145,6.2.1估计量的求法,由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,如何求估计量是关键问题.,常用构造估计量的方法:(两种),矩估计法和最大似然估计法.,(1).矩估计法,复习,2.样本k阶(原点)矩,.,146,.,147,(X为连续型),(X为离散型),.,148,矩估计法的定义,用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法.,.,149,.,150,.,151,(2).最大似然估计法,似然函数的定义,.,152,.,153,最大似然估计法,.,154,求最大似然估计量的步骤:,费舍尔,最大似然估计法是由费舍尔引进的.,.,155,最大似然估计法也适用于分布中含有多个未知参数的情况.此时只需令,对数似然方程组,对数似然方程,.,156,.,157,估计量的评价:,一致性是对估计量的一个基本要求,不具备一致性的估计量是不予以考虑的.,1.一致性,.,158,2.有效性,由于方差是随机变量取值与其数学期望的偏离程度,所以无偏估计以方差小者为好.,.,159,3.无偏性,无偏估计的实际意义:无系统误差.,.,160,.,161,1.区间估计的基本概念,(1)置信区间的定义,.,162,关于定义的说明,.,163,若反复抽样多次(各次得到的样本容量相等,都是n),按伯努利大数定理,在这样多的区间中,.,164,(2)求置信区间的一般步骤(共3步),.,165,1.,.,166,.,167,.,168,2.,.,169,3、小结(正态总体),.,170,一元线性回归模型,.,171,主要内容,一元线性回归模型模型参数估计(最小二乘法)样本判定系数与拟合优度检验回归参数估计值的显著性检验模型整体的显著性检验一元线性回归模型预测,参数估计,假设检验,.,172,2.线性回归模型,模型的基本形式:Y=0+1X1+2X2+3X3+iXi+i基本假设解释变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论