《概率论基础教程》总结2随机变量、期望、方差_第1页
《概率论基础教程》总结2随机变量、期望、方差_第2页
《概率论基础教程》总结2随机变量、期望、方差_第3页
《概率论基础教程》总结2随机变量、期望、方差_第4页
《概率论基础教程》总结2随机变量、期望、方差_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2随机变量、期望、差随机变量随机变量定义:随机变量在不同的条件下由于偶然因素影响,其可能取各种随机变量不同的值,具有不确定性和随机性,但这些取值落在某个范围的概率是定的,此种变量称为随机变量。随机变量先是个变量。昨天的天,你的考成绩都是随机变量,不过这些是确定疑的,相反随机变量结果不确定。累计分布函数定义:这X为实随机变量,即取值为实数的随机变量。(离散)伯努利变量:变量取值1或0,取值1概率为p,取值0概率为1-p。期望p,差p(1-p)。(离散)项随机变量:进n次独重复实验,每次成功概率p,总共成功次数x是项随机变量。记为参数为(n,p)的随机变量。项随机变量可以看做是n个独同分布伯努利变

2、量的和构成的随机变量。项分布分布列(概率质量函数):期望np,差np(1-p)。(离散)泊松随机变量:现实活中很多显现服从泊松分布,举个例:医院每天接待的病数、超市某商品每天的销售数、公司每天接到电话数、本书中错别字个数。这些问题中存在个单位范围:天、页书。这个单位范围中某事件发的次数就符合泊松分布。参数lambda可以在更范围统计平均值得到:年中平均每天病数、整本书中平均页错别字数。个明显的问题是,为什么这些问题付聪泊松分布,不是其他的如正态分布?这个涉及到概率论更级的问题,叫做泊松过程,如果事件是个泊松过程,那么它就服从泊松分布。具体学习随机过程教程。泊松分布 分布列:上式表,在t个单位时

3、间内,发n次事件的概率。当t为个单位时间时,可以如下表:泊松分布的均值、差都等于参数(lambda)另外,在某些条件下,项分布可以泊松分布近似。(连续)均匀随机变量概率密度函数:均值差:(连续)正态随机变量正态分布概是概率论中最重要的随机分布了。个原因是因为中极限定理说明了多个随机变量的和服从正态分布。活中的例有:的分布、测量误差的分布。实际上,正态分布在现实活中并没有那么常见,相反指数正太分布更常见(即是个随机变量的对数值服从正态分布)。正太分布密度函数:均值差分别为和。正态分布的计算:正态分布的计算过程是根据均值差的特点,将正态分布化为均值0、差1的标准分布。然后查表计算概率值。正态分布可

4、以于近似项分布,在计算离散值时需要进连续性修正。(连续)指数随机变量:指数分布概率密度函数:实际上,指数分布表了现实活中事件发的时间间隔的概率。神奇的是,指数分布可以由泊松分布推倒来:下次事件发的时间间隔于 t 的概率等于泊松分布中 t 时间内发0次该时间的概率。可以证明指数随机变量的公式可以由泊松分布得到。所以指数随机变量和泊松随机变量紧密相关,个衡量了段时间内发次数的概率,另个衡量了事件之间等待时间的概率。指数分布的记忆性:记忆性表现为:或者写为:也就是说,下次事件如果在 t 时间内没发,那么在 (t, t + s) 时间发的概率和在(0,s) 时间内发的概率相同。也就是长度为 t 的时间

5、对分布没有影响,或者说,被遗忘了。更级的概率分布:(Gamma)分布:参数为(n,)的gamma分布,在n为整数时,表了时间发n次需要的等待时间的分布。当n为1时,即是指数分布。实际上,参数为n的gamma随机变量是n个指数随机变量的和。所以,根据中极限定理,当n很时,gamma分布会趋近于正态分布。卡分布:卡分布也是由gamma分布来,取gamma分布的参数为(1/2, n/2)即得到由度为n的卡分布。卡分布常出现在误差分布中,例如n维空间上每个维度的偏差服从标准正态分布,那么最后整体的误差的平(也是各个维度的偏差的平和)服从由度为n的卡分布。3两个变量的联合概率密度函数/分布函数:即是有两

6、个变量的密度函数/分布函数。边缘分布:联合分布函数中,其中个变量取穷,得到另个变量的边缘分布函数。条件分布:随机变量的条件分布和事件的条件概率相同。有公式:左边的是已知x条件下y的概率密度函数,右边是xy联合概率密度函数除以x的边缘概率密度函数。离散情况类似。独随机变量:xy两个变量独,如果y的边缘密度函数等于已知x时y的条件密度函数,或者反过来。也就是说,x的值不影响y的分布。两个独的随机变量的联合密度函数等于各的密度函数的乘积。xy两个随机变量独的充分必要条件是:xy的联合概率密度函数可以分解为两个部分,个部分只和x有关,另个部分只和y有关。独性的对称性:独性的对称性是指,如果x独于y,那

7、么y也是独于x的。独性总是双向同时存在的,有时候法判断X是否独于Y,不妨换个度判断Y是否独于X。独随机变量和的分布:随机变量XY和为Z时,Z随机变量的概率密度函数为:两个相同的均匀分布的和的分布,变成了三形。gamma分布的和还是gamma分布。(参数不同)神奇的是,上的式被称为求卷积。、期望、差、协差1期望的定义:离散:连续:如何理解呢,根据离散随机变量的期望定义,期望是随机变量可能值的加权平均,权重是每种可能值的概率。期望定义了个随机变量取值的概位置(加权平均衡量)。期望的性质:1、期望是线性函数:这条性质、以及差的性质保证了任意的正态分布可以化为标准分布。2、随机变量函数的期望:3、随机

8、变量和的期望:随机变量和的期望等于期望的和。注意,这条性质并不要求各个随机变量之间独。根据这个性质,可以很容易的从伯努利随机变量的期望推出项随机变量的期望。4、期望值是个常数:根据定义计算差时,会遇到这个步骤,如何理解这个过程呢?我看来,任何随机变量的期望都是固定的,是个常数。算式中的期望可以像常数样提出来。另外可以知道,期望的期望就是期望本。2差的定义:差来表随机变量取值的离散程度。是随机变量值到均值的距离,叫做离差。为了数学处理上的便才使了离差的平,离差平的期望就是差。化简得到差的简化计算公式:协差的定义:定义公式:协差是衡量了两个随机变量整体偏离均值点的程度。另种表达:从这个公式可以看出

9、,当两个变量互相独时,协差为0。差、协差的性质:1、随机变量带常数参数:2、多个随机变量的差:可以看出,当随机变量序列互相独时,随机变量和的差就等于各个随机变量差的和。相关系数:注意,由于量纲的不统,协差并不能来计算两个变量的线性相关性,这需要使相关系数。三、概述内容这概括些没有提到的简短但是重要的内容。1、极限定理:弱数定理、强数定理:主要意思都是:在n趋近穷时,n个独同分布随机变量的平均值趋近于该分布的期望。中极限定理:在n趋近穷时,n个独随机变量的和趋近于标准正态分布。2、各个分布之间的转换各种分布之间有着更深的相互联系,某些极限情况下,会发转换。这总结在学习本书过程中跳过的内容:1、第七章:条件期望结合条件概率和期望。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论