概率论与数理统计-随机变量的独立性_第1页
概率论与数理统计-随机变量的独立性_第2页
概率论与数理统计-随机变量的独立性_第3页
概率论与数理统计-随机变量的独立性_第4页
概率论与数理统计-随机变量的独立性_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计---随机变量的独立性汇报人:AA2024-01-19BIGDATAEMPOWERSTOCREATEANEWERA目录CONTENTS随机变量及其分布多维随机变量及其分布随机变量的数字特征大数定律与中心极限定理数理统计的基本概念参数估计假设检验BIGDATAEMPOWERSTOCREATEANEWERA01随机变量及其分布随机变量的定义与性质定义随机变量是定义在样本空间上的实值函数,它将样本空间中的每个样本点映射到一个实数。性质随机变量具有可测性,即对于任意实数x,随机变量的取值小于等于x的事件是一个可测事件。离散型随机变量是指其取值是有限个或可列个的随机变量。定义离散型随机变量的分布律可以用概率质量函数来描述,即随机变量取各个值的概率。分布律离散型随机变量及其分布律VS连续型随机变量是指其取值是连续不断的随机变量,其取值充满某个区间。概率密度连续型随机变量的概率密度函数描述了随机变量取值的概率分布情况,它是一个非负可积函数。定义连续型随机变量及其概率密度定义随机变量的函数是指通过某种规则或运算将随机变量转换为另一个随机变量的过程。分布随机变量的函数的分布可以通过变换原随机变量的分布得到,常见的变换包括线性变换、指数变换等。随机变量的函数的分布BIGDATAEMPOWERSTOCREATEANEWERA02多维随机变量及其分布二维随机变量及其联合分布二维随机变量的定义设$X$和$Y$是两个随机变量,称$(X,Y)$为二维随机变量。联合分布函数对于任意实数$x$和$y$,称二元函数$F(x,y)=P{Xleqx,Yleqy}$为二维随机变量$(X,Y)$的联合分布函数。联合概率密度函数若存在非负函数$f(x,y)$,使得对于任意实数$x$和$y$,有$F(x,y)=int_{-infty}^{x}int_{-infty}^{y}f(u,v)dudv$,则称$f(x,y)$为二维随机变量$(X,Y)$的联合概率密度函数。边缘分布函数二维随机变量$(X,Y)$关于$X$的边缘分布函数定义为$F_X(x)=F(x,infty)$,关于$Y$的边缘分布函数定义为$F_Y(y)=F(infty,y)$。条件分布函数设$(X,Y)$的联合分布函数为$F(x,y)$,边缘分布函数分别为$F_X(x)$和$F_Y(y)$。在给定$Y=y$的条件下,$X$的条件分布函数定义为$F_{X|Y}(x|y)=frac{F(x,y)}{F_Y(y)}$。条件概率密度函数在给定$Y=y$的条件下,若$(X,Y)$的联合概率密度函数为$f(x,y)$,则$X$的条件概率密度函数为$f_{X|Y}(x|y)=frac{f(x,y)}{f_Y(y)}$。边缘概率密度函数若$(X,Y)$的联合概率密度函数为$f(x,y)$,则$X$的边缘概率密度函数为$f_X(x)=int_{-infty}^{infty}f(x,y)dy$,$Y$的边缘概率密度函数为$f_Y(y)=int_{-infty}^{infty}f(x,y)dx$。边缘分布与条件分布设$(X,Y)$是二维随机变量,若对于任意实数$x$和$y$,都有$P{Xleqx,Yleqy}=P{Xleqx}P{Yleqy}$,则称随机变量$X$与$Y$相互独立。相互独立的定义若$(X,Y)$相互独立,则对于任意实数集合${x_i}$和${y_j}$,都有$sum_{i}sum_{j}P{X=x_i,Y=y_j}=sum_{i}P{X=x_i}sum_{j}P{Y=y_j}$。相互独立的性质相互独立的随机变量$Z=X+Y$的分布:设$(X,Y)$是二维随机变量,其联合概率密度函数为$f(x,y)$。则对于任意实数$z$,有$Z=XY$的分布:设$(X,Y)$是二维随机变量,其联合概率密度函数为$f(x,y)$。则对于任意正数$z>0$,有$P{Zleqz}=intint_{x+yleqz}f(x,y)dxdy=int_{-infty}^{infty}dxint_{-infty}^{z-x}f(x,y)dy=int_{-infty}^{infty}dyint_{-infty}^{z-y}f(x,y)dx=int_{-infty}^{z}dz'int_{-infty}^{infty}f(z'-y,y)dy=int_{-infty}^{z}g(z')dz'$其中,函数$g(z)=int_{-infty}^{infty}f(z-y,y)dy=int_{-infty}^{infty}f(x,z-x)dx$称为卷积。两个随机变量的函数的分布BIGDATAEMPOWERSTOCREATEANEWERA03随机变量的数字特征描述随机变量取值的平均水平,是概率加权下的平均值。对于离散型随机变量,数学期望等于各可能取值与其对应概率的乘积之和;对于连续型随机变量,数学期望等于概率密度函数与自变量的乘积在全体实数范围内的积分。描述随机变量取值与其数学期望的偏离程度,即波动性或分散程度。方差等于随机变量与其数学期望之差的平方的数学期望。数学期望方差数学期望与方差协方差与相关系数衡量两个随机变量变化趋势的统计量。如果两个随机变量同时向相反方向变化(即一个增加,另一个减少),则协方差为负;如果两个随机变量同时向相同方向变化(即两者都增加或都减少),则协方差为正;如果协方差接近于零,则表明两个随机变量之间可能不存在线性关系。协方差是协方差的标准化形式,用于消除量纲影响,更客观地反映两个随机变量之间的线性相关程度。相关系数的取值范围为[-1,1],其中1表示完全正相关,-1表示完全负相关,0表示不相关。相关系数矩描述随机变量分布形态特征的统计量。一阶原点矩即为数学期望,二阶中心矩即为方差,三阶中心矩用于描述分布的偏态,四阶中心矩用于描述分布的峰态。要点一要点二协方差矩阵由多个随机变量的协方差组成的矩阵。对于n个随机变量,其协方差矩阵是一个n×n的对称矩阵,其中第i行第j列的元素表示第i个随机变量与第j个随机变量之间的协方差。协方差矩阵在多元统计分析、回归分析等领域具有广泛应用。矩、协方差矩阵BIGDATAEMPOWERSTOCREATEANEWERA04大数定律与中心极限定理大数定律是描述随机变量序列的算术平均值向常数收敛的定律,即当试验次数足够多时,随机事件发生的频率趋于一个稳定值。含义常见的大数定律有伯努利大数定律、辛钦大数定律和切比雪夫大数定律等。种类在保险、金融、医学等领域中,大数定律被广泛应用于风险评估和决策分析。应用大数定律中心极限定理是指当样本量足够大时,样本均值的分布近似于正态分布,无论总体分布是什么。含义要求样本之间相互独立且同分布。前提条件中心极限定理在统计学中具有重要地位,它使得我们可以用正态分布来近似许多实际问题的分布,从而简化了问题的分析过程。应用中心极限定理BIGDATAEMPOWERSTOCREATEANEWERA05数理统计的基本概念研究对象的全体个体组成的集合,通常用一个概率分布来描述。总体从总体中随机抽取的一部分个体组成的集合,用于推断总体的性质。样本样本中包含的个体数目,通常用$n$表示。样本容量总体与样本03常用统计量及其分布样本均值服从正态分布,样本比例服从二项分布等。01统计量样本的函数,用于描述样本的特征,如样本均值、样本方差等。02抽样分布统计量的概率分布,描述了不同样本下统计量的可能取值及概率。统计量及其分布抽样分布的概念当总体分布已知时,可以通过抽样得到样本,进而得到统计量的分布,即抽样分布。抽样分布的性质无偏性、有效性和一致性,这些性质保证了基于样本的统计推断是可靠的。常见抽样分布$chi^2$分布、$t$分布和$F$分布,它们在参数估计和假设检验中有着广泛应用。抽样分布BIGDATAEMPOWERSTOCREATEANEWERA06参数估计点估计点估计是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。方法点估计的主要方法有矩估计法、最大似然估计法、最小二乘法、贝叶斯估计法等。性质无偏性、有效性、一致性是评价点估计优良性的三个重要标准。定义最大似然估计基于截尾样本的最大似然估计是一种特殊的点估计方法,它根据已知的部分观测值,通过最大化似然函数来估计总体参数。性质基于截尾样本的最大似然估计具有一致性、渐近无偏性和渐近有效性等优良性质。截尾样本在实际问题中,有时由于种种原因,不能获得全部样本观测值,只能获得部分观测值,这样的样本称为截尾样本。基于截尾样本的最大似然估计估计量的评选标准无偏性指估计量的数学期望等于被估计参数的真实值,即估计量在多次重复抽样下的平均值等于被估计参数的真实值。有效性指在同一总体参数的两个无偏点估计量中,有更小方差的估计量更有效。一致性指随着样本容量的增大,点估计量的值越来越接近被估参数的真实值。充分性指一个统计量包含了样本中关于总体参数的全部信息,即没有其他统计量能够提供更多的信息。123区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。定义区间估计的主要方法包括枢轴量法、置信区间法等。方法区间估计具有置信水平、置信区间和显著性水平等概念,其中置信水平反映了区间估计的可靠性程度。性质区间估计BIGDATAEMPOWERSTOCREATEANEWERA07假设检验假设检验的基本概念显著性水平是事先设定的用于判断原假设是否被拒绝的概率阈值,第一类错误是原假设为真时错误地拒绝原假设的概率。显著性水平与第一类错误原假设是研究者想要拒绝的假设,备择假设是研究者想要支持的假设。原假设与备择假设检验统计量是根据样本数据计算出的用于检验原假设的统计量,拒绝域是使得原假设被拒绝的检验统计量的取值范围。检验统计量与拒绝域单样本t检验用于检验单个正态总体的均值是否等于某个给定值。单样本方差分析用于检验单个正态总体的方差是否等于某个给定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论