已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品精品 概率论讲课材料概率论讲课材料 本节主要介绍概率及其分布函数 数学期望 方差等方面的基础知 识 一 概率 Probabi lity 1 概率定义 Defi nition ofProbabi lity 在自然界和人类社会中有着两类不同的现象 一类是决定性现 象 其特征是在一定条件必然会发生的现象 另一类是随机现象 其特征是在基本条件不变的情况下 观察到或试验的结果会不同 换句话说 就个别的试验或观察而言 它会时而出现这种结果 时 而出现那样结果 呈现出一种偶然情况 这种现象称为随机现象 随机现象有其偶然性的一面 也有其必然性的一面 这种必然性表 现为大量试验中随机事件出现的频率的稳定性 即一个随机事件出 现的频率常在某了固定的常数附近变动 这种规律性我们称之为统 计规律性 频率的稳定性说明随机事件发生可能性大小是随机事件本身固定的 不随人们意志而改变的一种客观属性 因此可以对它进行度量 对于一个随机事件A 用一个数P A 来表示该事件发生的可能性大 小 这个数P A 就称为随机事件A的概率 因此 概率度量了随机 事件发生的可能性的大小 对于随机现象 光知道它可能出现什么结果 价值不大 而指出各 种结果出现的可能性的大小则具有很大的意义 有了概率的概念 就使我们能对随机现象进行定量研究 由此建立 了一个新的数学分支 概率论 概率的定义定义在事件域F上的一个集合函数P称为概率 如果它满 足如下三个条件 i P A 0 对一切 AF ii P 1 iii 若 iA i 1 2 且两两互不相容 则 i i 11 iiAPAP性质 iii 称为可列可加性 conformable addition 或完全可加性 推论1对任何事件A有 1 APAP 推论2不可能事件的概率为0 即0 P 推论3 ABPBPAPBAP 2 条件概率 Conditi onalProbabi lity 如果P B 0 记 BPABPBAP 称P A B 为在事件B 发生的条件下事件A发生的条件概率 转化后有 BAPBPABPAPABP 如果 P A 0 称 为概率的乘法原理 推广后的乘法原理 12121312121 nnnAAAAPAAAPAAP APAAAP 其中 121 n AAAP 0 3 全概率公式与贝叶斯 Bayes 公式设事件A1 A2 An 是样本空间 的一个分割 即AiAj i j 而且 1i iA 从而 i 1iBAB 这里AiB也两两互不相容 则 i i 11 iiiABPAPBAPBP 这个公式称为全概率公式 由于 iiiiABPAPBAPBPBAP 故 BPABPAPBAPii i 再利用全概率公式即得 i 1 iiiiiABPAPABPAPB AP这个公式称为贝叶斯公式 贝叶斯公式在概率论和数理统计中有着多方面的应用 假定A1 A2 是导致试验结果的 原因 P Ai 称为先验概率 它反映了 各种 原因 发生的可能性大小 一般是以往经验的总结 在这次 试验前已经知道 现在若试验产生了事件B 这个信息将有助于探讨 事件发生的 原因 条件概率P Ai B 称为后验概率 它反映了 试验之后对各种 原因 发生的可能性大小的新知识 4 事件 Random event 独立性 Independence 1 两个事件的独立性定义对事件A及B 若P AB P A P B 则称它们是统计独立的 简称独立的 推论1若事件独立 且P B 0 则P A B P A 证明 由条件 概率定义 APBPBPAPBPABPBAP 因此 若事件A B 相互独立 由A关于B的条件概率等于无条件概率P A 这表示B的 发生对于事件A是否发生没有提供任何消息 独立性就是把这种关系 从数学上加以严格定义 推论2若事件A与B独立 则下列各对事件也相互独立 证明 由于 ABPBPABBPBAP 1 APBPBPAPBP BPAP 所以A与B相互独立 由它立 刻推出A与B相互独立 由AA 又推出A B相互独立 2 多个事件的独立性定义对n个事件A1 A2 An 若对于所有 可能的组合1 i j n成立着 BABABA 2121nnkjikjijijiAPAPAPAAAPAPAPAPAAAPAPA PAAP 则称A1 A2 An相互独立 这里第一行有 n2个式子 第二行有 n3个式子 等等 因此共应 满足 n2 n3 12 nnnn 个等式 二 随机变量 Random Variabl e 和概率分布函数 Probabil ityDi stributionFuncti on 1 随机变量 Random Variabl e 如果A为某个随机事件 则一定可以通过如下示性函数使它与数值 发生联系 不发生如果发生A如果AIA 0 1这样试验的结果就能有 一个数 来表示 这个数是随着试验的结果的不同而变化 也即它 是样本点的一个函数 这种量以后称为随机变量 随机变量可分为 离散型随机变量和连续型随机变量 2 概率分布函数 p d f probability density function 称F x P x x 为随机变量 的分布函 数pdf 对于连续型随机变量 存在可能函数f x 使 xdXxfxF f x 称为随机变量的 分布 密度函数 densityfunction 3 随机向量 Random Vector 及其分布在有些随机现象中 每次试验的结果不能只用一 个数来描述 而要同时用几个数来描述 试验的结果将是一个向量 1 2 n 称n维随机向量 随机向量的联合分布函数也有离散型与连续型的分别 在离散型场 合 概率分布集中在有限或可列个点上 多项分布 就是一个例子 在连续型场合 存在着非负函数f x1 x2 xn 使 1 111 xxnnnndydyyyfxxF 这里的f x1 xn 称为密度 函数 满足如下两个条件 1nxxf 0 一般地 若 是二 维随机向量 其分布函数为F x y 我们能由F x y 得出 或 1 11nndxdxxxf 的分布函数 事实上 P 1xF P x x xF同理 P 2yF yFy F1 x 及F2 y 称为F x y 的边际分布函数 Marginal Di stri butionFuncti on 例 若F x y 是连续型分布函数 有密度函数f x y 那么 xdudyyufxF 1因此F1 x 是连续型分布函数 其密度函数 为 dyyxfxf 1同理F2 x 是连续型分布函数 其密度函 数为 dxyxfyf 2f1 x 及f2 y 的边际分布密度函数 二元正态分布 函数 22221 2122221 2 1 21exp12 1 bybyaxraxrryxf这里a b 21 r为常数 1 0 2 0 r 1 称为二元正态分布密度函数 定理二元正态分布的边际分布仍为正态分布 条件分布 Condi tional Distributi on 离散型若已知 xi p1 xi 0 则事件 yi 的条件概率 为 1ijiijiijxpyxPxPyxPxyP 这式 子定义了随机变量 关于随机变量 的条件分布 连续型在给定 x的条件下 的分布密度函数为 1xfyxfx yf 同理可行在给定 y的条件下 的分布密度函数为 2y fyxfyxf 这里当然也要求f2 y 0定理二元正态分布的条件分布仍 然是正态分布 1 2221122 xN其均值 1122 x是x的线性函数 这个结论在一些统计问题中很重要 4 随机变量的独立性定义设 1 n为n个随机变量 若对于 任意的x1 xn成立1 P nx 1 1 Pxn nPx 1 nx 1 则称n 1 是相互独立的 若i 的分布函数为 xFi 它们的联合分布函数为 1nxxF 则 1 等价于对一切x1 xn成立 111nnnxFxFxxF 在这种 场合 由每个随机变量的 边际 分布函数可以唯一地确定联合分 布函数 Joint Distribution Function 对于离散型随机变量 1 等价于任何一组可能取的值 x1 xn 成立 1111nnnnxPxPxxP 对于连续型随机变量 条件 1 的等价形式是对一切x1 xn成立 111nnnxfxfxxf 这里f x1 xn 是联合分布密度函数 Joint densityfunction 而fi xi 是各随机变量的密度函数 mn m nyxxfyxxf 1111 nny uyu 11此外 注意到若n 21 相互独立 则其中的任意r 2 r n 个随机变量也相互 独立 例如 我们证明121 n 相互独立 1 P 11 nx 11 Pxn 11 nx nnx 1 1 P 11 nPx 11 Pxn 1 P 11 nPx 1 n x随机变量的独立性概念是概率论中最基本的概念之一 也是最重要 的概念之一 5 随机向量变换 Transformati on 及其分布若 1n 的密度函数为 1nxxf 求 1111nnnnff 的分布 这时有11 PyyGn ny 1 n y nndxdxxxf 11 1 若对 1niixxfy 存在唯一的反函数 1 i 1nixyyxni 且 1n的密度函数为 1n yyq 那么 nnnduduuuqyyG 111 2 比较 1 与 2 可知 1n yyq 其它的值域属于若 0 111nnnffyyJxxf 其 中J为坐标变换的雅可比行列式 Jacobian Determinant nnnnyxyxyxyxJ 1111这里 我们假定 上述偏导数存在而且连续 随机变量的函数的独立性定理若 1 n是相互独立的随机变 量 则 11nnff 也是相互独立的 这里 1 nifi 是任 意的一元函数 三 数字期望及方差 1 数学期望一般地 如果X是随机变量 它的概率密度函数为f x 那么它的期望值为 是连续型随机变量时X当是离 散型随机变量时X当dxxxfxxfXEx 在许多问题中我们不仅需要 知道E X 而且还想知道X的某个函数g X 的数学期望 是连续时X当是离散型时X当dxxfxgxfxgXgEx 我们可以用同样的方法定义多元随机变量的函数的数学期望 假设随机变量X1 X2 Xn的联合概率密度函数为 21nxxxf 21nXXXgY 那么 nnndxdxdxxxxfxxxgYE 212121 如果随机变量是离散的 那么上面公式里的积 分号用和号代替 利用这个定义我们可以得到下列结果 1 如果a0 a1 an是常数 那么 110110nnnnXEaXEaaXaXaa E 2 如果X1 X2 Xn是相互独立的随机变量 那么 2121 nnXEXEXEXXXE 2 方差 Vari ance 与协方差 Covariance 一个随机变量X的r阶中心矩被定义为 rXE 记为r 如果 22 XEr被称为X的分布的方差或X的方差 常常记为 var 2X或 2 的正平方根 被称为X的标准差 关于方差 我们有一个有用的公式2222 XEXEXEXE X和Y之间的协方差 记为XY 或 cov YX YEXEXYEEY YEXXEXY X和Y之间的协方差是对它们之间的相关性的一个测 度 如果X和Y是相互独立的 那么 cov YX 0 这导致下面的相关系数的定义 X和Y之间的相关系数记为XY 被定 义为 var var cov YXYXXY 由这个定义 XY 的取值一定在 1和1之间 如果X和Y是相互独立的 那么XY 0 如果Y aX b 这里a b是不等于0的常数 那么 XY 1 此时 我 们说X和Y是完全相关的 X和Y的值越接近线性关系 XY 值接近1 利用这些定义 我们可以得到下面的结果如果a0 a1 an是常数 X 1 X2 Xn是随机变量 那么 jijijiiinnXXaaXaXaXa a cov 2 var var 2110 特别地 有 var var 121110XaXaa cov 2 var var var 212121XXXXXX 3 随机向量的协方差矩阵对于随机向量而言 我们可以相似地定义 它的期望和协方差矩阵 用X表示随机变量组成的向量 即 nXXXX 21假设ijjii iiiXXXXE cov var 2 那么X的期望值为 nnXEXEXEXE 2 121 也即是一个随机向量的期望值等于它的各个分量的期望 值组成的向量 我们定义一个随机向量X的协方差矩阵 Covariance Matrix 如下 X cov EXXEXEX 22211222221122112211211 nnnnnnnnnnXXXXXXXXXXXXXXXE var cov cov cov var cov cov cov var 112 2121211nnnnnXXXXXXXXXXXXXXX 2n2 122222111221nnnn X的协方差矩阵常常记为x 它是一个非负定矩阵 如下是证明对于任意的不为零的向量 21n aaaa 我们构造一个变量XaY 那么Y的方差0 aa XaVarYVarx 即证明了x 是非负定的 线性变换后的向量的均值与协方差如果P是一个m n常数矩阵 m n 那么Z PX是一个m维随机向量 可以得到a PXPEPXEZE b PPPXZx cov cov 证明 a a mnmmnnaaaaaaaaP212222111211X nxxx 21 x2 nmnmmnnnnxaaxaxaxaxaxaxaxaPX 21122221211212111 P 2 1 n 21 n 12 11PaaaaaaaaaPX EZEnnmnmmnn 212 122221121 b cov PX E PX P PX P E P X X P P E X X P P Px 四 条件分布 Condi tional Distri bution 条件数学期望 Condi tionalExpectati on 及其条件方差 Condi tional Vari ance 条件均值 Conditional Mean 是条件分布的均值 其定义为 y yyxyyfydyxyyfxyE 是离散的若是连续的若 条件均值函数的回归x对称为yxyE 条件方差 Conditional Variance 条件方差是条件分布的方差 2xxyEyExyVar ydyxyfxyEy 2或 y xyfxyEy 2 离散时 利用 下式可以简化计算22 xyExyExyVar 并且有 xyEE yEx 记号Ex 表示对X的值的期望 几个重要的公式1 XYXEXXYE 思考 XYEXgXYXgE 是否成立 2 XYXEEXYE 3 方差分解公式 Deposi tion ofVariance 推导分两步 先证明i 0 EZ XYEYZ 这是因为 XXYEYEXZE 0 0 XZEEEZXYEXYE从而ii 0 cov ZXYEXYEYZXYE即是不相关的和这是因为0 EZ 进而有 cov XYZEEZXYE 我们考察 XXYZEE0 XZEXYE 0 XXYZEEEXYZEE iii 对于任意Y有 XYEZXYEXYEYY 因为Z与E Y X 是 不相关 故 XYEVarXYEEYVarYVar 而2 XY EYEXYEYVar 2XXYEYEE XYVarEx 我们得到方差分 解公式 XYVarEXYEVarYVarx 方差分解结果表明 在双 变量分布中 y的变差出自两个 1 由于E y x 随x变化的事实所产生的变差为回归方差 Regressio n Variance 回归方差 Varx E y x 2 由于在每一条件分布中 y都围绕条件均值变化而产生的变差为 残差方差 Residual Variance 残差方差 Ex Var y x 这样 Var y 回归方差 残差方 差 由方差分解公式 我们得到 YVarXYEVar 这个是非常重要 的公式 它常被应用到寻求最小方差估计量的方法中 我们可以看一 个实际的例子 例子 设X和Y服从二元正态分布联合分布 我们已经知道 在给定X 的条件下 其条件分布仍然是正态分布 并且 1122 XXYE则EYXY EE 2 然而22 XYEEXYEVar2112 XE 222 2121222 XE在 1 1 条件下 22 222 满足方差分解公式 并且我们很容易知道 222 22 XYV arEx 1 222 六 极限分布理论 Li mit Distribution Theory 1几个极限的定义1 分布函数的弱收敛 Weak Convergence of theDistributionFunction 定义1对于分布函数列 Fn x 如果存 在一个非降函数F x 使 limn xFxFn 在F x 的每一连续点上 都成立 则称Fn x 弱收敛于F x 并记为 xFxFwn 中心极限定理就是一个分布函数弱收敛的例子 2 随机变量的收敛性 Convergenceofthe RandomVari able 概率论中的极限定理研究的是随机变量序列的某种收敛性 对 随机变量收敛性的不同定义将导致不同的极限定理 而随机变量的 收敛性的确可以有各种不同的定义 理解这些不同的极限定义 对 于我们分析线性回归的大样本结果很重要 现在就来讨论这个问题 a 依分布收敛 Convergence inDistribution 分布函数弱收敛的讨论启发我们引进如下定义 定义2 依分布收敛 设随机变量 n 的分布函数分别为Fn x 及 F x 如果 xFxFwn 则称 n 依分布收敛于 并记为 Ln b 依概率收敛 Convergence inProbabil ity 定义3 依概率收敛 如果0 lim n nP对任意 的 0成立 则称n 依概率收敛于 并记为 Pn c r 阶收敛定义4 r 阶收敛 设对随机变量rnnE 有及 rE 其中r 0为常数 如果0 lim n rnE 则称rn 阶收敛于 并记为 rn 下面定理揭示了r 阶收敛与依概率收敛的关系 定理8 Pnrn 2 极限的应用贝努里分布与普松分布a 近似计算在n次贝努里试验 中正好出现k次成功的概率b k n p nkqppnkbknknk 2 1 0 其中q 1 p b k n p k 0 1 2 n称为二项分布 在很多应用问题中 我们常常遇到这样的贝努里试验 其中 相对 地说 n大 p小 而乘积np 大小适中 在这种情况下 有一个便 于使用的近似公式 定理 普松 在贝努里试验中 以pn代表事件A在试验中出现的概率 它与试验总数n有关 如果 nnp 则当 n时 ekPnk bkn b 中心极限定理 Central LimitTheorem 若X1 X2 Xn 是一串相互独立相同分布的随机 变量序列 且2 kkXVarEX我们来讨论标准化随机变量和 k nknXn1 1 的极限分布 林德贝格与勒维 Lindeberg andLevy 建立了下列中心极限定理 定理2 林德贝格 勒维 若0 2 则nnlim P xtdtex2 22 1 2 契比雪夫 Chebyshevs Inequality 不等式对于任何具有有限方差的随机变量X 都有 E XXP 2 XVar 1 其中 是任一正数 证明 若F x 是X的分布函数 则显然有 EXXP EXxxdF 22 EXxxdFEXx 222 1 XVarxdFEXx 2 这就证得了不等式 1 有时把 1 改写成 EXXP 2 1 XVar 或 XVa rEXXP 21 3 契比雪夫不等式利用随机变量X的数学期望EX及方差 XVar 对X的概率分布进2行估计 例如 3 断言不管X的分布是什么 X落在 EXEX中的概率 不小于211 因为契比雪夫不等式只
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公务员考试实词八百个试题及答案
- 2025广东佛山市三水区事业单位招聘急需紧缺专业技术人员5人参考题库及完整答案详解
- 2026年烟台汽车工程职业学院单招职业适应性考试必刷测试卷完美版
- 2025年扶余市委党校公开选拔招聘工作人员(4人)参考题库及答案详解(基础+提升)
- 2025广西南宁市商务局招聘外聘人员1人参考题库含答案详解(突破训练)
- 会计业务实操题库及答案
- 2026年湖北科技职业学院单招职业适应性测试必刷测试卷完美版
- 2026年甘肃省平凉地区单招职业倾向性考试题库完美版
- 2025广东茂名化州市部分事业单位招聘24人参考题库及答案详解(夺冠)
- 2025年驻马店市驿城区事业单位联考招聘153人参考题库带答案详解
- 金斧子银斧子课件
- 美国总统选举流程
- 2025年国家开放大学(电大)《生命科学导论》期末考试复习试题及答案解析
- 婚姻家庭咨询师培训试题及答案
- 空气能中央热水施工方案
- 2025年初级会计实务(政府会计)真题及答案
- 安全生产台账的管理制度
- 2025年监理工程师继续教育机电安装考试试题及答案
- 医药代表新员工
- 医疗技术安全培训课件
- ICU获得性衰弱课件
评论
0/150
提交评论