




已阅读5页,还剩137页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第三章随机变量及其分布 3 1随机变量的概念引子 实际需要 在第一 二章中我们主要论述了可以用有限样本空间描述的随机试验 我们研究了事件概率的指定与计算 实际上人们观察了定义在结果空间上的函数 因为 若把一枚硬币抛掷n次 人们并不关心样本空间中的个n元组哪一个已发生 更确切地说 人们希望知道在n次抛掷中出现正面的次数 2 在靠碰运气取胜的游戏中 人们感兴趣的是某一游戏者净胜或者净输多少 在第一 二章中我们实际上已涉及到这种还没有用术语随机变量来定义的函数 理论需要 随机变量概念的引进和研究是概率论发展中的重大事件 它使概率论的研究从事件扩大为随机变量 这样 3 就利于使用精细的数学工具实变函数来进行研究和处理 使概率论成为一门真正的数学学科 随机变量与实变量的实值函数之间主要区别在于概率分布的有关概念 但是高等微积分或实分析知识仍是研究随机变量以及它们的概率分布的基本工具 4 直观上 我们把随机现象的每一种表现 把随机试验的每一个要观察到的结果叫做随机事件 有些E的结果本身是数量 有些虽然本身并不是数量但可以数量化 这样的量随着E的重复可以取不同的值 并且在每次E中究竟取什么值事先无法确切预言 是带有随机性的 自然地称这样的变量为随机变量 因此 5 直观上随机变量即在随机试验中被测量的量 例1向一目标射击n次 共命中目标次数 或随意抽验n件产品其中不合格品的件数 它有n 1个可能值 0 1 2 n 例2接连不断地射击 首次命中目标需要的射击次数 它可取任意的自然数 6 例3在长为t的时间内 某交换台接到呼叫的次数 它可取任何非负整数值 v t 例4一自动装置无故障运转的时间 它可取区间 0 上的任何值 例5随机测量的误差 例在分析天平上称量某物品的实际称量结果与该物品的质量之差 其值域为 例6掷硬币试验中被测量的量 7 于是X是随机试验结果的数量化 1 在n重的贝努里E中总成功次数X Xi表示第i次贝努里E成功次 于是 8 若成功k次事件为Bk k 0 1 2 n 2 E 接连射击两次 其中 0 表示来命中目标 1 表示命中目标 X表示命中目标次数 则X X e 是基本事件的函数 9 3 E 掷三枚骰子一次 用X表示三枚骰子点数之和 Xi表示第i枚骰子出现的点数 i 1 2 3 于是 10 亦是基本事件函数 我们采纳对应思想建立结果空间S上的r v 定义1设E为随机试验 其样本空间为S 若对于 都有唯一的实数值X e 与之对应 则称X e 为随机变量 简记为X 11 对于 有定义于S上的一个函数与之对应 事件A的示性函数 对于 定义为事件A的示性函数 首先xA e 为一个随机变量 12 其次 于是A的概率计算等价于求取1值的概率 此外 事件的关系和运算与示性函数的关系与运算是一一对应的 例 等价 此外 易验证 13 于是 事件的研究可以纳入随机变量的研究 14 Note 1 问题 是单值实函数 定义于S上 其值域 对一般情形 非结果空间S 需对X加限制 2 引入 事件关系与运算转化为之间关系运算 事件概率计算转化为概率分布讨论 利于用高等微积分与实分析解决概率中问题 15 3 2离散型随机变量离散型随机变量X X的取值至多为有限个实数或可数无穷多个实数 要了解一个需讨论两个方面事情 1 取值范围及可能取值 2 以多大概率来取得这些值 于是引入分布列概念 16 定义 设X为离散型 X所有可能取值为x1 x2 xn 且有 I 则称 I 为离散型的概率分布列or分布列 易证 的分布列具有性质 1 Pk 0 k 1 2 2 17 反之 满足 1 2 的实数列 pk 亦可作为某一离散型的分布列 分布列表格形式 Note 若S是离散的 F是S的一切子集的集合 则定义在S上的任何单值函数都是离散型 18 例1 巴斯卡分布 Pascal分布 考虑相继的贝努里E 用X表示第r次成功时贝努里E发生的总次数 求X的分布列 P表示成功概率 解 若第r次成功发生在第k次试验 则必有k r 设Ck表示第r次成功发生在第k次试验这一事件 19 于是Ck发生前面k 1次试验中有r 1次成功 k r次失败 而第k次试验的结果为成功 利用试验的独立性 对于 20 1 Pk 0 易证 2 这里利用推广的二项系数公式 21 P Ck 称为Pascal分布 特别当r 1时 我们得到几何分布 Pascal是十七世纪法国数学家 他对概率论的早期发展作出过重大贡献 例2讨论贝努里E中首次出现成功试验次数X的分布列 解 设贝努里E中首次成功出现在第X次 22 X k k 1 2 于是 X k 利用事件的独立性 II II 称为几何分布 23 例3一个人要开门 他共有n把钥匙 其中仅有一把是能开这门的 他随机地选取一把钥匙开门 即在每次试开时每一把钥匙都以概率1 n被使用 这人在第S次试开时成功的概率是多少 解 这是一个贝努里E 24 几个常见的分布列 1 两点分布 贝努里分布 X 0 1 2 二项分布 X B n p 3 泊松分布 X P Question 泊松分布与二项分布之间关系 下面讨论X B n p 具有什么规律性 25 1 两点分布 若分布列为 0 p 1 则称X服从两点分布记 2 二项分布 若分布列为 26 则称X服从参数为n p的二项分布 记 3 泊松分布 若分布列为 则称X服从参数为 的泊松分布 记 27 1 当kP X k 1 P X k 单调上升 2 当k n 1 P时 P X k P X k 1 P X k 单调下降 3 1 k n 1 P n 1 P 时 P X k P X k 1 max 28 2 当 n 1 P n 1 P 时 令k n 1 P 例k n 20 p 0 2 由于 n 1 p 20 1 0 2 4 2取k 4 2 4故P X 4 29 Remark 1 二项分布与Poisson分布的联系 2 二项分布与Poisson分布规律类似 30 3 3随机变量的分布函数引子例1向区间 a b 内任掷一质点 此E为几何型的 考察落点坐标X的分布 解 易知 利用分布列方法且 a b 中实数不可数 因此 用离散型r vX的分布列描述随机事件的概率行不通 31 一种自然做法 对于只需要求即可 由于Halmos已证明实轴上所有开区间或所有区间的集合类生成的 域与由所 32 所有形式为 a b 的有界半闭区间所成的集合类生成的 域相重合 于是我们只须讨论or即可 域 封闭 33 而从而研究概率转化为研究 这样做只是为了充分利用函数所显示出的巨大的优越性 亦使分布函数定义更具一般性 这样 完整地描 34 述了 即取哪一些值及以怎样的概率取这些值 定义1设称为的分布函数 记为dfF x Note F x P X x 是分布函数另一种定义 在一些优良性质上有差异 F x 是左连续的 35 述了 即取哪一些值及以怎样的概率取这些值 定义1设称为的分布函数 记为dfF x Note F x P X x 是分布函数另一种定义 在一些优良性质上有差异 F x 是左连续的 36 例1 37 例2设的分布列为求的dfF x 38 解 图象为一梯形 39 1 对于一般离散型 i 1 2 则的df为F x 在x xi处有跳跃 2 亦有反问题 40 例3向半径为1圆内任掷一质点 此E为几何型的 求落点到圆心距离X的dfF x 解 由题设对 41 综上所述 我们可归纳的dfF x 具有下列性质 反之 若某一实函数F x 亦满足 1 2 3 4 则必存在以作为的df 42 例4设的df为求A B 解 由题意 43 解得 例5袋中装有a个白球 b个黑球 从袋中任取r个球 求r个球中黑球个数X的分布列 解 设X为r个球中黑球个数 则X的分布列为 44 由题设 k为有意义数必有 45 于是于是的分布列为 46 3 4连续型随机变量引子 取值充满一个区间或者为整个实轴 而且其分布函数F x 是绝对连续函数 定义 设F x 是的df 若存在一个非负的可积函数P x 对于有 47 则称为连续型 同时称P x 为X的pdf 定义的直接推论 1 在R上 F x 是连续的 2 若P x 在点x x0连续 则有 2 刻划了的pdfP x 与dfF x 之间联系 我们工科学生常用的的pdfP x 常常为连续的 48 1 2 3 若对于连续型 则有 49 反之 若存在一个实函数P x 满足 1 2 则P x 一定是某个的pdf 关于的pdfP x 几何意义 50 1 y P x 曲线分布在x轴上方 2 y P x 与x轴所围区域面积数值为1 3 以 x1 x2 为底 以曲线为顶的曲边梯形的面积表示概率的值 以曲线y P x 为顶 以 x 为底的曲边梯形面积A 表示F x 的值 另外 pdfP x 若在x处连续 则其数值大小反映了rvX取x邻近值的概率之大小 51 最后 因为于是又F x 在R上连续 1 6公理1故利用夹逼Theorem 52 Note 一个事件概率为0 此事件不一定是不可能事件 同样一个事件概率为1 此事件不一定为必然事件 例1设的pdf为求 1 A 2 dfF X 3 P 1 x 2 53 1 由题意 54 3 两种方法1 2 55 例2设具有对称的pdfP x 即 证明 对于 56 Proof 1 57 2 3 几个重要的分布 1 均匀分布 X U a b 等价于一维情几何概率 2 指数分布 X E 0 58 1 均匀分布 若X的概率密度为则称X服从 a b 上均匀分布 记P x 满足 59 则Remark 背景问题 舍入误差等 2 指数分布 若X的概率密度为 则称X服从参数为 的指数分布 记X E 60 易知P x 满足 61 在许多重要场合 某一复杂系统中接连两次故障的时间间隔服从指数分布 它具有无后效性 与Poisson分布有密切联系 在可靠性理论及排队论中有广泛应用 它也是连续型非负的 无记忆性概率分布 永远年轻的分布 指数分布另一个应用 常用来近似表示各种 寿命分布 62 例3设已使用了t小时的电子管在以后的小时内损坏的概率为 其中 为正常数 0 是的高阶无穷小 0 若电子管寿命为X P X 0 0 求的pdfP x 解 由题设 63 64 又已知从而C 1 于是 65 3 5正态分布Question 一个实函数P x 满足 1 2 则一定有一个 连续型 以P x 作为其pdf 我们可观察一下这样的函数 66 其中为两个参数且可验证 1 2 于是 我们一定能找到一个 它以P x 作为pdf X称为正态变量 67 定义 若连续型的dpf为 为常数且 则称服从参数为的正态分布 又称Gauss分布 亦称X为正态变量 记作正态分布在理论与实际中的地位 总的来说 在概率论与数理统计的理论研究 68 和实际应用中 正态分布起着特别重要的作用 它在各种概率分布中居首要地位 1 实际意义 1 在实际中遇到的许多随机现象都跟服从或近似地服从正态分布 例 在生产中 在正常生产条件下各种产品的质量指标 一般都服从正态分布 在随机测量中 测量结果一般可表示为 69 其中a为真值 未知常数 e为随机误差 和e一般都是正态分布 在生物学中 同一群体的某种特征一般亦服从正态分布 其它 气象中 某地年七月份的平均气温 平均湿度及降雨量等 水文中的水位 亦都服从或近似地服从正态分布 总之 正态分布律广泛地存在于自然界的自然现象 生产及科学技 70 术的各领域之中 2 理论意义 1 正态分布是许多重要概率分布的极限分布 例1DeMoivre Laplace积分极限定理 设则当n充分大时 若npq亦充分大 则近似地有 71 即二项分布可用正态分布近似 利用Stirling公式证 例2若 则当 充分大时 X N 即例3Lindeberg Levy定理2 许多非正态随机变量是正态随机变量的函数 72 例在数理统计的理论和应用中占极重要地位的 都是正态随机变量函数的分布 3 正态分布的pdfP x 与dfF x 有各种良好性质和简洁的数学形式 在概率论与数理统计的研究和应用中 每当涉及正态分布时 一般均可得到完满和简单的结果 特别在数理统计中非常明显 73 4 许多随机现象不能用正态分布来描绘 除了正态分布之外 还存在许多重要的非正态分布 它们亦很有成效地用于理论与实际中 产生正态分布的一般条件 假设X是E的rv 若决定试验结果的是大量偶然因素的总和 假设各个因素之间近乎独立 并且每个因素的单独作用相对均匀地小 74 那么X的分布一般近似于正态分布 实际应用做法 假设 试验数据 检验数理统计 1正态变量X的pdfP x 与dfF x 性质 图象 特点 75 1 P x 图形关于直线对称 2 P x 有各阶导数 3 P x 在递增 在递减 为唯一极大值 亦最大值 等于 在处有拐点 且 76 4 y P x 图形如钟状 参数 决定y P x 图形的中心位置 而参数决定y P x 图形中峰的陡峭形状 77 5 y F x 以为中心对称 6 y F x 各阶导数均存在 7 F x 满足 1 2 3 4 特殊性质 2标准正态分布与一般正态分布之间关系 设 78 称rvX服从标准正态分布 其pdf df分别为两个等式 79 关系 设 其pdf df分别为P x F x 于是作替换 80 81 故对于编制了图表 82 例1设 求解 83 于是因而 在一次E中 X几乎总是落在 小概率事件 84 例2某工厂生产的电子管寿命X 小时计 N 1600 2 若要求寿命在1200小时以外的概率不小于0 96 求 的范围 解 由题意 85 86 例3测量到某一目标的距离所产生的随机误差X m 具有pdf 求三次测量中 至少有一次误差绝对值不超过30m的概率 87 解 这是一个n 3重贝努里E 成功概率为p P X 30 设至少有一次误差绝对值不超过30m事件为A 88 于是 89 3 6随机变量函数的分布引子 设X是一个具有已知分布的r v 且设f是一个定义在实线上的函数 我们寻找Y f x 的分布 只要Y亦是一个r v 具体背景 物理 数学 工程和统计方面等 定义 设f x 是定义在r vX的一切可能取值x集合上的函数 若r vY随r vX取x的值而取y f x 的值 则称r vY为r vX的函数 90 记作Y f X 结果空间S上r vX函数 一 当X为离散型r v时 f X 分布可直接由X的分布列求得 例1已知r vX的分布列为求 Y1 2X 1及Y2 X 2 2的分布列 91 解 由题设故Y1 2X 1的分布列为 92 至于Y2的分布列 只需注意在 I 中Y2取值有重复相同的 应把相同的值所对应的概率按概率的加法公式加起来 这样得到Y2的分布列 93 94 对于一般离散型r vX函数分布列处理方式一致 95 二 连续型r vX函数Y f X 的概率分布 例2 设Y aX b a b为常数且a 0 若r vX的pdf为PX X 求r vY的pdfpY y 解 由已知的r vY亦是一个连续型r v 设r vY的df分别为FY y r vX r vYpdf分别为PX X PY y 96 97 2 当a 0时于是由pdf定义 98 Question 1 正态变量的线性函数是否还是正态变量呢 是 原因 99 2 当 100 特别有 Theorem1设Y f X X为连续型 PX x 为X的pdf 若y f x 为严格单调的连续函数 且反函数x h y 有连续导数 则Y为连续型 且pdf为 101 Theorem2设Y f X X为连续型 其pdf为PX x 若f x 为一般连续函数 它在不相重叠的区间I1 I2 上逐段严格单调 对应的反函数分别为而且 102 Y f X 是连续型r V 且其这pdf为 103 104 105 106 107 例4设X N 0 1 求Y X2Rpdf 于是 108 109 110 111 解 设X轴与OM夹角点r vZ 其pdf为 而弧长为r vW 112 113 在 0 上 为严格单调连续函数其反函数有连续导数 114 115 116 117 补充两个例子 一般随机变数及其函数分布的例子 118 习题1 自动生产线在调整以后出现废品的概率为P 在生产过程中出现废品立即进行重新调整 求在两次调整之间生产的合格品数的分布列 解 以X表示两次调整之间生产的合格品数 则X的分布列为P X k k 0 1 2 119 2 在一汽车行驶的道路上有四盏红绿信号灯 若汽车遇到绿灯顺利通过和遇到红灯停止前进的概率是相同的 求汽车停止前进时通过的信号灯数的分布列 解 以X表示通过的信号灯数 则X的分布列为 120 3 进行某种试验 设成功的概率为3 4 以X表示首次成功所需试验次数 求X的分布列及X取偶数的概率 解X的分布列为 121 P X K P 前K
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 送受话器装调工创新改进考核试卷及答案
- 钢材热处理工信息保密意识考核试卷及答案
- 飞机钣金工班前会考核试卷及答案
- 推土机司机岗位现场作业技术规程
- 2025授权代理协议书范本样式
- 安徽省郎溪二中学2026届数学八上期末质量检测模拟试题含解析
- 内蒙古赤峰市翁牛特旗2026届数学九年级第一学期期末学业质量监测试题含解析
- 2026届咸宁市通城县数学七上期末教学质量检测模拟试题含解析
- 2026届浙江省杭州市英特外国语学校数学九年级第一学期期末质量跟踪监视模拟试题含解析
- 专利知识点培训课件
- 人教版语文必修上册 第一单元测试卷(含答案)
- 中建基础设施公司“主要领导讲质量”
- 2024-2025学年九年级化学人教版上册检测试卷(1-4单元)
- 生物-辽宁省名校联盟2024年高一10月份联合考试试题和答案
- 野生菌中毒和误食野果中毒防治知识安全课
- 新人教版四年级上册道德与法治全册复习资料知识点
- 辅警考试题《公安基础知识》综合能力测试题(附答案)
- JTG 3362-2018公路钢筋混凝土及预应力混凝土桥涵设计规范
- 高中数学重要函数图像(共62个高考压轴题必考)
- 电缆支架安装施工方案
- MOOC 一生的健康锻炼-西南交通大学 中国大学慕课答案
评论
0/150
提交评论