统计学第七章(概率与统计).pdf_第1页
统计学第七章(概率与统计).pdf_第2页
统计学第七章(概率与统计).pdf_第3页
统计学第七章(概率与统计).pdf_第4页
统计学第七章(概率与统计).pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 概率论与数理统计 王树佳 November 15 2015 Contents 1随机事件和概率3 1 1随机事件 3 1 2概率的定义及性质 5 1 3条件概率 全概率公式和贝叶斯定理 8 2一维随机变量及其分布11 2 1离散型随机变量及其分布 11 2 2连续型随机变量 19 3多维随机变量及其分布24 3 1二维随机变量的联合分布及边缘分布 24 3 2条件分布及随机变量独立性 29 4随机变量的变换31 4 1一个随机变量的函数的分布 32 4 2两个随机变量的函数的分布 32 5随机变量的数字特征34 5 1数学期望与方差 34 5 2协方差与相关系数 35 6大数定律和中心极限定理38 6 1大数定律 38 6 2中心极限定理 39 7样本及抽样分布40 7 1总体 样本及统计量 40 7 2几种常用抽样分布 41 7 3正态总体的抽样分布 43 1 8参数估计45 8 1点估计 45 8 2获得点估计量的方法 46 为什么要学好这一章 One 是统计学的理论基础 Two 测量经济指标 不确定性 所需要 Three 考研或欲深造者必须掌握 其实不太难嘛 既有用 又有趣 2 1随机事件和概率 本节要点 One 随机事件 Two 概率的三个定义 Three 条件概率 Four 全概率公式 Five 贝叶斯定理 1 1随机事件 随机试验 随机试验是具有如下特征的试验 1 可以在相同条件下重复进行 2 每次试验的结果不止一个 但所有可能的结果可以预知 3 试验前不能确定哪个果会出现 样本空间和样本点 随机试验 E 的每一个可能结果 称为样本点 所有样本点组成的集合 称为样本空间 Sample Space 记为 抛一枚硬币 1 次 H T 抛一枚硬币 3 次 HHH HTH THH TTH HHT HTT THT TTT 一年中发生恐怖袭击的次数 0 1 2 一部 iPhone 手机的使用寿命 t t 0 3 随机事件 随机试验 E 的样本空间的子集称为随机事件 Event 常用大写字母 A B C 表示 在每次试验中 当且仅当这一子集中的一个样本点出现时 称这一事件发生 每一次试验中必然发生的事件 称为必然事件 记为 每一次试验中不可能发生的事件 称为不可能事件 即为空集 有一个样本点组成的单点集 称为基本事件 由两个或以上样本点组成的集合 称为复合事 件 事件 A 抛 3 次硬币出现同一面 A HHH TTT 事件 B 考试成绩及格 B x x 60 事件间的关系 包含 A B 或 B A 事件 A 发生必然导致事件 B 发生 相等 A B A B 且 B A 则 A B 和 A B 事件 A B 中至少有一个发生 n i 1Ai 表示 n 个事件 A1 A2 An中至少有一个发 生 差 A B 表示事件 A 发生而 B 不发生 积 A B 或 AB 表示事件 A 和 B 都发生 n i 1Ai 表示 n 个事件 A1 A2 An都发生 互不相容 互斥 表示事件 A 和 B 不可能同时发生 即 A B 若 n 个事件 A1 A2 An 两两互不相容 则称 A1 A2 An互不相容 互逆 对立 事件若 A B A B 则称事件 A 和 B 互逆 事件 B 称为事件 A 的对立 逆 事件 记为 A 事件的运算 交换律 A B B A A B B A 结合律 A B C A B C A B C A B C 分配律 A B C A B A B A B C A B A C 德 摩根律 A B A B A B A B 4 1 2概率的定义及性质 概率的三个定义 1 古典概率 等可能概型 如果试验模型满足如下条件 则事件 A 发生的可能性大小 P A 称为古典概率 1 所有基本事件为有限个 2 各基本事件发生的可能性相同 P A A 包的基本事件数 基本事件总数 2 概率的频率定义 在相同条件下进行 n 次重复试验 事件 A 发生的次数 nA 称为频数 比值 nA n 称为频率 当试验次数充分大时 基于大数定律 频率将稳定于某一常数 这个常数就称为事件 A 的概率 抛硬币 蒲丰抛针计算圆周率 概率的主观定义 3 主观概率 概率 P A 是指试验者对事件 A 发生的信念程度 degree of belief 该概率是试验者基于其当 前全部知识对事件 A 发生可能性的估计值 如果后来又获得新的信息 试验者的信念程度将会相 应改变 贝叶斯理论基于这个定义 应用越来越广泛 明天下雨的概率 概率的三条公理 Kolmogorov axioms 不管何种定义 满足如下三条公理的集合函 数 P 就叫概率 非负性 对任何事件 A 有 0 P A 1 规范性 P 1 可列可加性 对 任 意 有 限 或 可 数 个 事 件 A1 A2 若两两互斥 则有 P i 1 Ai i 1 P Ai Kolmogorov 1903 1987 概率的性质 1 P A 1 P A 2 若 A B 则 P A P B 5 3 一般加法公式 对任意事件 A B 有 P A B P A P B P AB 4 减法公式 P A B P A P AB 有兴趣的同学可把加法公式推广到 n 个事件 排列与组合 排列数 把 n 个不同物体排成一列 共有 n n n 1 2 1 种不同方法 从 n 个不同物体中抽出 m 个物体排成一列 不重复 共有 Pm n 种不同方法 Pm n n n m PERMUT n m 从 n 个不同物体中抽出 m 个物体排成一列 重复 共有nm种不同方法 PERMUTATIONA n m 组合数 从 n 个不同物体中随机抽取 x 个 不重复 共有 n x 种不同方法 n x n x n x COMBIN n x 例 1 1 生日问题 Example 1 一个班有 n 个同学 问至少有两人在同一天生日的概率 解 设事件 A 没有人生日相同 则至少有两人在同一天生日的概率为 P A 1 P A 1 365 364 365 n 1 365n 人数10203050100 P A 0 120 410 710 971 6 例 1 2 泰坦尼克号 1912 年 04 月 14 日晚上 11 點 40 分撞上冰山 1514 人遇难 生还者 710 人 数据的背后是人性的光辉 乘员乘员级别乘员人数获救人数死亡人数死亡率 儿童 头等舱65117 二等舱242400 三等舱79275266 小计109565349 女子 头等舱14414043 二等舱93801314 三等舱165768954 船员2320313 小计42531610926 男子 头等舱1755711867 二等舱1681415492 三等舱4627538784 船员88519269378 小计1690338135280 合计 2224710151468 泰坦尼克号的生存概率 从乘员中随机抽取 1 人 记事件 S 乘员获救生存 M 乘员为男性 F 乘员为女性 则 P S 32 P M 1690 2224 76 P M S 338 2224 15 P F S 316 2224 14 7 男性和女性 谁的生存率更高 P S M 338 1690 20 P S F 315 425 74 三等舱和船员 谁的生存率高 1 3条件概率 全概率公式和贝叶斯定理 条件概率 Definition 2 设 P B 0 则在事件 B 发生的条件下 事件 A 发生的条件概率定义为 P A B P AB P B 可以验证 条件概率满足概率的三条公理 乘法公式 P A B P A P B A P B P A B 验证 P M 1690 2224 76 P S M 338 1690 20 P M S 338 2224 P M P S M 两个事件的独立性 Definition 3 如果事件 A 发生的概率 不受事件 B 发生与否的影响 则称事件 A 与 B 相互独 立 Corollary 4 事件 A 与 B 相互独立 P AB P A P B P B A P B 问题 两个互斥事件是否一定相互独立 反之如何 多个事件的独立性 Definition 5 如果 A1 A2 An任何事件发生的概率 都不受另外一个或几个事件的发生与否 的影响 则称事件 A1 A2 An相互独立 Corollary 6 事件 A B C 相互独立的充要条件是如下三个等式都成立 P AB P A P B P BC P B P C P ABC P A P B P C 即事件 A B C 相互独立等价于 A B C 两两独立 且 P ABC P A P B P C 8 全概率公式 Definition 7 完备事件组 设 样本空间 事件 A1 A2 An为试验 E 的一组事件 若 1 AiAj i j i j 1 2 n 2 n i 1Ai 则称 A1 A2 An为完备事件组 或 的一个划分 Theorem 8 全概率公式 若 A1 A2 An为完备事件组 则对任一事件 B 都有 P B n i 1 P Ai P B Ai 例 1 3 Monty Hall Problem Example 9 参赛者会看见三扇关闭了的门 其中一扇的后面有一辆汽车 选中后面有车的那扇门 就可以赢得该汽车 而另外两扇门后面则各藏有一只山羊 当参赛者选定了一扇门 但未去开启它 的时候 节目主持人开启剩下两扇门的其中一扇 露出其中一只山羊 主持人问参赛者要不要换另 一扇门 问题是 换另一扇门是否会增加赢得汽车的概率 解 记事件 A 选中汽车 B 更换选择后选中汽车 则根据全概率公式 P B P A P B A P A P B A 1 3 0 2 3 1 2 3 例 1 4 全概率公式 Example 10 从数 1 2 3 4 中任取一个数 记为 X 再从 1 2 X 中任取一个数 记为 Y 求 P Y 2 解 知道 X 才能求出 Y 的概率 事件 Ai X i i 4 形成完备事件组 由全概率公式 P Y 2 4 i 1 P X i P Y 2 X i 1 4 0 1 2 1 3 1 4 13 48 贝叶斯定理 Theorem 11 假设 A 为一个事件 B1 B2 Bn为 的一个划分 且 P A 0 P Bi 0 则 P Bi A P Bi P A Bi n j 1P Bj P A Bj i 1 2 n 妻子某天回家发现了一件新女式内衣 事件 A 这件新内衣可能是由于 B1 丈夫出轨了 B2 其它情况 妻子感兴趣的概率是 P B1 A 某人 HIV 检验呈阳性 事件 A 可能原因是 B1 他得艾滋病了 B2 他没病 他感兴趣的 概率是 P B1 A 已知观察结果 推测结果发生的原因 感兴趣的是原因 9 例 1 5 贝叶斯定理 要算 P B1 A 后验概率 Posterior probability 必须知道 1 P B1 先验概率 Prior probability 检验之前 某人是艾滋病者的概率 研究发现 比 例为 0 5 左右 2 P A B1 艾滋病人中检验呈阳性的概率 试剂准确率 80 3 P A B2 非艾滋病人中检验呈阳性的概率 试剂错误率 5 P A1 B P B1 P A B1 P B1 P A B1 P B2 P A B2 0 5 80 0 5 80 99 5 5 7 4 检查之前 他得艾滋病的概率为 0 5 先验 检验后 结果为阳性 他得艾滋病的概率修 正为 7 4 该先生再检验一次 结果仍为阳性 则他确实为艾滋病人的概率又是多少 例 1 6 谁生产的次品 Example 12 一家制造企业有两家工厂 老厂的产量占总量的 30 次品率是新厂的两倍 一位消 费者买到次品 要求退货 该次品是老厂生产的概率是多少 解 D Defective P Old 0 3 P New 0 7 P D Old 2P D New 要求 P Old D 知道结果 找原因 P Old D P Old P D Old P Old P D Old P New P D New 0 3 2P D New 0 3 2P D New 0 7 P D New 0 46 本节小结 学完本节 你需要做到 1 能计算古典概率 2 能运用加法 减法 乘法公式计算概率 3 能判断事件的独立性 4 理解并应用全概率公式 5 理解并应用贝叶斯定理 10 2一维随机变量及其分布 本节要点 One 离散型随机变量的 概率分布 分布函数 数学期望 方差与标准差 Two 常见的离散型随机变量 均匀 0 1 分布 二项分布 几何分布 泊松分布 Three 连续型随机变量的 概率分布 分布函数 数学期望 方差与标准差 Four 常见的连续型随机变量 均匀分布 指数分布 正态分布与标准正态分布 2 1离散型随机变量及其分布 什么是随机变量 随机变量 Random Variavle X 是定义于样本空间 上的一个函数 即对每一基本事件 都有一数值 X 与之对应 1 投掷一枚硬币三次 随机变量 X 表示出现的正面的次数 样本空间 HHH HTH THH TTH HHT HTT THT TTT X 的可能取值 S 0 1 2 3 2 扔一个骰子一次 X 表示出现的点数 S 1 2 3 4 5 6 3 从班里随机抽一人 如果为男生 令 X 0 如果为女生 令 X 1 S 0 1 4 从班里随机抽一人 其平均成绩为 X S x 0 x 100 5 个人收入 股票指数等等 S x x 0 离散型随机变量 变量取值为有限或可列无限多个 如 1 2 3 连续性随机变量 变量可能取值为某个区间 如 4 5 11 概率函数 pmf Definition 13 概率函数 假设离散型随机变量 X 的可能取值为 S x1 x2 x3 则 X 的 概率函数 概率分布 定义为 f x P X x x S 或 P X xi pi i 1 2 Corollary 14 离散型函数 f x 是某个随机变量概率分布的充分必要条件是 1 f x 0 2 x Sf x 1 分布函数 cdf Definition 15 分布函数 设 x 是任意实数 则函数 F x P X x x 称为随机变量 X 的分布函数 cdf 性质 1 F x 是个不减函数 即 F x1 F x2 x1 x2 2 F lim x F x 0 F 1 3 F x 右连续 即 F x 0 F x 例 2 1 投三次硬币 投一枚硬币三次 随机变量 X 表示出现的正面的次数 可能取值 S 0 1 2 3 样本空间 HHH HTH THH TTH HHT HTT THT TTT X 的概率分布为 x0123 f x 1 83 83 81 8 X 的分布函数为 F x 0 x 0 1 80 x 1 1 21 x 2 7 82 x 3 1x 3 12 离散型 r v 的数学期望 方差和标准差 数学期望 均值 E X x SxfX x 方差 2 E X 2 x S x 2fX x 标准差 2 方差重要公式 2 E X2 E X 2 离散型均匀分布 随机变量 X 称为离散型均匀分布 如果其概率分布为 P X x 1 m x 1 2 m 记为 X disunif m 离散型均匀分布的期望和方差 数学期望 E X m x 1 x 1 m m m 1 2 1 m m 1 2 E X2 m x 1 x2 1 m m m 1 2m 1 6 1 m m 1 2m 1 6 方差 D X E X2 EX 2 m 1 2m 1 6 m 1 2 2 m2 1 12 0 1 分布 随机试验 E 如果只有两个可能结果 成功 S 和失败 F 该试验称为贝努利 Bernoulli 试 验 如果重复进行 n 次独立试验 每次试验中成功的概率都是 p 则称为 n 重贝努利试验 在一次贝努利试验中 记随机变量 X 1结果为S 0结果为F 设成功的概率为 p 则 X 的概率分布为 P X x px 1 p 1 x x 0 1 称为 0 1 分布或两点分布 EX p 2 pq 13 二项分布 在 n 重贝努利试验 如果每次试验中成功的概率都是 p 记 X 为成功的次数 则称 X 服从二 项分布 Binomial 记为 X B n p 其概率分布为 P X x n x px 1 p n x x 0 1 n 验证 n x 0P X x p q n 1 二项分布的期望和方差 均值 E X n x 0 x n x px 1 p n x n x 1 x n x n x p x 1 p n x np n x 1 n 1 x 1 px 1 1 p n 1 x 1 np p 1 p n 1 np E X X 1 n x 0 x x 1 n x px 1 p n x n n 1 p2 方差 D X E X X 1 E X E X 2 n n 1 p2 np np 2 np 1 p n 20 及不同概率 p 下的二项分布 14 05101520 0 00 10 20 3 p 0 05 Probability 05101520 0 000 050 100 150 20 p 0 25 Probability 05101520 0 000 050 100 15 p 0 5 Probability 05101520 0 000 050 100 150 20 p 0 75 Probability 当 n 充分大时 二项分布趋向于正态分布 B n p 分布 p 0 2 及 n 10 50 100 300 15 n 10 Density 02468 0 00 10 20 3 n 50 Density 0510152025 0 000 040 080 12 n 100 Density 510152025303540 0 000 040 08 n 300 Density 30405060708090 0 000 020 040 06 例 2 2 二项分布的概率计算 若一年中某类保险人死亡率为 0 005 现有 10000 人参保 试求一年内这些参保人中 1 有 40 人死亡的概率 2 死亡人数不超过 70 人的概率 解 1 P X 40 10000 40 0 005400 9959960 0 021 在 Excel BINOM DIST 40 10000 0 005 FALSE 2 P X 70 70 i 0 10000 i 0 005i0 99510000 i 0 997 在 Excel BINOM DIST 70 10000 0 005 TRUE 几何分布 假设不断重复贝努利试验 设 X 为首次成功时所进行的试验次数 则 X 概率函数 pmf 为 f x P X x p 1 p x 1 x 1 2 称为几何分布 记为 X geom p 验证 x 1P X x 1 思考题 假设 X 表示第 r 次成功之前的失败次数 则 X 服从什么分布 16 泊松分布 稀疏 事件 同一时刻发生两件以上事件的概率为 0 的计数分布 通常服从泊松分布 如 1 天内交通事故数 一篇毕业论文中的错别字数 内分钟接到大电话数 每年发生的公布袭击次数 每分钟加入排队打饭队列的人数 每分钟某网站的访问次数 泊松分布的定义 假设随机变量 X 表示单位时间内 0 1 某事件的发生次数 参数 为单位时间内该事件的平均 发生次数 则 P X x xe x x 0 1 2 称为泊松分布 记为 X P 验证 x 0P X x e e 1 若 X 表示在时间区间 0 t 内事件发生的次数 则 X P t 泊松分布的期望和方差 数学期望 E X x 0 x x x e x 1 x 1 x 1 e e e E X X 1 x 1 x x 1 x x e 2 方差 D X E X X 1 E X E X 2 2 2 泊松分布是唯一均值与方差相等的分布 泊松过程 流 一个连续时间的计数过程 N t t 0 如果满足下列特点 则称为泊松过程 1 N 0 0 2 平稳性任何时间内发生次数只与时间间隔的长短有关 与初始时刻无关 3 无后效性不同时间段事件的发生相互独立 4 普通性 在很小的时间间隔内 同时发生两件或以上事件的概率为 0 17 例 2 3 美国大规模枪击案 2012 年 12 月 美国康涅狄格州发生校园枪击案 28 人死亡 深大一位女教师不幸身亡 资料 显示 1982 年至 2012 年 美国共发生 62 起 大规模 枪击案 其中 2012 年发生了 7 起 是次 数最多的一年 这是巧合 还是表明美国治安恶化了 1982 2012 年美国枪击案数据 枪击案次数01234567 年数313553101 数据来源 参考资料 Aatish Bhatia 2012 Are mass shootings really random events A look at the US numbers mass shootings really random events a look at the us numbers 美国枪击案 泊松分布 目的 利用过去 30 年数据 不包含 2012 年 判断 2012 年是否属于正常的泊松分布 总体分布 X P 平均每年枪击案发生率 1 833 按泊松分布计算发生枪击案次数的 概率 Excel 函数 POISSON DIST 枪击案次数01234567 频率0 1000 4330 1670 1670 1000 0330 0000 033 概率0 1600 2930 2690 1640 0750 0280 0080 002 Poisson 分布图 参数 5 时泊松分布 18 x Density 05101520 0 000 050 100 15 2 2连续型随机变量 概率密度函数 pdf 函数 f x 称为随机变量 X 的概率密度函数 probability density function pdf 如果 1 f x 0 x R 2 x Rf x dx 1 记为 X f x 对连续型随机变量 事件 A 发生的概率为 P X A x A f x dx 分布函数 cdf 假设 f x 为随机变量 X 的概率密度函数 则如下定义的函数 F x 称为分布函数 cdf F x P X x t f x dx 性质 1 F x 是非减函数 2 F x 为连续函数 3 如果 f x 在点 x 处连续 则 F x f x 4 limx F x 0 limx F x 1 19 数学期望和方差 连续型随机变量 X 的任意函数 Z g X 的数学期望为 E g X g x f x dx X 的数学期望为 E X xf x dx X 的方差为 2 E X 2 x 2f x dx 均匀分布 如果随机变量 X 具有如下密度函数 f x 1 b a a x b 0 otherwise 则称 X 服从 a b 区间上的均匀分布 记为 X U a b 其分布函数为 F x 0 x a x a b a a x 0 0 x 0 20 其分布函数为 F x 1 e xx 0 0 x 0 有时参数用 1 表示 均值 E X 1 方差 D X 1 2 证明 要用分部积分公式哦 例 2 4 指数分布概率计算 Example 16 假设超市里一位顾客的收银时间服从指数分布 X exp 1 3 即平均每位顾客收银 时间为 3 分钟 试求某顾客收银时间不超过 2 分钟的概率 解 P X 2 1 e 2 3 0 487 Excel 函数 EXPON DIST 2 1 3 TRUE 正态分布 随机变量 X 称为正态分布 或高斯分布 如果其 pdf 为 f x 1 2 exp x 2 2 2 x 记为 X N 2 可以证明 E X D X 2 其密度函数 f x 具有特点 1 曲线 y f x 关于 x 对称 2 当 x 时 f x 达到最大值 3 固定 改变 曲线延 x 轴平移 形状不变 固定 越小 曲线越集中于中间部位 所 以通常称 为位置参数 为刻度参数 Normal Curves 21 2024 0 00 20 40 60 81 0 x density X 0 X 1 Y 2 Y 0 5 标准正态分布 当 0 1 时 X 称为标准正态分布 记为 X N 0 1 其 pdf 记为 x 其 cdf 记为 x x 1 2 e x 2 2 x x 1 2 e t 2 2dt 显然 x 1 x Excel 函数 NORM DIST X Mean Standard dev Cumulative 其中 Cumulative TRUE 表示分布函数 x Cumulative FALSE 表示概率密度函数 x 正态分布常用概率 设 X N 2 则 P 1 X 1 68 P 2 X 2 95 44 P 3 X 3 99 73 P 1 96 X 0 2 0 1 1 则称 X Y 服从二维正态分布 记为 X Y N2 1 2 2 1 2 2 可以证明 边缘分布 X N 1 2 1 Y N 2 22 二维正态分布的矩阵表示 记 1 2 T 2 1 1 2 1 2 2 2 称 X X1 X2 T N2 若其联合 pdf 为 f x 1 2 1 2 exp 1 2 x T 1 x 其中 x x1 x2 T 例 3 2 二维离散型联合分布 Example 21 设 A B 为随机事件 已知 P A 1 4 P B A 1 2 P A B 1 4 定义随机变量 X 1 A 发生 0A 不发生 Y 1 B 发生 0B 不发生 试求 X Y 的联合分布和边缘分布 解 P AB P A P B A 1 4 1 2 1 8 又 P AB P B P A B 1 4P B 所以 P B 1 2 边缘分布 26 X01 pk3 41 4 Y01 pk1 21 2 联合分布 P X 1 Y 1 P AB 1 8 P X 0 Y 1 P AB P B P AB 3 8 P X 1 Y 0 P A B P A P AB 1 8 P X 0 Y 0 P A B 1 P A B 3 8 X Y 01 03 83 8 11 81 8 例 3 3 连续型 r v 的联合与边缘分布 Example 22 设 X Y 的联合密度函数为 f x y 1 0 x 1 y x 0 其它 求关于 X Y 的边缘分布 1 关于 X 的边缘分布 若 x 0 或 x 1 有 fX x 0 对于 0 x 1 有 fX x f x y dy x x 1dx 2x 所以 fX x 2x 0 x 1 有 fY y 0 对于 1 y 0 有 fY y f x y dx 1 y 1dx 1 y 对于 0 y 1 有 fY y f x y dx 1 y 1dx 1 y 27 所以关于 Y 的边缘分布 fY y 1 y 1 y 0 1 y 0 y 0 则称 P X xi Y yj P X xi Y yj P Y yj pij p j i 1 2 为在 Y yj条件下 X 的条件概率分布 连续型条件分布 Definition 24 设 X Y 的联合密度函数为 f x y 并且 fY y 0 则在 Y y 条件下 X 的 条件概率密度函数为 fX Y x y f x y fY y 同理定义 fY X y x 重要公式 f x y fX x fY x y x fY y fX y x y 随机变量的独立性 Definition 25 设 X Y 的联合分布函数为 F x y 边缘分布函数分别为 FX x 和 FY y 若 F x y FX x FY y 对任意实数 x y 成立 则称随机变量 X 与 Y 相互独立 Corollary 26 1 若 X Y 为离散型 则 X 与 Y 相互独立的充要条件为 P X xi Y yj P X xi P Y yj i j 1 2 2 若 X Y 为连续型 则 X 与 Y 相互独立的充要条件为 f x y fX x fY y x y R 只要等式在其中一个点不成立 X 与 Y 就不是相互独立 多个随机变量的独立性 Definition 27 设 X1 X2 Xn 的联合分布函数为 F x1 x2 xn FXi xi 为 Xi的边缘 分布函数 若 F x1 x2 xn n i 1 FXi xi 对任意 n 个实数 x1 x2 xn成立 则称 X1 X2 Xn相互独立 29 例 3 5 条件分布 Example 28 设 X Y 的联合密度函数为 f x y e x 0 y x 0 其它 1 求条件密度 fY X y x 2 X 与 Y 是否相互独立 3 求条件概率 P X 1 Y 0 故条件密度为 fY X y x f x y fX x 1 x 0 y 0 因为 f 2 1 e 2 fX 2 2e 2 fY 1 e 1 f 2 1 fX 2 fY 1 所以 X 与 Y 不独立 判断不独立 只需要在某一点不成立 3 条件概率 P X 1 Y 1 P X 1 Y 1 P Y 1 P X 1 Y 1 x 1 y 1 f x y dxdy 1 0 dx x 0 e xdy 1 0 xe xdx x e x 1 0 1 0 e x dx 1 2e 1 30 知道为什么先积 y 后积 x 吗 P Y 1 1 0 e ydy 1 e 1 所以所求条件概率 P X 1 Y 1 P X 1 Y 1 P Y 0 FY y P Y y P lnX y P X e y 1 FX e y 0 e y 0 1 e y Y 的密度函数为 fY y F Y y e y y 0 因此 Y exp 1 一个随机变量的变换法 Theorem 30 设 X 的密度函数为 fX x 令 U g X 为一一对应函数 并存在可导反函数 X g 1 U 则 U g X 的密度函数为 fU u fX x dx du 其中等式右边 x g 1 u 例 4 2 变换法 Example 31 设 X N 2 试求 Y eX的分布 解 注意 ex 0 所以 Y 的取值范围是 0 由 y ex反解出 x lny 从而 dx dy 1 y 因此 对任何 y 0 fY y fX x 1 y 1 y 2 exp lny 2 2 2 这个密度函数称为对数正态分布 记为 Y lnorm 2 4 2两个随机变量的函数的分布 例 4 3 分布函数法 Example 32 设 X Y 的联合密度分布为 f x y 2 x y 0 x 1 0 y 1 0 其它 求 U X Y Fact 33 卷积公式 已知 X Y f x y 则 U X Y 的密度函数为 fU u f x u x dx 32 解 U 的取值范围是 0 u 2 对任意 0 u 1 fU u u 0 2 x dx 2u u2 对 1 u 2 fU u 1 u 1 2 x dx 2 u 2 因此 U 的密度函数为 fU u 2u u2 0 u 1 2 u 21 u 2 0 其它 二维随机变量的变换法 Theorem 34 设 X Y 的联合密度函数为 f x y 令 U g X Y V h X Y 为一一对应函 数 则 U V 的联合密度函数为 fUV u v f x y J 其中 J 为雅可比 Jacobian 行列式的绝对值 J x u x v y u y v 例 4 4 二维变换法 Example 35 设 X Y 的联合密度分布为 f x y 2 x y 0 x 1 0 y 1 0 其它 求 U X Y 解 令 U X Y V Y 则 X U V Y V 则 1 取值范围 SXY x y 0 x 1 0 y 1 SUV u v v u v 1 0 v 1 图形 图形 2 Jacobian 为 J 1 1 01 1 U V 的联合密度函数为 fUV u v f x y J 2 u v u v 1 0 v 1 0 其它 33 因此 U 的密度函数为 fU u fUV u v dv u 0 2 u dv 2 u u 0 u 1 1 u 1 2 u dv 2 u 2 1 u 2 0 其它 本节小结 学完本节 你需要掌握如何 1 求一个随机变量的函数 Z g X 的分布 2 求二个随机变量的函数 Z g X Y 的分布 3 对同学中的 Outliers 可以考虑更一般的 n 个随机变量的变换的分布 5随机变量的数字特征 本节要点 随机变量的数学期望和方差的基本性质 协方差及相关系数 5 1数学期望与方差 数学期望的基本性质 1 E aX b aE X b 2 E aX bY aE X bE Y 3 若 X 与 Y 相互独立 则 E XY E X E Y 反之不然 方差的基本性质 1 D aX b a2D X 2 D X E X2 E X 2 3 若 X 与 Y 相互独立 则 D X Y D X D Y 反之不然 4 D X 0 的充要条件是 X 为常数 以概率 1 成立 34 二维随机变量函数的数学期望 设 Z g X Y 二维变量 X Y 的函数 则 Z 的数学期望为 E Z E g X Y R2 g x y f x y dxdy 边缘分布的期望 Z g X Y X E X R2 xf x y dxdy Z g X Y XY E XY R2 xyf x y dxdy 5 2协方差与相关系数 协方差 Definition 36 随机变量 X 与 Y 的协方差 Covariance 定义为 Cov X Y E X X Y Y 1 离散型 P X xi Y yj pij Cov X Y i j xi E X yj E Y pij 2 连续型 X Y f x y Cov X Y x E X y E Y f x y dxdy 协方差的性质 1 Cov X Y E XY E X E Y 2 Cov aX bY abCov X Y 3 Cov X Y Cov Y X 4 Cov X X D X 5 Cov aX1 bX2 Y aCov X1 Y bCov X2 Y 6 D aX bY a2D X b2D Y 2abCov X Y 35 相关系数 Definitions 37 X 与 Y 之间的相关系数定义为 XY Cov X Y X Y Definition 38 若 XY 0 则称 X 与 Y 不相关 Corollary 39 若 X Y 服从二维正态分布 则 X 与 Y 相互独立 X 与 Y 不相关 若 X 与 Y 相互独立 则它们一定不相关 反之不然 相关系数的性质 Theorem 40 1 XY 1 2 XY 1 当且仅当 Y 是 X 的线性函数 以概率 1 成立 哥西不等式 Cov X Y 2 D X D Y 例 5 1 单位园上的均匀分布 Example 41 设 X Y 服从单位园 A x2 y2 1 上的均匀分布 试求 1 求 X 与 Y 边缘分布 2 判断 X 与 Y 的独立性 3 求 X 与 Y 的相关系数 1 联合及边缘分布 X Y 的联合 pdf f x y 1 x2 y2 1 边缘 pdf 分别为 fX x 2 1 x2 x 1 fY y 2 1 y2 y 1 2 独立性 因为 f x y fX x fY y 所以 X 与 Y 不独立 3 相关系数 36 E X 1 1 x 2 1 x2dx 0 E Y 0 E XY xyf x y dxdy 1 1 dx 1 x2 1 x2 xy 1 dy 0 Cov X Y E XY E X E Y 0 所以 X 与 Y 不相关 本例说明 X 与 Y 独立 一定不相关 但不相关 不一定独立 例 5 2 求相关系数 Example 42 设 X Y 的联合密度函数为 f x y 1 0 x 1 y x 0 其它 分别求关于 X Y 的期望 方差和相关系数 1 关于 X 的期望和方差 已知 fX x 2x 0 x 1 0 其它 所以 E X 2 3 D X 1 18 2 关于 Y 的期望和方差 fY y 1 y 1 y 0 1 y 0 y 1 0 其它 1 y y 1 0 其它 E Y 0 1 y 1 y dy 1 0 y 1 y dy 0 3 相关系数 E XY xyf x y dxdy 1 0 dx x x xy 1dy 0 Cov X Y E XY E X E Y 0 所以 X 与 Y 不相关 显然 因为 f x y fX x fY y 所以 X 与 Y 不独立 看来 X 与 Y 不相关 但它们不独立 并不少见哦 再看 X N 0 1 Y X2 则 X 与 Y 当然不独立 但 E X 0 E XY E X3 0 所以 Cov X Y 0 37 本节小结 学完本节 你需要 1 能运用数学期望和方差的基本性质 2 知道二元联合分布 能求出协方差和相关系数 6大数定律和中心极限定理 本节要点 鼎鼎大名的大数定律和中心极限定理 6 1大数定律 切比雪夫不等式 设随机变量 X 具有数学期望 E X 和方差 D X 2 则对任意正数 有 P X 2 2 或 P X 1 2 2 切比雪夫定理 Theorem 43 切比雪夫定理 设 X1 X2 Xn 是相互独立的随机变量序列 E Xi 和 D Xi 都存在且 D Xi C i 1 2 则对任意正数 有 lim n P 1 n n i 1 Xi E Xi 1 大数定律 Theorem 44 贝努利大数定理 设 nA是 n 次独立重复试验中事件 A 发生的次数 p 是事件 A 在每次试验中发生的概率 则对任意正数 有 lim n P nA n p 1 即 nA n 依概率收敛于 p nA n P p 38 大数定律 Theorem 45 辛钦定理 设 X1 X2 Xn 是独立同分布 iid 的随机变量序列 且具有 E Xi i 1 2 则对任意正数 有 lim n P 1 n n i 1 X 0 使得 lim n 1 B2 n n i 1 E Xi i 2 0 则随机变量 Yn 1 Bn n i 1 Xn n 依分布收敛于标准正态分布 即 Yn的分布函数 Fn x 满足 lim n Fn x x x 本节小结 学完本节 你需要知道 1 大数定理 随机序列的平均值依概率收敛于总体均值 2 中心极限定理 随机序列之和标准化后依分布收敛于标准正态分布 不可不知 不过 知道就好啦 39 7样本及抽样分布 本节要点 几个常用抽样分布 正态 2 t 分布 F 分布 来自正态总体的常用统计量 X S2 T 等 如何用这些统计量于推断总体参数 7 1总体 样本及统计量 总体与样本 Definitions 48 总体 所研究的全部元素组成的集合称为总体或母体 Population 总体中的某 项数量指标通常用随机变量 X 表示 Definition 49 样本 对总体指标 X 进行 n 次观察 得到一组指标值 x1 x2 xn 称为容量 为 n 的样本观察值 Observations 由于抽取样本具有随机性 进行理论研究时又可以看做随机向 量 X X1 X2 Xn T 称为容量为 n 的样本 如果 X1 X2 Xn为独立同分布 且与总体 X 分布相同 则称为简单随机样本 简称样本 统计量 Definition 50 来自总体 X 的样本 X1 X2 Xn的连续函数 T g X1 X2 Xn 且不包 含任何未知参数 称为一个统计量 常用统计量 1 样本均值 X 1 n n i 1Xi 2 样本方差 S2 1 n 1 n i 1 Xi X 2 3 样本标准差 S S2 4 样本 k 阶原点矩 Ak 1 n n i 1X k i 5 样本 k 阶中心矩 Bk 1 n n i 1 Xi X k 抽样分布 研究统计量的分布 以便对总体的数字特征进行推断 1 精确分布 对每个 n 求出统计量 Tn g X1 X2 Xn 的分布 2 大样本分布 当 n 时 统计量 Tn的极限分布 正常情况下 是正态分布 40 7 2几种常用抽样分布 正态总体样本的线性函数 Theorem 51 设 X1 X2 Xn为来自正态总体 N 2 的一个样本 则统计量 T a1X1 a2X2 anXn也服从正态分布 且 E T n i 1 ai D T 2 n i 1 a2 k 特别 样本均值的分布 X N 2 n 2分布 Definition 52 设 X1 X2 Xn独立同分布于 N 0 1 则统计量 X n i 1 X2 i 称为服从 n 个自由度的 2分布 记为 X 2 n 其密度函数为 f x 1 2n 2 n 2 x n 2 1e x 2 x 0 均值 n 及方差 2 2n 性质 若 X1 2 n1 X2 2 n2 且相互独立 则 X1 X2 2 n1 n2 2 m 密度曲线 41 05101520 0 000 050 100 150 200 25 x y df 3 4 5 10 15 t 分布 Definition 53 设 X N 0 1 Y 2 n 且相互独立 则称 T X Y n t n 为服从自由度为 n 的 t 分布 t n 的密度函数 f x C 1 x2 n n 1 2 x 均值 E T 0 方差 D T n n 2 t 分布性质 1 t 分布密度函数关于 x 0 对称 2 t 分布的极限分布是标准正态分布 即当 n 充分大时 t n N 0 1 3 当 n 30 时 t n 与 N 0 1 差距较大 t n 比 N 0 1 更长 更厚 的尾部 42 t 分布密度曲线 6 4 20246 0 00 10 20 30 4 z or t density normal t1 t3 F 分布 Definitions 54 设 X 2 m Y 2 n 且相互独立 则称 F X m Y n F m n 为服从自由度为 m n 的 F 分布 性质 1 若 X F m n 则 Y 1 X F n m 2 若 X t n 则 X2 F 1 n 7 3正态总体的抽样分布 样本均值与样本方差的分布 Theorem 55 设 X1 X2 Xn为来自正态总体 N 2 的一个样本 X 和 S2分别为样本均 值与样本方差 则有 43 1 X 与 S2独立 2 X N 2 n 3 n 1 S2 2 2 n 1 用于推断总体均值 和总体方差 2 T 统计量的分布 Theorem 56 设 X1 X2 Xn为来自正态总体 N 2 的一个样本 X 和 S2分别为样本均 值与样本方差 则有 T X S n t n 1 用于推断总体均值 总体方差 2未知情形 比较两个总体的统计量 Theorem 57 设 X1 X2 Xn1和 Y1 Y2 Yn2分别为来自正态总体 N 1 2 1 和 N 2 22 的样本 且相互独立 样本均值与样本方差分别为 X1 X2和 S2 1 S22 则有 1 S2 1 S 2 2 2 1 2 2 F n1 1 n2 1 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论