已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一 协方差与相关系数的概念及性质 二 相关系数的意义 三 小结 第三节协方差及相关系数 前面我们学习了随机变量的数学期望和方差 对于多维随机变量 除了其数学期望和方差外 我们还要研究反映各分量之间关系的数字特征 其中最重要的 就是现在要讨论的 协方差和相关系数 1 问题的提出 一 协方差与相关系数的概念及性质 在讨论这个问题之前 我们先看一个例子 在研究子女与父母的相象程度时 有一项是关于父亲的身高和其成年儿子身高的关系 这里有两个变量 一个是父亲的身高 一个是成年儿子身高 为了研究二者关系 英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据 画出了一张散点图 问 父亲及其成年儿子身高存在怎样的关系呢 类似的问题有 1 吸烟和患肺癌有什么关系 定义对两个随机向量 X Y 若E X EX Y EY 存在 则称cov X Y E X EX Y EY 为X和Y的协方差 特别 若X Y 则cov X X E X EX 2 D X 因此 方差是协方差的特例 协方差刻画两个随机变量之间的 某种 关系 可以证明若 X Y 服从二维正态分布 即 则 2 定义 可见 若X与Y独立 则 4 计算协方差的一个简单公式 Cov X Y 0 Cov X Y E XY E X E Y D X Y D X D Y 2Cov X Y 3随机变量和的方差与协方差的关系 5 Cov X1 X2 Y Cov X1 Y Cov X2 Y 3 Cov X Y Cov Y X 对称性 5 简单性质 4 Cov aX bY abCov X Y 其中a b是常数 下面请大家利用上面所学的知识进行证明 1 Cov X X D X 2 Cov X c 0 c为常数 协方差的数值在一定程度上反映了X与Y相互间的联系 但它受X与Y本身数值大小的影响 如令X kX Y kY 这时X 与Y 间的相互联系和X与Y的相互联系应该是一样的 但是 Cov X Y k2Cov X Y 为了克服这一缺点 在计算X与Y的协方差之前 先对X与Y进行标准化 再来计算X 和Y 的协方差 这样就引进了相关系数的概念 为随机变量X和Y的相关系数 correlationcoefficient 1 定义 若D X 0 D Y 0 且Cov X Y 存在时 称 在不致引起混淆时 记为 二 相关系数 2 相关系数的性质 注意 XY 的大小反映了X Y之间线性关系的密切程度 XY 0时 X Y之间无线性关系 XY 1时 X Y之间具有线性关系 XY 0 X Y正相关 XY 0 X Y负相关 XY 0 X Y相关 XY 0 X Y不相关 XY 1 X Y完全正相关 XY 1 X Y完全负相关 完全正相关Y aX ba 0 完全负相关Y aX ba 0 x y 0 完全不相关 正相关 负相关 例 将一枚密度均匀硬币抛n次 分别以X和Y记作正反面出现的次数 则X和Y的相关系数为 A 0B 1C 1D 1或 1 解 因为X Y n 即P Y X n 1 所以X与Y完全负相关 故 从而选C 注 若 例2 X Y 的联合分布为 求相关系数 XY 并判断X Y是否相关 是否独立 解 例2 X Y 的联合分布为 求相关系数 XY 并判断X Y是否相关 是否独立 解 从而 另一方面 P X 1 Y 1 1 8 P X 1 P Y 1 3 8 3 8 所以X与Y不独立 这里可以利用相关系数的定义和微积分的知识可得即为X和Y的相关系数 结论 例3 解 X Y不相关 X Y相互独立 X Y不相关 若 X Y 服从二维正态分布 X Y相互独立 X Y不相关 不相关与相互独立 解 例4 这一讲我们主要介绍了协方差和相关系数 相关系数是刻划两个随机变量间线性相关程度的重要的数字特征 它取值在 1到1之间 如果两个变量之间存在强相关 则已知一个变量的值对预测另一个变量的值将很有帮助 如前面几个引例 小结 1 定义 2 协方差矩阵 例设随机变量X和Y相互独立且X N 1 2 Y N 0 1 试求Z 2X Y 3的概率密度 故X和Y的联合分布为正态分布 X和Y的任意线性组合是正态分布 解 X N 1 2 Y N 0 1 且X与Y独立 D Z 4D X D Y 8 1 9 E Z 2E X E Y 3 2 3 5 即Z N E Z D Z 故Z的概率密度是 Z N 5 32 契比雪夫不等式 证明 取连续型随机变量的情况来证明 切比雪夫不等式 得 切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计 从切比雪夫不等式还可以看出 对于给定的 0 当方差越小时 事件 X E X 发生的概率也越小 即X的取值越集中在E X 附近 这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量 当D X 已知时 切贝雪夫不等式给出了X与E X 的偏差小于 的概率的估计值 切比雪夫不等式的用途 1 证明大数定律 2 估计事件的概率 例1已知正常男性成人血液中 每一毫升白细胞数平均是7300 均方差是700 利用切比雪夫不等式估计每毫升白细胞数在5200 9400之间的概率 解 设每毫升白细胞数为X 依题意 E X 7300 D X 7002 所求为P 5200X9400 P 5200X9400 P 2100X E X 2100 P X E X 2100 由切比雪夫不等式 P X E X 2100 即估计每毫升白细胞数在5200 9400之间的概率不小于8 9 例2设电站供电网有10000盏电灯
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- LY/T 2190-2025枣属植物新品种特异性、一致性和稳定性测试指南
- 深度解析(2026)《GBT 35849-2018飞机电连接器压接可拆卸接触件标识系统》
- 深度解析(2026)《GBT 35546-2017工业用衣康酸》
- 高尔夫教练挥杆技巧试题及解析
- 超声技术题目及详解
- 算力基础设施资源共享共建方案
- 法考国际经济法贸易术语试题及解析
- 审计学真题及答案
- 教育心理学考点题目及解析
- 新生儿黄疸护理考核试题及答案解析
- GB/T 20972.3-2025石油天然气工业油气开采中用于含硫化氢环境的材料第3部分:抗开裂耐蚀合金和其他合金
- 兽医屠宰卫生人员考试题库及答案(415题)
- 职业压力管理学习通超星期末考试答案章节答案2024年
- 茶艺课教学教案文档
- (正式版)HGT 6270-2024 防雾涂料
- 自主创业 公平竞争 高中政治统编版选择性必修二
- 有机化学(冯骏材编)课后习题答案
- 大学语文(第三版)课件 秀色
- 能源的获取和利用途径
- 2023年新高考I卷数学高考试卷(原卷+答案)
- 海南省市政安装机械设备安装工程资料
评论
0/150
提交评论