数据模型与决策之离散概率分布(PPT 54页).ppt_第1页
数据模型与决策之离散概率分布(PPT 54页).ppt_第2页
数据模型与决策之离散概率分布(PPT 54页).ppt_第3页
数据模型与决策之离散概率分布(PPT 54页).ppt_第4页
数据模型与决策之离散概率分布(PPT 54页).ppt_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据、模型与决策,丁邦俊,第二讲 离散概率分布,离散概率基础,概率第一定律: 任何事件的概率都是0和1之间的数. 例 将一枚均匀的硬币抛出,观察是正面向上还是反面向上,由完备性和对称性,这两个结果出现的可能性相等,即 P(出现正面)=0.5; P(出现反面)=0.5,概率:是指不确定的结果出现的可能性。 例 从一副扑克牌(通常去掉大小猴)中任取一张,取到的是A,这种可能性就是概率。,概率第二定律: 如果事件A和事件B是互斥的,那么P(A或B)=P(A)+P(B),举例:从一副扑克牌中随机抽取一张,记A=“方快10”, B=“K”,那么,事件A和事件B是互斥的,于是,P

2、(A或B)=P(A)+P(B)=1/52+4/52=5/52,离散概率基础,离散概率基础,概率第三定律: 符号A|B表示事件B发生的情况下出现了事件A, 则 P(A|B) 例: 从一副扑克牌中随机抽取一张,记 A=“该牌是任何花色K”, B=“该牌是花牌(J、Q、K)” 则 P(A|B)=P(A B)/P(B)=,离散概率基础,例 一个班级学生情况统计如下,求 P(C|M),解:P(C|M)=,离散概率基础,这个班学生的概率分布为,另解:P(C|M)=,离散概率基础,同理,可求P(M|C)=25/70,第三定律也可以写成:,或:,这就是概率的乘法公式。,公式中的符号“”也可省去。,离散概率基础

3、,概率第四定律: 如果A、B是相互独立的事件P(A|B)=P(A),举例: 从一副扑克牌中随机抽取一张,记 A=“该牌是一张5”, B=“该牌是梅花” “AB”=“该牌是梅花5”,所以, P(A)= P(A|B),则 P(A)=4/52=1/13 P(A|B)=P(A和B)/P(B)=,离散概率基础,第四定律也可以写成:,或:,即:独立的两个事件乘积的概率等于概率的乘积。,这也叫概率的乘法公式。,如何计算决策树中的概率,Caroline Janse是一家消费品公司市场销售经理,她正在考虑是否生产一种无泡沫的新型自动洗碗清洁剂。为了使得该问题简化,我们假设市场要么是疲软的,要么是坚挺的。如果市场

4、是坚挺的,那么公司将赢利1800万美元,如果市场是疲软的,那么公司将亏损800万美元, 根据经验和直觉的综合考虑,卡罗林估计市场是坚挺的概率为30% 在决定是否生产之前,她可以对无泡沫市场进行一项全国性的调查测试,费用将达到240万美元。,这种市场调查测试不可能完全准确预测新产品市场,也就是说,它可能会误导新产品市场。过去的这类调查结果表明:如果市场是疲软的(weakly),那么有10%的可能性测试结果对市场是肯定的(Yes),同样,如果市场是坚挺的(strong),那么有20%的可能性测试结果对市场是否定的(No)。 卡罗林可以决定要么不生产无泡沫产品,要么在决定是否生产之前,进行调查测试;

5、要么不进行调查测试,直接进行生产。 利用第一讲的方法,我们对Caroline问题构造了如下的决策树:,A,C,G,不生产,市场调查测试,否定的调查结果,不生产,不调查,生产,市场坚挺,市场疲软,B,F,生产,不生产,D,生产,市场坚挺,市场疲软,E,市场坚挺,市场疲软,0.3,0.7,1800,-800,-240,-1040,1560,-1040,1560,-240,p1=?,p2=?,p3=?,p4=?,p5=?,p6=?,答案 p1=0.310 p2=0.690 p3=0.774 p4=0.226 p5=0.087 p6=0.913,肯定的调查结果,解:记 S=市场坚挺, W=市场疲软 Y

6、=调查结果是肯定的 N=调查结果是否定的,P(W)=1- P(S)=1-0.3=0.7,由已知:P(S)=0.30, P(Y|W)=0.1, P(N|S)=0.20,P(Y和W)=P(Y|W)P(W)=0.1*0.7=0.07,P(Y|S)=1-P(N|S)=1-0.20=0.80,,P(N|W)=1-P(Y|W)=1-0.10=0.90.,P1=0.31 P2=0.69 P3=P(S|Y) =P(SQ)/P(Y)=0.24/0.31=0.774 P4=P(W|Y)=P(W Q)/P(Y)=0.07/0.31=0.226 P5=P(S|N) =P(S N)/P(N)=0.06/0.69=0.0

7、87 P6=P(W|N) =P(W N)/P(N)=0.63/0.69=0.913,A,C,G,不生产,市场调查测试,否定的调查结果,不生产,不调查,生产,市场坚挺,市场疲软,B,F,生产,不生产,D,生产,市场疲软,E,市场坚挺,市场疲软,0.3,0.7,1800,-800,-240,-1040,1560,-1040,-240,p1=0.31,p2=0.69,P3=0.774,p4=0.226,P5=0.087,p6=0913,肯定的调查结果,1560,市场坚挺,972.4,-813.8,-240,972.4,135.84,-20,135.84,Caroline的最佳策略是:,首先选择市场调

8、查测试;,当市场调查测试给出肯定的结果时,她选择生产;当市场调查测试给出否定的结果时,她选择不生产;,这一决策的EMV是$135.84。,随机变量及其分布,斯隆学院的学生暑期工作的收入资料假定被收集到了,去年的情况是这样的(指第一年的MBA学生的收入):,随机变量及其分布,上面的表格就是斯隆学院的学生暑期工作的周收入(假设为X)的分布,随机变量:一个概率模型中可以用数值表 示一个不确定的量。用大写的字母X、Y、W 等表示,如:X=“斯隆学院的学生暑期工作的周收入”,Y=“一个硬币抛2次,出现的正面数”,W=“上海市明年7月份的降雨的毫米数”,随机变量及其分布,随机变量的分布需要指出其取值和相应

9、的概率,通常用表格或函数表示,表格法:X=Bill参加校园招聘计划的收入,函数法:设Y= “一个硬币抛2次,出现的正面数”,p=抛一次硬币出现正面的概率,二项分布,每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率 p 对每次试验结果是相同,进行n次重复试验,出现“成功”的次数的概率分布称为二项分布,设X为n次重复试验中事件A出现的次数,X 取x 的概率为,二项分布(Excel),计算二项分布的函数是 BINOMDIST(k,n,p,cumulative),它有两种形式,例 生产过程的质量控制 假如一个生产过程的产品为合格品的概率是0.83,为废品的概率是0.17,现在假设生产

10、5个这样的产品,求其中至少有一个是废品的概率。,解 p=,二项分布的应用,案例分析:航空公司机票超售问题,整概率分布的体指标,平均值 方差与标准差,概率分布的整体指标,平均值:也称期望,定义为随机变量的取值与相应的概率相乘,再将所有乘积求和的结果,公式是:,例:X=Bill参加校园招聘计划的收入,这个数字含义非常清楚, 它就是 Bill能够获得期望收入,期望值与轮盘赌,长期来看,庄家必赢,概率分布的整体指标,方差:定义为随机变量与其期望偏差的平方的期望公式是:,例:X=Bill参加校园招聘计划的收入,这个数字特别大,其单位是平方美 元,与X的单位不一致,它的算术平 方根是3458.60美元,与

11、X的单位一致, 人们更喜欢使用,并称它为标准差,随机变量的线性函数,考虑到Bill参加校园招聘计划有一定的成本(与接收John的机会相比,有时间成本),假如该成本是600美元,那么Bill暑期打工12周的实际收入R1为: R1=X-600 如果换成月收入,那么Bill暑期打工每月的实际收入R2为 R2=R1= X-200,这是随机变量X的线性函数,随机变量的线性函数,我们可以求出R2的分布:,我们也可以求出R1的分布:,有了R1的分布,我们自然能够求出R1的期望和标准差,并且可以用下面的简化公式。,随机变量的线性函数,例 R1的期望和标准差分别是:,协方差与相关性,实例:太阳镜和雨伞的销售量,

12、问题:太阳镜和雨伞的销售量之间有 关系吗?,协方差与相关性,X与Y的相关性定义为,其中分子COV(X,Y)叫做X与Y的协方差,定义为,例 太阳镜的销售量与雨伞的销售量的相关性为:,联合概率分布与独立性,两个事件A与B的独立性是指 P(AB)=P(A)P(B),考虑随机变量(X,Y)的概率,记(X,Y)的取值为(xi,yi),相应的概率为pi,将它们列出一个表,就是(X,Y)的联合分布,例 记X=“抛一枚均匀硬币出现的正面数” Y= “抛一枚均匀硬币出现的正面数减去反面数”,则X可能的取值是0、1; Y的可能取值是-1,1,联合概率分布与独立性,X与Y的联合分布为:,X,Y,-1,1,0,1,0

13、.5,0,0.5,0,合计,合计,0.5,0.5,1,0.5,0.5,联合概率分布与独立性,两个变量相互独立,当且仅当,对所有x、y都是成立的。,例 (1)上面抛硬币的例子中,X与Y独立。 (2)太阳镜的销售量与雨伞的销售量不独立。 您能验证一下吗?,提示:(1)需要写出四个式子验证。 (2)只要找到一个式子不成立即可。,P(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1,不相关就是指没有任何关系, 比如两个股票,一个涨跌不 影响另一个涨跌。,两个随机变量的和,在投资市场里,通常要考虑资产组合配置,这就涉及到随机变量和的概念,最简单的情况是两个随机变量之和,假设X、Y

14、是两个随机变量,Z=aX+bY,其中a、b是已知常数,那么,从该表达式可以看出: (1)若COV(X,Y)0, 则Var(aX+bY) a2 Var(X)+b2 Var(Y) (2)若COV(X,Y)0, 则Var(aX+bY) a2 Var(X)+b2 Var(Y) 由此可见,选择负相关的两个资产组合投资,可以降低风险。见P91案例,两个随机变量的和,例 假设AB两个资产的投资收益率分别为8%和15%,方差分别是100元和400元,且它们的协方差为-150,现在将1万元投资AB两个资产,求最佳分配比例。,解 设投资资产A、B的比例分别为x、1-x,则资产组合的方差为,由此可见,当x=68.75%时 组合风险达到最小,此时 总收益是68.75%*10000*8% +31.25%*10000*15%=1018.75 即平均收益率是10.1875%,由资产组合确定最佳投资比例,0.6875,股票价格的离散程度反映了投资的风险,资产组合收益的平均大小,资产组合收益的风险,两股票正相关 基本上同时上升和同时下跌,投资组合 两股票正相关,两股票负相关,投资组合 两股票负相关,投资组合,正相关股票的投资组合,均值等于这些股票的均值的和,方差大于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论