数据模型与决策21_第1页
数据模型与决策21_第2页
数据模型与决策21_第3页
数据模型与决策21_第4页
数据模型与决策21_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据、模型与决策丁邦ingbangjunmba@163.com

数据模型与决策21第二讲离散概率分布数据模型与决策21离散概率基础概率第一定律:任何事件的概率都是0和1之间的数.例将一枚均匀的硬币抛出,观察是正面向上还是反面向上,由完备性和对称性,这两个结果出现的可能性相等,即P(出现正面)=0.5;P(出现反面)=0.5概率:是指不确定的结果出现的可能性。例从一副扑克牌(通常去掉大小猴)中任取一张,取到的是A,这种可能性就是概率。数据模型与决策21概率第二定律:如果事件A和事件B是互斥的,那么P(A或B)=P(A)+P(B)举例:从一副扑克牌中随机抽取一张,记A=“方快10”,B=“K”,那么,事件A和事件B是互斥的,于是P(A或B)=P(A)+P(B)=1/52+4/52=5/52离散概率基础数据模型与决策21离散概率基础概率第三定律:符号A|B表示事件B发生的情况下出现了事件A,则

P(A|B)例:从一副扑克牌中随机抽取一张,记

A=“该牌是任何花色K”,

B=“该牌是花牌(J、Q、K)”则P(A|B)=P(A∩B)/P(B)=数据模型与决策21离散概率基础

中国学生(C)外国学生(I)合计男生(M)251540女生(W)451560合计7030100例一个班级学生情况统计如下,求P(C|M)解:P(C|M)=数据模型与决策21离散概率基础

中国学生(C)外国学生(I)合计男生(M)0.250.150.4女生(W)0.450.150.6合计0.700.301这个班学生的概率分布为另解:P(C|M)=数据模型与决策21离散概率基础同理,可求P(M|C)=25/70第三定律也可以写成:或:这就是概率的乘法公式。公式中的符号“∩”也可省去。数据模型与决策21离散概率基础概率第四定律:如果A、B是相互独立的事件P(A|B)=P(A)举例:从一副扑克牌中随机抽取一张,记

A=“该牌是一张5”,B=“该牌是梅花”

“AB”=“该牌是梅花5”所以,P(A)=P(A|B)则P(A)=4/52=1/13P(A|B)=P(A和B)/P(B)=数据模型与决策21离散概率基础第四定律也可以写成:或:即:独立的两个事件乘积的概率等于概率的乘积。这也叫概率的乘法公式。数据模型与决策21如何计算决策树中的概率CarolineJanse是一家消费品公司市场销售经理,她正在考虑是否生产一种无泡沫的新型自动洗碗清洁剂。为了使得该问题简化,我们假设市场要么是疲软的,要么是坚挺的。如果市场是坚挺的,那么公司将赢利1800万美元,如果市场是疲软的,那么公司将亏损800万美元,根据经验和直觉的综合考虑,卡罗林估计市场是坚挺的概率为30%在决定是否生产之前,她可以对无泡沫市场进行一项全国性的调查测试,费用将达到240万美元。数据模型与决策21这种市场调查测试不可能完全准确预测新产品市场,也就是说,它可能会误导新产品市场。过去的这类调查结果表明:如果市场是疲软的(weakly),那么有10%的可能性测试结果对市场是肯定的(Yes),同样,如果市场是坚挺的(strong),那么有20%的可能性测试结果对市场是否定的(No)。卡罗林可以决定要么不生产无泡沫产品,要么在决定是否生产之前,进行调查测试;要么不进行调查测试,直接进行生产。利用第一讲的方法,我们对Caroline问题构造了如下的决策树:数据模型与决策21ACG不生产市场调查测试否定的调查结果不生产不调查,生产市场坚挺市场疲软BF生产不生产D生产市场坚挺市场疲软E市场坚挺市场疲软0.30.71800-800-240-10401560-10401560-240p1=?p2=?p3=?p4=?p5=?p6=?答案p1=0.310p2=0.690p3=0.774p4=0.226p5=0.087p6=0.913肯定的调查结果数据模型与决策21解:记S=市场坚挺,W=市场疲软

Y=调查结果是肯定的

N=调查结果是否定的P(W)=1-P(S)=1-0.3=0.7,由已知:P(S)=0.30,P(Y|W)=0.1,P(N|S)=0.20P(Y和W)=P(Y|W)P(W)=0.1*0.7=0.07,P(Y|S)=1-P(N|S)=1-0.20=0.80,P(N|W)=1-P(Y|W)=1-0.10=0.90.数据模型与决策21P1=0.31P2=0.69P3=P(S|Y)=P(S∩Q)/P(Y)=0.24/0.31=0.774P4=P(W|Y)=P(W∩Q)/P(Y)=0.07/0.31=0.226P5=P(S|N)=P(S∩N)/P(N)=0.06/0.69=0.087P6=P(W|N)=P(W∩N)/P(N)=0.63/0.69=0.913

市场坚挺(S)市场疲软(W)合计市场调查是坚挺的(Y)

0.24

0.070.31市场调查是疲软的(N)

0.06

0.630.69

合计0.300.701.00数据模型与决策21ACG不生产市场调查测试否定的调查结果不生产不调查,生产市场坚挺市场疲软BF生产不生产D生产市场疲软E市场坚挺市场疲软0.30.71800-800-240-10401560-1040-240p1=0.31p2=0.69P3=0.774p4=0.226P5=0.087p6=0913肯定的调查结果1560市场坚挺972.4-813.8-240972.4135.84-20135.84数据模型与决策21Caroline的最佳策略是:首先选择市场调查测试;当市场调查测试给出肯定的结果时,她选择生产;当市场调查测试给出否定的结果时,她选择不生产;这一决策的EMV是$135.84。数据模型与决策21随机变量及其分布

斯隆学院的学生暑期工作的收入资料假定被收集到了,去年的情况是这样的(指第一年的MBA学生的收入):总的工资(12周)获得此类工资的学生所占百分比$21,6005%$16,80025%$12,00040%$6,00025%$05%数据模型与决策21随机变量及其分布

上面的表格就是斯隆学院的学生暑期工作的周收入(假设为X)的分布

随机变量:一个概率模型中可以用数值表示一个不确定的量。用大写的字母X、Y、W等表示如:X=“斯隆学院的学生暑期工作的周收入”

Y=“一个硬币抛2次,出现的正面数”W=“上海市明年7月份的降雨的毫米数”数据模型与决策21随机变量及其分布随机变量的分布需要指出其取值和相应的概率,通常用表格或函数表示表格法:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05函数法:设Y=“一个硬币抛2次,出现的正面数”,p=抛一次硬币出现正面的概率数据模型与决策21二项分布每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率p对每次试验结果是相同,进行n次重复试验,出现“成功”的次数的概率分布称为二项分布设X为n次重复试验中事件A出现的次数,X取x

的概率为数据模型与决策21二项分布(Excel)计算二项分布的函数是

BINOMDIST(k,n,p,cumulative),它有两种形式例生产过程的质量控制假如一个生产过程的产品为合格品的概率是0.83,为废品的概率是0.17,现在假设生产5个这样的产品,求其中至少有一个是废品的概率。解p=数据模型与决策21二项分布的应用案例分析:航空公司机票超售问题数据模型与决策21整概率分布的体指标平均值方差与标准差数据模型与决策21概率分布的整体指标平均值:也称期望,定义为随机变量的取值与相应的概率相乘,再将所有乘积求和的结果,公式是:例:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05这个数字含义非常清楚,它就是Bill能够获得期望收入数据模型与决策21期望值与轮盘赌数据模型与决策21长期来看,庄家必赢数据模型与决策21概率分布的整体指标方差:定义为随机变量与其期望偏差的平方的期望公式是:例:X=Bill参加校园招聘计划的收入X21600168001200060000Pr0.050.250.400.250.05这个数字特别大,其单位是平方美元,与X的单位不一致,它的算术平方根是3458.60美元,与X的单位一致,人们更喜欢使用,并称它为标准差数据模型与决策21随机变量的线性函数考虑到Bill参加校园招聘计划有一定的成本(与接收John的机会相比,有时间成本),假如该成本是600美元,那么Bill暑期打工12周的实际收入R1为:R1=X-600如果换成月收入,那么Bill暑期打工每月的实际收入R2为R2=⅓R1=⅓X-200,这是随机变量X的线性函数数据模型与决策21随机变量的线性函数我们可以求出R2的分布:R12100016200114005600-600Pr0.050.250.400.250.05R17000540038001866-200Pr0.050.250.400.250.05我们也可以求出R1的分布:有了R1的分布,我们自然能够求出R1的期望和标准差,并且可以用下面的简化公式。数据模型与决策21随机变量的线性函数例R1的期望和标准差分别是:数据模型与决策21协方差与相关性实例:太阳镜和雨伞的销售量概率pi太阳镜的销售量xi雨伞的销售量yi0.135410.1578100.058100.130130.216420.0529220.13510.114260.152110.054623问题:太阳镜和雨伞的销售量之间有关系吗?数据模型与决策21协方差与相关性X与Y的相关性定义为其中分子COV(X,Y)叫做X与Y的协方差,定义为例太阳镜的销售量与雨伞的销售量的相关性为:数据模型与决策21联合概率分布与独立性两个事件A与B的独立性是指P(AB)=P(A)P(B)考虑随机变量(X,Y)的概率,记(X,Y)的取值为(xi,yi),相应的概率为pi,将它们列出一个表,就是(X,Y)的联合分布例记X=“抛一枚均匀硬币出现的正面数”Y=“抛一枚均匀硬币出现的正面数减去反面数”则X可能的取值是0、1;Y的可能取值是-1,1数据模型与决策21联合概率分布与独立性X与Y的联合分布为:XY-11010.500.50合计合计0.50.510.50.5数据模型与决策21联合概率分布与独立性两个变量相互独立,当且仅当对所有x、y都是成立的。例(1)上面抛硬币的例子中,X与Y独立。

(2)太阳镜的销售量与雨伞的销售量不独立。您能验证一下吗?提示:(1)需要写出四个式子验证。

(2)只要找到一个式子不成立即可。P(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1不相关就是指没有任何关系,比如两个股票,一个涨跌不影响另一个涨跌。数据模型与决策21两个随机变量的和在投资市场里,通常要考虑资产组合配置,这就涉及到随机变量和的概念,最简单的情况是两个随机变量之和假设X、Y是两个随机变量,Z=aX+bY,其中a、b是已知常数,那么从该表达式可以看出:(1)若COV(X,Y)>0,则Var(aX+bY)>a2Var(X)+b2Var(Y)(2)若COV(X,Y)>0,则Var(aX+bY)<a2Var(X)+b2Var(Y)由此可见,选择负相关的两个资产组合投资,可以降低风险。见P91案例数据模型与决策21两个随机变量的和例假设AB两个资产的投资收益率分别为8%和15%,方差分别是100元和400元,且它们的协方差为-150,现在将1万元投资AB两个资产,求最佳分配比例。解设投资资产A、B的比例分别为x、1-x,则资产组合的方差为由此可见,当x=68.75%时组合风险达到最小,此时总收益是68.75%*10000*8%+31.25%*10000*15%=1018.7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论