




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据、模型与决策数据、模型与决策 Data, Models and Decisions 线 上 课 程:课 程 回 顾线 上 课 程:课 程 回 顾 复旦大学管理学院统计学系 DMD 线上课程课程回顾, 2015.8.23. 课程回顾课程回顾课程回顾课程回顾 ?概率论基础概率论基础 基本概念与概率计算?基本概念与概率计算 ?随机变量及其概率分布?随机变量及其概率分布 ?离散型随机变量 连续型随机变量?连续型随机变量 ?随机变量及其数字特征?随机变量及其数字特征 ?极限定理 基本概念基本概念基本概念基本概念 ?概率论概率论是一种描述并分析随机性与不确定性的科学?概率论概率论是种描述并分析随机性与不确定性的科学 语言 ?将不确定性看作随机试验随机试验:可重复、不确定?将不确定性看作随机试验随机试验:可重复、不确定 ?随机试验两大要素: 样本点 (样本空间) + 样本点的概率样本点 (样本空间) + 样本点的概率 例1:掷一颗均匀的骰子出现的结果 样本点123456样本点: 1, 2, 3, 4, 5, 6 概率:1/6, 1/6, 1/6, 1/6, 1/6, 1/6 ?三种概率分配法:古典法、频数估计法、主观估计法 ?(随机)事件:若干样本点构成的集合 例1续: A = 掷出偶数点 = 2, 4, 6;P(A)=1/2 概率计算概率计算概率计算概率计算 ?概率计算公式: 样本空间样本空间 A c A ?概率计算公式: ?公式1:1)()(=+ c APAP 样本空间样本空间公式2 (加法公式)样本空间样本空间 AB ?公式2 (加法公式): ()( )( )()BAPBPAPBAP+= ?公式3 (条件概率):() () ( )BP BAP BAP =| (乘法公式)()()( ) 如果 A 与 B 相互独立相互独立 (乘法公式):()()( )BPBAPBAP=| ()()( )APABPBAP=| ()( )APBAP| ?如果 A 与 B 相互独立相互独立,()( )APBAP=| ()( )BPABP=| ()( )( )BPAPBAP= 概率计算概率计算概率计算概率计算 习题习题 某地方银行对其信用卡制度进行审核并考虑收回部分信用卡。过去,大约有 5%的信用卡持有者不履行债务并造成银行无法收回的坏账。因此,管理层认为 某特定信用卡持有者不履行债务的先验概率为0.05。该银行还发现,最终履行债某特定信用卡持有者不履行债务的先验概率为0.05。该银行还发现,最终履行债 务的信用卡持有者有0.20的概率会拖欠到一个月后支付。当然,对于不履行债务 的信用卡持有者,拖欠1个月支付的概率为1。 a. 如果某个信用卡持有者已欠款一个月以上,计算他将不履行债务的后验概率。 b. 如果某个信用卡持有者不履行债务的概率超过0.20,银行就将收回其信用卡。 如果某信用卡持有者已欠款一个月,银行是否会收回其信用卡?为什么? 信用卡持有者不履行债务信用卡持有者履行债务 c A 翻译 = 1 A信用卡持有者不履行债务= 2 A信用卡持有者履行债务 c A1= =B信用卡持有者拖欠一个月后支付 ()()()()()()1| 1 =ABP()2 .0| 2 =ABP()05.0 1 =AP()()95.01 12 =APAP ( )=BP()()()() 2211 |APABPAPABP+=()() 21 ABPABP+24.0= ()BAP| 1 也可以直接用贝叶斯公式 )20.0( () ( )BP BAP = 1 ()() ( )BP APABP 11 | =208. 0 24. 0 05. 01 = = 随机变量随机变量随机变量随机变量 我们用随机试验来描述不确定现象当随机试验?我们用随机试验来描述不确定现象,当随机试验 可能出现的试验结果为数值时,我们将可能的试 验结果称为随机变量随机变量,通常用大写英文字母 X验结果称为随机变量随机变量,通常用大写英文字母 X、 Y 或 Z 等来表示 ?有些随机变量是自然的,有些是人为赋值的?有些随机变量是自然的,有些是人为赋值的 例2:随机变量的例子 X = 掷一颗均匀的骰子出现的点数X 掷颗均匀的骰子出现的点数 Y = 银行某天开业后前两位顾客达到时间之差 Z = 小张面对市场的结果 (0表示疲软、1表示坚挺) ?随机变量按其取值特征可分为两类 ?离散型离散型:可以取有限多个(至多可列)数值() ?连续型连续型:可以在某一区间或多个区间任意取值 离散型随机变量离散型随机变量离散型随机变量离散型随机变量 ?随机变量的概率分布概率分布是描述随机变量取不同值?随机变量的概率分布概率分布是描述随机变量取不同值 的概率 ?对于离散型随机变量 X,其概率分布即为离散?对于离散型随机变量 X,其概率分布即为离散 型概率分布,通过概率函数来定义,记为 f(x) ?列出离散型随机变量的所有可能取值列出离散型随机变量的所有可能取值 ?列出取每个可能值的概率 可能的取值xxx ()XPf)( 例2续X掷颗均匀的骰子出现的点数 可能的取值: 概率: n xxx, 21 L )(,),(),( 21n xfxfxfL () ii xXPxf=)( 1)( 1 = = n i i xf 例2续:X = 掷一颗均匀的骰子出现的点数 可能的取值: 1, 2, 3, 4, 5, 6 概率:1/6, 1/6, 1/6, 1/6, 1/6, 1/6 离散型概率分布离散型概率分布 离散型随机变量离散型随机变量:二项分布二项分布离散型随机变量离散型随机变量:二项分布二项分布 ?随机变量 X = n次独立试验(每次成功概率均为p)中成?随机变量 X = n次独立试验(每次成功概率均为p)中成 功的次数 ?X 的概率分布称为参数为n与p的二项概率分布,记作p X Binomial(n, p) 可能的取值: x = 0, 1, 2, , n, , , 概率:P( X = x) =px(1 p) n-x ! )(! ! xnx n 习题习题 据TD Ameritrade进行的一项调查,有1/4的投资者在其投资组合中有交易所 交易基金(USA Today, 2007.1.11)。考虑20名投资者组成的一个样本。 b 计算至少有两名投资者在其投资组合中有交易所交易基金的概率b. 计算至少有两名投资者在其投资组合中有交易所交易基金的概率; c. 如果你发现恰有12名投资者在其投资组合中有交易所交易基金,你会对调查 结果的精确度产生质疑吗? 翻译翻译 定义 X = 20名投资者中投资组合有交易基金的人数X Binomial(20, 0.25) ()2XP()()101=XPXP9757.0=b. 连续型随机变量连续型随机变量:密度函数密度函数连续型随机变量连续型随机变量:密度函数密度函数 ?连续型:可以在某一区间或多个区间任意取值?连续型:可以在某区间或多个区间任意取值 ?连续型随机变量概率分布的刻画:概率密度函数 (probability density function) f(x)(probability density function) f(x) 连续型随机变量连续型随机变量X 的密度函数的密度函数 f(x) () 0.15 0.2 曲线下总 面积 = 1 ()bXaP 0.1 0 5面积 1 计算密度函数 下的面积需 0.05 f(x)下的面积需 要使用定积分 0 52545658606264 ab 连续型随机变量连续型随机变量:分布函数分布函数连续型随机变量连续型随机变量:分布函数分布函数 连续型随机变量概率的计算累积分布函数?连续型随机变量概率的计算:累积分布函数 (cumulative distribution function) F(x)()xXP= 0.9 1 F(x) 0.6 0.7 0.8 0 3 0.4 0.5 0.1 0.2 0.3 0 52545658606264 x 连续型随机变量连续型随机变量:分布函数分布函数连续型随机变量连续型随机变量:分布函数分布函数 ?若X的分布函数为F(x),则 f(x) ()(xFxXP= f( ) ()xXP()xXP=1 )(1xF= x f( ) ()d f(x) ()dXcP ()()cXPdXP= cd 我们可以在概率的计算中任意调换 )()(cFdF= 我们可以在概率的计算中任意调换 “ ” 与 “” 随机变量的数字特征随机变量的数字特征随机变量的数字特征随机变量的数字特征 ?随机变量的概率分布给出了该随机变量包含的所有?随机变量的概率分布给出了该随机变量包含的所有 信息,但其往往包含了为数众多的数值,使得人们 难以得到直观理解 ?因此,我们希望用若干简单的数字数字来对概率分布的 信息进行汇总,以概括地表达随机变量的特征 ?X (离散型)的数学期望或均值为 () = n i n i iiiiX xxfxxXPXE 11 )()() =ii iiiiX f 11 )()( ?X (离散型)的方差为 = = n i XiiX xxfXVar 1 22 )()( 对于连续型随机变量可以用定积分定义均值方差以 ?X 的标准差为)(XVar X = ?对于连续型随机变量可以用定积分定义均值、方差以 及标准差 连续型随机变量连续型随机变量:正态分布正态分布连续型随机变量连续型随机变量:正态分布正态分布 正态(概率)分布又称高斯分布是描述连续?正态(概率)分布,又称高斯分布,是描述连续 型随机变量最重要的概率分布,也是概率论与 统计学中最重要的分布统计学中最重要的分布 ?若一个随机变量 X 服从均值为与标准差为 的正态分布则将其记为)(NX的正态分布,则将其记为 ?正态分布的密度函数: 2 2 2 )( 2 1 )( = x exf ),(NX 正态分布的密度函数: 2 f(x) x 正态分布的概率计算正态分布的概率计算正态分布的概率计算正态分布的概率计算 )(NX如果随机变量那么),(NX ?如果随机变量,那么 )1 ,0( N X Z = ?基于这个事实 ),( ()bXaP = bXa P = b Z a P b = a ZP b ZP ab = a F b F 正态分布的概率计算正态分布的概率计算正态分布的概率计算正态分布的概率计算 习题习题 由于相对高的利息率,许多消费者都立即还清信用卡上的欠账,但并不 永远这样。我们发现信用卡持有者所付利息服从均值为27元和标准差为7元的 正态分布。正态分布。 a.信用卡持有者所付利息超过30元的比例是多少? d. 请问只有20%的信用卡持有者所付利息超过它的利息值是多少? a. 翻译 定义 X = 信用卡持有者所付的利息X N (27, 7) ()30XP()4286.0(14286.0 7 2730 7 27 FZP X P= = 77 3336.0= d. 设该利息值为 x,则应有()2.0= xXP ()2.0 7 27 1 7 27 7 27 = = = x F xX PxXP 查表可得于是840 27x 查表可得,于是84.0 7 27 = x 88.322784.07=+=x 协方差与相关系数协方差与相关系数协方差与相关系数协方差与相关系数 很多时候除了单个随机变量的特征人们更?很多时候,除了单个随机变量的特征,人们更 希望定量地刻画两个随机变量之间的关系 用来描述两个随机变量之间关系最常用的数字?用来描述两个随机变量之间关系最常用的数字 特征是协方差和相关系数 两个随机变量 X 与 Y (离散型)的联合概率分布?两个随机变量 X 与 Y (离散型)的联合概率分布: 可能的取值:),(,),(),( 2211nn yxyxyxL 概率: ),(,),(),( 2211nn yxfyxfyxfL ?协方差:()() = n i YiXiii yxyxfYXCov 1 ),(),(协方差()() =i YiXiii yyf 1 ),(),( ?相关系数: YX YXCov YXCorr ),( ),(= 无单位,介于 无单位,介于 1到到1之间之间 YX ?正相关、负相关、不相关 1到到1之间之间 协方差与相关系数协方差与相关系数协方差与相关系数协方差与相关系数 习题 翻译定义 X = GPA,Y = 高考成绩 习题 某高校教务处统计了下列6个专业 上海生源的平均等级分数和高考成 绩 先给出(题目暗设的) X 与 Y 的联合概率分布 a. 计算 X 与 Y 的协方差: 111 绩:GPA 高考成绩 2.75345 3.52400 i x i y 1/6 1/6 ),( ii yxf 33. 301. 3 6 1 52. 3 6 1 75. 2 6 1 =+=L X 393360 6 1 400 6 1 345 6 1 =+=L Y 3.71440 3.39390 3.62423 1/6 1/6 1/6 L+=)393345()33. 375. 2( 6 1 ),(YXCov 2 .11)393360()33. 301. 3( 6 1 =+ 3.01360 a. 计算等级分数和高考成绩的协方差, 它们之间存在相关关系吗? 1/6 6 故 X 与 Y 存在正相关关系。 b. 计算 X 与 Y 的相关系数: 11 222 它们之间存在相关关系吗? b. 计算等级分数和高考成绩的相关系 数,这个数值告诉我们它们之间的关 系如何? 12. 0)33. 301. 3( 6 1 )33. 375. 2( 6 1 222 =+=L X 33.1093)393360( 6 1 )393345( 6 1 222 =+=L Y 211)(YXCov 系如何? 97. 0 33.109312. 0 2 .11),( ),(= YX YXCov YXCorr 故 X 与 Y 存在很强的正相关关系。 极限定理极限定理:大数定律大数定律极限定理极限定理:大数定律大数定律 概率论是描述不确定性的科学语言表面上?概率论是描述不确定性的科学语言,表面上 看,不确定性似乎无法把握,然而实质上随机 性的背后也有确定性规律可循性的背后也有确定性规律可循 ?假设n个随机变量相互独立且均服 从相同的分布则称独立同分布 n XXX, 21 L XXXL从相同的分布,则称独立同分布 (independent and identically distributed) n XXX, 21 L 记相同的均值为相同的标准差为?记相同的均值为,相同的标准差为 ?定义随机变量的和与算术平均 = n i XS X X n i i = = 1 ?定义随机变量的和与算术平均 =i in XS 1n X = 大数定律:当n足够大时X大数定律:当n足够大时,X 极限定理极限定理:中心极限定理中心极限定理极限定理极限定理:中心极限定理中心极限定理 (和的)中心极限定理:(和的)中心极限定理: 当 n 足够大时(一般 n 大于30即可),近似地近似地服从 均值为标准差为的正态分布即 n S 均值为 n,标准差为的正态分布,即n ()nnNS n , (算术平均的)中心极限定理: 当足够大时般大于即可近似地近似地服从当 n 足够大时(一般 n 大于30即可), 近似地近似地服从 均值为,标准差为的正态分布,即n/ X ()nNX/, 注该结论有趣之处在于无论随机变量 X 本身的分布是什么形态只要有足注:该结论有趣之处在于无论随机变量 Xi本身的分布是什么形态,只要有足 够多的独
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 村委大楼出租合同范本
- 租赁螺旋钻机合同范本
- 火锅商铺转让合同范本
- 设施外包合同范本
- 男鞋生产合同范本
- 年产10万套人工驱雷电设备生产线项目可行性研究报告模板-立项备案
- 山东建筑公司合同范本
- 铺面租赁拍卖合同范本
- 租人租车合同范本
- 花卉销售配送合同范本
- 2025年中国协同办公软件行业市场发展前景及发展趋势与投资战略研究报告
- 颈椎病课件完整版
- 传染科专科护士培训
- 综合设计我的书包课件
- 《海洋遥感技术》课件
- 企业人力资源管理师三级历年真题及答案(2024年11月-2025年5月)版
- 2024年度德国企业博士实习生招聘与雇佣合同3篇
- 华为-供应链管理课件
- 企业环保组织机构情况及管理制度模版(3篇)
- 【培训课件】商务礼仪培训
- 政府机关员工宿舍管理条例
评论
0/150
提交评论