《概率与统计基础》课件_第1页
《概率与统计基础》课件_第2页
《概率与统计基础》课件_第3页
《概率与统计基础》课件_第4页
《概率与统计基础》课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率与统计基础:课程介绍本课程旨在帮助学生掌握概率论与数理统计的基本理论和应用方法。通过系统学习,培养数据分析思维和解决实际问题的能力。考核方式包括:平时作业、课堂表现、期中考试和期末考试。概率论与数理统计发展简史117世纪帕斯卡与费马的通信开启概率理论218世纪伯努利家族贡献大量定理319-20世纪高斯、拉普拉斯推动统计学发展4现代计算机技术促进应用扩展概率与统计的实际应用工程领域质量控制与可靠性分析金融行业风险评估与投资组合优化医疗健康临床试验设计与疗效分析人工智能机器学习算法基础基本事件与样本空间样本空间(S)随机试验所有可能结果的集合基本事件样本空间中的单个元素随机事件样本空间的子集,由多个基本事件组成事件的分类与表示简单事件只包含一个基本事件1复合事件包含多个基本事件2必然事件等于样本空间S3不可能事件空集∅4频率与概率相对频率事件发生次数/试验总次数随试验次数增加趋于稳定概率三种解释古典概型:等可能性频率派:频率极限贝叶斯派:主观信念度量概率的公理化定义非负性公理任何事件A的概率P(A)≥0规范性公理样本空间S的概率P(S)=1可加性公理互斥事件概率相加等于并集概率古典概率模型1/6单个骰子点数为4的概率1/52抽一张黑桃A的概率1/2硬币正面朝上概率古典模型的局限性等可能假设现实中往往不成立有限样本空间无法处理无限样本空间蒙特卡洛方法用大量模拟克服局限条件概率与全概率公式条件概率公式P(A|B)=P(A∩B)/P(B)全概率公式事件B通过完备事件组分解应用步骤寻找完备事件组并逐一计算贝叶斯公式先验概率事件发生的初始信念证据/似然观察到的新信息后验概率综合新证据后的概率更新事件的独立性事件独立性定义P(A∩B)=P(A)·P(B)多事件独立需要两两独立且联合独立条件独立给定C条件下,A和B独立独立性检验验证乘法公式是否成立概率树与有序事件树形图构建按事件发生顺序画分支条件概率标记每个分支标记转移概率路径概率计算沿路径相乘得联合概率总概率求和多条路径概率相加古典分布:均匀分布与伯努利实验均匀分布各点概率相等骰子、轮盘赌例子伯努利实验只有两种结果:成功/失败典型例子:抛硬币成功概率p,失败概率q=1-p随机变量的定义随机变量概念从样本空间到实数集的映射函数离散随机变量取值有限或可数无限连续随机变量取值在区间上连续变化随机变量的分布律分布函数(CDF)的定义与性质1定义F(x)=P(X≤x)2单调性x1<x2则F(x1)≤F(x2)3右连续性limF(x+h)=F(x),h→0+4规范性limF(x)=0,x→-∞limF(x)=1,x→+∞常见离散分布:二项分布成功次数概率泊松分布及应用排队论顾客到达银行的次数稀有事件单位时间内故障发生次数网络流量服务器请求次数几何分布与负二项分布几何分布首次成功前失败次数P(X=k)=q^k·p应用:抽查直到发现第一个不合格产品负二项分布第r次成功前失败次数包含几何分布为特例(r=1)应用:钓鱼直到钓到r条鱼所需次数常见连续分布:均匀分布概率密度函数f(x)=1/(b-a),a≤x≤b随机数发生器计算机生成[0,1]随机数时间模型随机到达时间点舍入误差测量误差建模正态分布与中心极限定理68.3%μ±σ范围概率95.4%μ±2σ范围概率99.7%μ±3σ范围概率指数分布与记忆性概率密度函数f(x)=λe^(-λx),x≥0无记忆性P(X>s+t|X>s)=P(X>t)寿命分析设备失效时间建模服务系统等候时间与服务时间Gamma分布与卡方分布Gamma分布形状参数α,尺度参数β表示α个独立指数分布随机变量之和卡方分布自由度k的Gamma分布特例k个标准正态变量平方和分布应用领域假设检验可靠性分析生存分析随机变量的期望离散期望计算E(X)=∑x·P(X=x)连续期望计算E(X)=∫x·f(x)dx线性性质E(aX+b)=a·E(X)+b决策应用投资回报,风险评估方差与协方差高阶矩k阶矩E(X^k)k阶中心矩E[(X-μ)^k]偏度(三阶标准化矩)衡量分布对称性峰度(四阶标准化矩)衡量分布尖锐程度随机变量的函数分布函数法求Y=g(X)的分布函数再求导密度函数变换利用Jacobian行列式矩母函数法适用于线性变换和平方变换多维随机变量联合分布F(x,y)=P(X≤x,Y≤y)联合密度f(x,y)=∂²F/∂x∂y区域概率双重积分计算边缘分布与条件分布边缘分布离散:f_X(x)=∑f(x,y)连续:f_X(x)=∫f(x,y)dy消去其他变量的分布条件分布f_Y|X(y|x)=f(x,y)/f_X(x)给定一个变量值后的分布条件分布计算期望:E(Y|X=x)协方差与相关系数XY1(正相关)Y2(负相关)随机变量独立性判别独立性定义F(x,y)=F_X(x)·F_Y(y)离散随机变量P(X=x,Y=y)=P(X=x)·P(Y=y)连续随机变量f(x,y)=f_X(x)·f_Y(y)相关系数独立则ρ=0,反之不成立常用联合分布模型二维正态分布需要5个参数:μ_x,μ_y,σ_x,σ_y,ρ多项分布二项分布的多维推广多维泊松过程描述多种事件同时发生分布函数与随机变量变换Y=g(X)的分布求解步骤方法CDF方法F_Y(y)=P(Y≤y)=P(g(X)≤y)3变量替换法利用Jacobian行列式4应用示例平方变换、指数变换等重要不等式1切比雪夫不等式P(|X-μ|≥kσ)≤1/k²2马尔可夫不等式非负随机变量X,P(X≥a)≤E(X)/a3柯西-施瓦茨不等式[E(XY)]²≤E(X²)·E(Y²)4实际应用价值无需知道具体分布即可估计概率界限大数定律弱大数定律样本均值依概率收敛到总体均值临界值:P(|X̄_n-μ|<ε)→1强大数定律样本均值几乎必然收敛到总体均值更强的收敛性:P(limX̄_n=μ)=1实际应用抛硬币频率趋近于0.5保险公司风险评估基础长期投资回报率计算中心极限定理实用解释抽样分布与样本均值分布样本均值分布X̄~N(μ,σ²/n)方差缩小规律样本量n增大,方差减小正态性大样本下趋于正态统计推断基础构建置信区间与假设检验Bootstrap方法简介重采样原理从原样本有放回地抽取新样本统计量计算对每个Bootstrap样本计算兴趣统计量分布估计大量重复形成统计量经验分布优势无需假设总体分布形式适用于复杂统计量数理统计基本概念总体研究对象的全体样本从总体中抽取的部分统计量样本函数,不含未知参数统计推断点估计与区间估计参数估计方法:矩估计法基本原理样本矩等于总体矩矩等式建立E(X^k)=(1/n)∑X_i^k方程求解解出未知参数估计值方法优势计算简单,应用广泛最大似然估计(MLE)似然函数构建L(θ)=∏f(x_i;θ)对数似然lnL(θ)=∑lnf(x_i;θ)最大化求解求导数等于零的参数值区间估计及置信区间置信区间定义包含真实参数的随机区间置信水平区间包含参数的概率(通常95%)区间宽度与样本量n相关,n增大区间变窄均值区间X̄±z_(α/2)·σ/√n假设检验基础零假设H₀默认或保守假设备择假设H₁研究者希望证明的观点检验统计量基于样本数据的计算值P值与显著性P<α时拒绝H₀单样本均值检验(t检验)检验假设H₀:μ=μ₀vsH₁:μ≠μ₀检验统计量t=(X̄-μ₀)/(S/√n)自由度df=n-1决策规则|t|>t_(α/2,n-1)时拒绝H₀应用场景样本量小,总体标准差未知方差分析简介1单因素方差分析比较多组均值是否相等变异分解总变异=组间变异+组内变异F检验F=(组间均方)/(组内均方)应用场景产品质量对比,教学方法评估卡方独立性检验类别A类别B类别C类别D类别E相关与回归分析r相关系数-1≤r≤1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论