研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》_第1页
研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》_第2页
研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》_第3页
研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》_第4页
研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究生一年级智能科学与技术专业《非确定环境下的知识建模与推理:从贝叶斯到概率编程》

一、课程基本信息与顶层设计

(一)课程定位与学情分析

本课程定位于硕士研究生一年级智能科学与技术专业核心必修课,衔接本科阶段《人工智能导论》《概率论与数理统计》《Python科学计算》。学习者在本科阶段已接触过确定性推理(归结原理、产生式系统)及基础机器学习算法,但对于真实世界中由于观测噪声、知识不完备、环境动态变化及语义模糊所引发的不确定性,缺乏系统的数学建模能力与算法实现经验。【非常重要】【基础】当前学情呈现出“算法调用熟练、数学原理薄弱;单一模型可用、复合场景盲区”的特点。因此本设计不满足于孤立算法讲授,而是以“不确定性量化的代数基础——表示与传播的数学结构——计算层面的可处理近似——工程落地的可解释性”为主线,构建从理论到概率编程实现的完整链路。

(二)新课程标准与目标重构

1.知识与技能维度

(1)深刻理解不确定性的哲学根源与信息论本质,能够区分随机性(AleatoricUncertainty)与认知性不确定性(EpistemicUncertainty);【重要】【高频考点】

(2)系统掌握确定性因子(CertaintyFactor)、主观贝叶斯、DS证据理论、可能性理论四大经典不精确推理方法的代数模型、语义解释与适用边界;【热点】【难点】

(3)掌握贝叶斯网络的D-分离准则、马尔可夫毯、精确推理(变量消除)与近似推理(吉布斯采样、变分推断)的核心算法;【非常重要】【核心】

(4)理解概率图模型(PGM)的三种表示范式(贝叶斯网、马尔可夫网、链图)及其条件独立性断言的图论语义;【基础】

(5)掌握状态空间模型(卡尔曼滤波、粒子滤波)在时序不确定性推理中的应用;【热点】

(6)能够运用概率编程语言(PyMC/TensorFlowProbability)构建分层贝叶斯模型,并在真实数据集上完成不确定性量化与可解释性报告。【非常重要】【高阶能力】

2.过程与方法维度

(1)通过“推理网络手工推演——算法伪代码复现——开源框架二次开发”三阶递进,培养从数学结构到工程落地的映射能力;

(2)采用“物理建模-图表示-代码实现-诊断调试”的完整科研范式,重塑解决复杂非确定性问题的思维框架;

(3)引入因果视角(Pearldo-演算),将单纯的相关性推理拓展至干预层面,为因果推断奠定基础。【前沿】

3.情感态度与价值观维度

(1)通过对MYCIN、PROSPECTOR等经典专家系统历史脉络的溯源,体认学者在数据匮乏时代构建不确定性理论的智慧,培育学术创新精神;

(2)在算法透明度与可解释性训练中,建立“可信赖人工智能”的伦理自觉;

(3)强化“模型不确定性”与科学哲学中证伪主义的关联认知,破除对AI预测的盲目迷信。

二、教学实施过程全解析

本课程共计36学时,本单元为连续4讲(每讲90分钟,共360分钟)的深度专题模块,标题为《非确定环境下的知识建模与推理》。以下按照“认知冲突激发——经典范式重构——现代概率图模型——前沿概率编程与因果拓展”四阶递进,完整呈现实施全过程。

(一)第一阶:认知冲突与经典范式重访(第1讲,90分钟)

1.锚点事件与问题剧(0-20分钟)

【教师行为】不直接给出定义,而是呈现一个经过临床脱敏处理的医疗决策片段:某传染性疾病,甲实验室检测灵敏度90%,假阳性率5%;乙实验室检测灵敏度80%,假阳性率1%。两名实验室结果均为阳性,求患病概率。要求学习者以本科阶段确定性逻辑(P→Q)尝试推理。

【学生活动】分组用真值表、自然演绎推理,发现陷入循环与悖论。

【认知冲突揭示】明确宣告:经典逻辑(谓词演算、归结原理)在此类仅有统计关联、无蕴含关系的问题中彻底失效。【非常重要】

【关键追问】此时教师板书核心问题:知识不确定性的三个来源——随机性(事件固有)、模糊性(概念边界)、ignorance(知识不完备)。这是我们整个模块要解决的根本问题。

2.确定性因子(CF)模型的完整推演(20-55分钟)

(1)代数模型重构【重要】【高频考点】

从Shortliffe的MYCIN系统原始论文出发,不直接给公式,而是引导学习者思考:如果用一个数值表示“相信”与“不相信”,这个数值空间应具备何种代数结构?师生共同构建:

定义信任增长度MB(H,E)和不信任增长度MD(H,E),并推导二者互斥律:当MB>0时,MD=0;反之亦然。

进而定义CF(H,E)=MB-MD。值域[-1,1]。

特别强调:CF不是概率,因为概率的共轭公理P(H)+P(¬H)=1在CF中不成立。CF(H)+CF(¬H)=0。【难点】

(2)不確定性传播算法的手工推演(板书重点)

给出典型推理网络:E1、E2析取→A;E3、E4合取→B;A→C,B→C。已知原始证据不确定性C(E1)=0.7,C(E2)=0.4,CF(R1)=0.8,等。教师带领学生分步骤:

[1]析取证据合成:C(E1∨E2)=max(C(E1),C(E2))=0.7

[2]规则作用:C(A)=CF(R1)×max(0,C(E1∨E2))=0.8×0.7=0.56

[3]合取证据合成:C(E3∧E4)=min(C(E3),C(E4))

[4]独立证据导出同一结论的组合:C1(C)和C2(C)通过C=C1+C2-C1×C2(同号)或C=(C1+C2)/(1-min(|C1|,|C2|))(异号)进行合成。

【学生任务】每两人一组,完成包含4条规则、2层推理、1个结论汇合的手工计算纸笔练习。教师巡堂,重点关注异号合成时的符号处理。

3.主观贝叶斯方法及其几何直观(55-85分钟)

(1)从概率论公理到专家经验

指出CF方法的缺陷:缺乏严格的概率语义,组合函数是启发式的。由此引入PROSPECTOR系统的解决方案——主观贝叶斯。【重要】

(2)关键参数:LS与LN

不直接展示教科书公式,而是从贝叶斯公式的比值形式出发:

O(H|E)=LS·O(H)

O(H|¬E)=LN·O(H)

其中LS=P(E|H)/P(E|¬H),LN=P(¬E|H)/P(¬E|¬H)。

【直观解释】LS>>1:证据出现强烈支持假设;LN<<1:证据缺失强烈反对假设;LS=1且LN=1:证据与假设独立。

(3)教学难点突破:分段线性插值函数【难点】

当证据E本身不确定时(已知的是关于E的观察E‘),如何计算P(H|E’)?教师采用几何画板动态展示:已知三点(0,P(H|¬E)),(P(E),P(H)),(1,P(H|E)),通过分段线性函数逼近任意P(E‘)对应的后验概率。此处的教学智慧在于:不求严格的概率推导,而是建立“确定性——概率”的转换直觉。

4.课堂收束与学术史浸润(85-90分钟)

简要评述:CF方法是领域专家主导的启发式模型,主观贝叶斯是概率理论家对专家系统的改造。二者共同构成了20世纪70-80年代不确定性推理的双峰。引出下一讲的核心问题——当多个证据之间存在复杂依赖,且基本概率指派难以获得时,如何突破?

(二)第二阶:证据理论与可能性理论的范式突破(第2讲,90分钟)

1.认知预热:从概率精确到置信区间(0-15分钟)

【问题】法庭上,目击者指认嫌疑人。你有多相信“嫌疑人是罪犯”?概率论要求你必须给一个0-1之间的精确数字。但现实中,你可能只能说:“我有6成把握认定是他,3成把握认定不是他,还有1成——我不知道。”这个“我不知道”在概率框架中被强制分配给了0.5或按先验比例,这不合理。DS证据理论正是为解决这一“无知”表示而诞生。【非常重要】【热点】

2.DS证据理论的代数体系构建(15-50分钟)

(1)核心概念精讲

识别框架Θ:所有可能假设的完备集合。

基本概率指派m:2^Θ→[0,1],且Σm(A)=1,m(∅)=0。关键突破:质量可以赋予子集,而非仅仅是单点。

【板书推演】Θ={T1,T2,T3},m1赋予{T1,T2}0.6,Θ0.4;m2赋予{T2}0.5,Θ0.5。计算组合信度。

(2)Dempster合成规则【核心】【高频考点】

m12(C)=(Σ_{A∩B=C}m1(A)m2(B))/(1-K),其中K=Σ_{A∩B=∅}m1(A)m2(B),衡量证据冲突程度。

【易错警示】当K=1时,证据完全冲突,Dempster规则失效。这是该方法的重要缺陷,也为后续可能性理论埋下伏笔。

(3)信任函数Bel与似然函数Pl

Bel(A)=Σ_{B⊆A}m(B)——对A的总信任度

Pl(A)=1-Bel(¬A)——不反对A的程度

[Bel(A),Pl(A)]构成一个概率区间,这正是对“无知”的数学刻画。【重要】

3.可能性理论的互补视角(50-80分钟)

(1)模糊性与随机性的本质区别

Zadeh指出,DS证据理论仍然处理的是“随机集”,而模糊性是关于类属边界的非概率不确定性。

(2)可能性分布与模糊约束

引入变量X,可能性分布π(x):U→[0,1]。可能性测度Π(A)=sup_{x∈A}π(x),必然性测度N(A)=inf_{x∉A}(1-π(x))。

【核心定理】Π(A)<1⇒N(A)=0;N(A)>0⇒Π(A)=1。这揭示了可能性和必然性的对偶关系。【难点】

(3)与概率的对比实验

展示经典案例:“Xislarge”对于x=5,可能性0.8,概率可能只有0.1。通过可视化密度曲线,让学生直观感受:可能性关注“易程度”,概率关注“频次”。

4.批判性思辨环节(80-90分钟)

【分组辩论】场景:导弹拦截系统敌我识别。证据一:雷达信号特征(可信度0.9);证据二:电子侦察敌我应答(可信度0.7);证据三:光学成像模糊(目标模糊大)。问题:采用CF、主观贝叶斯、DS证据理论、可能性理论分别会如何处理?哪一种更合理?

教师在此环节不给定标准答案,而是引导学生认识到:不确定性推理方法的选择本质上是“本体论承诺”——你承认这个世界是随机的、模糊的、还是不可知的?【非常重要】

(三)第三阶:概率图模型与现代贝叶斯革命(第3讲,90分钟)

1.从单一推理到结构化建模(0-15分钟)

指出前三代方法的共性缺陷:知识表示是“扁平化”的规则库,难以表达变量间复杂的条件独立性。Pearl在20世纪80年代发起的概率图模型革命,本质是将图论引入不确定性推理。【非常重要】

2.贝叶斯网络的语义与构造(15-40分钟)

(1)条件独立性公理【基础】【高频考点】

有向无环图中,给定父节点,节点与其非后代节点条件独立。

(2)D-分离准则【难点】

通过三个典型结构(顺连、分连、汇连)的直观讲授:顺连和分连中,中间节点被观测则路径阻断;汇连中,中间节点被观测则路径连通。

【课堂手势教学法】教师用手掌模拟条件独立:两手掌心向下代表变量,观测变量时手掌握拳。学生通过模仿迅速建立图阻断直觉。

(3)马尔可夫毯

节点的马尔可夫毯=父节点+子节点+子节点的其他父节点。这是局部概率分布更新的充分统计量。

3.精确推理:变量消除算法(40-65分钟)

(1)从链式法则到因子操作

以P(A|B,C)为例,展示如何将联合分布分解为因子乘积。变量消除的核心:对非查询变量依次求和(边缘化),过程中缓存中间因子。【核心】

(2)手算演练

给定贝叶斯网络:Burglary→Alarm,Earthquake→Alarm,Alarm→JohnCalls,Alarm→MaryCalls。已知先验P(B),P(E),条件概率表完整。求P(B|J=T,M=T)。

教师带领学生完成:

[1]写出联合分布乘积形式

[2]确定消元顺序(通常从叶节点逆向)

[3]依次求和,记录中间因子规模

【学生反馈】此环节是整门课的第一个真正意义上的认知负荷高峰。必须慢,必须手算,必须暴露中间过程。

4.近似推理:采样方法(65-85分钟)

(1)动机引入

精确推理在树宽较大时指数爆炸,工业规模网络不可行。

(2)拒绝采样与似然加权【重要】

从先验采样→接受符合证据的样本(拒绝采样效率低)→固定证据变量,对非证据变量依条件概率加权(似然加权)。

(3)吉布斯采样的直观理解

马尔可夫链蒙特卡洛的入门:逐个变量依其马尔可夫毯重采样。不深究收敛诊断,只建立“迭代条件分布”的心智模型。

5.编程任务布置(85-90分钟)

【项目启动】使用pgmpy库,基于Asia数据集(肺结核、肺癌、支气管炎网络),完成:

[1]网络结构可视化

[2]基于变量消除的精确推理

[3]基于吉布斯采样的近似推理,并与精确结果对比误差。

此为后续翻转课堂做准备。

(四)第四阶:概率编程、因果初探与项目实战(第4讲,90分钟)

1.概率编程范式转移(0-25分钟)

(1)从“写图”到“写生成过程”

传统PGM建模:定义图结构→定义CPT→调用推理引擎。

概率编程:用编程语言描述数据的生成过程,推理由引擎自动进行。【非常重要】【前沿】

(2)PyMC实战演示(教师livecoding)

场景:估计某市新冠感染率I。历史先验:I~Beta(2,100)。随机抽样1000人,阳性20人。写出:

withpm.Model():

i=pm.Beta(‘i’,alpha=2,beta=100)

y=pm.Binomial(‘y’,n=1000,p=i,observed=20)

trace=pm.sample(2000)

【解释】这背后是HamiltonianMonteCarlo自动进行贝叶斯更新。学习者不必推导复杂的共轭分布,而是关注模型表示。

2.认知不确定性量化:贝叶斯神经网络(25-45分钟)

(1)为什么传统NN没有不确定性?

传统神经网络输出softmax是确定性函数,点估计权重,过拟合区域产生过高置信度预测。【热点】

(2)贝叶斯神经网络思想

为权重赋予先验分布,给定数据后计算后验分布。预测时积分所有可能权重——输出自然带有方差。

(3)简易实现:借助TensorFlowProbability构建带随机权重的全连接层,观察分布外检测(OOD)时预测方差显著增大。【非常重要】

3.因果推理的初步:从贝叶斯网络到因果图(45-65分钟)

(1)干预vs.观测【核心】【高频考点】

在贝叶斯网络中,P(Y|X)和P(Y|do(X))完全不同。前者只是统计条件,后者是物理干预。

(2)do-演算的直观案例

以“吸烟→焦油沉积→肺癌”网络为例。观测到P(肺癌|吸烟)高;但如果强行干预所有人吸烟,P(肺癌|do(吸烟))是多少?Pearl证明,需对焦油变量进行“截断乘积”调整。展示通过后门准则消除混淆偏倚。

(3)课堂思辨

AlphaGo下棋时,是在进行干预(它自己落子)还是观测?智能体决策本质上是在做干预。因此,从不确定性推理到决策智能,必须经历因果之梯。【重要】

4.微项目攻坚:完整不确定性推理全流程(65-85分钟)

【真实场景复现】苏州某游乐园假期客流量预测(改编自真实中学AI项目,但提升至研究生复杂度)-3

数据特征:天气(模糊词:晴好、小雨、暴雨)、节假日类型(普通周末、小长假、黄金周)、线上门票预售率(连续值,但有缺失)、过往同期客流量(含噪声)。

任务要求:

[1]分别采用确定性因子方法和概率编程方法,构建客流量等级(高/中/低)预测模型;

[2]对于同一个预测日(天气预报“可能有小雨”,预售率完成62%),给出两种方法下三类等级的信度分布;

[3]撰写不超过500字的不确定性报告,供运营部门决策(预留工作人员数量)。

【实施形式】4人小组,30分钟核心建模,最后20分钟展示关键图表。教师点评重点:CF方法依赖规则强度和专家启发;概率编程模型透明地展示了先验影响与后验更新。

5.单元升华与学术地图(85-90分钟)

总结四讲演进逻辑:规则启发式(CF)→概率主观化(主观贝叶斯)→无知表示(DS理论)→模糊边界(可能性理论)→结构化概率依赖(贝叶斯网)→自动化推理引擎(概率编程)→因果干预(do-演算)。这是一条从手工特征到生成式建模、从关联到干预的完整叙事。【非常重要】

三、全程嵌入的评价与反馈系统

(一)形成性评价的七个触点

[1]第1讲纸笔手算推理网络——考察CF合成规则,当堂批改,错误率高于40%者进入课后微辅导;

[2]第2讲课后DS证据理论编程作业——给定两组基本概率指派,编程计算Dempster合成结果并处理K=0.99的高冲突情况;

[3]第3讲变量消除手算日志——提交详细的消元步骤因子表;

[4]第4讲贝叶斯神经网络不确定性可视化——分布外检测的置信度标准差图像;

[5]微项目阶段一:PGM结构建模——提交Asia网络的pgmpy代码及推理结果;

[6]微项目阶段二:概率编程预测报告——包含先验敏感性分析;

[7]课堂辩论参与度与批判性思维量规。

(二)终结性评价

本模块终结性大作业为“复杂不确定性环境下的智能诊断系统原型”。学生三选一方向:

方向A(医疗):基于甲状腺功能检测真实数据集,构建贝叶斯网络推理模型,并与传统机器学习分类器(逻辑回归、随机森林)进行不确定性校准度对比(期望校准误差ECE)。

方向B(工业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论