《因果推理导论》笔记介绍BradyNeal_第1页
《因果推理导论》笔记介绍BradyNeal_第2页
《因果推理导论》笔记介绍BradyNeal_第3页
《因果推理导论》笔记介绍BradyNeal_第4页
《因果推理导论》笔记介绍BradyNeal_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、因果推理导论笔记(一)介绍Badea本章出现的重要术语:充分调整集(sufficientadjustmentset)什么是因果推理?Whatiscausalinference?Inferringtheeffectsofunytreatment/policv/intervention/tc.Examples:EffectoftreatmentynadiseaseEffectofclimatechangepolicyonemissionsEffectofsocialmediaonmentalhealthMorn?mrrenFXcn本章目录辛普森悖论。相关性不能说明有因果那么,什么表明了因果?观测实

2、验的因果MotivatingexampierSimpsotisparadoxCorrelationdoesnotimplycausationThen,whitedoesiipplycausation?.*=辛普森悖论Eg:新冠问题目标:决定AB两种新冠治疗方法,降低死亡率预设:此例设B更稀缺只能获得医院的数据,不能收集数据:症状(轻0/重1);治疗(A0/B1);结果(存活0/死亡1)死亡率图:辛普森悖论出现,那到底数字是怎么反转的,谁又是对的呢?列式看看某治疗方法下,人数的权重对死亡率的影响:可以看到第一个式子,在疗法A中,0.15权重(1400/1500)远大于0.3的(100/1500)

3、权重:MildSevereTotalA15%30%16%J210/14C0)脚咂CW1独1B10%20%19%(O胞15%1%M阿小的死亡率有大的人口权重,所以总体上,A的死亡率偏小。与此相对,B小的死亡率有小的人口权重,所以总体上,A的死亡率偏大。但是常理而言,重病号死亡率高于轻病号很正常,我们能根据总死亡率就判断B疗法不好吗?显然不能。那应该选择哪个呢?这时就需要明确因果关系了,在不同的因果图下,结果可能完全不同。第一种因果情况B优于A在机器学习中,也叫“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。在机器学习中,也叫

4、“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。cfbMildSevere即混淆变量“症状轻重”(C):是“在机器学习中,也叫“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。在机器学习中,也叫“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。MilJSevere叫卜A15%430%卫/幷显然,B在不同治疗方案中都有更低死亡率,选择B。第二种因果情况A优于BMildSevereTcta

5、lA15%(2iofmon-;30%卿16%(140/1500B3期20%nQD/509W%Condition在这种情况下,T为C和丫的原因,而C为丫的原因。即治疗方法影响病情,进而影响死亡率。比如,可以解释为等待治疗使病情加重,A疗法的人无需等待,所以多为轻症;B疗法的人等待很久,所以有许多人得到治疗B时已经转为重症。那么显然,这种情况下B是不如A的。这就是辛普森悖论。总结:该例中,若C为T的原因,选择B好;若T是C的原因,选择A好。决策的关键是问题的因果结构。相关性不能说明有因果Eg:问题:穿鞋睡觉与醒来头痛的关系?二者有强关联,能不能说不穿鞋睡觉预防头痛呢?当然不能。比起穿鞋,头痛真正的

6、原因更可能是前一天晚上喝多了。在机器学习中,也叫“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。在机器学习中,也叫“预测不意味着因果关系”。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。都喝过酒,而“睡觉不穿Comnoncause:drinkingthenightbefor亡Sleepingwithshoesonisstrogkcorrelatedwitnwakingupwithaheadache考虑喝酒与否,会发现,在数据中,大部分“睡觉穿鞋组,我们又可以像第一部分那样列出

7、correlatedwith;hshoin;LLSCVL(7Q/JOUJZ注意混淆关联与因果关联的不同:with直headache可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。Tbtdassocktion(c,g,corrclatioii):mbitutcofcausalandconfoundingassociationCorrelatio口doesnotimplycausationSleepingwithshoesonisstronglycorrelatedwithwakingupwithaheadacheCommoncause:drinkin

8、gthenightbeforeShoe-sleepersdifferfromnon-$hce-sleepersinsikeywayConfounding总关联:因果关联和混淆关联的混合物。注:相关性(correlation)是关联(association)的一种。在之后会讲到混淆的分类。相关性等于因果关系是一种认知偏见!可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。4Fima那么,什么表明了因果?2W3)fdnsUQj-cwrlngslffil边DO2l

9、2M22ffl3acsICOg20072D9XD9NicolasCagedrhespeopletodrownthemselves将穿鞋替代为*,*可以是任意混淆因子(confounder)Nk-hs.snokcformeasuringeffectonlungcancer)Infeasibility(egcanhtrandomizecountriesintocommunist/capitaEstsvstemstomeasurecfifccttinGDP)Impossibility(c,g.cantchange日lining那么问题来了:卜.:.rri、CajsalassociatiiinObse

10、rvationalstudiesHowdowemeasurecausaleffectsinobservationalstudies?由于各种原因,一般数据都是观察实验的数据,很难有理想数据。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。由于各种原因,一般数据都是观察实验的数据,很难有理想数据。可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。(该公式常用!)混淆的调整与控制YE|y()=Ey|do(T=t)=Ew叫Yt.Wf前提:w为充分调整集(右下图中w是c,w在其他情况下也可能是一组变量)目的:在c

11、是充分调整集条件下,利用阻断c消除混淆关联。Solution:adjust/controlforconfoundersAdju$t/centre)1fcjrthtrightvaiiabksFKIfWisasufficientadjustmentset,wehaveEy(t)|IVwl=lEjKldofT=w=EK|t,w寻找充分调整集:后门调整16%可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。寻找充分调整集:后门调整16%可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。z2一一Q如何找到可以用于阻断

12、的充分调整集?下Solution:backdooradjustmentEK|do(T=t)EwEr|ifWShadednodes肚亡亡samplesofsuEficientadjustmentsetsW1.CW1/W3/W2,C(即同时阻断这两个)回到新冠问题:ApplicationtotheCOVID27exampleEydo(r=t)=EcEY|t,C=Ey|,cP(c)/-c是充分调整集,Md15%(210/14001ConditionSeveredO%00/10(TotalCausal19.4%可以用公式计算之(10Q/500)19%(lC5/55flri12.9%CausalGraph从左到右,只有最右是因果量,因为计算:可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。计算:可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病号用A疗法。C1i1?5uIL二二gc/o将轻重症对治疗(T)的影响通过乘某C在某T出现的可能去除了。1+505002050卩+丽卿)-0.1941AA直观上,就是考虑了症状轻重作为权重的影响,对比看原始死亡率和用因果量计算的死亡率:可以看出,医生对病人的治疗并非随机,在这里,如果他们倾向于为重病号用B疗法,为轻病

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论