因果推论新思维反事实分析架构课件.ppt_第1页
因果推论新思维反事实分析架构课件.ppt_第2页
因果推论新思维反事实分析架构课件.ppt_第3页
因果推论新思维反事实分析架构课件.ppt_第4页
因果推论新思维反事实分析架构课件.ppt_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因果推論新思維:反事實分析架構,關秉寅政治大學社會學系2010.01.16,ANewParadigmforCausalInference:TheCounterfactualFramework,06.09.06,1,因果推論:從古到今,參考JudeaPearl(professorofComputerScienceandStatisticsanddirectoroftheCognitiveSystemsLaboratory,UCLA)/LECTURE/lecture_sec1.htm,06.09.06,1,因果推論:從古到今,從亞當與夏娃說起:亞當與夏娃吃過智慧樹的果子後,他們已經是因果解釋的專家。當上帝問亞當你是否吃了智慧樹的果子時(詢問事實),亞當的回答是:祢給我的那個女人,從樹上拿了果子讓我吃了(不只是說明事實,還做了解釋);上帝問夏娃,夏娃回答是:我是吃了,可是是蛇誘惑和欺騙了我。,06.09.06,1,因果推論:從古到今,聖經故事的意涵:因果解釋是一個man-madeconcept。因果解釋是拿來歸咎責任的。只有神(為了某些目的)、人與動物(有自有意志)可以讓事情發生,而不是東西(objects)或物理的過程(physicalprocesses)。,06.09.06,1,因果推論:從古到今,但當工程師開始建造有許多滑輪及繩纜的system來幫人做事後,physicalobjects開始有了因果的特性。當系統無法運作時,歸咎於神或人並沒有用,比較有效的解釋是滑輪或繩纜壞了,只要加以替換後,系統就可再運作。至此,causes之概念有雙重意義:thetargetsofcreditandblamethecarriersofphysicalflowofcontrolontheother,06.09.06,1,因果推論:從古到今,至文藝復興時,當上帝做為finalcause逐漸被人的科學知識所取代時,這雙重意義遇到困難與挑戰。Galileo在1638年出版Discorsi(兩門新科學的對話)這本書後,有了革命性的轉變。此書有兩項重要的格言(maxims):,06.09.06,1,因果推論:從古到今,1.先描述,後解釋(Descriptionfirst,explanationsecond):Thehowprecedesthewhy.Asknot,saidGalileo,whetheranobjectfallsbecauseitispulledfrombeloworpushedfromabove.Askhowwellyoucanpredictthetimeittakesfortheobjecttotravelacertaindistance,andhowthattimewillvaryfromobjecttoobject,andastheangleofthetrackchanges.2.以數學(方程式)來描述,而不是語言:如d=t2。,06.09.06,1,因果推論:從古到今,從此,物理學充滿了有用但未被解釋的經驗法則,如Snelllaw,Hookeslaw,Ohmslaw,Jouleslaw。另一項比預測實驗結果更重要的是代數方程式的運用,因為工程師除了可以問“howto”外,還可以問“whatif”。,06.09.06,1,因果推論:從古到今,至啟蒙時代,DavidHume將Galileo的第一項格言發揮至極致,他認為theWHYisnotmerelysecondtotheHOW,butthattheWHYistotallysuperfluousasitissubsumedbytheHOW。Onpage156ofTreatiseofHumanNature:ThusweremembertohaveseenthatspeciesofobjectwecallFLAME,andtohavefeltthatspeciesofsensationwecallHEAT.Welikewisecalltomindtheirconstantconjunctioninallpastinstances.Withoutanyfartherceremony,wecalltheoneCAUSEandtheotherEFFECT,andinfertheexistenceoftheonefromthatoftheother.,06.09.06,1,因果推論:從古到今,從實證主義的角度來看,Hume是在說“AcausedB”與“WheneverAoccurs,thenBdoes”相同。但是我們都知道雞啼是伴隨著朝陽,但雞啼並不是讓太陽出來的原因。大難題1:如果如Hume所說,我們的知識是來自於經驗,而經驗是以相關的形式存於我們的心靈中,那我們如何得到因果方面的知識?Ifregularityofsuccessionisnotsufficient;whatWOULDbesufficient?,06.09.06,1,因果推論:從古到今,大難題2:我們知道某些關連有或沒有因果間的關係,有何差別嗎?知道因果又有何用?當然知道因果關係,就可以做某些事。如果雞啼是造成太陽升起的原因,那我們要縮短夜晚的話,就可以讓雞早些啼。Ifcausalinformationhasanempiricalmeaningbeyondregularityofsuccession,thenthatinformationshouldshowupinthelawsofphysics.Butitdoesnot!,06.09.06,1,因果推論:從古到今,Russell(1913)認為“Allphilosophersimaginethatcausationisoneofthefundamentalaxiomsofscience,yetoddlyenough,inadvancedsciences,thewordcauseneveroccurs.Thelawofcausality,Ibelieve,isarelicofbygoneage,surviving,likethemonarchy,onlybecauseitiserroneouslysupposedtodonoharm.”“Itcouldnotpossiblybeanabbreviation,becausethelawsofphysicsareallsymmetrical,goingbothways,whilecausalrelationsareuni-directional,goingfromcausetoeffect.”,06.09.06,1,因果推論:從古到今,但另一位科學哲學家PatrickSuppes則指出“ThereisscarcelyanissueofPhysicalReviewthatdoesnotcontainatleastonearticleusingeithercauseorcausalityinitstitle.”物理學家一方面寫無因果意涵的方程式,但另一方面卻大談因果關係。統計學一百多年前發現相關(correlation)的概念後,卻無法忽略相關與因果間的區辨。,06.09.06,1,因果推論:從古到今,FrancisGalton於1888年進行個人的前臂與其頭大小關係的測量,企圖瞭解一個數值預測另一個數值的程度時,發現到:Ifyouplotonequantityagainsttheotherandscalethetwoaxesproperly,thentheslopeofthebest-fitlinehassomenicemathematicalproperties:Theslopeis1onlywhenonequantitycanpredicttheotherprecisely;itiszerowheneverthepredictionisnobetterthanarandomguessand,mostremarkably,theslopeisthesamenomatterifyouplotXagainstYorYagainstX.我們開始可以根據資料客觀的測量兩個變項間的關係,而不是根據我們的意見或判斷。,06.09.06,1,因果推論:從古到今,Galton的發現震撼了其學生KarlPearson(公認是現代統計學之父),使他終其一生認為我們只需要相關這個更廣泛的概念,而不需要另一個獨立的因果關係的概念。他也從不在其論文內提到因果的概念。這一直要到SirRonaldFisher建立randomizedexperiment的研究設計後,才成為唯一被主流統計學所接受,並認為這是唯一可從資料驗證因果間關係的科學方法。但這種謹慎的看法使得無法做實驗,而需靠統計分析為引導的社會科學處於近乎癱瘓的狀態。,06.09.06,1,因果推論的新典範,Pearl認為這樣的困境是源自統計學的官方語言:機率的語言。因為cause並不是機率的字彙。我們無法以機率的語言表達:Muddoesnotcauserain。我們只能說兩者相關。Naturally,ifwelackalanguagetoexpressacertainconceptexplicitly,wecantexpecttodevelopscientificactivityaroundthatconcept.Scientificdevelopmentrequiresthatknowledgebetransferredreliablyfromonestudytoanotherand,asGalileohasshown350yearsago,suchtransferencerequirestheprecisionandcomputationalbenefitsofaformallanguage.,06.09.06,1,因果推論的新典範,當研究者開始企圖使用電腦來建立因果關係時,對於先前兩大難題有了新的想法。從概念層次來說,機器人所遇到的問題是與經濟學家企圖建立稅收及預算模式,或流行病學家企圖建立流行病的模式是一樣的。不論是機器人、經濟學家或流行病學家都需要在行動受限制的條件下,依據充滿雜音的資訊,從環境中找出因果的關係。這就是先前的第一個大難題:HOW?,06.09.06,1,因果推論的新典範,機器人的世界也與第二大難題有關。如果我們教導機器人關於因果的知識,機器人要如何組織及運用這些知識呢?對機器人而言,這兩大難題是具體而實際的問題,就是如何從與環境的互動中得到因果的知識,以及如何運用從創造者/程式設計師得到的因果知識?,06.09.06,1,新典範與新語言,J.Pearl的答案:第二個難題可以結合graphs與equations的方式解決,如此則第一個難題也比較容易解決。解題的主要關鍵概念是:(1)treatingcausationasasummaryofbehaviorunderinterventions.(2)usingequationsandgraphsasamathematicallanguagewithinwhichcausalthoughtscanberepresentedandmanipulated.(3)Treatinginterventionsasasurgeryoverequations.,06.09.06,1,新典範與新語言,社會科學家過去75年來不時使用graphs,如structuralequationsmodeling及pathdiagrams。但是由於代數方程式的便利性,因而壓抑了圖型的使用,也進而失去了圖型帶來的好處。這些diagrams事實上捕捉了因果的本質預測不正常情況或是新的操弄狀態下,會產生什麼結果。這種預測是代數或相關分析無法做到的。,06.09.06,1,新典範與新語言,06.09.06,1,新典範與新語言,從這樣的角度來看因果關係,可以理解為何科學家如此熱衷於因果解釋,因為建立因果模式會得到一種“deepunderstanding”及“beingincontrol”的感覺。Deepunderstanding的意思是“knowing,notmerelyhowthingsbehavedyesterday,butalsohowthingswillbehaveundernewhypotheticalcircumstances,controlbeingonesuchcircumstance”.,06.09.06,1,新典範與新語言,即使我們無法實際上控制事情,我們也因理解因果關係而得到“incontrol”的感覺。例如,我們無法控制星體的運轉,但萬有引力的理論,讓我們能夠理解並獲得假設性控制(hypotheticalcontrol)的感覺。我們也可以預測當萬有引力改變時,對潮汐會產生什麼影響。因果模式也是做為區辨有意識的論證(deliberatereasoning)及被動或本能的反應(reactiveorinstinctiveresponse)的試金石。前者可在即使不真正去從事新的操弄(manipulation)下,也可以預期新的操弄可以得到什麼結果。,06.09.06,1,新典範與新語言,Equationsvs.Diagrams(J.Pearl),06.09.06,1,新典範與新語言,DefinitionofCausation:YisacauseofZifwecanchangeZbymanipulatingY,namely,ifaftersurgicallyremovingtheequationforY,thesolutionforZwilldependonthenewvaluewesubstituteforY.THEDIAGRAMTELLSUSWHICHEQUATIONISTOBEDELETEDWHENWEMANIPULATEY.INTERVENTIONAMOUNTSTOASURGERYONEQUATIONS,GUIDEDBYADIAGRAM,ANDCAUSATIONMEANSPREDICTINGTHECONSEQUENCESOFSUCHASURGERY.,06.09.06,1,新典範與新語言,INTERVENTIONASSURGERY-CONTROLLEDEXPERIMENTS假定我們要研究某種藥物是否能幫助病人從某些疾病復原。但影響復原的因素不只是藥物治療,還有其他的因素,如社經地位、年齡、生活方式等。這對我們判斷藥物的效果來說是個問題,因為我們不知道影響復原的程度是那個因素造成的。因此,我們希望能夠比較背景相同的病人,而這就是Fisher的RandomizedExperiment能夠做到的。但隨機分派的實驗設計如何做到這種比較呢?,06.09.06,1,新典範與新語言,這種實驗設計實際上有兩個部份:RandomizationandIntervention.Intervention就是我們將藥物給一些在正常情況下不會需要這種治療的病人,另一方面我們給一些尋求治療的病人安慰劑(placebo)。這也是先前提及的SURGERY的概念,因為我們將一個functionallink(如SES)切斷,而用另一種替代。Fisher的偉大貢獻是connectingthenewlinktoarandomcoinflip,以此保證我們想要切斷的link是確實被切斷了,因為我們可以假定這個randomcoin是不受任何我們可以測量到的因素所影響的。,06.09.06,1,新典範與新語言,06.09.06,1,新典範與新思維,在新典範下,我們可以如何在無法從事實驗的情況下,利用observationalstudies(如調查或病歷)的資料思考因果關係呢?,06.09.06,1,發問方式,兩類探索因果關係的研究問題第一類研究問題:X對Y的影響為何?研究目的是要知道:X對Y有影響嗎?有的話,影響有多大?這是實驗設計所問的研究問題第二類研究問題:影響Y的因素有哪些?研究目的是要知道:所有可能解釋Y的因素有哪些。,06.09.06,1,如何認定因果關係?,參考Morgan,StephenL.containsaninvertedforkofmutualcausationAC*B,whereC*andallitsdescendantsarenotinZ.,06.09.06,1,如何推估theeffectofDonY?(控制BMean:50;S.D.:21.06)自變項(Treatment):國三補習數學26個配對變項:個人特性及學習特質:性別、補習經驗、W1數學IRT等(motivation,ability)家庭背景:父母教育程度、職業、教育期待等班級/學校學習氣氛及環境,06.09.06,1,運用PSM的實例:補習數學有用嗎?,分析策略:只研究國三數學補習的效果國三補習主要是為了準備基測學校教育對數學能力的培養比較有影響力以階層性模型探討國三補習的參與及補習效果,以瞭解過往補習研究可能有的限制,以及比較OLS及PSM兩者估計ATE可能有的差異比較有及沒有W1數學IRT做為配對變項的差異,06.09.06,1,運用PSM的實例:補習數學有用嗎?,使用Stata(version9以上版本)的指令:psmatch2及bootstrapPSMATCH2:StatamoduletoperformfullMahalanobisandpropensityscorematching,commonsupportgraphing,andcovariateimbalancetesting(byEdwinLeuven&BarbaraSianesi)Bootstrap用來估計standarderroroftheestimate,06.09.06,1,運用PSM的實例:補習數學有用嗎?,useD:w2w1all01,clearsetseed19123584psmatch2w2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3/w1s507dw2s1121dcram1-cram3ethn2-ethn4paedu2paedu3/paocc1-paocc2w1p5152-w1p5154nuintactsibsize/eduexp2eduexp3groupingw1s309-w1s318w1urban32-w1urban33/w1m3p29c,out(w2m3p28NCE)kernelcommonlogitategenps=_pscore,06.09.06,1,運用PSM的實例:補習數學有用嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,誰參加國三數學補習?個人特性及學習特質:先備能力較佳、過去沒補習經驗者、回家會複習功課、自己沒有補習的意願家庭背景:非原住民、與雙親同住、父母不是研究所學歷、白領職業、高收入、高父母教育期望、手足人數少班級/學校情況:位於在都市化程較高地區、班上讀書風氣盛、學業競爭激烈程度高,06.09.06,1,運用PSM的實例:補習數學有用嗎?,-VariableSample|TreatedControlsDifferenceS.E.T-stat-w2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76ATT|57.124278654.8661212.25815756.4797762174.71ATU|44.684442448.26441023.57996779ATE|2.95584959-+-Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total-+-+-Untreated|615,263|5,324Treated|74,708|4,715-+-+-Total|689,971|10,039,06.09.06,1,運用PSM的實例:補習數學有用嗎?,pstestw2s1102w1s502mathtimew1s535-w1s550w1tms1w1tms3/w1s507dw2s1121dcram1-cram3w1m3p29cethn2-ethn4/paedu3paocc1-paocc2w1p5152-w1p5154nuintactsibsize/eduexp2eduexp3groupingw1s309-w1s318/w1urban32-w1urban33,summarytreated(_treated),06.09.06,1,運用PSM的實例:補習數學有用嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,setseed19123584psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)/addkernelcommonlogit,-VariableSample|TreatedControlsDifferenceS.E.T-stat-+-w2m3p28NCEUnmatched|57.149242144.428517512.7207246.4005282931.76ATT|57.104426854.98457362.11985317.492394954.31-+-Note:S.E.forATTdoesnottakeintoaccountthatthepropensityscoreisestimated.,psmatch2:|psmatch2:CommonTreatment|supportassignment|OffsuppoOnsuppor|Total-+-+-Untreated|05,324|5,324Treated|264,689|4,715-+-+-Total|2610,013|10,039,06.09.06,1,運用PSM的實例:補習數學有用嗎?,psgraph,bin(50)treated(_treated)support(_support)/pscore(_pscore)檢視有commonsupport的分析樣本的balance,06.09.06,1,運用PSM的實例:補習數學有用嗎?,bsr(att):psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)/mahal(w2stwt1)addkernelcommonlogit,BootstrapresultsNumberofobs=10039Replications=50command:psmatch2w2s1102,out(w2m3p28NCE)pscore(ps)mahal(w2stwt1)addkernelcommonlogit_bs_1:r(att)-|ObservedBootstrapNormal-based|Coef.Std.Err.zP|z|95%Conf.Interval-+-_bs_1|2.11783.46678194.540.0001.2029543.032706-,06.09.06,1,運用PSM的實例:補習數學有用嗎?,國三補習數學有用嗎?Grosseffect(OLS):12.243(分析樣本withcommonsupport)Aftercontrollingallmatchingvariables(OLS):3.017anestimateofATEPSMresults(allmatchingvariablesincluded):Totalpopulation(ATE):2.956Treated(ATT):2.258Untreated(ATU):3.580,06.09.06,1,運用PSM的實例:補習數學有用嗎?,階層性模型分析結果顯示PSM的ATE估計大多比OLS的估計小ATT比ATU小都會受到未納入重要自變項的影響,06.09.06,1,運用PSM的實例:補習數學有用嗎?,PSMstratifiedbypropensityscores1ststratum(lowest)3.5192ndstratum4.0633rdstratum3.3844thstratum1.9975thstratum(highest)2.9501st3rdstratum3.2924th5thstratum2.557,06.09.06,1,運用PSM的實例:補習數學有用嗎?,PSMstratifiedbypriormathabilityscores1ststratum(lowest)3.6002ndstratum4.4063rdstratum2.1014thstratum3.2155thstratum(highest)2.1081st3rdstratum4.2034th5thstratum2.248,06.09.06,1,運用PSM的實例:補習數學有用嗎?,PSMstratifiedbywhosedecisiontoundertakemathcrammingStudentsowndecision2.281Decisionmadebyothers1.429PSMstratifiedbyparentseducationlevelHighschool4.712Collegeandabove1.371,06.09.06,1,運用PSM的實例:補習數學有用嗎?,國三補習數學有用嗎?補習的時間更長的話,是否效果更好?其他科補習的效果呢?TEPS數學IRT不是基測成績?大家知道這個結果,會減少補習嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Q:如果treatment(如補習)不只是接受與否時,怎麼辦?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Q:如果解釋是否接受treatment的共變項不是都可被觀察到的,怎麼辦?Selectionontheobservablesvs.Selectionontheunobservables,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Sensitivityanalysis參考:DiPrete,T.A.&Gangl,M.(2004).Assessingbiasintheestimationofcausaleffects:Rosenbaumboundsonmatchingestimatorsandinstrumentalvariableses

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论