版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、因果推論新思維:反事實分析架構,關秉寅 政治大學社會學系 2010.01.16,A New Paradigm for Causal Inference: The Counterfactual Framework,06.09.06,1,因果推論:從古到今,參考Judea Pearl(professor of Computer Science and Statistics and director of the Cognitive Systems Laboratory , UCLA) /LECTURE/lecture_sec1.htm,06.0
2、9.06,1,因果推論:從古到今,從亞當與夏娃說起:亞當與夏娃吃過智慧樹的果子後,他們已經是因果解釋的專家。當上帝問亞當你是否吃了智慧樹的果子時(詢問事實),亞當的回答是:祢給我的那個女人,從樹上拿了果子讓我吃了(不只是說明事實,還做了解釋);上帝問夏娃,夏娃回答是:我是吃了,可是是蛇誘惑和欺騙了我。,06.09.06,1,因果推論:從古到今,聖經故事的意涵: 因果解釋是一個man-made concept。 因果解釋是拿來歸咎責任的。 只有神(為了某些目的)、人與動物(有自有意志)可以讓事情發生,而不是東西(objects)或物理的過程(physical processes)。,06.09.
3、06,1,因果推論:從古到今,但當工程師開始建造有許多滑輪及繩纜的 system來幫人做事後,physical objects開始有了因果的特性。當系統無法運作時,歸咎於神或人並沒有用,比較有效的解釋是滑輪或繩纜壞了,只要加以替換後,系統就可再運作。 至此,causes之概念有雙重意義: the targets of credit and blame the carriers of physical flow of control on the other,06.09.06,1,因果推論:從古到今,至文藝復興時,當上帝做為final cause逐漸被人的科學知識所取代時,這雙重意義遇到困難與挑
4、戰。 Galileo在1638年出版 Discorsi (兩門新科學的對話)這本書後,有了革命性的轉變。此書有兩項重要的格言(maxims):,06.09.06,1,因果推論:從古到今,1. 先描述,後解釋 (Description first, explanation second): The how precedes the why. Ask not, said Galileo, whether an object falls because it is pulled from below or pushed from above. Ask how well you can predict
5、 the time it takes for the object to travel a certain distance, and how that time will vary from object to object, and as the angle of the track changes. 2. 以數學(方程式)來描述,而不是語言:如d=t2 。,06.09.06,1,因果推論:從古到今,從此,物理學充滿了有用但未被解釋的經驗法則,如Snell law, Hookes law, Ohms law, Joules law。 另一項比預測實驗結果更重要的是代數方程式的運用,因為工程
6、師除了可以問“how to” 外,還可以問 “what if”。,06.09.06,1,因果推論:從古到今,至啟蒙時代,David Hume 將 Galileo的第一項格言發揮至極致,他認為 the WHY is not merely second to the HOW, but that the WHY is totally superfluous as it is subsumed by the HOW。 On page 156 of Treatise of Human Nature: Thus we remember to have seen that species of object
7、 we call FLAME, and to have felt that species of sensation we call HEAT. We likewise call to mind their constant conjunction in all past instances. Without any farther ceremony, we call the one CAUSE and the other EFFECT, and infer the existence of the one from that of the other.,06.09.06,1,因果推論:從古到
8、今,從實證主義的角度來看, Hume是在說 “A caused B” 與 “Whenever A occurs, then B does”相同。但是我們都知道雞啼是伴隨著朝陽,但雞啼並不是讓太陽出來的原因。 大難題1:如果如Hume所說,我們的知識是來自於經驗,而經驗是以相關的形式存於我們的心靈中,那我們如何得到因果方面的知識? If regularity of succession is not sufficient; what WOULD be sufficient?,06.09.06,1,因果推論:從古到今,大難題2:我們知道某些關連有或沒有因果間的關係,有何差別嗎?知道因果又有何用?
9、當然知道因果關係,就可以做某些事。如果雞啼是造成太陽升起的原因,那我們要縮短夜晚的話,就可以讓雞早些啼。 If causal information has an empirical meaning beyond regularity of succession, then that information should show up in the laws of physics. But it does not!,06.09.06,1,因果推論:從古到今,Russell(1913)認為 “All philosophers imagine that causation is one of t
10、he fundamental axioms of science, yet oddly enough, in advanced sciences, the word cause never occurs . The law of causality, I believe, is a relic of bygone age, surviving, like the monarchy, only because it is erroneously supposed to do no harm .” “It could not possibly be an abbreviation, because
11、 the laws of physics are all symmetrical, going both ways, while causal relations are uni-directional, going from cause to effect.”,06.09.06,1,因果推論:從古到今,但另一位科學哲學家Patrick Suppes 則指出 “There is scarcely an issue of Physical Review that does not contain at least one article using either cause or causali
12、ty in its title.” 物理學家一方面寫無因果意涵的方程式,但另一方面卻大談因果關係。 統計學一百多年前發現相關(correlation)的概念後,卻無法忽略相關與因果間的區辨。,06.09.06,1,因果推論:從古到今,Francis Galton於1888年進行個人的前臂與其頭大小關係的測量,企圖瞭解一個數值預測另一個數值的程度時,發現到: If you plot one quantity against the other and scale the two axes properly, then the slope of the best-fit line has some
13、 nice mathematical properties: The slope is 1 only when one quantity can predict the other precisely; it is zero whenever the prediction is no better than a random guess and, most remarkably, the slope is the same no matter if you plot X against Y or Y against X. 我們開始可以根據資料客觀的測量兩個變項間的關係,而不是根據我們的意見或判
14、斷。,06.09.06,1,因果推論:從古到今,Galton的發現震撼了其學生Karl Pearson(公認是現代統計學之父),使他終其一生認為我們只需要相關這個更廣泛的概念,而不需要另一個獨立的因果關係的概念。他也從不在其論文內提到因果的概念。 這一直要到Sir Ronald Fisher 建立 randomized experiment 的研究設計後,才成為唯一被主流統計學所接受,並認為這是唯一可從資料驗證因果間關係的科學方法。 但這種謹慎的看法使得無法做實驗,而需靠統計分析為引導的社會科學處於近乎癱瘓的狀態。,06.09.06,1,因果推論的新典範,Pearl 認為這樣的困境是源自統計學
15、的官方語言:機率的語言。因為 cause 並不是機率的字彙。我們無法以機率的語言表達:Mud does not cause rain。我們只能說兩者相關。 Naturally, if we lack a language to express a certain concept explicitly, we cant expect to develop scientific activity around that concept. Scientific development requires that knowledge be transferred reliably from one s
16、tudy to another and, as Galileo has shown 350 years ago, such transference requires the precision and computational benefits of a formal language.,06.09.06,1,因果推論的新典範,當研究者開始企圖使用電腦來建立因果關係時,對於先前兩大難題有了新的想法。 從概念層次來說,機器人所遇到的問題是與經濟學家企圖建立稅收及預算模式,或流行病學家企圖建立流行病的模式是一樣的。不論是機器人、經濟學家或流行病學家都需要在行動受限制的條件下,依據充滿雜音的資訊
17、,從環境中找出因果的關係。這就是先前的第一個大難題: HOW?,06.09.06,1,因果推論的新典範,機器人的世界也與第二大難題有關。如果我們教導機器人關於因果的知識,機器人要如何組織及運用這些知識呢? 對機器人而言,這兩大難題是具體而實際的問題,就是如何從與環境的互動中得到因果的知識,以及如何運用從創造者/程式設計師得到的因果知識?,06.09.06,1,新典範與新語言,J. Pearl 的答案:第二個難題可以結合graphs與equations的方式解決,如此則第一個難題也比較容易解決。解題的主要關鍵概念是: (1) treating causation as a summary of
18、behavior under interventions. (2) using equations and graphs as a mathematical language within which causal thoughts can be represented and manipulated. (3) Treating interventions as a surgery over equations.,06.09.06,1,新典範與新語言,社會科學家過去75年來不時使用graphs,如structural equations modeling 及 path diagrams。但是由
19、於代數方程式的便利性,因而壓抑了圖型的使用,也進而失去了圖型帶來的好處。 這些diagrams事實上捕捉了因果的本質預測不正常情況或是新的操弄狀態下,會產生什麼結果。 這種預測是代數或相關分析無法做到的。,06.09.06,1,新典範與新語言,06.09.06,1,新典範與新語言,從這樣的角度來看因果關係,可以理解為何科學家如此熱衷於因果解釋,因為建立因果模式會得到一種 “deep understanding” 及 “being in control” 的感覺。 Deep understanding的意思是 “knowing, not merely how things behaved yes
20、terday, but also how things will behave under new hypothetical circumstances, control being one such circumstance”.,06.09.06,1,新典範與新語言,即使我們無法實際上控制事情,我們也因理解因果關係而得到 “in control” 的感覺。例如,我們無法控制星體的運轉,但萬有引力的理論,讓我們能夠理解並獲得假設性控制(hypothetical control)的感覺。 我們也可以預測當萬有引力改變時,對潮汐會產生什麼影響。 因果模式也是做為區辨有意識的論證(deliberat
21、e reasoning)及被動或本能的反應(reactive or instinctive response)的試金石。前者可在即使不真正去從事新的操弄(manipulation)下,也可以預期新的操弄可以得到什麼結果。,06.09.06,1,新典範與新語言,Equations vs. Diagrams (J. Pearl),06.09.06,1,新典範與新語言,Definition of Causation: Y is a cause of Z if we can change Z by manipulating Y, namely, if after surgically removing
22、 the equation for Y, the solution for Z will depend on the new value we substitute for Y. THE DIAGRAM TELLS US WHICH EQUATION IS TO BE DELETED WHEN WE MANIPULATE Y. INTERVENTION AMOUNTS TO A SURGERY ON EQUATIONS, GUIDED BY A DIAGRAM, AND CAUSATION MEANS PREDICTING THE CONSEQUENCES OF SUCH A SURGERY.
23、,06.09.06,1,新典範與新語言,INTERVENTION AS SURGERY - CONTROLLED EXPERIMENTS 假定我們要研究某種藥物是否能幫助病人從某些疾病復原。但影響復原的因素不只是藥物治療,還有其他的因素,如社經地位、年齡、生活方式等。這對我們判斷藥物的效果來說是個問題,因為我們不知道影響復原的程度是那個因素造成的。因此,我們希望能夠比較背景相同的病人,而這就是Fisher的Randomized Experiment能夠做到的。但隨機分派的實驗設計如何做到這種比較呢?,06.09.06,1,新典範與新語言,這種實驗設計實際上有兩個部份: Randomizatio
24、n and Intervention. Intervention 就是我們將藥物給一些在正常情況下不會需要這種治療的病人,另一方面我們給一些尋求治療的病人安慰劑(placebo)。這也是先前提及的SURGERY 的概念,因為我們將一個functional link (如SES)切斷,而用另一種替代。 Fisher的偉大貢獻是 connecting the new link to a random coin flip,以此保證我們想要切斷的 link 是確實被切斷了,因為我們可以假定這個 random coin 是不受任何我們可以測量到的因素所影響的。,06.09.06,1,新典範與新語言,06
25、.09.06,1,新典範與新思維,在新典範下,我們可以如何在無法從事實驗的情況下,利用observational studies (如調查或病歷)的資料思考因果關係呢?,06.09.06,1,發問方式,兩類探索因果關係的研究問題 第一類研究問題: X 對 Y 的影響為何?研究目的是要知道: X 對 Y 有影響嗎? 有的話,影響有多大? 這是實驗設計所問的研究問題 第二類研究問題:影響 Y 的因素有哪些?研究目的是要知道: 所有可能解釋 Y 的因素有哪些。,06.09.06,1,如何認定因果關係?,參考 Morgan, Stephen L. contains an inverted fork o
26、f mutual causation A C* B, where C* and all its descendants are not in Z.,06.09.06,1,如何推估the effect of D on Y? (控制 B Mean: 50; S.D.: 21.06) 自變項(Treatment):國三補習數學 26個配對變項: 個人特性及學習特質:性別、補習經驗、W1數學IRT等(motivation, ability) 家庭背景:父母教育程度、職業、教育期待等 班級/學校學習氣氛及環境,06.09.06,1,運用PSM的實例:補習數學有用嗎?,分析策略:只研究國三數學補習的效果
27、國三補習主要是為了準備基測 學校教育對數學能力的培養比較有影響力 以階層性模型探討國三補習的參與及補習效果,以瞭解過往補習研究可能有的限制,以及比較OLS及PSM兩者估計ATE可能有的差異 比較有及沒有W1數學IRT做為配對變項的差異,06.09.06,1,運用PSM的實例:補習數學有用嗎?,使用 Stata(version 9以上版本)的指令:psmatch2 及 bootstrap PSMATCH2: Stata module to perform full Mahalanobis and propensity score matching, common support graphing
28、, and covariate imbalance testing (by Edwin Leuven & Barbara Sianesi) Bootstrap 用來估計 standard error of the estimate,06.09.06,1,運用PSM的實例:補習數學有用嗎?,use D:w2w1all01, clear set seed 19123584 psmatch2 w2s1102 w1s502 mathtime w1s535-w1s550 w1tms1 w1tms3 / w1s507d w2s1121d cram1-cram3 ethn2-ethn4 paedu2 pae
29、du3 / paocc1-paocc2 w1p5152-w1p5154 nuintact sibsize / eduexp2 eduexp3 grouping w1s309-w1s318 w1urban32-w1urban33 / w1m3p29c, out(w2m3p28NCE) kernel common logit ate gen ps=_pscore,06.09.06,1,運用PSM的實例:補習數學有用嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,誰參加國三數學補習? 個人特性及學習特質:先備能力較佳、過去沒補習經驗者、回家會複習功課、自己沒有補習的意願 家庭背景:非
30、原住民、與雙親同住、父母不是研究所學歷、白領職業、高收入、高父母教育期望、手足人數少 班級/學校情況:位於在都市化程較高地區、班上讀書風氣盛、學業競爭激烈程度高,06.09.06,1,運用PSM的實例:補習數學有用嗎?,- Variable Sample | Treated Controls Difference S.E. T-stat - w2m3p28NCE Unmatched | 57.1492421 44.4285175 12.7207246 .40052829 31.76 ATT | 57.1242786 54.866121 2.25815756 .479776217 4.71 AT
31、U | 44.6844424 48.2644102 3.57996779 ATE | 2.95584959 -+- Note: S.E. for ATT does not take into account that the propensity score is estimated. psmatch2: | psmatch2: Common Treatment | support assignment | Off suppo On suppor | Total -+-+- Untreated | 61 5,263 | 5,324 Treated | 7 4,708 | 4,715 -+-+-
32、 Total | 68 9,971 | 10,039,06.09.06,1,運用PSM的實例:補習數學有用嗎?,pstest w2s1102 w1s502 mathtime w1s535-w1s550 w1tms1 w1tms3 / w1s507d w2s1121d cram1-cram3 w1m3p29c ethn2-ethn4 / paedu3 paocc1-paocc2 w1p5152-w1p5154 nuintact sibsize / eduexp2 eduexp3 grouping w1s309-w1s318 / w1urban32-w1urban33, summary treat
33、ed(_treated),06.09.06,1,運用PSM的實例:補習數學有用嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,set seed 19123584 psmatch2 w2s1102, out(w2m3p28NCE) pscore(ps) mahal(w2stwt1) / add kernel common logit,- Variable Sample | Treated Controls Difference S.E. T-stat -+- w2m3p28NCE Unmatched | 57.1492421 44.4285175 12.7207246 .4005
34、2829 31.76 ATT | 57.1044268 54.9845736 2.11985317 .49239495 4.31 -+- Note: S.E. for ATT does not take into account that the propensity score is estimated.,psmatch2: | psmatch2: Common Treatment | support assignment | Off suppo On suppor | Total -+-+- Untreated | 0 5,324 | 5,324 Treated | 26 4,689 |
35、4,715 -+-+- Total | 26 10,013 | 10,039,06.09.06,1,運用PSM的實例:補習數學有用嗎?,psgraph, bin(50) treated(_treated) support(_support) / pscore(_pscore) 檢視有 common support 的分析樣本的balance,06.09.06,1,運用PSM的實例:補習數學有用嗎?,bs r(att): psmatch2 w2s1102, out(w2m3p28NCE) pscore(ps) / mahal(w2stwt1) add kernel common logit,Bo
36、otstrap results Number of obs = 10039 Replications = 50 command: psmatch2 w2s1102, out(w2m3p28NCE) pscore(ps) mahal(w2stwt1) add kernel common logit _bs_1: r(att) - | Observed Bootstrap Normal-based | Coef. Std. Err. z P|z| 95% Conf. Interval -+- _bs_1 | 2.11783 .4667819 4.54 0.000 1.202954 3.032706
37、 -,06.09.06,1,運用PSM的實例:補習數學有用嗎?,國三補習數學有用嗎? Gross effect (OLS): 12.243(分析樣本with common support) After controlling all matching variables (OLS): 3.017 an estimate of ATE PSM results (all matching variables included): Total population (ATE): 2.956 Treated (ATT): 2.258 Untreated (ATU): 3.580,06.09.06,1,
38、運用PSM的實例:補習數學有用嗎?,階層性模型分析結果顯示 PSM的ATE估計大多比OLS的估計小 ATT比ATU小 都會受到未納入重要自變項的影響,06.09.06,1,運用PSM的實例:補習數學有用嗎?,PSM stratified by propensity scores 1st stratum (lowest) 3.519 2nd stratum 4.063 3rd stratum 3.384 4th stratum 1.997 5th stratum (highest) 2.950 1st 3rd stratum3.292 4th 5th stratum2.557,06.09.06,
39、1,運用PSM的實例:補習數學有用嗎?,PSM stratified by prior math ability scores 1st stratum (lowest) 3.600 2nd stratum 4.406 3rd stratum 2.101 4th stratum 3.215 5th stratum (highest) 2.108 1st 3rd stratum 4.203 4th 5th stratum2.248,06.09.06,1,運用PSM的實例:補習數學有用嗎?,PSM stratified by whose decision to undertake math cram
40、ming Students own decision 2.281 Decision made by others 1.429 PSM stratified by parents education level High school 4.712 College and above 1.371,06.09.06,1,運用PSM的實例:補習數學有用嗎?,國三補習數學有用嗎? 補習的時間更長的話,是否效果更好? 其他科補習的效果呢? TEPS數學IRT不是基測成績? 大家知道這個結果,會減少補習嗎?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Q:如果 treatment(如補習)不只是接受 與否時,怎麼辦?,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Q:如果解釋是否接受 treatment 的共變項 不是都可被觀察到的,怎麼辦? Selection on the observables vs. Selection on the unobservables,06.09.06,1,運用PSM的實例:補習數學有用嗎?,Sensitivity analysis 參考: DiPrete, T. A. & Gangl, M. (2004). Assessing bias in the estimation of causal effects: Rosenbaum
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三角形的中位线(课件)2025-2026学年北师大版数学八年级下册
- 果树腐烂病刮治操作规范
- 脊柱体态测量分析操作手册
- 异议处理沟通解决指南
- 玉米种子纯度检验技术规程
- 职业病防护设施运行维护手册
- 电视制作试题及解析
- 防爆区域动火作业应急处置方案
- 肉牛标准化育肥饲养管理方案
- 国内导游资格证题库及答案
- 中远海运集团社招笔试题
- 成都2025年公安辅警笔试题目及参考答案
- JJG(皖) 138-2026 电动汽车充电设施在线远程检定规程(修订)
- 2026淮北矿业集团校园招聘240人笔试参考题库附带答案详解
- 防汛队伍培训课件
- 算力设施产业图谱研究报告 -2024
- 公共洗手间卫生清洁培训
- 大连软件产业发展战略的深度剖析与对策构建
- 乐队乐手合同范本
- 专题05平面向量(讲义)数学学业水平考试合格考总复习(原卷版)
- 2025广东中山市神湾镇人民政府所属事业单位招聘事业单位人员8人人参考题库及答案详解(真题汇编)
评论
0/150
提交评论