结构方程模型之遗漏值处理潜在变项组型混合模型_第1页
结构方程模型之遗漏值处理潜在变项组型混合模型_第2页
结构方程模型之遗漏值处理潜在变项组型混合模型_第3页
结构方程模型之遗漏值处理潜在变项组型混合模型_第4页
结构方程模型之遗漏值处理潜在变项组型混合模型_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

結構方程模型之遺漏值鄭中平翁儷禎國立台灣大學心理學系實徵研究經常遭遇資料遺漏,本研究即在探討資料遺漏機制為潛在變項組型混合模型時,結構方程模型的最大概似估計,並利用模擬資料為範例比較其與常用遺漏值處理法的差異。潛在變項組型混合模型為組型混合模型的延伸,此模型假設觀察變項的遺漏組型反映潛在變項之類別,而非外顯類別,且各類別可有相異的結構方程模型。本研究建議以MonteCarloEM算則估計當結構方程模型的資料遺漏機制符合此模式時之參數,並以模擬資料瞭解其與不同遺漏值處理法表現之差異。結果顯示,本研究建議的方法對因素負載量與潛在類別比率等參數之估計良好。關鍵詞:非隨機遺漏、組型混合模型、結構方程模型、最大概似法、潛在變項#通訊作者:翁儷禎台北市羅斯福路四段一號台灣大學心理系(電子郵箱:jweng@.tw)調查研究需透過收集實徵資料以瞭解研究對象,但有時研究者除了對問題反應有興趣外,亦期待能深入探討多個測量變項間的相互關係,此時「結構方程模型」structuralequationmodels,簡稱SEM乃為適用方法之一。例如,Newcomb與Bentler(1988)在對青少年進行八年長期追蹤調查後,即利用該方法探討青少年毒品使用對其早期成年生活各方面的影響。結構方程模型包括研究者無法直接觀察到的潛在變項,早期結構方程模型著重於研究連續潛在變項,現在已有不少研究拓展到潛在類別變項,本研究即在探討潛在類別影響資料遺漏組型時結構方程模型的參數估計。組型混合模型Little與Rubin(1987)以及Little(1993)嘗試闡釋遺漏資料產生的機制。當觀察變項的各種遺漏組型分別表示不同類的受試者組群,且觀察變項間的關係可能因不同組群而異時,Little將此遺漏機制稱為組型混合模型(patternmixturemodel)組型混合模型所以得名係因不同的遺漏組型下形成不同分配,整個資料的邊際分配為有限混合模型(finitemixturemodel),因此稱為「組型混合模型」(Little,1993,1995)。以縱貫性的社會調查為例,該類研究常因受訪者搬家或對政治敏感拒訪而產生資料遺漏,不同遺漏原因可能造成相異的遺漏組型,同時亦反應其社經背景,進而影響調查變項的分配,此等資料遺漏機制即屬組型混合模型。許多遺漏值處理方法無法直接處理組型混合模型下之結構方程模型,Hedeker與Gibbons(1997)將多樣本結構方程模型(multi-sampleSEM)處理遺漏值之分析方式視為組型混合模型遺漏情形下的結構方程模型(例如Lee,1986;Muthen,Kaplan&Hollis,1987)組型混合模型假設遺漏組型反應不同的受訪者類別,而不同類別可能有相異的結構方程模型,因此不同遺漏組型者應分開處理。多樣本結構方程模型遺漏值處理法即將每個遺漏組型視為一個群體進行分析,因此可處理組型混合模型遺漏情形下的結構方程模型,然以此方法處理組型混合模型時,組型個數不能太多。組型混合模型乃針對外顯類別變項討論資料遺漏機制,但此等討論對心理學研究而言可能不夠充足,而需進一步引進潛在類別變項。我們可從兩個角度瞭解為何需將潛在類別引進遺漏機制模型。首先,可以從「理論構念」的角度引入潛在變項。心理學研究常因理論構念無法直接測量,而在理論模型中引進潛在變項以表達理論構念(如Everitt,1984;Joreskog&Sorbom,1993)例如,在較長的政治議題問卷上,受訪者可區分為「敏感受訪者」與「疲勞受訪者」兩類,其中「敏感受訪者」的特點是對敏感議題較易有拒答的傾向,而「疲勞受訪者」產生遺漏資料的原因則為因題目增多產生疲勞以致未填答。兩類受訪者的資料遺漏組型可能恰巧相同,但其資料遺漏的原因卻相異。因此,兩類受訪者無需對應特定的資料遺漏組型,遺漏組型僅反應受訪者隸屬於某類型的可能性。如果一受訪者在敏感題目上遺漏的機率較高,其他題目遺漏的機率較低,則此受訪者為「敏感受訪者」的機率較高。另一方面,若受訪者在各題的遺漏機率隨著題序增加而升高,則其可能為「疲勞受訪者」。此情形中,受訪者類別為潛在類別,反映研究者之理論概念,遺漏組型不用以界定潛在類別,而視作潛在類別的指標變項(indicators)其次,可以從測量誤差的角度引入潛在變項。當外顯變項有測量誤差時,可引進潛在變項,將外顯變項視為潛在變項與測量誤差之和(例如Griliches,1974),遺漏機制模型中的潛在變項同樣也可以從這個角度來討論。以前述「敏感受訪者」與「疲勞受訪者」為例,兩者在問卷各題產生資料遺漏的機率不同,但仍可能產生相同的遺漏組型,例如一個疲勞受訪者填答問卷時,可能恰巧都漏答敏感題目,因此遺漏組型未必完全決定受訪者之類別,而可能有誤差。將受訪者類別視為潛在分類變項,遺漏組型作為潛在分類的指標變項,可以將誤差考慮在內。本研究之目的即在組型混合模型遺漏機制中加入潛在類別變項,以表達潛在類別對遺漏組型的影響,稱之為「潛在變項組型混合模型」(latentvariablepatternmixturemodel),並以最大概似法估計此遺漏機制之結構方程模型參數,最後以模擬資料作為範例,初步評估本研究建議方法之表現。潛在變項組型混合模型遺漏機制的討論常引入遺漏指標變項,以指示外顯變項是否遺漏。假設有p

個外顯變項,每一外顯變項對應一遺漏指標變項。令M為px1的遺漏指標變項向量,M之變項皆為二元變項,值0表示資料遺漏,值1表示資料完整,M之數值即反應了外顯變項的遺漏組型。Mj若Y遺漏jY未遺漏

Mj若Y遺漏jY未遺漏

j1,2,(1)潛在變項組型混合模型假設遺漏組型反映的是受訪者隸屬各潛在類別的機率而非外顯類別,不同潛在類別可有個別的結構方程模型,而外顯變項與遺漏指標變項皆反映潛在類別。因此,外顯連續變項與潛在類別變項形成有限混合結構方程模型(finitemixturesSEM),而遺漏指標變項M與潛在類別變項則形成潛在類別模型(潛在類別分析,latentclassanalysis)。有限混合結構方程模型有許多種描述法(例如,Jedidi,Jagpal&Desarbo,1997a,b),本研究以Dolan與vanderMaas(1998)之模型描述:TOC\o"1-5"\h\zY|g=v+Aq+s⑵ggggn=a+G(3)ggggg式(2)表示潛在類別為g時外顯連續變項與潛在變項的關係,其中YIg為px1的外顯變項向量,V為pX1的截距向量,n為kx1的潛在變項向量,Aggg為pXk的係數矩陣,s為pX1的殘差向量。式(3)表示潛在類別為g時潛在g變項間的關係,其中a為kX1的截距向量,B為kXk的係數矩陣,G為kXggg1的殘差向量。假設在給定潛在類別下,外顯變項的條件分配為多元常態分配,則外顯連續變項分配為多元常態有限混合分配。潛在變項組型混合模型的遺漏機制在形式上相當於潛在類別模型,遺漏指標變項間的關係為潛在類別所造成,若固定潛在類別,則遺漏指標變項間彼此獨立,稱為局部獨立(localindependence,McCutcheon,1987)。在此假設下,當潛在類別為g時,M組型為m的機率為p(M=mIg)=np(M=mIg)=R九(1一九)—mj(4)jjjgjgj=1j=1其中p(M=mIg)與p(M=mIg)分別表示在給定潛在類別為第g類下,Mjj組型恰為m與第j個二元變項恰為m的機率,九為第g個潛在類別在第j題數jjg值為1(未遺漏)的機率。各潛在類別下都可能觀察到M為m,因此當有n個c潛在類別時,M組型為m的機率為p(M=m)=为冗*p(M=m11)=为冗*O九m;(1一九)】一m;(5)ttjtjtt=1t=1j=1其中冗為第t個潛在類別佔母體比率。假設潛在類別數已知(恰為n),待tc估計參數包括九與兀,前者為pXn的機率矩陣,表示每個潛在類別在每一題c的遺漏機率,而兀則為nX1維向量,表示各潛在類別比率,其元素和為1。c潛在變項組型混合模型下之結構方程模型可以式(2)、(3)與(5)描述。如果僅考慮外顯連續變項(Y),包括式(2)與(3),則模型為有限混合結構方程模型。若只考慮外顯二元變項(遺漏指標變項M,式(5)),則為潛在類別模型。潛在變項組型混合模型的結構方程模型形式上可以視為包含潛在類別模型與有限混合結構方程模型,相當於分析變項w,w=(y,M')'。在給定潛在類別時,假設Y與M局部獨立,且Y為多元常態分配,則概似函數為(Bartholomew&Knott,1999;Muthen,2001a):TOC\o"1-5"\h\zL=门KC*f(Y)*f(M),(6)i,t1,ti2,tii=1t=1其中f(Y)=(U2兀)-p*(I力I)—.5*exp(-.5(Y-y)'*力-1*(Y-)),titittitf(M)=rfXMj(1—九)1-MjOtijtjtj=1f()表示潛在類別為t時之多元常態分配機率密度函數,f()是多元二項1,t2,t分配機率函數。Muthen(2001b)的第二代結構方程模型描述包含潛在連續變項與潛在類別的模型,其外顯變項則包括連續變項與類別變項,並考慮連續的共變項(covariate),潛在變項組型混合模型下之結構方程模型形式上相當於沒有共變項且有遺漏值時的第二代結構方程模型。本研究擬採MCEM算則(MonteCarloEMalgorithm)推導當遺漏機制為潛在變項組型混合模型時結構方程模型之最大概似估計,以LVPM-ML稱之,完整資料之第二代結構方程模型估計(Muthen,2001a,b)可作為MCEM算則的M步驟。潛在變項組型混合模型的估計:MCEM算則MCEM算則為EM算則的變形。EM算則是一個疊代(iterative)程序,每次疊代分成E步驟(expectationstep)與M步驟(maximizationstep)E步驟推導給定觀察外顯變項下遺漏變項之條件機率密度函數,用以計算在目前參數估計值下對數概似函數之期望值。M步驟則根據E步驟所得資料求參數之最大概似估計值,相當於完整資料之最大概似估計(Dempster,Laird,&Rubin,1977;McLachlan&Krishnan,1997)。完整資料的最大概似估計多半較容易或已於過去研究中發展,因此研究者在分析遺漏資料時,若使用EM算則常僅需考慮E步驟即可,故許多遺漏資料的處理都採用EM算則(McLachlan&Krishnan,1997)本研究潛在變項組型混合模型之結構方程模型估計亦採EM類算則,在推導E步驟後,以Muth6n(2001a,b)之第二代結構方程模型作為M步驟,估計相關參數。EM算則E步驟期望值之求取有時牽涉多元積分,致使其分析困難或計算耗時,MCEM算則即可加以改善。MCEM算則以MCE步驟(MonteCarloEstep)取代E步驟,特點在於以模擬方法(MonteCarloMethod)計算E步驟中對數概似函數期望值之近似值,亦即藉由產生數個隨機向量,分別以之填補遺漏值,計算對應之對數概似函數值,平均後作為對數概似函數期望值之估計(例如,Wei&Tanner,1990;Ruud,1991)MCEM算則不牽涉期望值,因此常能避免多元積分運算,是對數概似函數期望值難以分析計算時極佳之替代方案(McLachlan&Krishnan,1997)本研究建議之MCEM算則,包含如下步驟:1.MCE步驟:僵件分配:求取條件機率密度函數。針對每筆具遺漏值資料(假設為第i筆),在給定觀察值,即給定未遺漏變項(Yy)與遺漏指標變項i,obsi,obs(M=m)下,求取遺漏變項(Y)之分佈。固定潛在類別時,Y與Y形iii,misi,misi,obs成多元常態分配,兩者並與M獨立,因此如進一步給定y,Y仍呈多元常i,obsi,mis態分配,而M之分配未受影響。橫跨所有類別,給定Y,則Y為有限常態ii,obsi,mis混合模型,M呈潛在變項類別模型。如再給定M=m,並不直接影響遺漏變項iiiY之分配,而影響潛在類別隸屬變項,遺漏變項仍呈有限常態混合模型:i,misTOC\o"1-5"\h\zf(YIY=y,M=m)=1LC'*f(YIY)(7)i,misi,obsi,obsiii,tti,misi,obst=1其中c=Ci*ft(Mi),其中細節請見附錄。i,tncEC*f(M)i,llil=11.2產生隨機向量,求取近似期望值:導出條件機率密度函數後,本研究建議採複合抽樣法(compositionmethod,又譯合成法,高惠璇,1995)產生隨機向量。複合抽樣法適用在欲抽取之分佈函數可表示為F(x)=EpF(x)之情ttt=1形,本研究欲抽樣之機率密度函數為常態混合分配,即符合複合抽樣法之要求。首先在給定M下計算對應之C',產生隨機整數T,使p(T=t)=p=C'。假設ii,tti,tT=g,則依據多元常態機率密度函數N(中,口)產生隨機向量。重複前mis|obsmis|obs述步驟R次,則可得R組隨機向量,將其取代遺漏變項後可形成R筆完整資料,再計算該筆資料對數概似函數之平均值作為近似期望值。2.M步驟:以Muth6n(2001a,b)之作法估計參數。範例本研究產生一模擬資料,以初步比較數種遺漏值處理法於潛在變項組型混合模型下之表現。此範例之目的乃在探討如果資料遺漏機制為潛在變項組型混合模型,則本研究推導之估計的表現是否較其他遺漏值處理法為佳。探討的遺漏值處理法包括列刪除法、平均值插補法、迴歸插補法與本研究建議之LVPM-ML,由於本研究焦點在遺漏資料的處理,故乃假設外顯連續變項的結構方程模型設定正確,即為有限混合結構方程模型。進行有限混合結構方程模型分析時,需以各個觀察值的個別資料進行分析,因此,無法產生完整個別資料之遺漏值處理法皆不適用,此類方法包括對刪除法與全訊息最大概似估計(fullinformationML,Arbuckle,1996;Enders,2001),多樣本結構方程模型遺漏值處理法則因本例遺漏組型過多而不適用。本範例產生完整資料時,設定樣本數為1000,並假定有「疲勞受訪者」與「敏感受訪者」兩個潛在類別,各佔全樣本之66.7%與33.3%。兩類受訪者的結構方程模型皆為四變項之斜交二因素模型,各因素之平均數為0,標準差為1,因素間相關則為.5,前二變項在第一個因素上有非零負載量,後二變項則在第二因素上有非零負載量,其餘負載量為0。非零之因素負載量與變項平均數則依潛在類別不同而異,「疲勞受訪者」分別設定為.8與0,「敏感受訪者」則為.6與2。在產生資料遺漏上,為使遺漏機制符合潛在變項組型混合模型,乃假設疲勞類別受訪者各題遺漏機率隨題序而增加,分別為.05、.15、.25與.35,敏感類別受訪者對前二題較敏感,因此有較高遺漏機率(.35),對後二題遺漏機率則較低(.05)。此模擬資料產生歷程之參數數值整理於表一模型理論值一欄。產生遺漏資料後,即以不同遺漏值處理法分析,並估計結構方程模型之參數,同時亦分析完整資料,作為考量遺漏值處理法優劣之參考。分析模型設為有限混合結構方程模型,受訪者所屬類別未知,僅假設已知有二個潛在類別。列刪除法、平均值插補法與迴歸插補法是先處理遺漏值,再以最大概似法進行有限混合結構方程模型分析的二階段作法,LVPM-ML則同時處理遺漏值並進行有限混合結構方程模型分析。LVPM-ML之MCEM算則以研究者撰寫之SAS/IML程式控制主要流程,M步驟以Mplus2.02(Muthen&Muthen,2002)進行,MCE步驟則以作者撰寫的讀取Mplus輸出之程式,得到M步驟每次疊代之參數估計值,再以SAS/IML求取條件機率密度函數及產生R個隨機向量。由於MCEM算則疊代過程牽涉隨機抽樣因素,估計值會在定值附近波動,因此可以參數估計穩定後,最後數次估計值之平均作為估計值(例如,Bockenholt&Tsai,2001)本範例之R初始值設為15,隨疊代次數每次增加5,上限設為100。隨著疊代次數的增加,對數概似函數估計值在第16次後,變化不超過對數概似函數數值之千分之一,任兩次疊代求得參數估計值之RMSD(rootmeansquareddifference)在第19次疊代後則不高於.01,且多在.005以下,參數估計趨於穩定,為使所得之參數估計值較穩定,本範例再疊代50餘次,計疊代75次,以最後25次估計值平均作為LVPM-ML之估計值。各種遺漏值處理法中除列刪除法採410筆完全未遺漏資料分析外,其餘各方法皆處理1000筆資料,各種遺漏值處理法與完整資料之參數估計值列於表一。四種遺漏值處理法中,因素負載量估計以本研究建議之LVPM-ML最佳,RMSD為.165,優於列刪除法與迴歸插補法(RMSD為.227與.243),平均值插補法最差(.523)因素間相關以LVPM-ML與列刪除法估計最佳(.098與.105),迴歸插補法與平均值插補法最差(.173與.207)。變項的平均數以列刪除法與LVPM-ML估計最佳(.088與.108),迴歸插補法次之(.323),仍以平均值插補法最差(.406)潛在類別比率估計值以LVPM-ML與列刪除法估計較準(RMSD為.009及.011),其他方法表現不佳。四種遺漏值處理法中,LVPM-ML納入遺漏指標變項,因此可估計不同潛在類別各變項之遺漏比率,由表一可看出遺漏組型如假設模式,疲勞類別之遺漏比率依題序增加而升高,敏感類別則在前二題有較高遺漏比率,LVPM-ML對各題遺漏機率估計之RMSD為.018。(置表一於此)如以完整資料為標準,各遺漏值處理法在各類參數估計上的表現與前述類似,唯RMSD較低。因素負載量估計以LVPM-ML最佳(RMSD為.049),列刪除法次之(.106),平均值插補法與迴歸插補法表現較差(RMSD分別為.258與.476)因素間相關以LVPM-ML與列刪除法估計最佳(.035與.045),迴歸插補法與平均值插補法最差(.079與.118)變項的平均數以列刪除法與LVPM-ML估計最佳(.078與.086),迴歸插補法及平均值插補法最差(.307與.382)。潛在類別比率估計值以LVPM-ML與列刪除法估計較準(RMSD皆為.002),優於迴歸插補法及平均值插補法(.1497與.251)。綜合看來,LVPM-ML表現最佳,除變項平均數外,對其餘參數的估計都優於其他方法,同時亦提供各類別資料遺漏之訊息。列刪除法表現次之,特別對因素間相關的估計較準確,平均值插補法與迴歸插補法的表現都相當差。討論結構方程模型分析需要實徵資料以驗證研究者假設的理論模型,而資料發生遺漏是其收集過程經常會遭遇到的情形。Littl(1993)提出的選擇模型(selectionmodel)與組型混合模型對心理學研究而言有其不足之處,因為此兩類模型均僅著眼於可觀察變項與資料遺漏間的關係,資料遺漏也可能與潛在變項有關。MuthOn等人(1987)將潛在連續變項加入選擇模型,鄭中平與翁儷禎(2002)則推導此時的最大概似估計。本研究則將潛在類別變項加入組型混合模型,稱之為潛在變項組型混合模型。潛在變項組型混合模型假設觀察變項的遺漏組型並非受訪者的分類,而是潛在類別的指標變項,此模型為Little組型混合模型擴充至潛在變項層次之延伸。簡言之,潛在變項組型混合模型假設觀察變項的遺漏組型反映潛在變項之類別,且各類別有其結構方程模型。本研究建議以MCEM算則估計資料遺漏機制為潛在變項組型混合模型時結構方程模型的參數,並以模擬資料為例,比較數種遺漏值處理法的表現。結果發現LVPM-ML最能回復資料產生歷程的因素負載量,對於不同潛在類別之遺漏機率與潛在類別比率估計亦表現良好,唯因素間相關估計略差。列刪除法對因素結構的回復表現次於LVPM-ML,但優於平均值插補法與迴歸插補法。本研究建議之LVPM-ML表現優良,相較於完整資料,LVPM-ML估計時除利用連續資料訊息外,遺漏指標亦作為潛在類別指標變項,可能因此使潛在類別比率之估計較準確,進而影響各類別因素負載量之估計。唯本範例假設之遺漏比率較高,前述結論是否能運用至一般情形,則宜以設計完整之模擬研究探究。LVPM-ML有賴兩個假設,首先是資料遺漏組型受潛在類別影響,其次為研究者正確設定潛在類別個數。違反任一假設都可能使估計程序表現不如預期理想,未來如能發展檢定假設是否成立的方法,或瞭解假設未成立時估計方法之強韌性,均對LVPM-ML的實際運用有所助益。兩個假設中,判定資料遺漏是否為潛在變項組型混合模型可能最為關鍵,此乃由於現行大多數遺漏值處理法皆在選擇模型假設下進行,判定資料遺漏是否為潛在變項組型混合模型乃為不可忽視的議題。未來如能發展相關檢定程序,將更能協助研究者對資料遺漏機制之判斷,進而選擇適當的遺漏值處理法。LVPM-ML亦假設研究者正確設定遺漏機制模型,尤其是潛在類別的數目。但多數實徵研究的旨趣並不在遺漏機制,若研究者對其背後的潛在類別不清楚,則潛在變項組型混合模型分析中,遺漏機制模型設定正確與否對參數估計影響的研究便相當重要,未來宜以模擬研究釐清。本研究以潛在變項組型混合模型嘗試探討潛在類別影響資料遺漏組型時結構方程模型之參數估計,初步研究發現推導之MCEM算則表現良好。此研究為一初探性研究,有關該模式假設與適用性之相關議題尚待後續研究進一步探討瞭解。參考文獻高惠璇(編著)(1995)。「統計計算」。北京:北京大學出版社。鄭中平與翁儷禎(2002年八月)。「潛在變項選擇模型下結構方程模型之最大概似估計」。發表於第四屆調查研究方法與應用學術研討會,台北。Arbuckle,J.L.(1996).Fullinformationestimationinthepresenceofincompletedata.InGA.Marcoulides&R.E.Schumacker(Eds.),Advancedstructuralequationmodeling:Issuesandtechniques(pp.243-277).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Bartholomew,D.J.&Knott,M.(1999).Latentvariablemodelsandfactoranalysis.London:Arnold.Bockenholt,U.,&Tsai,R.C.(2001).Individualdifferencesinpairedcomparisondata.BritishJournalofMathematicalandStatisticalPsychology,54,265-277.Dempster,A.P.,Laird,N.M.,&Rubin,D.B.(1977).MaximumLikelihoodfromincompletedataviatheEMalgorithm.JournaloftheRoyalStatisticalSociety,SeriesB,39,1-38.Dolan,V.C.,&vanderMaas,H.L.J.(1998).Fittingmultivariatenormalfinitemixturessubjecttostructuralequationmodeling.Psychometrika,63,227-253.Enders,C.K.(2001).Aprimeronmaximumlikelihoodalgorithmsavailableforusewithmissingdata,StructuralEquationModeling,8,128-141.Everitt,B.S.(1984).Anintroductiontolatentvariablemodels.NewYork:ChapmanandHall.Griliches,Z.(1974).Errorsinvariablesandotherunobservables.Econometrika,42,971-998.(ReprintedinD.J.Aigner,&A.S.Goldberger(Eds),1977,Latentvariablesinsocio-economicmodels.Amsterdam:North-Holland.)Hedeker,D.,&Gibbons,R.D.(1997).Applicationofrandom-effectpattern-mixturemodelsformissingdatainlongitudinalstudies,PsychologicalMethods,2,64-78.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997a).STEMM:Ageneralfinitemixturestructuralequationmodel.JournalofClassification,14,23-50.Jedidi,K.,Jagpal,H.S.,&Desarbo,W.S.(1997b).Finite-mixturestructuralequationmodelsforresponse-basedsegmentationandunobservedheterogeneity.MarketingScience,16,39-59.Johnson,N.L.,&Kotz,S.(1972)Distributionsinstatistics:continuousmultivariatedistributions.NewYork:JohnWiley&Sons.Joreskog,K.G.,&Sorbom,D.(1993).LISREL8:StructuralEquationModelingwiththeSIMPLIScommandlanguage.Mooresville,IN:ScientificSoftware,Inc.Lee,S.Y.(1986).Estimationforstructuralequationmodelswithmissingdata.Psychometrika,51,93-99.Little,R.J.A.(1993).Pattern-mixturemodelsformultivariateincompletedata.JournaloftheAmericanStatisticalAssociation,88,125-134.Little,R.J.A.(1994).Aclassofpattern-mixturemodelsfornormalincompletedata.Biometrika,81,471-483.Little,R.J.A.(1995).Modelingthedrop-outmechanisminrepeated-measuresstudies.JournaloftheAmericanStatisticalAssociation,90,1112-1121.Little,R.J.A.,&Rubin,D.B.(1987).Statisticalanalysiswithmissingdata.NewYork:JohnWiley&Sons.McCutcheon,A.L.(1987).Latentclassanalysis.SageUniversityPaperseriesonQuantitativeApplicationsinthesocialScience,seriesno.07-064.NewburyPark,CA:Sage.McLachlan,GJ.,&Krishnan,T.(1997).TheEMalgorithmandextensions.NewYork:JohnWiley&Sons.Muthen,B.(2001a).Latentvariablemixturemodeling.InGA.Marcoulides&R.E.Schumacker(Ed)Newdevelopmentsandtechniquesinstructuralequationmodeling,(pp.1-33).Mahwah,NJ:LawrenceErlbaumAssociates,Inc.Muthen,B.(2001b).Second-generationstructuralequationmodelingwithacombinationofcategoricalandcontinuouslatentvariables.InL.M.Collins&A.GSayer(Ed)Newmethodsfortheanalysisofchange,(pp.291-322).Washington,DC:AmericanPsychologicalAssociation.Muthen,B.,Kaplan,D.,&Hollis,M.(1987).Onstructuralequationmodelingwithdatathatarenotmissingcompletelyatrandom.Psychometrika,52,431-462.Muthen,L.,&Muthen,B.(2002).Mplus2.02[Computersoftware].Http://www.StatM.Newcomb,M.D.,&Bentler,P.M.(1988).Consequencesofadolescentdruguse:Impactonthelivesofyoungadults.NewburyPark,CA:Sage.Ruud,P.A.(1991).ExtensionsofestimationmethodsusingtheEMalgorithm.JournalofEconometrics,49,305-341.Wei,G.C.G.,&Tanner,M.A.(1990).AMonteCarloimplementationoftheEMalgorithmandthepoorman'sdataaugmentationalgorithm.JournaloftheAmericanStatisticalAssociation,85,699-704.附錄潛在變項組型混合模型之遺漏變項條件機率密度函數令Y為第i筆資料的外顯變項向量,維度為pX1,其中Y為Y中遺漏變TOC\o"1-5"\h\zii,misi項向量,Y為未遺漏變項向量,M為Y之遺漏指標變項向量。現欲在給定i,obsiiMCEM算則M步驟估計之第g個潛在類別Y的平均數向量X和共變數矩陣Yg,及隸屬變項C下,求得固定Y=y與M=m時,Y之條件機率密i,gi,obsi,obsiii,mis度函數f(YIY=y,M=m)。i,misi,obsi,obsii為方便表達,乃引進選取變項並重排的運算w,w為axp矩陣,a為選取變項數(Finkbeiner,1979)每筆資料的連續變項可分成二類:遺漏變項與未遺漏變項,w之下標依序標示是否選取遺漏變項與未遺漏變項,0表示不選取該類變項,1表示選取該類變項;例如,w表示不選取遺漏變項,但選取未遺漏變01項。以Y'=[2.5..3為例(.表示遺漏值),(wy)'=[253],對應之w如下所i01i01示。01000010000000000100001000000000同樣的,w則相當於先選取遺漏變項,再選取未遺漏變項,(wY)'=[•…21111i53],對應之w如下。1111010000100000001000010001000001101000010000000100001000100000000001在給定潛在類別下,Y的機率密度函數為(A1)i(A1)f(Y,Y)~N(卩g,Sgib)

gi,misi,obsmis,obsmis,obs其中卩gmis,obs=w其中卩gmis,obs=w卩g11Sgmis,obsmis,obswSgw'。1111進一步給定Yi,obsYi,msi之條件機率密度函數仍為多元常態分配(Johnson&Kotz,1972&Kotz,1972):f(Ygf(Ygi,mis|Y)~i,obs,Sg)mis|obsmis|obs(A2)其中其中卩gmis|obsS卩gmis|obsSgmis,obsmis,obsobs)+卩gmis-1S-1Sgmis|obsSg-SgSgSgmismis,obsobsobs,misobs=wSgw'0101obs=w卩g01Sg=wSgwobs=wSgw'0101obs=w卩g01Sg=wSgw'mis1010J卩gmis=w卩go10給定Yi,obs,由於局度獨立,M之條件機率函數及Yiii,mis與M之條件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论