我国全民健康保险医疗费用审查制度之研究.doc_第1页
我国全民健康保险医疗费用审查制度之研究.doc_第2页
我国全民健康保险医疗费用审查制度之研究.doc_第3页
我国全民健康保险医疗费用审查制度之研究.doc_第4页
我国全民健康保险医疗费用审查制度之研究.doc_第5页
免费预览已结束,剩余17页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

我國全民健康保險醫療費用審查制度之研究 131我國全民健康保險醫療費用審查制度之研究陳建勝 林佳慧 陳美菁* 通訊作者 E-mail:.twTel:(04) 2332-3000轉4202本研究特別感謝中央健保局中區分局方志琳副理及田麗雲專員提供專業協助。 王安平朝陽科技大學保險金融管理系摘要我國全民健康保險的財務結構一直受到各界的高度重視,其中又以醫療費用最受矚目,本研究以健保局中區分局基層院所申報案件為研究對象,應用資料探勘技術建置申報案件核減與否的分類預測模型,並比較邏輯特迴歸與類神經網路所建構的模型,其實証結果發現利用邏輯特迴歸方法所得的型I誤差將隨臨界值的不同而有所變動,而若以誤判成本為評估依據,類神經網路模型擁有較佳之分類效果,該模式將可做為協助健保局於審查申報案件的初步過濾分類,提供可能遭核減的異常申報案件,進而改進抽審制度。關鍵字:行政核減、類神經網路、邏輯特迴歸、專業審查、誤判成本壹、前言我國全民健康保險(以下簡稱全民健保)自1995年實施至今,投保率高達96%,民眾的醫療品質藉此獲得顯著的改善,其滿意度也在七成以上(中央健保局,2003),此充分顯示全民健保已普遍獲得人民的肯定,故如何維持永續經營以提供長期性的就醫保障即成為重要的課題。全民健保乃以照顧我國國民的健康為宗旨,在財務穩健的前提下提供便利及完善的醫療照護。然而,當財務入不敷出的情況持續發生時,一切的目標都將淪為空談。事實上,我國全民健保自開辦以來,財務結構就一直受到大眾的關注,自1998年開始,保費收入的成長早已不及醫療費用支出的成長,其中,最大的隱憂在於醫療資源的浪費(林雨靜,2003)。全民健康保險局(以下簡稱健保局)為避免不必要的支出增加而造成醫療浪費,在醫療需求方面,藉由調高費率以降低民眾非必需的就醫行為,並誘導民眾選擇適當層級的醫療院所;然而,就醫療供給面而言,除了社會變遷、人口老化及醫療科技進步等無法避免之環境因素外,健保局是否針對醫療費用支出做嚴謹的控管並防止醫療資源的濫用,亦是影響全民健保財務結構的重要關鍵。換言之,若只依賴調漲保費或調高費率並非解決財務困境的最有效方法,重點在於使得每筆醫療費用的支出皆能妥善地被運用。而審查制度的實施除了可抑制醫療費用的增加之外,亦可確保醫療院所申報的費用之合理性及必需性,故醫療費用查核的重要性日益俱增。但申報醫療費用的案件不斷地增加,在審查人力與資源有限的情形下,如何有效地提升審查作業效率,促使醫療資源的合理運用,對健保局而言實為當務之急。根據全民健康保險醫事服務機構醫療服務審查辦法之規定,健保局審查作業主要區分為行政審查(即程序審查)及專業審查,行政審查乃依據醫療服務,由各分局的門診組或住院組負責,採電腦審查和人工作業來執行,審查項目包含保險給付範圍之核對、保險支付標準及藥價基準正確性之核對、申報資料填載之完整性及正確性、檢附資料之齊全性、論病例計酬案件之基本診療項目的初審、事前審查案件之核對及其他醫療服務申報程序審查事項等,申報案件若於不符行政規定或有疏失者則予以行政核減。專業審查乃由具有五年以上教學、臨床或實際經驗之醫師、藥師等醫事人員依相關法令規定辦理醫令審查之工作,並基於醫學原理、病情需要、治療緩急、醫療能力與服務行為進行審查,若對於申報案件之醫療適當性或品質有所疑義時,得會同具相關專長之醫師或藥師等醫事人員進行審查,必要時,得提交審查會議討論。一旦經專業審查有不當情形者,則不予支付不當部分之申報費用,並註明不予支付的內容及理由。事實上,健保局對於申報案件之醫療費用審查作業流程,首先是將醫療院所每個月所上呈之資料轉檔存入資料庫,全部的申報案件經由行政審查後進行隨機抽樣,承辦人員會針對電腦抽樣案件函請醫療院所寄發被抽樣案件之病歷資料,並與申報清單明細表彙總後交由各科別專業審查醫師進行審查。當然,醫療院所可就被通知核減的案件進行申覆,此類案件會交由不同的專業醫師審查,如被駁回可再送至衛生署爭議審議委員會。另外,健保局各分局若經檔案分析發現醫療機構有申報異常者,得增加或減少隨機抽樣比率或採行立意抽樣。就現況而言,醫療院所依病患就診項目及規定向健保局請領費用之申報案件,健保局需經審查並判斷其醫療費用是否合理才能給予核付,但每月申請的件數高達二千多萬件,如此龐大的數量,若全部案件均採逐一審查,雖可儘量避免申報費用的不合理或浪費的情況發生,但礙於人力、成本及核付時間的考量卻窒礙難行(左祖儀,2003)。因此,健保局自1995年9月開始實施抽樣審查方式,即從申報案件中等距隨機抽取部份案件為樣本,經審查後再回推計算總核減金額(黃肇明,1996)。該抽樣審查方式會放大回推核減金額,即當所抽樣的案件中,被發現有申報不實或錯誤的情形,其申報費用的刪減將在扣除非抽樣之案件金額後,依異常案件核減金額與總抽樣金額的比例回推到全部受審的案件。事實上,此一制度會因抽樣誤差及放大回推制度造成刪減費用過低或過高,若最後核付的金額無法因應實際支出時,醫療院所可能會降低醫療品質,致使就醫的民眾受害;再者,抽樣難免遭受外界質疑樣本無法適度地代表母體(徐弘正,1999)。例如,有心人士可能將虛浮報費用之申報案件集中在一起,將可規避被抽審到多件需核減之案件。最後,抽樣率乃依申報件數多寡計算,而核減率卻以金額多寡為依據,此一現象並不合理。審查的主要目的係以確保醫療的服務品質為主,糾正醫療資源之濫用為輔,但現行的審查制度,有過度強調懲罰的傾向,極易造成排擠其他正常必要之醫療支出,進而影響醫療院所的營運及其品質的維護 (左祖儀,2003)。健保局曾針對上述審查制度提出修正方案,例如回推案件不含極端值、改變抽樣排序方式等,然而,審查制度仍舊存在一個最根本的問題,就是抽樣誤差,而此問題的解決辦法在於抽審制度的改善。若案件審核者可以利用電腦先行過濾,並分類出可能遭核減之案件,則可免除抽樣手續以改善現行之抽審方式,進而避免因抽樣所產生的誤差或人為規避案件的抽查。另將審查的人力與資源投注於較可能遭核減的案件所獲得之成本效益或許高於隨機地查核所有的抽樣案件。而資料探勘(data mining)技術是藉由電腦資訊所發展出的管理分析工具,其運用大量的資料轉換、處理及萃取規則來進行分類與預測,具有快速歸納、整合的功能與效果,且應用範圍亦相當廣泛。因為資料探勘技術可以有效地提供即時資訊以供決策之用,故該技術運用於臨床資料庫將可促進醫學治療技術的進步(Biafore, 1999;Milley, 2000;Oakley, 1999)。因此,本研究的主要目的即是運用資料探勘技術進行申報案件的全面篩檢,希冀透過所建構之分類模式找出可能遭核減之申報案件,以作為優先審查及稽核之參考。貳、文獻探討與研究設計一、文獻探討徐弘正(1997) 以健保局中區分局所屬設有神經科、神經外科、骨科及整型外科之醫療院所為研究對象,運用類神經網路、區別分析及邏輯特迴歸分析等方法,將輸出結果依核減率區分為三個等級,並針對復健申報代碼之醫令處方作分析,其研究變數包括處方平均金額、復健治療平均金額、用藥平均金額、口服平均金額、注射藥平均金額、外用藥平均金額、X光平均金額、多重治療比率、1次比例、6次比例、2至5次比例、物理治療評估次數、簡單治療比例、中度治療比例、複雜治療比例、人力等16個變數,其研究結果發現類神經網路的模型之正確率皆高於利用其他統計方法的結果。湯玲郎和林信忠(2000)則以健保局北區分局之基層診所為研究單位,並以診所是否曾因虛浮報費用而遭處以停止特約1至3個月為分類依據,其研究變數以每月平均之屬量資料為主,分別為每月平均申請件數、每月平均申請金額、案件平均申請金額、行政核減金額、專業核減金額、核減率、每月一般案件數、每月一般案件申請金額、一般案件平均申請金額、每月專案申請件數、每月專案申請金額、專案案件平均申請金額、醫師數、醫師用藥明細金額、醫師診療申請金額、負責醫師年齡等16個變數。研究發現類神經網路對於判別診所異常與否確實可行;除此之外,在中醫與西醫基層診所方面,運用類神經網路模式的結果相對較區別分析及邏輯特迴歸分析來得有效;牙醫部份則以邏輯特迴歸分析最為理想。藍中賢(2000) 以健保局某醫療院所為研究對象,藉由模糊集合理論來建立連續數值的區隔,將連續的資料轉換成離散的屬性值,再結合貝氏分類法建立資料探勘決策模式。其研究變數包括案件分類、就醫科別、性別、部分負擔方式、給藥日份、醫師性別、藥費、診療費、診察費、藥事費、合計金額、部分負擔、申請金額、核減金額等14個變數。其研究結果顯示該模式之鑑別率和整體正確率良好,可藉此進一步管理與監控醫療費用的成長。二、樣本資料根據中央健保局2003年的統計數據顯示,全民健保開辦至今,門診申報費用(點數)及件數遠高於住院,另由健保局特約類別分析發現,基層診所的申報費用(點數)及件數為最高;此外,有鑑於醫療院所區分科別眾多,而各科的申報量中,內兒科、外科及婦科等三大科別之申報案件數為全部的40%,且佔整體醫療費用之最大宗。因此,本研究將以健保局中區分局全體基層診所之兒科、外科及婦科等三大科別為研究對象,樣本期間為2001年3月至12月,以其實際審查結果做為預測模式建立的依據。另外,本研究旨在取代抽樣方式以避免回推造成的抽樣誤差,故研究樣本不包含不列入抽審之案件,包含洗腎、居家照護、精神疾病、社區復健、預防保健、一般案件、職災門診案件、論病例計酬案件、支付制度試辦計畫、愛滋病案件、論病歷計酬及經行政審查需整件核減等。因此,針對基層診所門診的申報費用抽樣送審檔,在剔除申報類別為補報之後,共得24,852筆資料。三、研究變數本研究以健保局之醫療申報案件資料為主,故所選擇的變數將侷限在醫療院所申報格式之內容,其分析資料包括與申報費用有關的門診處方治療明細檔與門診處方醫令明細檔。另參考上述之相關文獻,本研究以專業核減與否做為因變數(),並以案件分類(-)、電腦行政核減()、就醫科別(-)、特定治療項目代號(-)、國際疾病分類號(-)、給藥日份()、部份負擔()、申請金額()、單價()、總量()及金額()等變數為自變數,所選取之變數及說明如表1所示。健保局行政核減可分為人工及電腦審查方式,有鑑於樣本資料中人工行政核減金額皆為0,因此,本研究將以電腦行政核減欄位內容做為行政核減變數分析之用。其中,醫令明細檔之欄位內容分別表示每一種藥品的資訊,因為單次看診可能開立一種以上的藥品,故此兩個檔案是屬於一對多的關係,本研究將利用資料庫中申請案件之電腦序號為主連結兩個檔案之資料以進行分析。表1 研究變數彙整表檔案別變數名稱資料說明治療明細檔專業核減()以1表需核減案件,0表無需核減案件案件分類(-)利用以虛擬變數分別表示案件之分類別電腦行政核減()以1表需核減案件,0表無需核減案件就醫科別(-)以虛擬變數分別表示內兒科、外科及婦科特定治療項目代號(-)以虛擬變數分別表示特定治療項目之代號國際疾病分類號(-)以虛擬變數表示疾病分類之代號給藥日份()屬量資料部份負擔()屬量資料申請金額()屬量資料明細檔醫 令單價()屬量資料總量()屬量資料金額()屬量資料四、研究方法(一) 邏輯特迴歸在傳統的方法中,邏輯特迴歸的應用因不需要像區別分析的多變量常態之假設,故在二分類(binary or dichotomous)問題的研究較廣泛地被採用,例如保單失效預測(楊宗杰,1992;林耀東,1998,陳建勝、林明宏,2003)、破產預測(呂嘉盈,2000)等。邏輯特迴歸的基本形式與一般線性迴歸並無很大不同,惟準則變數不再如線性迴歸為連續性變數,而是以二分類變數形態出現,因此必須透過邏輯特迴歸函數的轉換使其與預測變數呈現線性的關係。令因變數=0或1分別表示需核減案件或不需核減案件;其模型如式(1)所示。(1)其中,表示迴歸係數向量;表示預測變數向量,。換句話說,即表示= 1的發生機率,稱之為邏輯特迴歸函數(logistic regression function)。若將此函數作以下轉換:,則可得一個線性迴歸模型。進一步而言,因為,故採用此模型時必須決定臨界值(cut-off value),以作為決定是否屬需核減案件的分類標準,通常取最保守的臨界值為0.5,但當兩類別之機率與0.5有顯著的差異時,則須利用樣本的事前機率或依經驗或以試誤法找出最適臨界值為何作為臨界值。以本研究為例,假設為申報案件被判定須專業核減的機率,則模型以 表示,其中為迴歸係數。(二) 倒傳遞類神經綱路倒傳遞類神經網路(back-propagation network,簡稱BPN)則是類神經網路中應用最為廣泛的模型,常被用來解決二分類問題,如失卻清償能力之預測(Brockett et. al., 1994;柯俊良,1994;馬中驍,1996)、銀行授信企業之違約風險預測(陳錦村、許通安、林蔓秦,1996)等。倒傳遞類神經網路所得的輸出值與訓練範例的目標值互相比較可求得網路錯誤,並利用最陡坡降法(gradient steepest descent method)將此錯誤作為修正連結中的加權值與閥值的依據,進而從訓練範例中建立最佳的預測模型(Fausett, 1994)。倒傳遞類神經網路需要設定隱藏層單元數、隱藏層層數及學習速率等重要參數,而參數值會依研究問題的難易度和資料結構而有所不同,並無固定的設定值,使用者必需透過試誤法找出最佳值。茲就本研究所應用的倒傳遞類神經網路模型(Haykin, 1999)說明如下:(2)(3)其中,、分別表示輸入層與隱藏層的運算元數目;表示第個輸入變數與第個隱藏運算元之間的權數值;表示第個隱藏運算元與輸出運算元之間的權數值;表示第個隱藏運算元之閥值;表示輸出運算元之閥值;表示第個輸入變數,;表示第個隱藏運算元之輸出值;表示輸出運算元之輸出值,亦為網路模型的期望輸出值;表示作用函數。針對倒傳遞類神經網路模式之應用,本研究將樣本資料24,852筆分為訓練範例12,426筆、測試範例6,213筆及驗證範例 6,213筆,各範例樣本皆以隨機抽樣方式取得,其中驗證範例是在檢驗模式的訓練結果是否能夠收斂;測試範例則用於評估該模式實際運用時的預測效果。五、模型預測能力之衡量(一) 混亂矩陣本研究利用混亂矩陣(confusion matrix)判斷預測模式的優劣性之一,並藉由其誤差分配的情況以作為改善模式的依據。由表2可知,型I誤差係指需核減的案件被誤分類為不需核減的案件數比率,型II誤差則為不需核減的案件被誤分類為需核減的案件數比率;另總正確率定義為正確分類數佔總案件數的比率。表2 混亂矩陣實際案件不需核減實際案件需核減預測案件不需核減正確分類型I誤差預測案件需核減型II誤差正確分類(二) 誤判成本根據混亂矩陣得知,健保局若投入大量的專業人力來檢查原本不需審查的案件,將會造成審查醫師的工作量的增加,此即為型II誤差;型I誤差則為需核減的案件但未能正確地予以核減,因此,產生不必要的醫療費用支出,當然造成醫療資源的浪費甚至影響全民健保的收支平衡。本研究的重點希冀能正確地篩選出應被核減之案件,換言之,型I誤差所產生的成本與資源浪費遠超過型II誤差。然而,型I和型II誤差是無法二者完全避免的錯誤判斷,且它呈現互為反比的關係,是故,本研究將兩者的比值轉換為成本比值,例如成本比值為10即表示因型I誤差所產生的成本為型II誤差的10倍。Boritz and Kennedy(l995)利用型I、型II誤差及成本比值等比率定義誤判成本(misclassification cost)如下:其中,表示成本比值;表示核減案件的比率。由定義可以得知誤判成本係同時考量型I及型II誤差的效應,故為一較客觀且具參考價值的指標。雖然許多文獻探討誤判成本時,皆假設成本比值為 1的情況下求誤判成本最小,但如此的假設與現實並不相符(Berardi and Zhang, 1999)。為了確實呈現出誤判成本的影響力,以瞭解各模型因錯誤分類所造成的損失幅度大小,我們將計算在不同的成本比值下各模型的誤判成本以供比較。(三) 接受者操作特徵曲線一般而言,在評估分類模型的預測能力時,常以模型的個別與整體正確率或誤判率高低衡量預測的效果,但二分類問題對臨界值的選定相當敏感,為克服臨界值的影響,Zweig and Campbell(1993)以接受者操作特徵曲線所包含的面積(area under receiver operating characteristic curve;簡稱AUROC)的大小來比較模型在不同臨界值下之分類結果,並評估分類模型的區別效果。圖1為一典型的接受者操作特徵曲線,一般而言,以曲線下方面積(area under the curve,簡稱AUC)作為評估的準則,若AUC愈大則表示該模型區別效果愈佳,反之則表示該模型的區別效果不理想。1-型I誤差ROC曲線型II誤差011圖1 ROC曲線圖本研究將比較邏輯特迴歸及倒傳遞類神經網路所建構模式之正確率,而正確率則取決於型I及型II誤差的大小,誤差愈小則整體正確率愈高,但在型I誤差以及型II誤差不能同時最小化的情況下,為特別強調對於可能核減案件之分類能力,本研究將選取型I誤差較小之模式。另外,本研究亦加入成本比值的觀念,考量不同臨界值的模型對成本比值的影響,以及在不同的成本比值之下,誤判所造成的成本變化情況。最後,將以ROC曲線來評估模式之配適效果。參、實證分析一、樣本描述首先針對樣本資料做一初步分析,如表3所示。其中,給藥日份表示單次看診醫師依病情需要所開立藥方天數,天數會依疾病別或病情需要等而有所不同,平均約以5天居多;部份負擔表示就醫民眾需自行負擔之費用,該值會依就醫院所的不同而有所差異,平均約為100元;申請金額則為診斷所需全部費用扣除部份負擔後,可向健保局請領之金額,包含用藥明細金額、診療明細金額及診察費等,每筆案件的申請金額約為500元,佔合計金額的 83.78%。醫令檔之單價、總量及金額則分別表示每一種藥品的相關資訊。從這些屬量資料中可發現各輸入變數間的差異性都很大,其中又以總量及金額的資料分散程度相對其他研究變數大許多,推論為藥品劑型不同等因素所造成。單價部份雖然標準差高達近80元,相對的資料分散程度也屬最大,但因單價本來就會因疾病及藥性的不同而有很大的差異,從其中金額可高至 3,630元即可了解單價間的差距頗大,這部份也與現實之認知相符。表3 屬量資料敘述統計彙總表變數平均數標準差最大值最小值變異係數(%)給藥日份4.524.79600105.90部份負擔98.1853.64300054.64申請金額506.78444.3875909187.69單價18.4378.253,6300424.64總量7.0317.373000247.06金額35.42106.146,0000299.63在門診處方明細檔方面,係依欄住內容將資料轉換為以虛擬變數來表示,如表4所示。其中案件分類、就醫科別、特定治療項目代號、國際疾病分類號等乃依據健保局規定的申報資料格式來判別,例如西醫門診醫療費用之案件分類別,若為健保局所公告之九十五種慢性病,或經醫師確認保險對象病情穩定,可長期使用同一處方藥品治療者,案件分類皆為西醫慢性病;不屬上述範圍之案件分類者,或同時有急性、慢性病一起診治時則分類為西醫其他專案。特定診療項目因細分類別過多,經資料分析後乃選取其中七種項目別做為分類依據。另外,因基層診所多屬耳鼻喉科,所以在特定治療代號方面,以內耳前庭病變約佔總樣本半數;疾病別方面亦以循環系統疾病及呼吸道疾病佔多數。健保局所指之核減率,為醫療院所第一次申報金額遭專業醫師刪減的金額回推至總金額,加上行政核減金額除以總申報金額的比例,在樣本資料中遭核減之申報案件數比例約為18%,該數值表示申報案件之件數核減率,不同於申報案件之金額核減率,本研究將利用此機率值做為邏輯特迴歸模型之臨界值。表4 屬質資料變數彙總表變數名稱筆數比例(%)變數名稱筆數比例(%)專業審查案件分類有核減4,46017.95西醫急診360.14無核減20,39282.05西醫慢性病8,31033.44西醫其他專案16,46966.27電腦行政審查其他370.15遭行政核減10,23141.17無行政核減14,62158.83就醫科別內兒科20,66083.13國際疾病分類號外科2,4209.74腫瘤 6412.58婦科1,7727.13內分泌、新陳代謝疾病與免疫性疾病 1,1794.74循環系統疾病 4,55018.31特定治療項目代號呼吸道疾病4,52718.22糖尿病1,1624.68消化系統疾病3,04112.24高血壓2360.95泌尿生殖系統疾病 2,98712.02慢性肝炎1,4725.92皮膚及皮下組織疾病 5532.23痛風3,13312.61骨骼肌肉系統及組締組織之疾病3,88915.65消化性潰瘍1,0244.12徵候症狀及診斷欠明之各種病態7202.90心臟病4861.96損傷及中毒1,9687.92內耳前庭病變11,75247.29其他7973.21該欄位空格1,1184.50其他4,46917.98二、各模型預測能力比較本研究將分別探討邏輯特迴歸及類神經網路各模型之分類預測能力。在執行邏輯特迴歸時,除使用樣本之實際件數核減率外,另外模擬不同數值之臨界值,以建立不同的模式;且為避免變數間的高度共線性影響實證結果,將刪除具共線性之變數以建構模型。類神經網路的運用則採取三種輸入變數的選取方法,分別為網路自動選取、輸入全部變數及經邏輯特迴歸選取顯著之變數,並比較臨界值依網路自動設定或依實際件數核減率AB二種,以選取效果較佳之模式。其網路模型之架構及設定如表5,其中,參數設定中的數字依序為輸入層運算元個數、隱藏層運算元個數及輸出層運算元個數,另其訓練模型的學習速率及慣性因子則分別設定為0.3及0.1(葉怡成,2001)。表5 類神經網路模型結構及設定說明變數選取方法參數設定臨界值模型代號自動選取22-21-1網路自動設定BPN-Auto-A0.18BPN-Auto-B全部變數29-15-1網路自動設定BPN-All-A0.18BPN-All-B邏輯特迴歸顯著15-8-1網路自動設定BPN-LR-A0.18BPN-LR-B因類神經網路之使用必須對模型進行訓練,而在網路進行訓練的過程中,若誤差率逐漸升高時,則停止訓練並保存網路。由表6觀察訓練及測試範例的誤差率,可發現本研究之模型皆無過度學習的現象發生;另訓練範例誤差和測試範例誤差皆很小且二者差異不大,可知網路具有重現性及普遍性,而運用訓練後的模型於其他樣本時,其成效將不至於和訓練結果有太大的差異。測試範例的結果乃用於評估該模式實際運用時的預測效果,表7顯示 BPN-Auto-B擁有最低之型I誤差,但該模型的型II誤差卻也是最高的。表6 類神經網路模型執行結果單位:%範例類別模型名稱訓練範例測試範例型I誤差型II誤差總正確率型I誤差型II誤差總正確率BPN-Auto-A18.0515.2683.3415.5916.8383.79BPN-Auto-B0.8928.0685.531.1930.8683.98BPN-All-A12.6612.0887.6313.3913.7986.41BPN-All- B5.1917.1288.846.2719.0187.36BPN-LR-A15.4814.8285.0715.0816.3383.9BPN-LR- B9.5518.7882.727.5421.2081.39因為不同的臨界值對邏輯特迴歸模型有很大的影響,故若以實際件數核減率作為臨界值不一定最適當,且該值在醫療費用審查之相關研究中並無經驗值可供參考。因此,本研究除使用0.18為臨界值之外,另選取0.4、0.3及0.29等數值為臨界值,以了解不同的臨界值對型I、型II誤差及總正確率之影響。由表7可知,在不同的臨界值設定下的型I及型II誤差呈現消長的現象,若為求型I誤差較小,相對的也必須付出較高的型II誤差,總正確率也會跟著降低,故必須經由試驗的方式決定最佳的臨界值。表8顯示LR-0.18之型I誤差最小,但0.18未必即為最佳之臨界值,鑑於模型優劣的比較不能單單只追求型I誤差最小或總正確率最大,必需去考量現實環境中誤判所造成的成本大小。因此,本研究將以模擬的成本比值觀察各模型誤判成本變化的趨勢。表7 不同臨界值邏輯特迴歸模型之分類結果單位:%臨界值型I誤差型II誤差總正確率0.4019.9313.8985.020.3016.0515.5584.360.2915.1615.8284.300.185.1624.2379.19從圖2可以發現當模型的型I誤差小於型II誤差時,誤判成本會隨成本比值增加而呈下降的趨勢,反之則呈上升趨勢;另從圖3可知類神經網路中,由使用者自行設定臨界值之模型或許可以降低型I誤差,但同時也會提高型II誤差,其誤判成本會依成本比值的不同而有大幅度的變動,和其他由網路自動決定臨界值之模型相比較為不穩定。在實際成本比值未知的情況下,我們很難藉此判斷何者誤判成本最小,假設成本比值等於1或10下所選擇的最適模型也會因此不同,然而健保局成本比值的計算牽涉到錯誤分類案件所造成的社會成本增加幅度,該值會因現實環境等因素而變動,並無一固定數字可供參考。因此,本研究嘗試從圖中選取在不同模擬成本比值下誤判成本相對較小且變化平穩之模型,目的為求可以較為精準地估計模型的誤判成本,以做為比較模型優劣的依據。依上述準則所選取的邏輯特迴歸模型為LR-0. 29,該模型的誤判成本約為0.16;在類神經網路模型中則以BPN-All-A之誤判成本相對較小且變化穩定,約為0.14。而在不同的成本比值之下,BPN-All-A誤判成本皆略小於LR-0.29;在不同的臨界值下,兩模型之型I、型II誤差變化趨勢,並將之轉換成ROC圖後亦可發現BPN-All-A擁有較大之AUC值,如圖 4所示,顯示該模型之區別效果略優於LR-0.29。圖2 邏輯特迴歸模型之誤判成本圖圖3 倒傳遞網路模型的誤判成本圖圖4 模型BPN-All-A和LR-0.29的ROC曲線圖肆、結論與建議一、結論全民健保以照顧全民健康為宗旨,在財務穩健的前提下提供便利及完善的醫療照護,有效地開源節流才能使全民健保能夠永續經營,在全面實施總額支付制度後,財務壓力雖已大幅減輕,但為避免醫療院所不實的虛浮報費用造成醫療資源的浪費,健保局仍需對於申報費用進行審查以確保其合理性。健保局目前因考量審查人力有限,採用抽樣審查的方式,但抽審制度是否合適,值得相關單位進一步討論。本研究利用資料探勘技術,希望能由電腦協助健保局申報案件的審查,藉由架構分類預測模式來進行申報案件的初步過濾分類,以有效運用資源於重點案件,進而提高審查效率以及節省大量的人力與資源。本研究運用邏輯特迴歸與類神經網路所架構的模式加以比較分析,測試邏輯特迴歸的不同臨界值及類神經網路不同的設定值下的各模型,並對於模擬的成本比值下之誤判成本大小及變動幅度加以考量。本研究以健保局中區分局基層院所申報案件為研究對象,運用邏輯特迴歸及類神經網路等兩種方法建立預測模型,其實證結果顯示類神經網路模型BPN-All-A擁有較佳之分類效果。BPN-All-A將可做為協助健保局於審查申報案件的初步過濾分類,提供高度可能遭核減的異常申報案件,進而改進抽審制度,以達到本研究之目的。另其實證結果與相關文獻(徐弘正,1997;湯玲郎、林信忠,2000)比較,雖所使用之研究樣本不同,但其實證結果皆顯示類神經網路模型之分類結果較佳。二、建議基於上述實證結果,本研究有下列三點建議:(一) 囿於資料取得的困難度,本研究僅針對中區基層診所進行分析,有鑑於所建構的模型分類成效良好,因此,將來對於其他分局亦可依循此方法各自建構模型,以全面提升審查效率。(二) 不論是採邏輯特迴歸或類神經網路做為分析方法,皆是以過去的歷史資料規則來做分類模式的依據,類神經網路模型使用一段時間後,需再收集補充新的範例,執行網路訓練以維護系統效能;而邏輯特迴歸模型的運用亦相同,當分類預測模式的成效逐漸低落時,研究者應重新收集案例資料進行模型的架構,以確保提供最佳的分類預測效果。(三) 隨著環境與法令的改變,資料特性並非一成不變,亦可能因此大不相同,當資料結構日益複雜時,本研究建議研究者重新建構模型或採用時間序列的資料以維持良好之分類成效,同時也相信,屆時利用倒傳遞類神經網路模型其分類成效應可顯著優於邏輯特迴歸之模型。最後,希望藉由本研究結果,能對健保局的永續經營及全體納保民眾之福祉有所裨益。參考文獻一、中文部份:1. 中央健康保險局網站全民健康保險統計資料(2003) ,.tw/00chinese/c_index.asp。2. 左祖儀(2003),以資料探勘方法研究醫師審查制度,國立陽明大學醫務管理研究所碩士論文。3. 呂嘉盈(2000),台灣產險產業保險財務研究邏輯特迴歸的運用,國立高雄第一科技大學保險營運研究所碩士論文。4. 林雨靜(2003),當前全民健保政策分析,財團法人國家政策研究基金會,社會(析)092-004號。5. 林耀東(1998),八十三年度個人壽險保單第十三個月解約失效分析,壽險季刊,第109期,頁10-26。6. 柯俊良(1994),壽險業清償能力預警模型類神經網路之應用,國立台灣大學財務金融研究所碩士論文。7. 徐弘正(1997),醫療機構服務品質評估系統研究一以類神經網路分析健保局中區分局之複健申報業務,中央健保局委託研究計畫報告。8. 徐弘正(1999),全民健保醫療品質審查指標之建立:以門診、住診常見病例為例,中央健保局委託研究計畫報告。9. 馬中驍(1996),台灣地區壽險業清償能力預警模型Logit與類神經網路之應用,逢甲大學保險學研究所碩士論文。10. 陳錦村、許通安、林蔓秦(1996),銀行授信客戶違約風險之預測,管理科學學報,第十三卷,第二期,頁173-195。11. 陳建勝、林明宏,壽險保單早期失效之預測,風險管理學報,第5卷,第3期,2003年,頁341-361。12. 黃肇明(1996),全民健康保險醫療費用抽樣審查與回推制度,全民健康保險贅訊,17,頁12-16。13. 葉怡成(2001),應用類神經網路,台北:儒林圖書有限公司。14. 楊宗杰(1992),台灣地區個人壽險保單早期失效之研究,政治大學保險研究所碩士論文。15. 湯玲郎、林信忠(2000),資料萃取法在健保費用稽核之研究,醫療資訊雜誌,11,頁85-104。16. 藍中賢(2000),結合模糊集合理論與貝氏分類法之資料探勘技術應用於健保局醫療費用審查作業,私立元智大學資訊研究所碩士論文。二、英文部份:1. Berardi, V. L. & G. P. Zhang (1999), “The effect of misclassification costs on neural network classifiers,” Decision Sciences, 30(3), pp. 659-783.2. Biafore, S. (1999), “Predictive solutions bring more power to decision makers,” Health Management Technology, 20(10 ;史岸), pp. 12-14.3. Brockett, P. L., W. W. Cooper, L. L. Golden, and U. Pitaktong (1994), “A neural network method for obtaining an early warning of insurer insolvency,” The Journal of Risk and Insurance, 61(3), pp. 402-424.4. Boritz, J. E. & D. B. Kennedy (1995), “Effectiveness of Neural Network Types for Prediction of Business Failure,” Expert Systems with Application.5. Fausett, L. (1994), “Fundamentals of neural networksarchitectures, algorithms, and applications,” New Jersey: Prentice Hall.6. Haykin, S. (1994), “Neural NetworkA Comprehensive Foundation,” Macmillan College Pub. Co.7. Milley, A. (2000), “Hea

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论