工学类东北大学工学部.ppt_第1页
工学类东北大学工学部.ppt_第2页
工学类东北大学工学部.ppt_第3页
工学类东北大学工学部.ppt_第4页
工学类东北大学工学部.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2007/4/20,東北大学工学部橋本研究室,AGeneralFrameworkforMiningConcept-DriftingDataStreamswithSkewedDistributions生分布偏対一般的枠組,出典:SIAMConferenceonDataMining2007(SDM07)著者:J.Gao,W.Fan,J.Han,P.S.Yu発表者:橋本研究室年西村聖所属:東北大学工学部発表日:2007/4/20,2007/4/20,東北大学工学部橋本研究室,1,目次,背景既存手法問題予測誤差原因提案手法誤差削減実験方法結果考察,背景,分類:大量予決()分例.不正検出毎日大量履歴,不正僅分布偏,不正手段日変化()不正見逃大変!分布偏,対応手法必要,2007/4/20,東北大学工学部橋本研究室,2,2007/4/20,東北大学工学部橋本研究室,3,基本的型分類学習流,学習用,学習,分類,1,2,分類,分類,発生構築,発生,2007/4/20,東北大学工学部橋本研究室,4,既存手法問題点,分布取,安定仮定生分布偏仮定条件付確率変化捉実際観測,結合確率結合確率変化条件付確率変化,生起確率変化分結合確率変化捉,詳細分析,x:事例y:,2007/4/20,東北大学工学部橋本研究室,5,予測誤差関係,予測誤差発生結合確率変化表種類予測誤差発生指標,対応既存手法同様最新再構築必要,分類予測,2007/4/20,東北大学工学部橋本研究室,6,分類結果含誤差種類,予測誤差誤差(真分類誤率)+分散:分類用制約分散:異学習用場合分類予測差大学習精度小学習結果安定適切設定提案手法学習C4.5用,枝刈適度保,提案手法流,学習,学習,分類,1,2,分類,分類,再構築,最新,発生,過去少数,学習用,2007/4/20,東北大学工学部橋本研究室,7,学習最新用,分布偏過去少数再利用,多数数減分布偏図流,少数分類事例多数分類事例,過去少数,最新,2007/4/20,8,東北大学工学部橋本研究室,2007/4/20,東北大学工学部橋本研究室,9,分散削減,利点:過去少数用,事例不足分散減欠点:過去事例用,現在異増,増,多数事例現在反映,数十分上昇僅見予測精度上昇,2007/4/20,東北大学工学部橋本研究室,10,学習,複数分類用予測精度向上計学習結果,分類予測平均,事例x少数属確率:分類数:学習結果:各分類予測結果,学習,学習用k,学習用,分類,分類,結果平均,学習用,分類k,2007/4/20,東北大学工学部橋本研究室,11,学習分散削減,学習結果誤差用表現分散項分散以下分類数k大分散分散小,精度上,2007/4/20,東北大学工学部橋本研究室,12,実験方法目的,提案手法他手法比,提案手法分布偏対優位性示表2提案手法他手法提案手法SE(Sampling+Ensemble)分類数5個比較手法NS(Nosampling+Singlemodel)SS(Sampling+Singlemodel),2007/4/20,東北大学工学部橋本研究室,13,人工,実現11個作1000実現間各次元値,重変P(x),P(y|x)変相当変化方向10%確率反転分布偏実現少数全体1%設定生,分布偏実現,2007/4/20,東北大学工学部橋本研究室,14,条件付確率,生起確率変化,P(x)変化事例x正規分布従,x各次元平均値変化,x分布変化P(y|x)変化事例x小数c割当条件付確率表()x各次元値次元重関数,分布偏(少数全体%)設定,2007/4/20,東北大学工学部橋本研究室,15,人工ROC曲線,Figure2-(a)人工ROC曲線提案手法他手法遥,縦軸:検出率少数正分類確率横軸:誤検出率多数誤分類確率左上近理想的分類,2007/4/20,東北大学工学部橋本研究室,16,人工精度-再現率,Figure2-(b).人工精度-再現率提案手法他手法精度再現率高保,縦軸:精度少数予測中正確率横軸:再現率(検出率)精度再現率経験的,2007/4/20,東北大学工学部橋本研究室,17,既存手法対応分布偏対,提案手法,学習用対応既存手法同様,分類再構築対応,対詳細分析課題問題,多問題対応,2007/4/20,東北大学工学部橋本研究室,18,考察,毎回再構築,現在変化対応再構築方法,再構築頻度減,2007/4/20,東北大学工学部橋本研究室,19,静聴,2007/4/20,東北大学工学部橋本研究室,20,予測精度比較,補助表AUC比較,2007/4/20,東北大学工学部橋本研究室,21,実(UCImachinelearningrepository公開),偏分布実現使,分布偏加工少数,残多数実現偏分布保分実現実現為,元分同士微妙異実現,程度弱補助表実,実,補助表実,2007/4/20,東北大学工学部橋本研究室,22,2007/4/20,東北大学工学部橋本研究室,23,実ROC曲線,Figure3-(a)実ROC曲線実程度激,人工程提案手法改善見,提案手法最優,2007/4/20,東北大学工学部橋本研究室,24,実精度-再現率,図実精度-再現率程度激人工差,提案手法一番精度再現率高保,2007/4/20,東北大学工学部橋本研究室,25,人工詳細,ROC曲線,少数確率密度,多数確率密度,0%,100%,50%,2007

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论