版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目錄目錄 1.緒論 2.文獻探討 3.研讨方法 4.系統實作 5.結論1.緒論緒論-研讨動機研讨動機 目前市面上已有許多獨軟體開發廠商以及應用軟體服務供應商針對普通企業組織在資发掘上的需求,推出套裝資发掘軟體或是資发掘相關的服務與技術援助。 企業在實際运用現有的資料发掘軟體與服務時經常面臨以下的問題:一、企業部門間異質系統的整合與資料傳輸的相容性 問題二、傳統資料发掘軟體缺乏因應运用者的需求而進行 流程彈性調整的才干三、軟體或服務的整合及維護本钱過高研讨目的研讨目的 為解決以上的問題,我們將提出一個具有跨平台能,而且具有彈性程調整能的資发掘系統架構。具體而言,本研讨的主要目的是在解決目前企業所
2、面到的以下問題: 一、抑制質系統與資交換格式的問題 二、提供彈性的資发掘程 三、低軟體整合與維護本钱2.文獻探討文獻探討-資发掘資发掘 資資(Data)、資訊、資訊(Information)與知與知(Knowledge)等三者的定義與之間的關係。等三者的定義與之間的關係。資发掘的相關技術資发掘的相關技術 一、分 (Classification): 分是一種監督式學習(Supervised Learning),它的定義為根據一些已經有別的史資分析它們的一切特徵,再依據這些特徵對未分或是新的資進歸,如銀根據某些規則將其顧客區分為高貢獻族群、低貢獻族群等別。 二、關法則 (Association R
3、ule): 關法則的目的是從一堆看似無關的資中,发掘出同項目之間發生的關性,探討在同一事件中某一項目出現時,另一個項目也在該事件出現的機 三、群集 (Clustering): 群集就是將一大筆資根據它們彼此間的类似程,將似的資分在一群之中,而區隔类似的資。資发掘的步驟資发掘的步驟 學者學者Fong 等人等人(2019)認為資发掘的過程普通可分為確認為資发掘的過程普通可分為確認发掘目標、資選擇、資準備、資轉換、資儲存、認发掘目標、資選擇、資準備、資轉換、資儲存、資发掘與結果評估等七大步驟資发掘與結果評估等七大步驟資前處資前處資清資清資整合資整合資轉換資轉換資簡化資簡化資发掘的應用資发掘的應用-1
4、 資发掘的相關應用相當的廣泛與多樣化,在許資发掘的相關應用相當的廣泛與多樣化,在許多域如生物醫學域、財務融業、製造售多域如生物醫學域、財務融業、製造售業等各方面可以發現資发掘的相關應用與研業等各方面可以發現資发掘的相關應用與研讨。以生物醫學域為,近十生物醫學讨。以生物醫學域為,近十生物醫學域的相關研讨呈現爆炸性的成長,從新藥物的開域的相關研讨呈現爆炸性的成長,從新藥物的開發、癌症法的研讨到人發、癌症法的研讨到人DNA 序解析等研讨序解析等研讨域,均藉助資訊科技與資发掘技術處龐域,均藉助資訊科技與資发掘技術處龐大的資。大的資。資发掘的應用資发掘的應用-2 資发掘技術出現過短短十多,但卻能迅速資发
5、掘技術出現過短短十多,但卻能迅速地應用於各種學術與商業域,學者地應用於各種學術與商業域,學者Berry and Linoff(2019)經過規納分析之後,認為以下五個經過規納分析之後,認為以下五個要素促成資发掘技術的崛起:要素促成資发掘技術的崛起: 一、大資的获得難低一、大資的获得難低 二、資倉儲系統的發展成熟二、資倉儲系統的發展成熟 三、電腦運算速的加強與網際網的發展三、電腦運算速的加強與網際網的發展 四、全球化商業競爭的壓四、全球化商業競爭的壓 五、資发掘軟體的获得方五、資发掘軟體的获得方企業應用整合與網服務企業應用整合與網服務 學者學者Coyle(2019)則認為企業組織可以採取以下三種
6、則認為企業組織可以採取以下三種新技術因應目前劇競爭的商業環境,它們分別為新技術因應目前劇競爭的商業環境,它們分別為 1.可延伸式標記語言可延伸式標記語言 2.網服務網服務 3.無線技術無線技術 質系統與資訊整合質系統與資訊整合 企業組織對於資訊整合的需求已從企業應用系統的整合提企業組織對於資訊整合的需求已從企業應用系統的整合提升至廣泛的資訊源的整合,微軟升至廣泛的資訊源的整合,微軟(2019)認為資訊系統認為資訊系統整合的演進大致上可分成以下三大階段:整合的演進大致上可分成以下三大階段: 一、資整合一、資整合 二、應用程式整合二、應用程式整合 三、服務整合三、服務整合 這三個資訊整合的階段清楚
7、地表達出目前企業組織在系統這三個資訊整合的階段清楚地表達出目前企業組織在系統整合與資交換這大議題中所面到的限制所在,以及整合與資交換這大議題中所面到的限制所在,以及在同階段中整合方式的差之處。在同階段中整合方式的差之處。企業應用整合企業應用整合 企業應用整合企業應用整合(Enterprise Application Integration; EAI)的發展是提供企業組織一套完好系統整合架構的解決方案,的發展是提供企業組織一套完好系統整合架構的解決方案,以達成企業資訊的整合與分享。以達成企業資訊的整合與分享。 企業組織應用企業組織應用EAI 進企業內部的資訊整合自以下三個進企業內部的資訊整合自以
8、下三個要素:要素: 一、電子商務一、電子商務 二、企業合併與組織功能的強化二、企業合併與組織功能的強化 三、企業資源規劃三、企業資源規劃 雖然雖然EAI 是以企業主體為出發點,強調企業程與資訊是以企業主體為出發點,強調企業程與資訊系統之間的整合與自動化,藉著整體採用單一系統標準及軟系統之間的整合與自動化,藉著整體採用單一系統標準及軟體達成企業組織內部應用程式的整合,但是所必須付出的體達成企業組織內部應用程式的整合,但是所必須付出的本钱依舊居高下。而為添加企業競爭優勢,與协作夥伴本钱依舊居高下。而為添加企業競爭優勢,與协作夥伴以及顧客之間的資訊整合在所難免,因此,企業資訊整合的以及顧客之間的資訊
9、整合在所難免,因此,企業資訊整合的發展,除必須以服務為導向外,也必須跳脫特定標準或介發展,除必須以服務為導向外,也必須跳脫特定標準或介面的限制,而保有系統的彈性以及未擴充的能。面的限制,而保有系統的彈性以及未擴充的能。網服務的應用網服務的應用 由於Web Service 具有即時、彈性、標準化等特征,目前許多廠商紛紛開始將Web Service 的相關技術與其本来的域進整合。 Web Service 在資訊技術(IT)域的應用大致上有以下所述的四個方面: 一、入口網站 二、企業應用程式整合 三、分散式運算 四、應用程式服務提供者與獨軟體開發商3.研讨方法研讨方法 本研讨將以本研讨將以Web S
10、ervice 架構為基礎,將資架構為基礎,將資发掘過程中的程序視為由一系的发掘過程中的程序視為由一系的Web Services 所構成,並透過動態任务程的概,所構成,並透過動態任务程的概,以敘述以敘述Web Service 程的程的BPEL4WS 語法,提語法,提供服務运用者得以根據實際上的需求自編排資供服務运用者得以根據實際上的需求自編排資发掘发掘Web Service 的整體程,透過程中各的整體程,透過程中各個個Web Service 的執達成运用者的目標。的執達成运用者的目標。系統概系統概-1 本研讨所提出之系統架構是考W3C所提出之服務導向架構的概與根本架構修正而。 為達成SOA 的遠
11、景,企業組織必須將系統或應用程式加以分割成為許多具有同功能特性的分散式子系統模組,這些分散於企業組織內外部的子系統模組必須要援助統一的共通性標準,如此一才干使得資訊毫無阻礙的在系統中傳遞,達成系統整合的目的。目前業界對於SOA架構的作法是將應用程式與系統建構在網際網上,也就是將應用程式與系統加以網化,而Web Service 架構正是目前SOA 架構中最新的作法。系統概系統概-2 W3C 所提出SOA 之根本架構圖4.實作實作-範例流程實作步驟過程範例流程實作步驟過程以下為三種不同品種蝴蝶花(Iris)之萼片與花瓣(Petal)的長度與寬度數值之集合 本步驟中所呼叫的遠端Web Service
12、採用的分群演算法為K-Means。 K-Means是屬於一種直接將資料集合進行分割成為數個相互間無關聯的目標群集,屬最根本且典型的分割式群集演算法。此演算法的目的是將資料集合中之資料物件分割成為數個群集,而群集的結果須滿足以下條件: 1.每個群集中至少要有一個以上的物件 2.每個物件須完全的歸屬於某個群集 3.每個物件與其所歸屬的群集質心間的歐基理德 距離會小於與其他群集質心間的距離 我們可根據其所在位置、參與流程的目的與方法,將他們分為三種角色: 1.具資料发掘需求的系統运用者,也就是流程設計者與流程运用者 2.於網際網路上提供對資料庫進行資料擷取和分群演算等Web Services的服務提
13、供者 3.作為上述兩者間的資料傳輸橋樑,由流程設計者所設計規劃完成的IrisFlow等5.結論結論此研讨的貢獻可以歸納如以下幾點:此研讨的貢獻可以歸納如以下幾點:1.導入導入Web Service與與XML相關技術做基礎,抑制在相關技術做基礎,抑制在傳統資料发掘流程中所遇到的資料相容性問題傳統資料发掘流程中所遇到的資料相容性問題2.以任务流程的觀念做基礎,結合以任务流程的觀念做基礎,結合Web Service流程流程描画語言描画語言BPEL4WS,有系統的提供在資料发掘流程,有系統的提供在資料发掘流程中關於活動、流程順序等各方面的細節描画中關於活動、流程順序等各方面的細節描画3.在資料发掘流程中各步驟的演算活動是由多個功能在資料发掘流程中各步驟的演算活動是由多個功能各異的各異的Web Service元件所組成,在日後因需求改變元件所組成,在日後因需求改變而使資料发掘流程需進行更新和修正時,較傳統資料而使資料发掘流程需進行更新和修正時,較傳統資料发掘軟體更具有流程變動上的彈性发掘軟體更具有流程變動上的彈性4.以統一且公開的資料发掘方式描画語言以統一且公開的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 47212.3-2026家畜遗传资源保种场保种技术规范第3部分:牛
- 新能科技利用推动承诺书6篇
- 根治性肝癌肝叶切除术后护理查房
- 教育培训项目完成承诺书8篇
- 人力资源招聘流程与工具清单
- 项目交付质量控制模板系统
- 2026年安徽省蚌埠局属校初三第二学期第3次练考英语试题含解析
- 云南省曲靖市重点名校2026届初三第三次质量检测试题试卷英语试题含解析
- 上海市浦东区重点中学2026届初三下学期5月热身英语试题含解析
- 2026年上海浦东第四教育署初三第六次质检语文试题含解析
- GB/T 1883.1-2025往复式内燃机词汇第1部分:发动机设计和运行术语
- 2025年支部存在的问题及整改措施
- 差速器工作原理课件
- 46566-2025温室气体管理体系管理手册及全套程序文件
- 2025年山东省港口集团有限公司社会招聘笔试历年参考题库附带答案详解
- 橡皮筋扑翼机课件
- 公路工程施工中的环境保护措施研究
- 安全员c1证机械课件
- 2026年初级健康管理师(健康基础知识)考试题及答案
- 影视导演入门基础课程讲义
- 《统计学》考研(第8版)贾俊平配套考试题库及答案【含名校真题、典型题】
评论
0/150
提交评论