




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
以技術關鍵詞分析專利分類的專利資訊檢索系統高佐良經濟部智慧財產局 .tw莊智凱國立台北科技大學 商業自動化與管理研究所吳忠敏國立台北科技大學 商業自動化與管理研究所.tw摘要根據世界智慧財產權組織(WIPO)之調查,善加利用專利資訊,可縮短研發時間60%,節省研究經費40%,如何將知識財產轉為企業利潤更成為當前企業著重的焦點,各科技產業於致力技術的創新與產品的推陳出新時,專利資訊的正確性、時效性以及是否能有足夠的資訊來解決問題,已逐漸成為企業所關注的議題。 本研究係以本國專利文獻資料庫及國際專利分類表(IPC)的資料為研究的資料源,另以國際專利分類的邏輯與分類準則作為分析專利分類落點的基本架構,研究建置一個具實用性的智慧型技術關鍵詞與專利分類的資訊檢索系統雛型系統,並應用資料探勘的技術對本國專利文獻進行技術關鍵詞的比對分析,以便專利發明人及相關的研究人員等雖未具備充份的專利分類知識,僅需藉由其所熟悉專利分類落點為第四階的技術關鍵詞,亦可藉由資訊系統的統計分析能力,全面擷取及展開涉及技術關鍵詞的所有專利文獻及其在國際專利分類表(IPC)的五階專利分類中,所被定位的專利分類號之詳細資料,並經人工判讀後,可推演待研究分析的技術主題的專利分類落點,重新調整技術主題與專利分類的配位,達到如國際專利分類表(IPC)際的分類邏輯與準則,準確的檢索各國專利文獻。關鍵字:專利分類、技術關鍵詞、專利資訊、檢索系統 壹、緒論一、背景隨著資訊與通訊科技的快速發展與高度應用,人們除了重視資訊的正確性、時效性以及是否能有足夠的資訊來解決問題之外,也逐漸強調資訊的品質與它所能帶來的經濟效益。近年來,各科技產業莫不積極投入大筆的研發經費,致力於技術的創新與產品的推陳出新,藉以在競爭激烈的市場上占有一席之地,故如何將知識財產轉為企業利潤更成為當前企業著重的焦點。袁建中(2001)認為當人類經濟邁入以知識為主軸的知識經濟時代,企業的競爭優勢已逐漸走向有形資產空洞化,無形資產充實化,企業必須掌握重要且關鍵的知識,才能維持其競爭力。對企業而言,關鍵的知識除了包括長久以來的記錄、檔案、員工個人的知識與經驗、顧客的意見與抱怨等資料之外,專利資訊更是一項不容忽視的關鍵知識。夏文龍(1998)根據世界智慧財產權組織之調查,善加利用專利資訊,可縮短研發時間60%,節省研究經費40%,可見專利文獻在人類生活與產業技術發展的重要性。 綜觀目前國內、外與專利有關的研究,大致可分為三大類,第一類是從法學的角度進行研究,例如就各國專利法、專利制度之比較與分析等(蕭佩珊,2003)。第二類是從管理學的角度作研究,藉由專利的申請數量、核淮數量與核准專利的技術類別之分布概況等,探討研發之投入與產出關係,或探討各國在基礎研究、應用研究技術發展研究上之產出關聯(蔡耀輝,2001)。第三類則是從技術的觀點,藉由資料探勘與專利地圖等電腦資訊的分析技巧,探討某專業技術之現況及未來發展趨勢(王泓翔,2003)。整體而言,目前國內已有不少研究從法學、管理學及技術等方面探討專利,但將專利技術關鍵詞及專利分類分析法應用於專利檢索之相關研究則較為缺乏。故本研究係以我國專利資料為研究對象,探討藉技術關鍵詞為檢索條件下,導引出相關專利文獻的專利分類之分布狀況,加以分析研究後,重新調整及重組技術關鍵詞及專利分類號等二項檢索專利文獻的條件,藉以檢索出精確且完整的專利文獻,提供企業瞭解相關產業之研發概況、競爭公司及產業分佈,作為其他學術研究、產業分析及技術創新之參考。 二、 研究動機與目的由於專利分類系統係採用階層結構,將整個技術領域按降冪方式依次分為五個不同的等級,故其分類之精準度及分類邏輯不易全面掌握;另專利文獻的數量龐大且每個領域需要監控蒐集的專利數量也大幅成長;此外專利文獻的文法結構以及其特定用語遣辭與一般文章大相逕庭,使得想要對專利文獻進行深入的分析,就必須花費大量的人力與時間,或是付出高昂的經費聘請專利專家或顧問進行專案計畫,協助分析專利文獻中所涵蓋的有用技術與資訊,並定訂技術領域所涉及的專利分類,作為專利資訊蒐集的依據。且相同的技術主題,經由不同的研究人員或法務人員作資料探索,會因其對專利分類邏輯與準則的不了解或認知上的落差,檢索出各種不同領域,甚至於極大差異的專利文獻,故如何利用技術關鍵詞與專利分類作結合,達到專利文獻的檢全率及檢準率,已是各專利主管機構及研究單位的主要議題。 基於上述種種情況及希望透過本研究能整合以人為本的經驗知識(如專利分類的工作人員長期研究心得、研發者於特定領域的實務經驗及建置相關智慧財產權資料資訊之檢索系統等)及以事為主的理論知識(如國際專利分類表、專利分類準則、可供參考之智慧財產權資料、非智慧財產權文獻及有形資產等),開發建置一個既能具滿足智慧局專利審查委員需求又能符合產官學研界實務所需的智慧型技術關鍵詞與專利分類的資訊檢索系統,讓需搜尋不同專業領域的利專利資訊使用者,均能經由簡易的專利技術關鍵詞作為專利文獻的檢索及分析條件,擷取到專利文獻於不同領域的專利分類情況、專利技術資訊與可參考的隱性知識,以達到專利資料蒐集、管理與有效地運用專利資源的目標。 本研究達成之目的如下:(1)研究建置一個智慧型專利資訊檢索系統以技術關鍵詞分析專利分類的雛型系統,達到以有限的資訊(技術關鍵詞)輔助作知識(專利)分類的目的。(2)研究以技術關鍵詞為檢索條件,擷取分析相關專利文獻的專利分類分布情形,以瞭解特定技術的產業發展概況。(3)研究以多個專利分類號為檢索條件,配合資料探勘的技術,擷取除檢索用之技術關鍵詞彙以外的其他技術關鍵詞彙的出現機率,以瞭解各種特定技術間的關聯性。(4)研究利用前述檢索取得的資訊,重新調整技術主題與專利分類的配位,達到合於國際專利分類表(IPC)際的分類邏輯與準則,準確的檢索到各國專利文獻以達到專利資料蒐集、管理與有效地運用專利資源。貳、文獻探討本段第一部份旨在探討智慧財產權的定義,第二部份則探討專利文獻及其應用,第三部份就專利分類的現況作文獻探討,最後二部份的探討範圍,則著重於專利檢索與分析及專利檢索系統。一、智慧財產權薛又軒(2001)認為智慧財產權具有無形資產權之性質,其保護之標的為人類智慧結晶及精神上創作,係屬獨立於有形物之所有權以外而且與物之所有權無關之權利,並由法律所特別賦予其專屬性、排他性之權利,以實現其經濟利益。鄭成思(2001)認為智慧財產權與一般民事權利、有形財產權利相比,具有專屬性、排他性之權利,故智慧財產權法律的不斷修訂與力求完善,就顯得比民事領域的其他法律更有必要。徐小波(2002)認為對智慧財產權的基本概念的定義:是一種人類思維活動的結晶,利用此一結晶,可以生產製造某項產品,或提供特定勞務,在客觀上這種結晶具有金錢價值,得作為交易的標的。馮震宇(1994)認為智慧財產權的概念在國際間採取不同的國際公約保護。以保護工業財產權的巴黎公約為例,其涵蓋的範圍包括發明專利、新型專利、新式樣專利、商標、商號名稱、產地標示或原產地名稱、以及制止不公平競爭。黃俊英及劉江彬 (1998)認為中華民國智慧財產權包括:專利權、著作權、商標權、積體電路電路布局權,營業秘密及其他無形智慧資產等。二、專利專利者,專有某種權利或利益之謂;為專利發明人或其合法多受人經由申請而取得的專利。故專利是給予的保護是讓專利權人在有限的期限內,對於發明進行商業性的製造、使用、經銷或銷售有同意及禁止權;這些權利通常是由政府與法院所給予的,在多數國家之中,法院有權利與義務阻止侵權行為的產生。 (一)、專利的重要性謝寶煖(1997)認為專利權是一種具有高度排他效力,保護發明人在法定有效期限內,對其完全公開的發明技術內容享有獨占權,目的不僅在排除他人未經同意就實施其發明技術之行為,更在避免重複投資與研發,促進產業發展。專利資訊對於技術研發的每個階段,從技術創新到產品化,都有很重要的影響: (1)提供產業發展方向,建立競爭優勢(2)提供近似研究的完整資訊(3)提供發明的詳細說明 (二)、專利文獻的應用所謂的專利文獻,即記錄有關發明創造訊息的文獻。廣義的專利文獻包括專利申請書、專利說明書、專利公報、專利檢索工具以及與專利有關的一切資料;狹義的專利文獻僅指各國專利局出版的專利說明書或發明說明書。陳家駿(2000)認為專利文獻的應用可分為下列三項: (1)專利審查的主要參考:專利文獻完整記載所有技術創新內容,故世界各國的專利局或國際專利組織於審查專利申請案時,會先就先前公佈的相關專利文獻進行前案調查,以分析比較發明人所提出的技術創新內容與已公開的相關專利文獻,其相同或相異之處,作為是否准予專利的主要依據。 (2)實施專利法律保護的依據:專利制度以技術公開為條件,依法授予技術創新內容在一定期間法律保護,並以發行專利文獻的方式,公開其申請專利範圍及技術創新內容,作為印證發明創造受法律保護的文件。 (3)評估與預測技術發展:專利文獻詳細記載著某項特定技術創新的發展與過程,經由對相關專利文獻資料整理分析;另藉由專利地圖等分析工具亦可有系統的對特定技術發展作深入探討。 三、專利分類由於專利資訊的數量可觀,專利申請人若欲更快、更有效的掌握特定技術領域的專利資訊與產品,應對專利分類有深入的瞭解。專利分類是透過有系統的分類架構,將發明創作依其技術主題進行組織與整理,使專利資料呈現具邏輯性的架構。而專利分類的目的是對發明創作的技術內容進行組織和建立索引,以便將特定主題或某一技術領域的專利說明書歸類,並能夠準確、容易的再檢索出來,便於爾後對專利資料作檢索與應用。 (一)、專利分類的目的陳達仁(2002)認為專利分類是一種使各國專利文獻獲得統一分類的工具,其主在於提供專利局或其他使用者,為確定專利案申請之之新穎性與評斷進步性(包括技術提昇及有用結果或實用性之評價),或是申請專利時確定是否有相關前案,而搜取專利文獻時的一種有效檢索工具。國際專利分類有下列重要目的: (1)利於資料的整理、歸檔與組織(2)合理劃分專利內容之技術範圍 (3)便於專利資訊的檢索與應用 (4)作為判斷產業技術發展相關性的依據(二)、國際專利分類國際專利分類史特拉斯堡協定已於1975年10月7日生效(Strasbourg Agreement Concerning the International Patent Classification,1971),該協定中說明設立國際專利分類的目的,在為各國的發明專利,包括公告的專利申請書、發明證書說明書、新型說明書和新型證書說明書(以下簡稱為“專利文獻”)建立一套國際性的專利分類標準。 國際專利分類表自西元一九六八年九月一日生效至今總共經過六次修正,其自二第版以後約定每五年修訂一次,現行的國際專利分類本為第七版,自西元二000年一月一日起生效。 (三)、國際專利分類編排架構許耀華(2004)認為在架構編排部分,國際專利分類表是按照技術主題來設立的,採用階層結構將整個技術領域按降冪方式依次分為五個不同的等級,即部(Section),主類(Class)、次類(Subclass)、主目(Main group)、次目(Sub group),目前國際專利分類(IPC)共分為有八個部、一百二十個主類、六百二十八個次類與六萬九千個主目和次目。 (1)部(Section):國際專利分類表中,部分類表內容涵蓋了與發明專利有關的全部知識領域,共分為八個部。(a)部之類號:每一個部由A到H中的一個大寫字母標明。(b)部之類名:各部之類名概略地指出屬於該部範圍內之內容,八個部的類名如下: A: 生活必需品,B: 作業;運輸,C: 化學;冶金,D: 紡織;造紙,E: 固定建築物,F: 機械工程;照明;供熱;武器;爆破,G: 物理,H: 電學 (c)部之內容:每個部的類名後面有一個它下面主要細分類目的概要。 (d)分部:各部之中有由資訊性標題構成的分部,分部沒有類號。 (2)主類(Class):每一個部分成許多個主類。(a)主類之類號:每一個主類的類號由部的類號及在其後加上兩位數字組成。 (b)主類之類名:每一主類的類名表明該主類包含之內容。 (c)主類索引:某些主類有一個索引,它僅給予該主類內容粗略檢視的一種資訊性概要。 (3)次類(Subclass):每一個主類包括一個或多個次類。(a)次類之類號:每一個次類類號由主類類號加上一個大寫英文字母組成。(b)次類之類名:次類的類名儘可能確切地表明次類的內容。(c)次類索引:某些次類有一個索引,它僅給予該次類內容粗略檢視的一種資訊性概要。(4)目(Group):每一個次類細分成許多目,包括主目(Main group)和次目(Sub group)。(a)目之類號:每一個目之類號由次類類號加上用斜線分開之兩個數字組成。 (b)主目之類號:由次類類號加上一個一位到三位的數字、斜線及數字“00”所組成。 (c)主目之類名:主目之類名明確表示檢索發明有用的主題範圍。主目之類號與類名在分類表中用黑體字印刷。(d)次目之類號:次目是主目之細分類。每一個次目之類號由次類類號加上一個它所屬主目之一位到三位數字,後面跟著一個斜線,再加上一個除“00”以外至少有兩位的數字而組成。(e)次目之類名:次目之類名明確表示檢索屬於該主目範圍之內的一個主題範圍,次目的類名前加一個或幾個圓點表示該次目之階層位置,即表示每一個次目是它上面離它最近的又是比它少一個圓點的那個次目之細分類。 (5)完整之分類號:一個完整之分類號由代表部、主類、次類、主目或次目之符號結合構成。(四)、國際專利分類表(IPC)的應用只有使用正確的分類號才能得到正確的檢索結果,所以如何把技術主題對應到分類號就成了進行分類或檢索時至為重要的工作,這全有賴於對分類邏輯與觀念的進一步認識。 國際專利分類表最重要的精神在於將同樣的技術主題歸入同一個分類位置,且使此分類位置成為該技術主題最容易被檢索到的位置(國際專利分類表使用指南,1999)。故可以把分類視為是將技術主題與分類位置做配對的動作,根據這樣的邏輯,分類最重要的便在於如何正確的解讀技術主題與如何劃分分類位置所涵蓋的範圍。此外國際專利分類為了能有效的將所有技術領域做清楚的劃分,並對於那些容易混淆的技術主題或分類位置做統一性的規定,設計了幾個分類規則以便各國分類人員在對同一技術主題進行分類時不致有太大差異。 三、專利資訊檢索專利資訊檢索的目的是從眾多的專利資訊中,找出特定資料供使用。而專利資料係屬公開的資料,其內容又明確顯示法律所賦與之專利保護範圍及最新的技術發展詳細情況,故透過研究專利資訊,有助於快速掌握先端技術脈動並提升技術水準。根據世界專利組織之調查,善加利用專利資訊,可縮短研發時間60%,節省研究經費40%。可知,專利資訊非常值得研發人員檢索與應用,而檢索的目的、檢索的技巧、檢索系統、檢索策略與經驗等,都會直接影響到檢索的結果。 (一)、專利檢索的目的謝寶煖(1998)認為專利檢索可以幫助研發人員和企業,追蹤技術發展動向,規畫研發方向和研擬市場競爭策略。專利檢索的目的分為: (1)可專利性檢索(Patent ability searches):發明人為確定其所擬提出申請的發明還沒有人獲得專利或是還沒有人提出專利申請,以瞭解此項發明是否已在過去的專利文獻中揭露。(2)專利現況檢索(State-of-the-art searches):為對某些特定技術的最新研發情況作探入探討分析。(3)專利發明人/讓受人檢索(Inventor/Assignee searches):探討特定專利發明人或是特定公司握有那項專利。 (4)專利族群檢索(Patent family searches):由於專利係採屬地義,故發明人為了保障其發明的權益,除了在本國申請專利外,有時亦會同時向外國申請專利,將同一發明在不同國家申請的專利結集在一起,就稱為專利族群。 (5)專利引用檢索(Citation searches):專利引用係指該項專利引用過那些文獻專利,藉以追蹤一項技術或產品的研發情況。(二)、專利檢索的效益美國專利分析學者(Mogee,1991)認為,專利檢索的結果作深入的探討與分析,應該具有下列的效益: (1)競爭對手分析(Rival Analysis) (a)不同公司的技術競爭態勢與策略(b)得技術的來源和合資的對象(c)公司間技術成長的強烈對比(d)可能的技術銷售對象 (2)技術追蹤與預測(Technology Tracking and Forecasting) (a)技術內容和項目的設定(b)技術開發之動向(c)技術發明階段 (d)技術演變態勢(e)技術相關性 (3)國際專利策略分析(International Strategic Analysis) (a)專利申請國別(b)權利構成之要件(三)、專利檢索的技巧專利檢索需要經驗的累積和創造力的培養,初學者要能分析精確的資料不是十分容易,在目前資訊檢索領域中,黃慕萱(1996)認為探討檢索技巧的相關學者整理出在檢索過程中會遇到的困難和解決方法,有下列主要技巧: (1)瞭解要檢索資料庫的控制語言:控制語言就是一種標準和固定的檢索語言,用明確的辭彙代表某明確的意義。(2)利用輔助檢索法:資料庫常見的輔助檢索技巧,計有布林邏輯運算元,相近運算元和限制檢索欄位等,透過此輔助技巧能提高檢索的精確率。 (3)利用相關訊息幫助檢索:當資料檢索人員不熟悉某些技術領域的關鍵字,可先行查詢在此技術領域上有較多專利或規模較大的公司,由該公司專利申請的書寫方式瞭解上行和下行用語,如此下關鍵字才能檢索到較精確的資料。 (4)確認資料庫所包含的檢索欄位:專利資料庫會提供不同的檢索欄位以方便使用者做檢索,所以檢索時如能將檢索欄位與檢索條件互相搭配其,則能提高檢索的準確率。 (5)當檢索到過多的資料時:除了透過人工篩選之外,還可重新檢視其搜尋的關鍵字是否太過於廣義,或是透過交叉檢索(例如搭配關鍵字和IPC 分類號同時做檢索),可以改善資料過多或無關的情形。 (6)當檢索到過少的資料時:檢視所使用檢索的關鍵字與資料庫的控制語言是否有落差,或是將較狹隘的關鍵字放寬檢索標準,在透過人工閱讀做篩選。 四、專利資料庫資料庫(database)是對某一特定主題,有系統地將這些大量複雜多樣的資料加以收集、整理,並以一定的資料結構、儲存於電腦中,供各方利用終端機查詢的使用者,達到能在最短時間以快效率檢索,並選擇出其所需之資料。專利資料庫是取得專利資料的便利管道,也是傳播專利資訊的主要媒介。而電腦與通訊科技的蓬勃發展,使得專利資訊得以透過線上的專利資料庫公開且快速取得與利用,檢索者得以最短時間內取得所需的資訊。故線上專利資料庫已逐漸取代了綷本的檢索工具書。透過各種方便取得的專利資料庫,不僅可快速獲得最新且完整的專利訊息,更能掌握技術領域的最新發展,對人類智慧與思想的傳播實一大貢獻。近年來,由於電腦與通訊技術之進步與結合,帶動了資訊科技之發展。 蔡明月(1991)認為由於專利資料庫是藉由電腦來管理專利資料,所以它具有很大的容量可儲存許多資料,節省了資料儲存空間與管理維護等成本,而且一次即可檢索到許多相關的資料,省時、方便、完整性高;對於資料的存取、處理及檢索具有高效率,故檢索速度快、彈性好、準確性佳;而且資料庫於資料的修訂、增補及更新的方式快、頻率高,使資料擁有較高之時效性及正確性。對專利管理者而言,專利資料庫是蒐集資訊的最佳工;對資料檢索人員而言,專利資料庫則是進行專利資訊搜尋時不可或缺的輔助工具。参、研究方法本章將就本研究的系統組成與邏輯分析、系統設計邏輯、系統功能架構及檢索系統組織架構等加以說明。第一節的系統組成與設計邏輯主要介紹整個研究過程中每個階段所進行之工作、第二節主要說明雛型系統的設計邏輯架構與及設計目的、第三節就雛型系統的系統組成及前、後台作業系統的功能架構詳加說明、最後一節的檢索系統設計邏輯則說明如何利用本研究的雛型系統進行專利資料檢索。期能說明本研究方法可利用有限的資訊(技術關鍵詞),經由雛型系統演算分析後,除可輔助擷取正確知識(國際專利分類),並將萃取到的技術關鍵詞與國際專利分類(IPC),依照專利分類邏輯與準則,作檢索條件的重新調整與(或)組合,達到能準確的檢索到專利文獻與有效地運用專利資源的目的。一、系統組成與邏輯分析本研究的系統組成與邏輯分析部分,在確認研究範圍後,即就雛型系統所需的資料源(中華民國專利公報及國際專利分類)作整理、分析與歸類,並對原始資料的欄位及格式予以定義與建置原始資料檔;另就國際專利分類(IPC)的分類邏輯與準則及如何將技術關鍵詞與國際專利分類作合理配位等專業知識,配合本研究進行分析及設計雛型系統的功能需求。在雛型系統的建置部分,所有模組皆以 C 語言開發,並以大鐸資訊公司開發的全文檢索系統(Transmission Text retrieval System,TTS)為檢索主幹,前台作業系統的國際專利分類(IPC)對應分析及詞彙統計分析二個子系統,則是使用TTS 開發的 PlugIn 程式,讓檢索系統與加值系統能完全整合;在系統功能測試與分析階段,先針對各種不同功能需求,以不同的情境對雛型系統作模擬、測試及評估分析,以為雛型系統找出較佳之應用程式;並對研究的過程以及結果,加以評估與解釋,適時調整與修正系統功能,再進行後續的研究;最後針對整個研究的過程及結果,完成本研究。 二、系統設計邏輯經由文獻得知,專利涵蓋範圍廣且以現行檢索方式容易造成結果不如預期之問題,因此本研究針對前述檢索系統功能不足之處,建置一個以技術關鍵詞分析專利分類為基礎的智慧型專利資訊檢索雛型系統,該系統的檢索功能除具備目前一般專利資訊檢索系統的單向式搜尋功能外,並加強該系統對於檢索結果的分析能力,以期能達到除了以技術關鍵詞與國際專利分類作配位來搜尋專利資料外,更可將檢索所得的專利資訊,就其全文內容作關鍵技術詞之詞彙比對(Text matching),經由比較分析後,將出現頻率較高的相關技術關鍵詞依序表列,萃取出與技術關鍵詞相關的其他重要技術關鍵詞,再藉經由本研究所開發的雛型系統之二維檢索分析構念,作縱橫交錯的資料搜尋後導引出相關的隱性知識。本研究之雛型系統,其前端檢索系統之基本檢索功能,已能提供檢索人員利用已知的技術關鍵詞(詞組)為檢索條件,其檢索結果係資料量極為龐大之擴散型資料,無法輕易讀取相關資訊。故本研究之雛型系統之後台作業,藉由國際專利分類表為資料源,整理出國際專利分類表分佈對照表資料庫,供前台作業系統中的國際專利分類表分類樹子系統於運算大量擴散型專利資料的國際分類分佈狀況時使用。此系統會依照每筆專利資料的國際專利分類作統計、歸類及加以運算,並將分佈在不同階層之專利資料依國際專利分類之編排順序作樹狀結構排列。有助於資料檢索人員了解其所檢索到的專利資料在國際專利分類中不同階層的分佈狀況及每個國際專利分類所包含的專利案件筆數,藉由對相關專利資料之分佈狀況作人工判讀後,可選取與研究主題相關的國際專利分類號表,達到擷取合適專利分類號的目的。惟因每份(筆)專利資料,有可能跨越二個或以上的國際專利分類,且專利文件中之隱性詞彙亦會造成無法精準掌握所要搜尋資料的疑慮,固本系統另於前台作業系統中建置詞彙統計分析子系統,將以國際專利分類表作為檢索條件所搜尋到的專利全文資料,以每份(筆)專利資料為比對單位,與後台作業系統中虛擬技術詞資料庫所建置的技術詞彙作詞彙比對。將所有經作資料比對後而產生的專利技術詞彙,加以累積、統計及分析其出現的頻率後,依序由大到小方式列表顯示供檢索人員參考分析,以方便資料檢索人萃取隱藏於相關專利文獻的其他重要技術關鍵詞,達到萃取隱性技術關鍵詞的目的,進而彌補檢索人專業能力之不足。藉由前述的萃取隱性技術關鍵詞之設計,可以萃取出隱藏於相關專利文獻中出現頻率較高之隱性技術關鍵詞彙。依據已知技術關鍵詞及萃取後得到的隱性技術關鍵詞,作為再次篩選及(或)擴增技術關鍵詞之依據,並配合已擷取的國際專利分類,重新組合專利資料的檢索條件,利用本研究所建置的雛型系統的前端檢索主系統的全文檢索功能,對檢索主資料庫作縱橫交錯的二維資料檢索,即可搜尋出一般檢索系統無法發現的隱性專利資訊,以達到資料完整且精確的目的。三、系統架構本研究之雛型系統的功能架構及系統架構包括檢索主資料庫(以中華民國八十九年起專利公報為資料源)、國際專利分類表分佈對照表資料庫(以國際專利分類第七版為資料源)及虛擬技術詞庫(取自於國際專利分類表國第七版的技術詞彙為資料源)等三個資料庫及前端檢索系統、國際專利分類表分類樹子系統及詞彙統計分析子系統等三個系統。本節將對系統作進一步闡述。USER主檢索資料庫前 端檢索系統詞彙統計分析子系統IPC分類樹子系統全文檢索資料庫前置作業國際專利(IPC)分佈對照表對照表建立主檢索資料庫斷詞斷字模 組規則詞庫無效詞庫有效詞庫新詞彙表以虛擬技術詞庫替代國際專利分類專 利原始資料詞彙分析系統本研究的系統組成與功能分布,分為前台作業系統及後台作業系統二部分,前台作業系統之功能為提供資料檢索,後台作業系統則處理加值運算(如圖 3.1)。(後台作業系統)(前台作業系統)圖 3.1 系統架構圖(一)、前台作業系統架構(1)前台作業系統的主要功能為提供專利資料檢索,故前端檢索系統之檢索欄位包括專利名稱專利分類、專利摘要、專利公告日期及不限欄位等五種不同欄位,每個欄位都具備邏輯運算的功能,檢索系統可依據檢索人員所下的條件,對檢索主資料庫(中華民國專利公報)之內容作資料搜尋後,將檢索結果以全文資料顯示,供檢索人員瀏覽點選或作進一步資料分析使用。(2)國際專利分類表分類樹子系統的功能是將檢索所得的資料叢集作國際專利分類的對應分析(Classification Mapping),並將分析所得的資料分佈狀況,依國際專利分類表的五階分類方式,作階層式的樹狀顯示,作為提示檢索人員篩選合適的國際專利分類配位,達到有效縮減檢索結果的擴散程度。(3)詞彙分析統計是將檢索所得的資料叢集,以每份(筆)專利資料為比對單位,與虛擬技術詞資料庫的技術詞作詞彙比對,對於相同技術詞彙的出現頻率加以累積、統計及分析,並將出現頻率較高的詞彙以表列方式提示資料檢索人員,以輔助其在專業知能不足時,仍能萃取到合適的相關技術關鍵詞,作為重新調整檢索詞彙而再達到收縮檢索結果的目的。 (4)附屬於前端檢索主系統的國際專利分類表分類樹子系統及詞彙統計分析子系統,最終目的是對檢索所得資料叢集,重新整理分析後供研擬再檢索條件時參考。故此二系統的主要功能係針對前端檢索主系統檢索到的任一組資料叢集,作進一步統計分析,期能經由本研究設計的雛型系統作反復演算,達到以知識管理方式將擴散資料作適度收縮而萃取出所需資料的目的。 (二)、後台作業系統架構(1)後台作業系統的主要目的,是將原始專利資料作加值與運算,以先備妥前端檢索系統、國際專利分類表分類樹子系統及詞彙統計分析子系統所需的資料庫及相關檔案,以因應台前作業系統所需,期能即時提供前台作業系統分析相關資訊使用,以達到提升雛型系統的效能及縮短檢索結果的反應時間。 (2)資料加值與運算的工作,計分為下列三項: (a)資料庫欄位處理:依照中華民國專利公報的資料特性及檢索系統的功能需求,規劃資料庫的欄位及資料格式, 並為每筆資料標示欄位及相關註記,以利資料之存取與演算。 (b)國際專利分類表加值:以國際專利分類表第七版為資料源,建置國際專利分類表資料庫,另擴增國際專利分類表演算欄位,建立國際專利分類表分佈表資料檔,以備將前端檢索系統演算所搜尋到的專利資料叢集之樹狀分佈概況。 (c)虛擬技術詞加值:將專利名稱、專利摘要、申請專利範圍三欄位的資料與虛擬技術詞庫的語詞作詞彙比對,並將比對結果擴增為一加值欄,以備將前端檢索系統演算所搜尋到的詞彙統計分析概況。 (3)資料加值後產生三種資料: (a)全文檢索資料庫前置檔。 (b)國際專利分類表對應分佈表資料檔。 (c)新詞彙出現頻率表資料檔。 (4)全文檢索資料庫前置檔經由載入,轉換為專利檢索主資料庫。肆、雛型系統本章係依據第三章的研究方法,並以民國八十九年起的中華民國專利公報為資料庫的資料源,依照專利資料查詢之需求,開發建置一個具簡易查詢、進階查詢及索引瀏覽與國際專利分類號表分類瀏覽的智慧型技術關鍵詞與專利分類的資訊檢索系統,並就查詢系統、資料瀏覽及資料顯示之操作,加以說明。期能說明本研究所建置的雛型系統可利用有限的資訊(技術關鍵詞),檢索出相關專利文獻,再經由雛型系統後端平台的虛擬詞庫對專利文獻作資料的技術語詞作資料探勘與演算分析,萃取到專利文獻的其他相關技術關鍵詞與國際專利分類,作檢索條件的重新調整與(或)組合,達到能準確的檢索到各國專利文獻與有效地運用專利資源的目的。 一、基本查詢系統系統基礎部份如同一般查詢系統具有簡易查詢與進階查詢及索引瀏覽等選項。如圖 4.1 簡單查詢可依不同的欄位進行技術關鍵字之查找,於圖 4.2 進階查詢則可將不同欄位進行複合式查詢,另外在索引瀏覽方面則針對您要查詢某一個欄位顯示它的清單,從頭開始瀏覽該欄位的索引,或鍵入欲查詢的資料的前幾個字,此時系統會自動列出吻合的記錄(如圖 4.3)。圖 4.1 簡易查詢系統操作畫面圖 4.2 進階查詢系統操作畫面圖 4.3 索引瀏覽查詢系統畫面二、國際專利分類表分類瀏覽查詢系統國際專利分類表分類瀏覽查詢系統,為檢索人員提供國際專利分類號與國際專利分類描述的對照顯示功能,並具展開國際專利分類號的資訊查詢系統,方便檢索人員分層瀏覽每一階層式之國際專利分類號對照表。檢索人員可依需求,對國際專利分類表的四個階層(部-次部-次類-次目),點選分類瀏覽查詢系統類的鈕,逐層展開國際專利分類,即可瀏覽每一階層的相關資訊(如圖 4.4)。檢索人員可透過此國際專利分類表瀏覽每一專利分類內容,自由點選想要查看的類號後;欲瀏覽閱讀特定專利分類的相關專利文獻時,可將直接點選其專利分類號,系統即列出所有具有相同分類號之專利資料(如圖 4.5 所示)。圖 4.4 國際專利分類表分類瀏覽查詢系統階層展示圖圖 4.5 國際專利分類表分類瀏覽查詢系統特定分類展示圖三、查詢系統資料顯示與詞彙統計本研究的雛型系統可依檢索人員的其檢索條件及檢索目的,選擇檢索結果的顯示方式。其顯示功能包括簡目顯示、詳目顯示、國際專利分類表分析、索引詞彙統計分析等;並可就檢索結果設定資料欄位圖之排序及資料輸出的範圍與方式。 簡目顯示所指即為上方(圖 4.5)所示,提供簡單資訊,以利一次多筆資料之閱讀,詳目顯示則在使用者按下鍵後進行單筆資料之詳細檢視(如圖 4.6),詳目資料中以籃色字呈現之辭彙則為透過專利名稱、專利範圍、摘要等三個欄位的資料與虛擬技術詞庫進行比對後發現相同之辭彙,如點選索引詞彙欄中的詞彙,亦可以進行詞彙再檢索(如圖 4.7)。圖 4.6 詳目顯示頁面圖 4.7 索引詞庫顯示畫面四、國際專利分類表對應分析本雛型系統檢索人員於圖 4.5 或圖 4.6 的資料顯示畫面中,點選國際專利分類表對應分析,系統會將所查詢到專利文獻依國際專利分類號進行分類,使檢索人員可以瀏覽到所查到資料在各國際專利分類號的分布狀況,並依檢索人員之需求,作不同階層的資料展示(如圖 4.8)。圖 4.8 國際專利分類表於(類)對應分析顯示畫面檢索人員可依據所欲查找之範圍點選類號將其展開,並可點選類名閱讀國際分類第七版之相關資訊。展開後如圖 4.9 般閱讀下層資訊,若認為資訊過於雜亂亦可點選上方圖示,則只顯示分析到的結果畫面(如圖 4.10)。圖 4.9 國際專利分類表於(主目)對應分析顯示畫面圖 4.10 國際專利分類表檢索結果對應分析顯示畫面五、索引詞彙統計本研究的雛型系統業於後端平台所建置的虛擬技術詞庫,會可對每筆檢索結果的專利名稱、專利範圍、摘要等三個欄位的資料與虛擬技術詞庫進行比對,當比對相同詞彙時,並將每筆檢索所得的索引詞彙(每筆資料在索引詞彙中出現一次以上時,在統計將只統計一次),進行詞彙統計(如圖 4.11)。圖 4.11 索引詞彙統計顯示畫面當檢索人員根據圖之出現數字欄進行點選時,系統即如圖 4.12 所示將點選比數的資料展現出來,另外若檢所人員點選欄位值欄內之關鍵字時,系統則根據檢索人員之選擇於資料庫內進行大範圍之查詢(如圖 4.13)。圖 4.12 索引詞彙以出現次數作檢索顯示畫面圖 4.13 索引詞彙以欄位作檢索顯示畫面於圖 4.11 的畫面,為依檢索結果統計出所有合於檢索的專利文獻中,依序列出共同出現的詞彙與出現次數,如欲將統計過後的詞彙進行組合再檢索,先勾選所要再檢索的詞彙,再點選,系統會自動找尋資料庫中有勾選詞彙的資料,查到後再與統計母體進行交集查詢(如圖 4.14)。 圖 4.14 統計詞彙組合式查詢檢索顯示畫面伍、結論與建議一、研究發現本研究主要的研究目的,在利用技術關鍵詞、國際專利分類表的相互連動關係,開發建置一個以技術關鍵詞分析專利分類為基礎,且能具滿足智慧局專利審查委員需求又能符合產官學研界實務所需的智慧型專利資訊檢索系統,讓需搜尋不同專業領域的利專利資訊使用者,能藉由簡易的專利技術關鍵詞作為專利分類文獻的檢索及分析條件,擷取到專利技術關鍵詞於不同領域的專利分類號、專利資訊與可參考的知識,達到專利資料蒐集、管理與有效地運用專利資源的目的。 經由本雛型系統的建置證明,雖然一般的專利資訊檢索人員在未具備解讀國際專利分類表的專業知識而僅採用技術關鍵詞作資訊搜尋,經由智慧型技術關鍵詞與專利分類的資訊檢索系統,確實可讓檢索人員有較高的機會擷取到專利文獻於國際專利分類表的相關資訊及分析出專利文獻的隱性知識,配合布林邏輯運算(And、Or、Not)的組合,進而達成專利資訊檢索的精準度。根據本研究建置的雛型系統所提供的功能作運轉測試後,整理出較具實用意義結論如下: (1)可利用有限的資訊(技術關鍵詞),達到擷取國際專利分類號的目的:根據本雛型系統所產出的國際專利分類表對應分析的統計分析圖,具備分析專利文獻與專利分類表相關資訊的加值功能,藉由統計分析圖所呈現出更深的意涵,讓專利資料檢索人員在無法掌握國際專利分類表的邏輯與準則、或未接受國際專利分類的訓練、未累積足夠的經驗及深層的知識的情況下,經由本研究的雛型系統所提供的功能,在僅知且有限的技術關鍵詞,亦可檢索到相關專利文獻,並將其檢索結果於國際專利分類多達六萬九千個主目和次目,依照國際專利分類表的邏輯與準則,對已檢索到的擴散型資料加以統計歸類,並參照國際專利分類表降次冪的排列方式,將分佈在不同階層之專利資料,依國際專利分類表的順序作樹狀排列,以方便資料檢索人員經由國際專利分類表的樹狀分佈圖所提供的訊息,能有效克服非經長期訓練無法掌握專利分類表準則之困擾,且經由國際專利分類表對應分析圖的展開,瞭解各項專利資料的專利分類號之分佈狀況及每個國際專利分類號所包含的專利案件筆數,作為擷取專利分類號之參考。經由專利分類表瀏覽功能作全面展示,透過有組織的檢索及分類後,即可同時分析出特定技術關鍵詞在相關專利技術領域之應用,以獲得的專利資訊,達到擷取與分析國際專利分類的目的。 (2)可利用索引詞庫與資料探勘的技術,達到擷取隱性知識的目的:根據本研究雛型系統索引詞庫所提供的功能證實,當資料檢索人員於專利文獻檢索時,在確定研究與檢索主題,並從相關管道擷取技術關鍵詞後,搜尋存於檢索主資料庫的相關資料欄位,並將合於檢索條件的資料全部以表列的方式顯示,供檢索人員作資料研讀判斷及點選合於需求的相關專利文獻後,雛型系統會就資料檢索人員所點選的資料內容,以後端平台的虛擬技術詞庫為資料探勘的比對基準,分析出每一筆專利文獻相關技術詞彙的出現次數及全部合於檢索條件的所有專利文獻間出現相關技術詞彙之次數,以達擷取相關的隱性知識(隱藏於專利文獻的相關技術詞彙)的目的,並能克服資料檢索人員對於技術名詞的認知及礙於專業知能的限制,恐難能將相關技術詞彙作通盤考慮之困擾。 (3)利用擷取的技術詞彙與國際專利分類號,精準檢索所需的專利文獻:據本研究雛型系統的整體功能證實,經由技術關鍵詞為檢索條件,擷取分析相關專利文獻的專利分類分布情形,即可瞭解特定技術的產業發展概況及所需研究的技術領域在國際專利分類表的定位;另藉由雛型系統所分析出的多個專利分類號為檢索條件,配合資料探勘的技術,即可擷取除檢索用之技術關鍵詞彙以外的其他技術關鍵詞
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京邮电大学集成电路学院招聘3人(人才派遣)模拟试卷及答案详解(历年真题)
- 2025安徽蚌埠高新投资集团有限公司招聘录用考前自测高频考点模拟试题及答案详解一套
- 2025鄂尔多斯准格尔旗事业单位引进40名高层次人才和急需紧缺专业人才模拟试卷及完整答案详解
- 2025广西桂林市第十九中学招聘初中语文代课教师1人考前自测高频考点模拟试题及答案详解参考
- 2025广西桂林城乡建设控股集团有限公司公开招聘5人模拟试卷及答案详解(易错题)
- 2025广东佛山市季华中学面向社会招聘编制教师2名考前自测高频考点模拟试题及参考答案详解一套
- 2025北京铁路局集团招聘76人(三)模拟试卷(含答案详解)
- 2025湖南永州市双牌县第二中学教师遴选3人模拟试卷及答案详解(易错题)
- 2025广东中山市沙溪镇人民政府所属事业单位招聘事业单位人员11人(教师6人)模拟试卷及完整答案详解一套
- 2025年浙江湖州吴兴区医疗卫生单位公开招聘编外工作人员30人考前自测高频考点模拟试题及答案详解(必刷)
- 民间借贷抗诉申请书
- 国家基层高血压防治管理指南(2025版)
- 2025年B2B企业生成式引擎优化(GEO)实战指南
- 2025年宁波辅警考试题库(附答案)
- 2025年考研护理综合全程真题及答案
- 电力市场风险管理办法
- 学堂在线 知识产权法 章节测试答案
- 小学道德与法治五年级上册《烟酒有危害》教学课件
- 2025四川能投合江电力有限公司员工招聘11人笔试参考题库附答案解析
- 测漏培训课件
- 2025年军事理论知识竞赛题库及答案
评论
0/150
提交评论