检索策略与检索技巧.ppt_第1页
检索策略与检索技巧.ppt_第2页
检索策略与检索技巧.ppt_第3页
检索策略与检索技巧.ppt_第4页
检索策略与检索技巧.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

檢索策略與檢索技巧,大仁科技大學 通識教育中心 授課老師:王巧燕,本著作除另有註明外,採取創用CC姓名標示非商業性相同方式分享台灣2.5版授權釋出,進行資料的檢索時,必須先決定研究的問題(主題),再決定蒐尋的途徑,進而決定尋找的範圍及方向,亦即產生檢索策略。,檢索流程與步驟,所謂檢索策略是由一個以上的檢索詞組合而成,其中包含布林邏輯運算元(and、or、not) ,用來擴大或縮小檢索的範圍。 擬定正確的檢索策略,不僅可找到相關的資訊,同時可節省蒐集資訊的時間。,檢索流程與步驟,決定 檢索 策略,研究 題目 擬定,選擇 資料庫,決定 檢索 用語,進行 檢索,檢索 結果,概念 分析,開始,選擇資料庫,檢索結果 符合所需,決定檢索用語,決定檢索策略,執行檢索,檢索策略 是否合適,列印、儲存 或E-mail,檢索用語 是否合適,結束,是,是,是,否,否,否,檢索流程,何謂檢索策略(search strategy) Hartley等人的定義: 如何避免找到不相關文章的方法,或是處理找到過多或過少相關文章的可能對策。,檢索策略(search strategy),何謂檢索策略(search strategy) Bates的定義: 是針對一檢索問題之通盤考量或全面性規劃。而檢索技巧只是為完成特定目的所採取的行動。,檢索策略(search strategy),檢索策略(search strategy),圖書或期刊文獻資料庫和線上檢索系統,涵蓋範圍、主題及查尋介面有所差異,但檢索基本概念卻是相同。 因此,為節省資源蒐尋的時間,並確保蒐集到的都是真正所需的資源,實有必要擬定檢索策略,按照步驟逐一進行。,常見的兩種檢索策略: 分區組合檢索法 引用文獻滾雪球法,檢索策略(search strategy),分區組合檢索首先找出檢索問題的主要概念,再確定這些主要概念間的布林邏輯關係(是 “and” 或“or” 或 “not”的關係)。 然後再找出所有能代表每個主要概念之同義詞(或相近詞),將這些詞彙以布林運算元 “or”做聯集,以充分掌握每個主題之完整性。,分區組合檢索法,分區組合檢索最重要的步驟,分區組合檢索法,選擇資料庫,確定問題 之主要概念,主要概念間 布林邏輯 關係,找出每個 主要概念之 所有詞彙,輸入 檢索敍述,各概念之 所有詞彙以 “or”連結,將步驟5所得結果 以步驟3所決定 之布林關係 進行結合,評估 檢索結果,詞彙 a1 OR 詞彙 a2 OR 詞彙 an,詞彙 b1 OR 詞彙 b2 OR 詞彙 bn,詞彙 c1 OR 詞彙 c2 OR 詞彙 cn,主題概念 A,主題概念 B,主題概念 C,將主題層面以布林邏輯關係 ( AND,OR,NOT )結合,(a1+a2+a3)*,(b1+b2+)*,(c1+c2+c3),分區組合檢索法,分區組合檢索技巧 檢索所得資料筆數過多時(即想增加精確率時),可以嘗試增加主題層面的數目或是刪除一些較不相關的詞彙。 當檢索所得資料筆數過少時(即想增加回收率時),最適合得的檢索技巧為刪除次要之主題層面或是各主題層面中增加一些相關度較低的詞彙。,分區組合檢索法,引用文獻滾雪球法的先決條件是先掌握一篇或數篇相關文章,利用這些相關文章尋找更多相關的文章,因此相關文章就像珍珠或雪球一樣愈滾愈大。 真正在線上利用此法時,大部分是已相關文章的關鍵字或敘述語繼續檢索,而非利用引用文獻的方式將雪球滾大。,引用文獻滾雪球法,利用已知書目進行檢索,或利用分區組合檢索以掌握相關文獻,當找到相關書目後,可從敘述語和主題詞等控制語彙欄位,及題名和摘要等自然語言欄位中找尋相關詞彙,再將其輸入資料庫中進行檢索,直到感到滿意或是無法找到新的相關詞彙為止。,檢索小秘訣,分區組合檢索,引用文獻滾雪球,+,檢索技巧有賴經驗的累積及檢索時應變能力的培養外,也必須瞭解資料庫所提供的檢索功能,及其所用的術語,如是否具有控制詞彙、切截、片語功能等(可多利用Help功能)。,檢索技巧,Harter將檢索技巧分為五大類: 指令語言及資料庫結構有關之檢索技巧 檢索所得資料筆數過多(通常指誤引過多時) 檢索所得資料筆數過少時(包括零筆資料) 想增加檢索時之回收率 想增加檢索時之精確率,檢索技巧,指令語言及資料庫結構有關之檢索技巧 1.確知系統使用之停字。 (如:of、the、in、as、because、if 等系統自動忽) 2.確知系統預設之排列順序。 3.確知基本索引檔所包含之欄位。 4.確知所欲檢索欄位之索引法 (單字索引法或片語索引法)。 5.確知任何零筆資料發生的原因。,檢索技巧,檢索所得資料筆數過多(通常指誤引過多時) 1.是否使用正確之資料庫進行檢索? 2.是否過分簡化問題? 3.是否需要重新釐清檢索概念? 4.是否使用正確的布林邏輯? 5.是否使用過分含混或一般性之名詞? 6.是否應考慮使用控制語彙? 7.是否將相近運算元限制過鬆? 8.是否將切截應用過鬆?,檢索技巧,檢索所得資料筆數過少時(包括零筆資料) 1.是否使用正確之資料庫進行檢索? 2.是否將問題過分複雜化? 3.是否真有文獻探討該檢索主題? 4.是否每個概念都使用足夠的檢索詞彙來表達? 5.是否將相近運算元限制過緊? 6.是否使用正確的布林邏輯? 7.是否有語法或拼字上的錯誤? 8.是否該改用自然語言進行檢索? 9.是否考慮使用切截?,檢索技巧,想增加檢索時之回收率 1.增加同義詞和類同義詞的數目。 2.使用較為廣義的檢索詞彙。 3.以自然語言檢索代替控制語彙檢索。 4.檢索其他主題欄位。 5.刪除布林邏輯運算元“AND”及“NOT”。 6.增加切截的範圍。 7.使用限制較鬆的相近運算元。 8.刪除一些非主題之檢索限制,如年代限制及資料形態限制等。 9.刪除一主題層面。,檢索技巧,想增加檢索時之精確率 1.刪除部份類同義詞或是詞意含混的檢索詞彙。 2.使用專門性較高的詞彙進行檢索。 3.當有適當的控制詞彙時,盡量以控制詞彙代替自然語言。 4.使用欄位之優先順序a.敘述語,b.識別語,c.題名,d.摘要,e.全文。 5.增加一主題層面。 6.使用“NOT”除去不相關文章。 7.減弱切截的範圍。 8.加上非主題之檢索限制,如年代限制及資料型態限制等。,檢索技巧,資訊檢索的類型可能是圖書、期刊、報紙、學位論文、會議論文、研究報告等,如何有效地進行檢索策略,以關鍵字(Keyword)進行檢索為例。,評估檢索結果,Keyword是最常用的檢索策略,以單字或辭彙蒐尋在書刊名、篇名、或其他欄位中出現相同單字或辭彙的資料。 當進行關鍵字檢索時,等於是從資料庫的書目資料中檢索出你所鍵入”關鍵字”的所有記錄。,如何有效進行檢索,如何有效進行檢索,因此,以關鍵字(Keyword)進行檢索所找到的辭彙不一定是並列出現。,例如:鍵入information management system, 得到的結果可能是information出現在篇名, management出現在標題,system出現在摘要 這種現象我們稱為“誤檢”(false drops)。,所以,所用的關鍵字決定檢索結果的好壞,用Keyword檢索要得到滿意的結果,必須注意幾個原則:,1.選用涵蓋主要主題概念的詞彙 選擇的關鍵字要能正確清楚地界定研究主題, 選用意義明確的字彙, 如:cloning 或 global warming, 而不要用一般性的、共通的字彙, 如trends或study,省略描述關係的字彙。,如何有效進行檢索,2.選用單字或是簡短的片語 關鍵字檢索時,系統是到資料庫中去 比對我們所輸入的字彙, 如果輸入的片語或詞組愈長, 找到完全吻合的機率就愈小, 因為作者並不見得剛好用我們所輸入 的片語或詞組。 例如:不要用 “effects of birth order on sibling relationships”, 而應該用“birth order and sibling“。,如何有效進行檢索,3.選用各學科的專門用語 來檢索各學科的資料庫 當檢索專科資料庫 (subject-specific database)時, 不要用一般性的單字。如果用“management” 來檢索管理相關的資料庫如:ABI/INFORM, 找到的資料量肯定過多。,如何有效進行檢索,4.視資料庫類型選用廣義 或狹義的關鍵字 圖書所涵蓋的範圍較廣泛,所以書名所用的字彙 通常較為普通,例如:管理學。 如果所檢索的資料庫系統是以圖書為主, 就應該用比較廣義的檢索詞彙。 如果所檢索的是以期刊論文或 博碩士論文為主的資料庫, 因期刊論文的主題內容較為專精, 而篇名所用的字彙也較為專門、精確, 就應該選用比較明確的關鍵字。,如何有效進行檢索,5. 利用切截(truncation) 有些資料庫可利用切截方式 (truncation或wild card searching) 來查尋不同字尾變化的字彙, 以擴大檢索範圍。 不同資料庫所使用的切截符號不盡相同, 查尋前應參閱使用說明或手冊。,如何有效進行檢索,6.組合關鍵字以擴大或縮小索引範圍 組合關鍵字以擴大或縮小檢索範圍的技巧 稱為布林邏輯檢索(boolean searching)。 常見的布林邏輯運算元(boolean operators) :and、or、not、adj(adjacent)。 Adj是緊鄰的意思。 以Adj組合兩個關鍵字, 表示這兩個字要緊鄰,而且順序不可以顛倒。,如何有效進行檢索,評估檢索結果,不同系統會有不同的方法來呈現檢索結果,如何評估檢索結果符合需求,通常需要看完整的紀錄來評估資訊,以確定這篇文章和資訊需求是否相符合。,書目資料庫檢索結果的評估: 1.與研究主題相關性:可查看摘要(abstracts)或關鍵字(keywords)或標題(subject headings)欄位中的資料以瞭解文章的內容是否與主題相關。 2.是學術性文章或是通俗文章(popular articles)。,評估檢索結果,3.新穎性:要注意date和title of publication(通常要查看source一欄),了解我們所研究主題的變化速度,再決定我們所需資訊的新穎度,然後再從作者所引用的參考資料,決定是否適用。 4.作者的背景:作者的服務機構和學經歷是否符合研究的主題。,評估檢索結果,本單元參考書目,淡江大學覺生紀念圖書館。蒐集資料的方法(八版)。上網日期:98年2月7日,檢自:.tw/libintro/pub/8thed.pdf. 黃慕萱(民國85年)。資訊檢索。台北市:台灣學生。 檢索策略。上網日期:98年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论