基本環節
1明确課題需求、選擇數據庫
檢索過程中的首要環節,就是要明确課題需求,第一步如果搞錯了,就談不上最後檢索結果的正确性。
由于用戶對自己的需求,特别是潛在的、模糊的需求并不總是非常明确,因此需要進行分析,以求得一個完整而明确的表達。
在用戶需求分析中,應搞清楚以下一些問題:
(1)分析課題檢索的目的
通常有幾種類型:
1):開始某一項科學研究或承接某項工程設計,需要對課題進行全面的文獻普查,并從中篩選出所需的資料,用以編寫可行性報告、計劃任務書等。
對這樣的課題,應選擇一個年限比較長的,收錄比較廣泛的相關專業的二次文獻數據庫,在全面回溯檢索的基礎上,選出相關的文獻,再獲取一次文獻。
2):為解決某個技術難題,查找關鍵性的技術資料。
對這樣的課題,應選擇工程和技術類數據庫或專利數據庫。
3):為貿易與技術引進、合資談判,了解國外市場、産品與公司的行情。
查找科學數據庫以了解技術的先進性,查找市場、産品、公司等商情數據庫以對手的情況。
4):為申報專利或鑒定成果,查找參考依據。
以選擇國内外專利數據庫為主。
5):為某項決策查找有關情報。
根據決策的不同性質,進行綜合性的全面文獻調研,涉及到科學研究、技術研究、産品、市場等最新發展動态。
6):為撰寫論文查找相關文獻等。
以期刊論文、學位論文等學術研究性的數據庫為主。
(2)明确題所涉及的學科範圍和專業面
明确課題所涉及的主要學科範圍、相關學科範圍、交叉學科範圍,并根據數據庫的主題收錄範圍進行選擇。
(3)對文獻的新穎性程度的要求
對文獻新穎性要求高,就要選擇數據更新周期短、速度快的數據庫。
(4)用戶對檢索的查全與查準要求
為滿足查全要求,就要普查多種數據庫,為快速滿足查準要求,應選擇主題範圍最專指的數據庫。
2主題分析
明确檢索需求後,就要對用戶課題的具體内容作主題分析,這是正确選用檢索詞和邏輯算符的的關鍵,它将決定檢索策略的質量并影響檢索效果。
主題分析就是對用戶的課題進行主題概念的分析,并用一定的概念詞來表達這些主題内容,同時明确概念與概念之間的邏輯關系。主題分析必須注意:
(1)概念的表達要确切。抓住課題的實質性内容,分析出課題中有幾個概念組面。
(2)找出核心的概念組面,排除掉無關概念組面,包括意義不大的概念和重複概念。用戶有時會認為選取的概念組面越多,邏輯組配越細緻,檢索結果的針對性越強。事實上,過多過嚴的概念組配很可能導緻大量的漏檢,甚至結果為零。因此有時需要簡化邏輯關系,減少概念組面,以提高檢索效果。
(3)找出隐含的重要概念。如"智力測試",隐含着"能力測試"、"态度測試"、"創造力測試"等概念。數據庫的标引往往使用比較專指的詞,用戶對标引規則不甚了解,往往會列出比較抽象的概念,而忽略了較專指的概念
(4)明确概念組面之間的交叉關系,即明确是邏輯"與"、邏輯"或"還是邏輯"非"的關系。哪些概念可以用來擴大檢索範圍,哪些可以作為進一步縮小檢索範圍的主題詞。明确這些邏輯關系,有助于編制出正确的檢索式。
定義概念
qingbao:jiansuo:cele情報檢索策略information:retrieval:strategy在分析情報實質的基礎上,确定檢索途徑與檢索用詞,并明确各詞之間的邏輯關系與查找步驟的科學安排。
計算機檢索
在計算機檢索的條件下,由于情報提問與文獻标識之間的對比匹配工作是機器進行的,必須事先拟訂周密的檢索策略,用計算機能夠理解和運算的形式加以表達,而後交計算機去執行。最常用的表達形式,是應用布爾邏輯(OR,AND,NOT)的原理,使用概念組配的方法,轉化成布爾邏輯檢索表達式。這種表達式,從狹義來說就是檢索策略。
任何情報需求,不管表面看起來多麼複雜,都可以用布爾邏輯式加以表達。例如,“輕金屬的焊接”這一情報需求,包含了“輕金屬”這一概念組面和“焊接”另一個概念組面,這兩個組面之間是邏輯乘(AND或×):的關系。而每個組面應根據所檢數據庫的詞表選出合适的檢索詞。同一組面内的各詞用邏輯或:(OR或+)連接因而可以形成如下檢索表達式:(輕金屬+鎂+鋁+铋)×(焊接+結合+銅焊+粘接):。檢索策略可根據檢索目标和命中文獻的有無或多寡而調整其查全率與查準率。
提高查全率的措施有;提高檢索詞的泛指度,控制同義詞;截詞;減少用邏輯乘或邏輯非的概念組面;增加用邏輯或連接的相關檢索詞;聚類檢索法,以及字串位置邏輯等。提高查準率的措施有:提高詞的專指度;增加用邏輯乘或邏輯非連接的概念組面;連号法;職号法;加權法;利用文獻的外表特征進行限制等。而在實現上述調整中,一是依靠概念的分析,即從學科專業知識出發,選擇泛指詞、專指詞及相關詞以及它們的權值,并确定概念組面和組配邏輯;另一是依靠功能操作,即利用計算機檢索系統的功能,從文獻的類型、年代、文種等外表特征入手對命中文獻集合進行調整與控制。