检索词分类
一、从词的性质来划分,检索词可以划分为四类:表示主题的检索词、表示作者的检索词、表示分类的检索词和表示特殊意义的检索词。
1、表示主题的检索词
标题词:指经规范化处理得先组定组式的词汇。
单元词:指从信息内容中抽出的最基本的词汇。
叙词:指从信息的内容中抽出的、能概括表达信息内容基本概念的名词或术语,它是经规范化处理的自然语言词汇。
关键词:指从信息单元的题目、正文或摘要中抽出德能表征信息主体内容的具有实质意义的词语,它是未经规范化处理的自然语言词汇。
2、表示作者的检索词。如作者姓名、机构名。
3、表示分类的检索词。如分类号
4、表示特殊意义的检索词。如ISBN、ISSN、引文标引词等。
二、从语言的规范性方面来划分,检索词又可以划分为两类:受控词和非受控词。
受控词是事先规范化的检索语言,取自主题词表、叙词表、分类表等,如果数据库对数据采用了受控标引,并有机读式或印本式主题词表时,应优先选用其中的受控词。
非受控词是指非规范化的自然语言词汇,又称自由词。
受控词和非受控词两者各有优缺点,受控词的检索效率高,一旦选定宽度适当的概念,系统就能检出这一概念的全部内容,而且,由于标引人员已事先解决了自然语言中的同义、近义关系,使检索相对容易,但由于其先组性质,受控词不能及时反映新事物的发展,概念数量有限,结构复杂,不能适应数量众多、要求各异的信息用户,也不易为非专业人员掌握。非受控词可以在一定程度上弥补这些缺陷。非受控词具有可任意选词、专指性强、不需要熟悉词表、能使用新产生的名词术语及时检索与新概念有关的文献,但主要缺点是不能提供概念的等级结构,不能检索宽泛概念,解决同义词、近义词、相关词的结合或连接问题。 受控词和非受控词的作用是互补的,数据库的词表与我们要查询的主题概念并非存在一一对应的关系,很多概念得不到反映,因此,当检索结果不满意时,要对选词进行分析,要多备用一些词汇,根据具体情况决定增、删和替换。
选择原则
检索词的选择与确定要遵循以下两个原则:
1、根据检索课题所涉及的学科专业和技术内容选词。
2、对检索词进行处理。如使用检索词表进行比较对照,选用规范化的词汇作为检索词。