摘要:在我们进行日常生活、工作、学习与研究中,免不了需要进行信息检索。要想得到令人满意的检索效果,关键是能够构造出全面描述、正确揭示信息需求的检索式。而检索词是组成检索式的基本组成元素,如果选词不当很容易造成漏检和误检。因此,能否选准、选全检索词直接影响到检索效果的优劣。本文将就本人的使用经验对检索词的选用进行分析。
关键词:信息检索;检索词;查全率;查准率
一、信息检索与检索词
信息检索(Information Retrieval),有广义和狭义之分。
广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,它的全称又叫“信息的存储与检索(Information Storage and Retrieval)。
狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。
检索词是指用于描述信息系统中的内容特征、外表特征和表达用户信息提问的专门的基本成分,简单的说就是能概括你要检索内容的相关词汇。检索词是构成检索式的最基本的要素,是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元。
按照目前流行的可见网络资源与不可见网络资源的划分方法,大家常用的通过搜索引擎获得的WEB资源可以算作可见资源,而各种数据库、电子期刊、论文等可看作是不可见资源,一般的搜索引擎是无法检索到不可见资源的。无论是使用可见网络资源,还是使用不可见网络资源进行查询,都离不开检索词的选用。要想得到令人满意的检索效果,关键是能够构造出全面描述、正确揭示信息需求的检索式。而检索词是组成检索式的基本组成元素,如果选词不当就很容易造成漏检和误检,因此,能否选准、选全检索词直接影响到检索效果的优劣。
二、检索质量与检索词的关系
评价信息检索质量的重要指标有两个,一个是查全率;一个是查准率。
查全率是指检出的相关信息量与系统库中相关资源信息总量的比率,它反映该信息库中实有的相关信息在多大程度上被检索出来。查全率=检出的相关信息量/系统库中相关资源信息总量×100%。
查准率是指检出的相关信息量与检出信息总量的比率,是衡量信息检索系统检出信息准确度的尺度。查准率=检出的相关信息量/检出的全部信息总量×100%。
查全率与查准率在一定程度上是成反比关系的,为了提高查全率就要牺牲部分查准率为代价,反之亦然。在不同对信息的不同需求情况下,对二者的要求也不同。有时信息的全面性更为重要,这时就要以提高查全率为重点;有时希望找到的文献准确率更高,就要以提高查准率为重点。而检索式中检索词的选用,正是信息检索中调节这两大重要指标的必备手段。
三、检索词的选用
(一)检索词的选择与确定应遵循两个原则
1.根据检索信息所涉及的相关内容主题、外表特征选词。
2.对检索词进行相应的处理。如使用检索词表进行比较对照,选用规范化的词汇作为检索词。
在选择检索词时要选最有代表性、最能说明问题、通用的、规范的、具体的检索词。同时试查相关信息数据库,在进行初步检索后,逐步优化检索策略。
(二)信息获取中提高查全率的方法─使用相似检索词
使用相似检索词即在信息的查找过程中,对于需要较高查全率的检索信息,通过对需检索的项目进行分析,以降低检索词的专指度为出发点,补充还原词组、同义词、近义词和选用检索词的上位词。以此来扩展数据库中的搜索范围,在牺牲部分查准率为代价的基础上提高查全率。此方法常用于对知识性信息与技术的普遍查询和了解。例如:
另外,许多名词是由词组缩略而成,可以采用与之相反的操作来补充还原。如:“教研”可还原为“教学研究”,“语质”可还原为“语言质量”。
(三)信息获取中提高查准率的方法─使用精确检索词
使用精确检索词即在信息的查找过程中,对于需要较高查准率的检索信息,通过对需检索的项目进行分析,以提高检索词的限制和专指度为出发点,增加或换用下位词进行检索。以此来减少数据库中的搜索范围,在牺牲部分查全率为代价的基础上提高查准率。此方法常用于对知识性信息与技术的精确查询。例如:
1.项目名称:“食用菌的栽培技术”。若考虑针对不同种类的食用菌进行精确分析查询,即可考虑食用菌的下位概念,如:木耳、银耳、香茹、猴头、松口蘑、红菇和牛肝菌等具体的菌种。
2.项目名称:“轻金属的焊接”。若考虑针对不同种类的轻金属进行精确分析查询,即可考虑轻金属的下位概念,如:铝、镁等具体的金属。
这样检索使信息的标的更明确,虽然缩小了检索出的信息量,但同时也让使用者在利用资料的时候更有目的性和可比性。
在确定检索词后,通过分析各词之间的逻辑关系,运用布尔逻辑算符、截词符、位置算符等检索算符把各检索词组配起来,即可构成准确表达信息需求的检索式。
当然,检索词是表达信息需求的基本元素,其选择恰当与否直接影响到检索效果。对于给定的检索信息,应首先深入分析信息内容,在提取核心词的基础上进行扩展,然后构造较为完善的检索策略和检索式,才能获得令人满意的信息检索效果。
参考文献
[1]鄢百其.信息检索策略优化分析[J].武汉科技大学学报,2011,(2).
[2]程琳.网络信息检索策略与检索途径探讨[J].***书情报论坛,2010,(3).
作者简介:李毅(1973- ),男,乐山职业技术学院副教授,研究方向:电子商务、计算机网络管理、***书馆信息系统。