1基础检索技术
1.1布尔逻辑检索
CNKI知识搜索的高级检索和专业检索中,体现了对布尔逻辑检索的支持,而初级检索中不支持布尔逻辑算符(AND、OR、NOT)的应用。
1.2大小写敏感检索
很多语言如英语、法语、西班牙语,它们的大小写词汇都有不同的意思,大小写敏感检索能够允许终端用户在一个提问和系统中精确指出一个检索词是如何表示的。在全文文献中分别检索“SPSS”,“Spss”、“spss”,得到的检索记录完全一致,说明,CNKI知识搜索中也不支持大小写敏感检索,不管使用大写、小写还是首字母大写的单词,检索的结果都不变。
1.3截词检索
CNKI知识搜索中并未提供截词检索符号使用的说明,信息系统通常指定一些特殊的符号(如问号?或星号*)来截词。CNKI中的截词符号使用的“%”,而且只是在专业检索中才提供这样的功能。但是与通常意义上的截词检索不一样的是,CNKI提供的是一种模糊检索的功能。举例来说,检索式“题名%SP”得到的检索结果是题名中包含字符“SP”的文献记录,而不是包含以SP开头的英文单词。
1.4临近检索
输入检索式“普华永道(2With)IBM”,意***检索同时包含“普华永道”和“IBM”的文献,且它们在句中的距离不超过2个单词,但检索的结果表明,CNKI将“普华永道”、“2”、“With”和“IBM”分别作为检索词检索,它们之间的关系以逻辑或的方式处理。当文献中不包含这四个词时,CNKI会将“普华永道”拆分成单字检索。与此相似的是,输入检索式“普华永道(3Near)IBM”,也不能得到符合预期的检索结果。可见,CNKI的全文检索也不支持临近检索。
2系统扩展
除了一些基本的检索功能之外,CNKI知识搜索还提供了一些扩展功能,本文在经济、***治、历史、哲学、科技五个领域,搜索了《德隆末路的内在必然性》、《IBM公司人力资源管理浅析》、《普华永道:外资银行对在华发展的前景充满信心》、《台湾当局“渐进式”透视》、《天子•霸主•诸侯———春秋霸***研究》、《叔本华直观认识论述评》、《康德道德哲学详解》、《3G移动通信主流标准的比较研究》、《数据挖掘中的数据分类算法综述》、《面向本体的需求分析》等10篇文献,作为下列分析的数据。
2.1引证分析
(1)引证文献对于上述10篇文献,列举20篇引证文献,对于引证的结果检验如表1所示.
(2)同被引文献表2列举了上述10篇检索文献获得的引证文献、同被引文献和二级引证文献的统计数据。
2.2读者推荐
文章CNKI提供的读者推荐文章,推荐了该作者的其他系列文章,有助于了解该作者的研究内容和进展情况等信息。在组A中,很容易看出,CNKI所推荐的文章有一个共同点,即作者都为郎咸平,推荐的文章内容包括金融证券、宏观经济、企业管理、市场法律等多个不同领域;组B中推荐的文章则都与叔本华相关,同时涉及了叔本华的认识论、意志论等哲学内容以及对叔本华哲学特点的综合评述;组C原本搜索的是软件开发的需求分析方法,CNKI推荐的文章明显偏离了检索的意***,虽然都包含“本体”的字样。由此可以看出,CNKI知识搜索读者推荐的文章,大都是推荐相同作者的文章或是文献标题中包含相同文字的文章,但这些文章的内容却不一定是用户所想要检索的,对于用户来说,CNKI推荐的文章或许并不值得推荐。
2.3相似文章
除了读者推荐文章,CNKI提供的相似文章,则给检索者显示出了其他作者关于本条检索记录的相似的研究成果。以上述的检索文献为例,CNKI提供的相似文献如上表4所示。在组A的10篇相似文献中,有7篇文献都是关于资金链,与原文所讨论的主题相似,而有2篇分别是关于金融业存款保险制度和房地产销售情况文献,与原文献主题不同;组B中的相似文献有7篇与原文献一样,讨论的是叔本华的哲学思想,而有2篇文献论述的是教学方法,与检索文献相去甚远;组C中的文献或者涉及到“本体”,或者涉及到“需求分析”,真正与检索意***相似的只有2篇文献是关于软件开发的需求分析的方法,其他的文献都只是标题中含有相同的词汇,而内容则与检索文献不相关。可见,CNKI的提供的相似文献,只是一种从标题判断相同的词汇(如本体),一旦该词汇在不同的领域中都有所应用,得到的相似文献准确度不大。
2.4相关研究
机构与相关文献作者CNKI提供的相关研究机构和相关文献作者,只是列举了上述相似文献的作者及其所在机构,如上表4所示。因为相似文献的准确度值得商榷,因此相关研究机构和相关文献作者对于用户检索来说,也存在着不准确的缺陷。
3结语
CNKI全文检索功能众多,可以从题名、关键字、作者、出处等多个入口检索文献,涉及的学科范围广,包含的全文文献齐全,而且对检索文献进行引文分析,以及提供了读者推荐文章、相似文献、相关文献作者等其他信息,功能不可谓不强。但对于布尔逻辑检索、大小写敏感检索、截词检索、临近检索等基本检索技术支持得不够完善。此外,读者推荐文献和相似文献、相关文献作者等存在着准确性不大的缺陷,或许这正是其值得改进之处。
参考文献
[1]张淑芳,郑琳.CNKI与中国期刊网.怀化师专学报,2002(21).
[4]顾东蕾.试析CNKI的微观结构.现代情报,2008(4).[5]周蕴博.CNKI年鉴、工具书数据库应用研究.今日科苑,2008(12).
[6]周秀会.知识元搜索引擎:CNKI知识搜索平台.现代情报,2007(5).
作者:谢松;杨志永
转载请注明出处学文网 » CNKI知识搜索检索技术与评估