图书馆

读者服务

中文期刊全文数据库检索方法与技巧

发布人: 发布时间:2021-11-17 点击量:

一、中文数据库系统的检索功能

从学科类目和期刊名称途径的导航查询功能,有简单的初级检索方式和复合检索方式等。

在复合检索中‚只需一次性地输入逻辑组配式‚就能完整地表达各种主题内容。另外‚在检索输入框的右侧还提供了“模糊”和“精确”检索方式的可选项‚便于进行更灵活的搜索‚以实现扩检与缩检的调节。

二、检索的语法规则

几乎在所有的搜索引擎中‚都将布尔逻辑操作符作为最基本的语法规则。一般布尔逻辑操作符包括NOT、AND、OR和括号。NOT表示逻辑“非”‚使用NOT寻找包含NOT前的关键词但排除NOT后的关键词的文档;AND表示逻辑“与”‚使用AND操作符检索所得的文档中包含所有的关键字;OR表示逻辑“或”‚使用OR将检索出几个关键字中至少包含一个的文档;括号的作用和数字中的括号相似‚可用来使括在其中的操作符先起作用。

以上四种操作符可互相结合使用‚但有一定的执行先后次序‚其优先顺序依次为:括号、NOT、AND、OR。不同的搜索引擎对逻辑检索支持的程度不同‚有的是完全支持‚有的仅部分支持。

1.符号的使用

逗号:其作用类似于OR‚不同的是‚查询结果按包含的关键词的多少排列‚包含的关键词越多‚文档的位置越靠前。

空格:其作用类似于AND。

通配符“∗”和“?”:“∗”代替任意一个字母‚“?”代替一个任意的字母‚通配符不能放在单词的开头或中间。

“+、-号”:在一个关键词前不留空格地加上一个“+”号‚表示该关键词一定要出现在检索结果。“-”号的情况正好相反‚表示该关键词一定不会出现在结果中。

2.截词检索

指利用不完整的词或词根进行的检索‚可提高查全率‚扩大检索范围‚但相应地准确率会降低。绝大多数网络检索工具都支持截词检索‚一般是指右截词‚部分支持中间截词‚有的需要使用通配符‚如“∗”等。

3.字符串检索

也叫词组检索‚将一个字符串当作一个独立运算单元‚进行严格匹配‚以提高检索的精度和准确度。字符串检索不仅规定了检索式中各个具体的检索词及其相互间的逻辑关系‚而且规定了检索词之间的临近位置关系。几乎所有的搜索引擎都支持字符串检索‚并且都用双引号(“”)来代表字符串。

4.字段检索

虽然网络信息实际上不分字段‚但以万维网为用户界面的网络信息检索工具设计了类似于字段检索的功能。字段检索一律表现为前缀符的限制形式‚如主题字段限制的有“Title:”、“Keywords:”等‚非主题字段限制的有“im-age:”等‚另外还有主机名限制(host:)、link限制(link:)、URL限制(URL)等诸多类型‚这些字段限制功能限定了检索词在数据库记录中出现的位置‚可用来控制检索结果的相关性。

5.检索范围限制在某一范围中检索指定的关键词‚可提高检索的准确性。包括几种类型:

分类范围:在某一类型中检索。

地域范围:在某一地区中检索。

时间范围:检索某一时间范围内建立的网站或编写的网页。

信息来源限制:在某一类型的网站中检索。

检索词位置限制:提供检索词必须出现在网址或是网页或其它位置的限制。另外还有一些特殊范围的限定‚如域名后缀(com、gov、org等)、文件类型(文本、图形、声音等)。

6.自然语言检索

直接采用自然语言中的字、词或整个句子作提问式进行检索‚也叫问题检索。这种方式使检索变得简单而直接‚不必依赖于专门的检索语言‚这正是网络检索工具优于传统检索工具之处‚使得非情报专业的用户不用经过专深的检索语言学习即能进行检索活动。几乎所有的搜索引擎都支持自然语言检索‚但有其利亦有其弊‚由于自然语言不加控制‚用词灵活‚容易产生检索范围失控现象。

7.概念检索

即用某一检索词进行检索时‚能同时对该词同样或类似概念的词‚如同义词、近义词、广义词、狭义词进行检索‚以达到扩大检索‚避免漏检的目的。

8.区分大小写检索

大小写有别是英文等西方文字中的一个特点。在查找西文信息时‚区分大小写这一检索特性有助于提高查准率‚尤其有助于对专有名词的查询。

9.模糊检索

即允许被检索信息和检索提问之间存在一定的差异‚这些差异往往来自用户的输入错误‚如少键入一个字;另一种差异来自某些词汇在不同国家的不同形式。目前的网络信息检索工具还只能进行纠正输入错误的模糊检索。

三、检索策略的设计

关键词检索是信息检索的主要方法。首先对检索课题进行主题分析‚选取一些对揭示和描述主题内容起主要作用的关键性词语作为检索词‚然后用来对中文数据库题(篇)名字段进行摸底检索。检索词(式)在题(篇)名字段命中的文献‚通常是比较切题的;此时再逐篇浏览命中文献的题(篇)名和关键词(也可包括文摘)‚了解专业用词习惯和标引用词规律‚选取有用的同义词、近义词及专业术语的不同表达形式‚作为相关检索词补充到提问式中‚然后再作进一步地试检、筛选‚如此循环‚直至选全、选准各种检索用词。

在课题的检索中‚可将专业术语拆分‚然后进行合理的逻辑组配‚以满足多样化的专业术语表达形式‚然后指定在同一字段搜索‚以提高检索的专指性。如,某用户查找“德国民主社会主义及其政党研究”方面的文献‚通过试检浏览了解到‚与“民主社会主义”相关的内容应包括下列关键词:民主社会主义、社会民主主义、新保守主义、新自由主义。所涉及的“政党”‚应列出所有的全称和简称:社民党(德国社会民主党)、民社党(民主社会主义党)和基民盟(基督教民主联盟‚又简称基民党)。采用知网的全文检索功能‚检索提问式为“(民主社会主义OR社会民主主义OR新保守主义OR新自由主义)AND(社民党OR社会民主党OR民社党OR民主社会主义党OR基民盟OR基督教民主联盟OR基民党)AND德国”(根据系统的功能‚该式需分步组配完成)‚并指定按相关度排序‚最终获得相关文献。

四、检索技巧总结

1.选择合适的检索工具,不同的检索工具有不同的特点。细节查询或强调获取较为具体、特定的信息时‚一般应利用关键词进行大范围的快速检索‚方便、快捷地查询到针对性较强的检索结果。

2.一般性的浏览查询或强调获取较为综合、准确的信息时‚一般应利用分类检索‚用户可按思维的逻辑顺序或按照其主题目录体系的导引去浏览、追踪、查找信息。

3.选择合适的检索词为了提高检索的精度‚应尽量选专指词、特定概念或非常用词‚避免普通词、泛指概念;而当检索结果数量太少‚需扩大检索范围时‚要使用同义词、近义词。

4.几乎所有的搜索引擎都提供“对搜索结果按相关性大小排序”的功能‚但有时排列第一的结果未必是“最好”的结果。一次成功的搜索也经常是由好几次搜索组成的。可先用简单的关键词测试‚从搜索结果页面里寻找更多的信息‚再设计一个更好的关键词重新搜索。

 

相关文章