网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化。所谓快、准、全,是指设计出来的检索策略能够快速、准确、全面地从网上检索到所需要的信息;低成本则是指以最低的费用获取所需的信息。由于检索网上信息要付通讯费,有些数据库还要付数据库使用费,因而降低信息成本对消费能力较弱的我国用户有比较重要的意义。
主题分析
明确检索需求后,就要对用户课题的具体内容作主题分析,这是正确选用检索词和逻辑算符的的关键,它将决定检索策略的质量并影响检索效果。
主题分析就是对用户的课题进行主题概念的分析,并用一定的概念词来表达这些主题内容,同时明确概念与概念之间的逻辑关系。主题分析必须注意:
(1)概念的表达要确切。抓住课题的实质性内容,分析出课题中有几个概念组面。
(2)找出核心的概念组面,排除掉无关概念组面,包括意义不大的概念和重复概念。用户有时会认为选取的概念组面越多,逻辑组配越细致,检索结果的针对性越强。事实上,过多过严的概念组配很可能导致大量的漏检,甚至结果为零。因此有时需要简化逻辑关系,减少概念组面,以提高检索效果。
(3)找出隐含的重要概念。如"智力测试",隐含着"能力测试"、"态度测试"、"创造力测试"等概念。数据库的标引往往使用比较专指的词,用户对标引规则不甚了解,往往会列出比较抽象的概念,而忽略了较专指的概念
(4)明确概念组面之间的交叉关系,即明确是逻辑"与"、逻辑"或"还是逻辑"非"的关系。哪些概念可以用来扩大检索范围,哪些可以作为进一步缩小检索范围的主题词。明确这些逻辑关系,有助于编制出正确的检索式。
注意问题
如果对主题不熟悉,可采用关键性的文献以确认检索词汇和厘清概念。宜避免选择太广泛或模糊的词汇检索,且可以储存并重复使用相同的概念和检索策略以节省检索时间。检索时除了利用选定的检索词汇进行检索外,也可利用索引典、标题表或系统自动提供之相关词进行检索,以增加检索结果。
选择词汇时,需注意「隐含性概念」和资料库的关系。
总述
事实上,在构造检索策略过程中,要涉及到许多方面的知识与技能。诸如,用户对检索课题的明确程度,对检索课题的分析;对数据库及其系统特性和功能的掌握;编制逻辑检索式的技巧以及调整检索策略的方法等方面都会影响用户检索的整体效果。因此,制定检索策略是一种全面的知识与技能,也是一种经验。掌握了这种技能和经验,再通过广泛实习,可以获得比较好的检索效果。