结果池过滤技术是文本信息检索会议(Text Retrieval Conference,TREC) 针对万维网大规模语料库集合中正确答案的标注问题,总结出的一整套解决方案和评价体系。其核心实称为“结果池过滤技术”(poolingtechnology)。结果池过滤技术的主要思想可以归结成:在面临大规模文档集合时只能借助有一定检索精度的检索工具进行信息获取,因此候选答案集合只可能通过检索工具进行定位。这在一定程度上是出于无法手工筛选整个文档集合时的权宜之举,但在处理类似网络数据集合这样规模文档集时却又是必要与合理的。