离群点可能蕴含重要信息,因此研究离群集的结构特征及释义空间具有重要学术意义和广泛应用领域。现有离群挖掘主要集中于检测离群点,缺乏对离群数据的行为进行分析和解释的有效方法。本项目针对数据集空间模型的结构特征,引入结构离群、离群释义空间等概念,把正常数据和离群数据融入统一结构体内进行分析,综合考虑宏观层面和微观层面,剖析离群对数据集主体结构特性的影响,探索检测和解释离群点的新方法。技术路线采用谱系特征系统描述结构离群特性,将数据空间划分为离群子特征系统和聚类子特征系统;基于项目组前期提出的离群划分相似度、关键域子空间等算法,研究高维离群数据的结构特性和降维算法;针对特定领域,研究获取离群触发规则及解释离群行为的模型;拟采用国际标准测试数据集和移动通信中欺诈离群数据分析来验证算法的正确性和有效性。项目研究有望在离群检测及离群行为分析的模型和算法研究方面取得突破。