主要研究大规模图像数据的自动标注算法,具体研究内容有:研究具有更好表示和区分能力的图像特征提取算法,其重点是研究特征选取和特征变换;研究用于高层语义特征提取的机器学习方法,其重点是研究半监督学习和大规模数据学习问题;研究图像标记的语义相关性挖掘问题,以进一步提高自动标记的性能,基本思路是利用先验信息、WordNet等知识库和标记在图像同现等统计信息。基于上述算法研究成果,我们将针对日常生活中常见的实体语义对象,从互联网上下载相应的图像,通过学习训练建立起较大规模的视觉语义特征模型库,用于实现图像的自动语义标注;我们还计划研究开发大规模图像数据的自动标注原型演示系统,用于网上大规模图像的搜索和过滤。