结构化增强学习(Hierarchical reinforcement learning: HRL)是求解大规模空间复杂优化决策问题的一类重要方法,具有广泛的应用前景,近年来成为机器学习与智能系统的研究热点。本项目以虚拟人运动规划面临的高维空间序贯优化决策问题为背景,研究结构化增强学习的快速策略迭代算法与自适应分层逼近算法,克服已有方法面临的高维连续状态空间逼近与学习泛化问题;结合HRL的理论方法创新,研究结构化增强学习在虚拟人运动规划中的应用,包括基于HRL的分层路径规划和自适应运动合成方法等。本项目的成果将有效解决现有HRL理论方法面临的算法计算效率与高维空间泛化性能等挑战问题,为虚拟人运动规划提供高效的学习优化手段,同时也将推动结构化增强学习在实际大规模优化控制问题中的应用。