DeepMind 联合伦敦大学研究人员提出了 RoboBallet,这是一种基于启发式的学习方法,用于在随机生成的环境中进行任务和运动规划,能够在与训练期间看到的环境不同的环境中规划多臂到达轨迹,具有任意障碍物几何形状、任务姿势和机器人位置。

任务和运动规划是一大类问题,需要高级离散调度和低级连续规划来解决。
在这项工作中,为了简单起见,他们专注于 reaching 子类。具体来说,他们解决了可扩展性和高效任务调度是主要挑战的问题,没有隐式或显式的任务相互依赖性,并且每个单独的任务都很容易完成。
该方法共同解决了任务分配、调度和运动规划问题,没有现有方法中常见的手工设计的简化,例如预采样固定数量的IK解决方案,根据启发式方法将任务预分配给机器人,或一次为一个机器人规划子轨迹。