摘要

从对象,关系和层次结构上对我们的世界进行结构化的理解是人类认知的重要组成部分。从原始的感知数据中学习这种结构化的世界模型仍然是一个挑战。为了朝这个目标迈进,我们引入了Contrastively-trained Structured World Models(C-SWMs)。C-SWMs利用对比方法在具有合成结构的环境中进行表示学习。我们通过图神经网络建模将每个state嵌入构造为一组对象表示及其关系。这允许模型从原始像素观察中发现对象,而无需把直接监督作为学习过程的一部分。我们在包含多个交互对象的合成环境中评估C-SWMs,这些交互对象均可以被智能体相互独立操作,包括简单的Atari游戏和多对象物理模拟器。我们的实验表明,C-SWMs可以在学习到可解释的基于对象的表示形式的基础上,克服基于像素重构的模型的局限性,并在高度结构化的环境中胜过此类模型的典型代表。

论文信息

  • 作者:Kipf, T., van der Pol, E., & Welling, M. (2019).
  • 出处:ICLR2020 Oral
  • 机构:University of Amsterdam
  • 关键词:表示学习,图神经网络,自监督
  • 论文链接

内容简记

方法

实验