智元开源行业首个专属于世界模型的具身数据集,让机器人从“多样交互”中理解真实世界

2026-06-031754机器人技术及应用

2026年6月3日,智元正式开源AGIBOT WORLD 2026数据集第二期主题“多样交互(Rich Interaction)”。这是行业首个聚焦物理交互的开源具身数据集,面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究,系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程,旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。

本期数据集已在Hugging Face平台开放下载。继此前发布以“模仿学习”为主题的第一期数据集后,AGIBOT WORLD 2026进一步将数据建设从专家示范和成功轨迹,推进到真实环境中更复杂、更不确定、也更接近物理世界本质的交互学习阶段。

长期以来,具身智能数据集大多围绕标准任务、专家示范和成功案例展开。然而,真实世界并不总是理想、稳定和可控的。机器人在现实环境中会频繁遇到抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等非标准情境。对于人类而言,这些是日常生活中习以为常的经验;但对于机器人而言,它们恰恰是理解接触、摩擦、重心、形变和反馈等物理规律的关键入口。

为了补齐当前世界模型训练中长期缺失的真实物理交互数据,AGIBOT WORLD 2026第二期“多样交互”数据集应运而生。与传统具身数据集中只关注“成功示范案例”的采集逻辑不同,智元此次开源的“多样交互”主题数据集主动保留并强调非理想行为的研究价值。该数据集基于100%真实场景采集,系统记录了机器人与不同材质、形态和结构物体之间的丰富物理互动,覆盖成功与失败、预期与意外、稳定与混沌等多种交互状态。通过开放这批数据,智元希望为世界模型提供更接近真实世界运行规律的数据基础,推动机器人从“学习如何完成任务”进一步走向“理解动作如何改变世界”。

这些过去常被视为“失败”或“噪声”的数据,正在成为世界模型研究中宝贵的资产。对于世界模型而言,如果训练数据只包含标准动作和成功示范,模型往往容易停留在对成功状态的拟合上。当面对少见动作、复杂接触和非理想情况时,模型可能难以准确预测真实世界中的失败分布与物理演化。只有见过足够丰富的成功与失败过程,模型才能更好地模拟真实未来场景,减少不符合物理规律的生成结果。

智元在实验中证实,基于其世界模型仿真器Genie Envisioner-Sim 2.0,多样交互数据与失败数据对于提升Action-Conditioned World Model的建模能力具有重要意义。相比仅基于成功示范训练的模型,纳入更丰富动作分布、接触过程和非理想交互结果的数据,有助于模型更准确地理解“动作如何改变世界”,并提升未来状态预测的物理一致性。

本期数据集的发布,意味着具身智能数据建设正在进入新的阶段。过去,机器人更多是在学习“如何成功执行动作”;现在,机器人需要进一步学习对世界的建模——“真实世界如何回应动作”。从成功到失败,从动作到反馈,从任务完成到世界理解,AGIBOT WORLD 2026正试图为下一代世界模型、机器人学习和物理智能研究搭建更完整的数据底座。

随着“多样交互”数据集开源,智元希望推动全球研究者共同探索真实物理世界中的复杂交互规律,加速世界模型、具身智能和物理智能的发展。

项目主页:agibot-world.com/

开源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026