智元开源行业首个专属于世界模型的具身数据集，让机器人从“多样交互”中理解真实世界

2026-06-032043机器人技术及应用

2026年6月3日，智元正式开源AGIBOT WORLD 2026数据集第二期主题“多样交互（Rich Interaction）”。这是行业首个聚焦物理交互的开源具身数据集，面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究，系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程，旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。

本期数据集已在Hugging Face平台开放下载。继此前发布以“模仿学习”为主题的第一期数据集后，AGIBOT WORLD 2026进一步将数据建设从专家示范和成功轨迹，推进到真实环境中更复杂、更不确定、也更接近物理世界本质的交互学习阶段。

长期以来，具身智能数据集大多围绕标准任务、专家示范和成功案例展开。然而，真实世界并不总是理想、稳定和可控的。机器人在现实环境中会频繁遇到抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等非标准情境。对于人类而言，这些是日常生活中习以为常的经验；但对于机器人而言，它们恰恰是理解接触、摩擦、重心、形变和反馈等物理规律的关键入口。

为了补齐当前世界模型训练中长期缺失的真实物理交互数据，AGIBOT WORLD 2026第二期“多样交互”数据集应运而生。与传统具身数据集中只关注“成功示范案例”的采集逻辑不同，智元此次开源的“多样交互”主题数据集主动保留并强调非理想行为的研究价值。该数据集基于100%真实场景采集，系统记录了机器人与不同材质、形态和结构物体之间的丰富物理互动，覆盖成功与失败、预期与意外、稳定与混沌等多种交互状态。通过开放这批数据，智元希望为世界模型提供更接近真实世界运行规律的数据基础，推动机器人从“学习如何完成任务”进一步走向“理解动作如何改变世界”。

这些过去常被视为“失败”或“噪声”的数据，正在成为世界模型研究中宝贵的资产。对于世界模型而言，如果训练数据只包含标准动作和成功示范，模型往往容易停留在对成功状态的拟合上。当面对少见动作、复杂接触和非理想情况时，模型可能难以准确预测真实世界中的失败分布与物理演化。只有见过足够丰富的成功与失败过程，模型才能更好地模拟真实未来场景，减少不符合物理规律的生成结果。

智元在实验中证实，基于其世界模型仿真器Genie Envisioner-Sim 2.0，多样交互数据与失败数据对于提升Action-Conditioned World Model的建模能力具有重要意义。相比仅基于成功示范训练的模型，纳入更丰富动作分布、接触过程和非理想交互结果的数据，有助于模型更准确地理解“动作如何改变世界”，并提升未来状态预测的物理一致性。

本期数据集的发布，意味着具身智能数据建设正在进入新的阶段。过去，机器人更多是在学习“如何成功执行动作”；现在，机器人需要进一步学习对世界的建模——“真实世界如何回应动作”。从成功到失败，从动作到反馈，从任务完成到世界理解，AGIBOT WORLD 2026正试图为下一代世界模型、机器人学习和物理智能研究搭建更完整的数据底座。

随着“多样交互”数据集开源，智元希望推动全球研究者共同探索真实物理世界中的复杂交互规律，加速世界模型、具身智能和物理智能的发展。

项目主页：agibot-world.com/

开源地址：huggingface.co/datasets/agibot-world/AgiBotWorld2026

精彩推荐

税收数据“接住”资本热度，市场迎来“验收时刻”？

刚刚，宇树科技科创板IPO注册通过，“人形机器人第一股”进入发行倒计时

平均年龄不到25岁，清华博士团队凭什么让雷军独家押注？

为优必选、荣耀、智元代工，这家营收破500亿制造巨头即将赴港IPO

成立仅1年拿下数亿融资，深度机智凭什么让十余家机构集体下注？

精彩文章

扫码手机阅读

智元开源行业首个专属于世界模型的具身数据集，让机器人从“多样交互”中理解真实世界

精彩推荐

关于我们

商务合作