行业唯一!「慧思开物最强大小脑」双底层模型一次性同步备案,具身智能国家队率先打通商用合规通道

李鑫2026-06-292452具身智能

2026年6月26日,北京人形机器人创新中心旗下“慧思开物”平台两大模型完成北京市网信办最新一批生成式人工智能服务备案,分别为通用大脑基座天鹕(Pelican-VL)、具身世界模型我悟(WoW)。



 

这也是国内人形机器人行业内,首次有机构同步完成通用底层基座模型、物理仿真模型双模型合规备案。此次备案落地,标志着该机构已取得两类模型对外商业化输出的合规资质,同步官宣开放慧思开物平台Token商用服务。

消息发出后,行业内部讨论集中在两点:一是这次备案的技术层次,国内此前已有机器人企业完成大模型备案,但对象基本是应用层交互模型;二是备案与商用开放同步落地的节奏,直观体现北京人形机器人创新中心已从技术研发沉淀阶段,转向产业落地、对外技术输出新阶段。

01.

底层基座和交互模型,差在哪一层?

在具身智能赛道,底层基座模型与浅层交互模型的技术鸿沟,远不止名称上的区别,二者存在本质层级差异。

可完成工厂零件装配的人形机器人,需要实时三维空间感知、物体状态判别、抓取路径规划与操作结果预判;而仅用于展台对话展示的机器人,核心只需要语言理解与生成能力,几乎无需感知真实物理环境。当下市面上绝大多数人形机器人仍局限于后者能力:在预设规整的结构化场景中表现稳定,一旦落地无标准化约束的真实作业场景,各类能力缺陷会集中暴露,这也是全行业普遍面临的技术瓶颈。

本次完成备案的两大模型,恰好对应两大核心技术层级:

天鹕(Pelican-VL)为通用视觉语言基座,无需针对单一对话交互任务微调,核心能力覆盖复杂场景解析、视觉语言统一表征、具身任务推理规划,同时可作为底层底座支撑上层各类智能系统开发。若将交互模型比作机器人对外的“聊天交互窗口”,天鹕则是整套机器人智能体系的底层核心架构,二者技术层级完全不在同一维度。



 

我悟(WoW)则是面向具身智能的物理世界仿真模型,以真实物理规则作为训练基础,能够搭建高精度数字孪生场景,自主推演物体运动、碰撞、形变、抓取等物理行为,支持机器人在虚拟环境中完成大批量作业预演,大幅削减实体样机落地的试错成本。该模型核心价值在于打通数字空间与物理实体的双向映射:机器人无需仅在现实中试错,可提前在仿真环境反复演练、预判风险、优化动作方案,这项核心能力是普通交互模型完全不具备的,也是人形机器人适配复杂非结构化实景作业的关键基础。



 

两套模型可形成完整协同体系:通用大脑基座负责全局环境认知、逻辑推理、任务统筹与多机协同调度;具身世界模型承担物理场景建模、动作仿真、风险预判、运动预演工作,搭建起“认知世界—仿真试错—实体落地执行”全链路底层技术闭环。

02.

备案门槛对底层模型,究竟有多高?

理解这两个模型是什么,才能理解为什么备案这件事本身有一定分量。

根据2023年施行的《生成式人工智能服务管理暂行办法》,向社会公众提供生成式人工智能服务,必须完成属地安全评估与备案,适用范围涵盖底层大模型的对外服务。换言之,任何机构若要将自研底层模型以API调用形式对外开放,备案是绕不过去的前置条件。

此前已完成备案的交互模型,与普通消费级对话产品在逻辑层面差距不大,备案路径相对成熟。底层基座模型的情况截然不同:训练数据从文本为主转向多模态具身数据,安全评测维度更广,评测重点不只是模型“能否回答”,还需验证其在复杂环境下“推理是否稳定、输出边界是否清晰”。

北京人形此次建立了覆盖“数据合规—模型能力—输出安全—场景适配—风险处置”完整链路的测试体系,面向真实机器人应用场景构建大量测试样例,系统检验模型在多模态理解、场景认知、空间关系判断、目标识别、任务语义理解、上下文推理和内容安全等多个方向的表现,并在此框架下完成双底层模型全维度安全评测、数据合规校验、算法透明性审查及内容风险管控体系搭建。整个测试的量级和复杂度均高于交互模型备案路径。此次通过意味着,这套针对具身底层大模型的测试范式,有可能成为后续同类模型的行业参考标准。

03.

这两个模型,是怎么走到备案这一步的?

慧思开物平台的技术路径有一条相对清晰的主线:以数据积累开始,向模型迭代延伸,最终收束于合规资质。

2024年末,北京人形发布了行业首个跨本体标准化大规模具身数据集RoboMIND,为大脑、小脑双模型训练搭建起适配多类机器人本体的数据底座;2025年3月,正式提出慧思开物平台的“大脑决策+小脑执行”双轮驱动技术框架;同年10月,全面开放慧思开物全套开发SDK,同步开源具身世界模型WoW。

在模型参数规模上,北京人形从72B的具身大脑模型起步,当时性能超过所有开源模型、与GPT和Gemini最新版本效果相当,随后接力推出122B、397B大脑模型,在具身场景任务规划、工具调用等能力上持续提升,并在时延和服务稳定性上形成了对国外闭源模型的可替代能力。



 

2026年4月,搭载慧思开物大小脑体系的具身天工3.0拿下机器人勇士挑战赛冠军,在极限场景下验证了全域自主决策与物理操作能力;5月,Pelican-Unify大一统具身基础模型发布,实现大脑全局感知与动态记忆的核心技术突破,慧思开物平台的世界模型和大一统模型随后先后在WorldArena全球评测榜单多个赛道登顶。

6月26日,双模型备案完成。从数据集发布到真机验证,再到合规资质落地,这条路线的内在逻辑是:先把技术跑通,再把合规跟上。而备案不是研发的终点,是积累到一定程度后向产业化推进的必要步骤,更是承接后续大模型商用合规的关键。

04.

合规资质拿到了,商业化能接上吗?

备案完成后,北京人形随即宣布启动慧思开物全系列模型Token服务,分阶段面向产业客户、科研机构和开发者开放API调用能力,并依托具身天工3.0硬件,以“模型+整机”软硬一体化方案覆盖工业制造、商业服务和特种作业场景,SDK开源生态同步开放。

慧思开物平台定位为“全球首个实现一脑多能、一脑多机的通用具身智能平台”,即同一套底层大脑可驱动不同型号、不同本体的机器人完成多类型任务,而不是为每种机器人单独训练一套模型。如果这个定位能在实际商业部署中得到验证,其对外输出的不只是模型API,而是一套可适配多种硬件平台的通用智能能力,商业边界将比单一硬件厂商更宽。



 

这条商业路径的推进,在合规层面已无障碍。政企客户、大型制造企业在引入人形机器人系统时,底层模型的合规资质是采购决策的基础门槛而非加分项;底层模型没有备案,意味着基于该模型构建的任何对外服务在法律上面临风险。从这个角度看,双备案完成后,北京人形在B端市场的产业合作谈判中具备了其他玩家暂时无法复制的资质前提。

实际落地的检验在此之后才真正开始:Token服务能否稳定支撑真实工况下的实时调用需求、软硬一体化方案能否保证跨场景交付质量、开源生态能否聚集真正具备机器人系统集成能力的开发者,这些都需要在真实部署中逐步验证。

05.

结语与未来

过去两年,人形机器人行业的主叙事集中在技术演示,运动控制的流畅度、感知模型的精度、在特定场景中的视觉冲击力。监管合规在这套叙事里处于边缘位置。当产业化部署的真实需求到来,合规层面的完整性开始变成与技术性能同等重要的竞争维度。

全球范围内,人形机器人赛道的竞争格局正在分化:一部分玩家在硬件层持续优化运动性能,另一部分在软件层构建通用智能平台。北京人形走的是后一条路,以底层通用大模型为核心资产,以硬件整机为商业化载体,以合规体系为产业准入凭证。这个组合在国内市场的产业化竞争中,代表着当前条件相对完整的进攻阵型。