LIBERO 99.25%,越疆空弈DobotWAM具身大模型排名第一!实测第一!

2026-06-021000具身智能人工智能(AI)

近两年,具身智能赛道吸引了各界的目光。舞台上表演的具身机器人,成了这场资本与技术狂欢最直观的图腾。

它们出现在世界人工智能大会的聚光灯下、春晚的舞台中央,车企发布会的前排嘉宾席。翻跟头、跳街舞、端着托盘平稳穿过人群——每一次亮相都精准地踩在社交媒体的兴奋点上,像极了当年人形机器人概念在科幻电影里种下的那枚种子,如今终于发了芽。

这是具身智能的上半场,万众瞩目。

下半场,在非结构化的真实世界里,散落在地上的零件、突然出现的障碍物、光线从亮变暗的走廊等构成了一个个具体的难题,具身智能从技术炫技开始走向商业落地的残酷战场。在这个过程中,大模型的重要性,正在被重新定义,让机器人从"执行指令的工具"蜕变为"理解意图的伙伴"。

 

PART 01

99.25%背后:不仅是机械臂领域的王者,更是具身智能技术的领跑者

 

近期,越疆科技发布自研世界动作模型——空弈DobotWAM具身大模型,给出了一个震撼行业的答案。

在具身智能权威评测基准LIBERO上,空弈DobotWAM具身大模型以99.25%的平均成功率登顶榜首,领先于π0.5、π0、GR00T-N1.5、π0+FAST等公开模型,以及行业内已有数据公布的其他模型结果。

更令人瞩目的是细分表现:在LIBERO四个标准任务套件中,空弈DobotWAM具身大模型

在LIBERO-Object上实现100/100全部成功,在Spatial、Goal和LIBERO-10三个套件中均达到99/100。

Image
 

这个数字的意义,远超表面的"第一"。

它标志着越疆从“全球协作机器人第一”向“具身智能头部企业”的硬核跃迁——不再只是机械臂领域的王者,更已成为具身智能技术的领跑者。这并非偶然,而是源于公司近三年完成从协作机器人到具身智能的产品战略升级。基于对机器人“身体”操作能力的深刻理解,空弈DobotWAM具身大模型形成了独特的具身优势。

具身智能的下一站,不是更好看的演示,而是真实可用的现场执行能力。过去,机器人演示多以预设轨迹的舞蹈、翻跟头为主,好看却离生产很远;如今,越疆将焦点拉回插接、抓取、对准等高精度接触作业,让具身智能真正走向可用、可靠、可落地,引领行业向具备真实操作能力、可落地复用的方向前进。

图片
 

当前,搭载了越疆空弈DobotWAM具身大模型的人形机器人已实现商业化落地,正在真实的作业场景中创造价值。

图片
 

在电影院,越疆爆米花机器人单日工作14小时,创下单日营收2万的成绩。

图片
 

在汽车产线上,越疆人形机器人承担高强度的夜班工序,秒级识别料盘错位等突发异常,自主排障。

 

PART 02

为什么机器人需要世界动作模型?

 

机器人走向真实应用,需要面对的不是静态、规则、完全可控的环境,而是充满变化的开放场景。

同一个任务,物体位置可能不同;同一句指令,表达方式可能不同;同一个操作,机器人初始姿态可能不同;同一类物体,尺寸、形状、材质和摆放方式也可能不同。对于机器人而言,真正的挑战不只是“识别物体”,而是理解物体之间的空间关系、判断任务目标、生成符合机械臂运动结构的动作,并在多步骤执行中保持全局目标一致。

这意味着,机器人需要的不是一套在固定条件下死记硬背的动作序列,而是一种能够穿透表层变化、直抵任务本质的理解力。

近两年视觉-语言-动作模型成为具身智能动作生成的主流范式,在数据覆盖充分、任务边界清晰的场景下展现了较高效率,但过度依赖二维图像模式或离线轨迹模仿,在面对空间扰动、物体变化、长流程任务和真实接触反馈时,仍容易出现动作漂移、目标丢失,或局部动作正确而整体任务失败的情况。

这要求机器人模型必须超越单纯的“模仿”,建立起对动作深层次结构的真正理解。

在此背景下,世界模型正在成为具身智能动作生成的另一条技术路线。越疆空弈DobotWAM具身大模型,正是在这条技术路线上实现了领跑。

Image
 

越疆空弈DobotWAM具身大模型在视觉-语言-动作建模的基础上,进一步引入三维空间理解、机器人运动几何约束和真实数据闭环机制,使机器人不仅学会“模仿动作”,更学会“理解动作为什么这样做”,在感知、理解、控制与数据闭环上实现了系统性设计。

 

PART 03

四大核心技术能力构建独特能力栈

 

越疆空弈DobotWAM具身大模型系统性重构,并非单点优化,而是由四项关键技术突破协同完成的。它们分别从空间感知、运动建模、任务规划和数据闭环四个维度,构筑了空弈DobotWAM具身大模型区别于其他模型的独特能力栈。

Image
 

3D-Aware Spatial Representation

将3D 空间信息引入视觉-语言-动作建模,使模型不只依赖 2D 图像纹理和像素特征,能够显式感知物体位置、空间关系与操作目标之间的几何结构,具备更强的泛化能力。

Joint Dynamic Geometry Loss

将机器人关节动态信息与末端执行器几何约束融入训练loss,使模型从“模仿动作”升级为“理解真实动作结构”,从而减少轨迹漂移、姿态不连续和抓取失败,提升长时序任务中的执行稳定性。

Advanced VLM Task Decomposition

基于高级VLM backbone 对复杂语言指令进行语义理解与任务拆解,将长流程操作分解为更清晰的阶段目标和可执行子步骤,避免局部动作正确但全局任务失败。

High-Quality Data Flywheel + Real-Robot Recap

构建高质量数据飞轮,以Recap真机实验为核心,闭环采集、训练、评测与反馈,持续吸收成功、失败及长尾场景的真实经验,提升从仿真 benchmark 到真实环境执行的迁移能力。

从感知到规划,从执行到进化,四项关键技术让空弈DobotWAM具身大模型具备了一套完整的“具身理解力”。

 

PART 04

越疆空弈DobotWAM具身大模型的真实执行力

 

在真机实测中,越疆选取了三类具有代表性的精细操作任务:分类任务抓取、插充电器和插笔帽。

这些任务的共同特征是:看似简单,但对机器人而言,都是典型的高精度接触任务,也是真实物理环境中衡量“执行能力”最直接的标尺。模型不仅需要识别目标物体的位置,还需要理解插头、插座、笔身、笔帽之间的空间关系,并在执行过程中完成对准、接近、插入和闭合等连续动作。

1.分类抓取——考验“看见”与“拿到”

在多场景高精度分类自主抓取任务中,空弈DobotWAM具身大模型需要识别不同类别的目标物体,并准确抓取。

这听起来基础,但物体可能被随意摆放,姿态千奇百怪,光照条件不断变化。模型必须完成小目标的精准定位与姿态估计,才能在杂乱中准确出手。

这正是空弈DobotWAM展示的第一重能力:在非结构化场景中,稳定地“看见”并“拿到”。

2.插充电器——考验“对准”与“力控”

插充电器,属于典型的“强几何约束下的高精度插接”——插头与插座之间的容错间隙极小,角度稍有偏差、力度稍有失控,就会卡住或弹开。

空弈DobotWAM具身大模型能够基于视觉观测自主完成目标定位,结合机器人实时状态进行动作生成,控制机械臂在真实环境中稳定完成充电器插接的全流程。甚至当需要双臂协作旋转调整插头角度时,模型依然能保持动作的连贯与稳定。

3.插笔帽——考验“精度”与“柔顺”

图片
 

笔身细长,笔帽开口极小,轴线稍有偏移就会顶住、滑脱,力道稍大就会把笔推倒。这考验的是机器人在“对准”与“精细接触控制”上的极限能力。

空弈DobotWAM具身大模型根据视觉信息自主判断笔身与笔帽的相对位置,控制机械臂完成精细对准和插入动作。

这类能力,在3C装配、精密仪器操作等真实产线场景中,是真正的刚需。

 

PART 05

越疆的人形机器人、协作手臂,已经拥有了自己的大脑

 

回过头来看,99.25%,这个数字的意义,远不止一个榜单的排名。

过去,机械臂是高精度的执行终端——它忠实复现人类预设的每一条轨迹,但无法理解“为什么要这样做”,更无法应对预设之外的任何变化。那是“手”很强、“脑”很弱的时代。

如今,空弈DobotWAM让这只手长出了真正能思考的大脑。它看得懂三维空间里的位置关系,理解得了任务指令背后的意图,判断得了接触瞬间该用多大的力、该往哪个方向微调。它不再只是“做动作”,而是在“理解操作”。

简而言之,越疆的人形机器人、协作手臂,已经拥有了自己的大脑。

未来,越疆将继续围绕真实机器人场景推进空弈DobotWAM具身大模型持续迭代,让机器人从“能看懂、能行动”,进一步走向“能适应、能泛化、能长期可靠执行”。