6月2日,星海图发布了双足人形机器人行客Kengo。
消息本身不算意外,但时间节点耐人寻味。
因为就在这前后,星海图推出了新一代具身基础大模型G0.5,并在七项独立评测中全面领先,在业界公认最难的长程任务基准BEHAVIOR-1K上,以单一模型权重击败了多模型集成的冠军方案。
![]()
两件事同时发生,很难把它解读成单纯的产品节奏巧合。
因为大讲堂注意到,星海图是一家从创立起就把具身大模型放在核心位置的公司,因此双足整机的推出,对他们来说,或许就不是常规的产品线延伸,这更像是一次战略表态,意思是:我的大脑已经做到足够的厚度,现在要让它去驱动真正能进入生产力市场的身体了。
行客Kengo,就是这个判断的产物。
01.
先做大脑,再做硬件
机器人行业的主流开发逻辑是硬件先行——先把本体做出来,跑起来再说,大脑的事慢慢补。
这条路走了很多年,结果是市场上有很多能展示特定动作的机器人,但几乎没有能在新环境里自主干活的机器人。
星海图走的是反方向。几乎众所周知的是,公司以轮式机器人R1系列起步,把大量精力投入大模型的预训练架构设计,在工厂和商业场所里真实部署,用落地数据持续反哺G系列模型的迭代。
这条路在品牌曝光度上不如双足抢眼,但积累的是更扎实的底层能力。这使得如今,当大模型跨越零样本泛化的能力门槛时,公司已经有完整的技术工具链,可以把大脑能力迁移到新的硬件平台上,而不是从头开始。
这也使得G0.5的发布,意味着这家公司的场景落地关键节点已经来临了。
![]()
02.
为什么是现在?
因为星海图从成立第一天起,瞄准的就是用具身智能真正解决生产力的问题。
生产力问题意味着什么?意味着机器人不能只在实验室里表演,不能只在一张桌子上抓方块,不能只在一个房间里认路。它要走进工厂、仓库、商场、家庭。
而这些场景的共同点是,环境非结构化,地形复杂,任务多变。需要面临的是楼梯、门槛、狭窄通道、高低错落的操作面、湿滑地面、碎石路……
因此,为了满足这些场景的落地作业需求,G0.5的核心能力大讲堂认为可以梳理成三条,每一条其实都在解决机器人能不能在真实环境里不挑活、不挑地、不挑人地干活的这个问题。
![]()
第一,零样本泛化。传统机器人换个房间、换个物体、换个指令,就要重新采集数据、重新微调。
但G0.5不一样。在DROID评测中,没有任何该机器人的微调,10个桌面操作任务平均成功率超过80%。这意味着机器人第一次进入一个工业新场景,不需要停下来训练,直接就能上手干活。
![]()
第二,自然语言调行为。在场景切换最麻烦的就是代码重复编写,但G0.5因为的推理和动作走的是同一条路,语言指令可以直接影响动作输出,不需要重新训练,这就大幅加快了进入场景的时间。
![]()
第三,长程任务稳定。真实世界的任务很少是单步的。例如“收拾桌子”这个任务,就包含识别、抓取、移动、放置多个步骤。
G0.5在BEHAVIOR-1K这个目前规模最大、任务最真实的长程操作评测上,却只训练了一个周期就超过了训练四个周期的行业模型,这意味着未来机器人部署时间的大幅减少。
这三条合在一起,指向一个结论,星海图的大脑已经具备了在真实场景中干活的基础能力,并且还在不断升级优化。这也使得在场景的需求下,大模型的迭代本质上可以看作是星海图一个又一个新的起点,而不是终点。
但恰恰因为星海图恰好拥有一颗强大的大脑,这让它的双足从一开始就和其他双足不一样。
![]()
03.
Kengo:为干活设计的双足
那么,有了这样的大脑,星海图选择的身体是什么样的?如何能让大脑的能力去覆盖更多、更通用的真实场景?
我们先来看看行客Kengo的核心参数:身高1,396mm,整机重量约40kg(含电池),总自由度23+,单膝关节最大扭矩超过130N·m,手臂最大负载2kg,续航2小时,支持OTA升级和二次开发,对外开放控制接口。
![]()
理解这款产品的各项参数,其实需要把为真实场景设计作为前提。
身高1,396mm,是围绕人类工作场所的物理规格选择的结果。标准操作台高度在750至850mm之间,门洞净高通常为2,000mm。这个身高让Kengo能操作大多数人类设计的工作台和设备,同时自由穿越建筑内通道,不需要对任何存量环境做改造——轮式平台处理不了的高差和狭窄空间,双足可以自然应对。
130N·m的膝关节扭矩,对应的是边走边干的硬件基础。双足机器人在执行上肢任务的同时,下肢需要持续维持动态平衡,任何操作引发的重心偏移都要求关节在毫秒级内做出补偿。高扭矩关节,是行走与操作同步进行的物理前提。
![]()
倒地跌落10次完好无损,线束折弯寿命超20万次,全身关节仅由两款核心模组覆盖,这三个参数瞄准的是商业部署里最容易被忽视的可靠性和可维护性问题。因为机器人在真实环境里难免碰撞和重复动作,每次意外都需要停机维修,综合运营成本会迅速超出预算。高标准化的模组设计,是从供应链和维修体系倒推出来的工程约束。
开放性是Kengo另一个值得关注的设计取向。支持二次开发、OTA升级,对外开放控制接口,这意味着Kengo的目标用户不只是最终客户,也包括在这个平台上开发行业应用的开发者。一个开放的硬件平台,意味着更多可能的落地路径,这是推动具身智能走向规模化应用的必要条件之一。
04.
全栈闭环的价值闭环
星海图把自己的技术路径定义为大脑×小脑×本体的全栈自研闭环,这意味着具身基础大模型、运动控制系统、硬件整机,三层能力均自主研发。
这三层之间的耦合比表面看起来更深。因为其大模型的训练数据来自轮足本体平台的真实操作记录,运动控制系统的调参依赖大模型对任务的理解,本体的传感器布局和关节配置又需要围绕模型的感知接口来设计。任何一层外包,耦合成本就转移到集成界面上,迭代速度和控制精度都会打折扣。
![]()
全栈自研最直接的工程收益是低延迟。大模型推理结果需要在毫秒级内转化为关节控制指令,三层同一软件栈内的深度优化,把这个延迟下限压到跨系统方案难以实现的水平。更深层的价值是迭代速度:硬件数据直接回流到模型训练,模型改进直接验证在整机表现上,这套闭环的迭代频率是分布式系统难以追赶的。
这个判断正在被越来越多的头部玩家验证。2025年,OpenAI密集布局机器人方向,英伟达把Isaac平台定位为机器人训练与部署的全栈基础设施,高通推出专为机器人设计的边缘AI方案。具身智能的竞争,正在从单点能力转向系统整合效率。先走完全栈路径的公司,积累的是越来越难被追赶的工程优势。
05.
走向生产力市场
双足机器人行业过去几年的主线叙事,是站起来,也就是能否保持平衡、能否行走、能否做出让人印象深刻的运动表现。这个阶段的验收标准是视觉冲击,是证明技术存在。
这条叙事线已经基本讲完了。站起来这件事,头部公司都做到了。下一个问题是,这些机器人能不能干好活?
干好活意味着什么?能在陌生环境里直接上手,不需要为每个新场景重新采集数据;能听自然语言指令,不需要专业示教就能部署;能完成有多个步骤的任务,中间出了问题能自我调整;连续工作,坏了能修,成本可控。
![]()
这些要求,硬件侧和软件侧缺一不可。Kengo的本体设计解决的是物理侧的准入条件,G0.5解决的是智能侧的准入条件。在此基础上,星海图当前展示了两条路线的硬实力。一个在七项评测上领先同类的大模型,和一台为真实场景设计的双足整机。
未来,当Kengo搭载G0.5,大脑的泛化能力和通用操作能力将赋能双足本体,让机器人真正具备在更多真实场景里自主工作的能力。这是星海图做双足的长期逻辑,也是具身智能行业从能动走向真正干活的关键一步。
行客Kengo的出现,标志着具身智能行业开始认真面对这个问题。从展示运动能力,到具备真正理解现实世界、参与真实任务的潜力,这是通用机器人道路上一个真实的刻度,不是终点,而是新的起点。
技术报告已完整公开:
https://opengalaxea.github.io/G05/
https://opengalaxea.github.io/G05/Galaxea_G0_5.pdf