硅谷新锐K-scale挑战波士顿动力:强化学习重塑人形机器人竞争格局

2025-07-041312人形机器人

成立不足一年的K-scale Lab,正是在一次次“部署”与迭代中,朝着宏愿迈进:打造一个真正开源、普惠的软硬件一体机器人平台。

强化学习:技术路线的孤注一掷

人工智能浪潮席卷硅谷,但对于K-scale Lab联合创始人兼首席运营官徐睿而言,未来在于能真正行走于物理世界、像孩童般学习进化的具身智能体。驱动这一愿景的,是团队对“强化学习”(Reinforcement Learning, RL)近乎偏执的信仰。

“我们百分百、完全依赖强化学习实现机器人的运动控制。”徐睿语气不容置疑,“团队九人中,绝大多数是强化学习工程师,我是唯一不写代码的。”他笑道,“这也意味着所有非技术事务都由我负责。”

这不仅是技术选择,更是一种底层哲学。当全球多数人形机器人公司仍沿用传统运动规划(预设动作)时,K-scale Lab选择了一条“少有人走的路”。

“我们摒弃所有传统运动控制,”徐睿解释,传统方法在动态环境(如突风、地面凸起)中常捉襟见肘,而强化学习被寄予实现更强泛化能力的厚望。

理念虽似“大道至简”,执行却艰深无比。如同教婴儿走路不指定每块肌肉动作,K-scale Lab为机器人定义“奖励函数”(Reward Function):“例如设定不能摔倒、双腿交替前进、保持速度。”机器人在模拟环境中通过无数次跌倒爬起,学习如何最大化“奖励”,最终“学会”行走。

这一技术路线也深刻影响了硬件选型。“液压系统不会是未来方向,它难以支持强化学习。”徐睿此言,含蓄挑战了以液压驱动闻名的波士顿动力等前辈。他认为,受益于电动汽车技术的电动关节马达才是更优选择。

“人形机器人这波热潮的核心驱动力,不正是强化学习吗?”他反问道。机器人创业的兴起,源于三股合力:大语言模型(LLM)和多模态模型展示了通用AI潜力;电动汽车产业链成熟降低了高性能伺服电机、传感器和电池成本;资本正从纯AI算法转向能与物理世界交互的“硬核科技”。

“极客”先行:数据驱动的市场策略

K-scale Lab首款大型人形机器人拥有24个自由度,定价却控制在1万美元以内,目标用户直指美国充满热情的“Geek”(极客/爱好者)。

“我们首先希望卖给真正的爱好者,让他们买回家折腾。”徐睿描绘着用户画像。他期待极客们像对待开放式电脑一样,编程、训练机器人整理房间、跳舞,甚至实现更多自定义功能。

这不仅是市场策略,更是深思熟虑的数据积累计划。徐睿坦言,强化学习的最大瓶颈在于“数据量不足”。“当前RL的天花板就是数据,机器人有效交互数据太少。”不同于可吞噬互联网文本的语言模型,机器人学习依赖真实物理世界互动。将机器人投放到最具创造力的爱好者手中,旨在催生海量、多样化场景数据,反哺模型迭代。

此外,一款售价约1000美元的小型机器人也在筹备中,目标客户是希望孩子通过前沿科技项目提升大学申请竞争力的高中生家长。市场反响热烈,徐睿透露小型机器人已收到高达2万份购买意向注册。

尽管聚焦爱好者,徐睿目光长远。他相信随着技术成熟和数据积累,产品功能将泛化至听写、打扫等实用场景,并关注行业和学校市场在教育机器人软件开放性及技术支持方面的潜力。

软硬一体与开源灵魂:ksim的实践

“在美国,像我们这样深度结合软硬件的公司不多,多数只做软件或AI训练。”徐睿点出团队的核心竞争力。他们坚信硬件性能与软件算法必须深度耦合。硬件开发有三大核心标准:流畅实现基本动作(可用性)、皮实耐用(健壮性)、价格亲民(成本效益)。

徐睿丰富的智能硬件从业经历(曾任职中美多家科技大厂),让他深谙中美在信息密度和创新环境的特质,视两者为“全球信息最密集、最适合机器人和AI开发之地”。

制造方面,团队最初计划依托中国成熟供应链(如国内供应商的灵巧手部)。但复杂的地缘政治因素促使他们考虑将产线转移至东南亚,甚至在美国本土建厂。“美国制造业人才储备确实是个问题,”徐睿忧虑道,“老师傅老去,年轻一代经验断层。”他半开玩笑感叹:“美国的成本'梦'不够低啊!”

彰显K-scale Lab开放决心的,更是其对“开源”的极致追求。他们高调发布了开源Python库'ksim'(已迭代超60次)。该工具基于谷歌MuJoCo物理引擎和JAX高性能计算库构建,旨在为全球开发者提供便捷高效的机器人测试平台。

通过ksim,开发者可便捷进行强化学习模拟训练,优化算法后,将成熟模型“一键部署”到真实K-scale机器人进行实测。这大幅降低了开发门槛,践行“人人皆可参与”的开源精神。

社区是另一块重要基石。Discord平台上活跃着数千人的社群(爱好者、学生、教师),他们不仅是潜在用户,更是测试者和共建者,利用ksim探索可能,甚至有人用3D打印自制硬件适配开源软件。一位阿里员工仅凭公开信息成功复刻其机器人设计,令团队惊喜。

这种彻底的开放性和活跃社区,被徐睿视为区别于其他公司的“护城河”,尤其不同于国内部分“号称开源却难复制”的项目。“国内很多公司的'开源',全球除他们自己无人能完整复现。”他直言。

选择开源也伴随“不确定性”。“我们从去年11月就开始延期,”徐睿坦承,“原因很简单:开源工具链有时不太靠谱。”但这源于他们对社区力量和长远价值的笃信。

传感器方案也体现RL优先思路:主要依赖视觉和IMU(惯性测量单元),未采用广泛应用的激光雷达(LiDAR)。“我们的RL算法基于视觉和重力传感器,装激光雷达也无用。”这出于成本考量,也与特斯拉端到端学习理念契合。

精干团队、特斯拉基因与资本转向

驱动这一切的是一支仅9人的精干团队,多为背景深厚的强化学习工程师,充满活力与锐气。徐睿透露,另一位联合创始人是特斯拉FSD(完全自动驾驶)V12版本核心成员。

“如今说做AI,投资人可能反应平淡;但如果说进军制造业、硬科技,所有投资人眼睛都会亮起来,争相投资!”资本正从纯AI算法转向深度交互物理世界的“硬核科技”。

公司已完成约500万美元天使轮融资(主要来自美国)。团队组建充满硅谷特色:成员多从活跃社区招募,先以短期合同合作,择优转正。徐睿笑言:“当前机器人和AI领域真正能打的,大多是年轻人。”

K-scale Lab的“大本营”也颇具硅谷传奇色彩:团队租下阿瑟顿(Atherton,硅谷顶级地段)一栋估值约1500万美元的五卧豪宅,月租高达2万美元(传闻房主是PayPal早期副总裁)。

对初创团队而言,这实为精打细算:楼下客厅、车库是堆满设备的“战场”与实验室;楼上卧室、后院是休憩“港湾”。团队成员24小时同吃同住同工作,极大提升了沟通效率与产出。毗邻斯坦福大学的地理优势,也便于随时召集人才解决难题。

行业洞察:特斯拉启示与中国硬件实力

作为局内人,徐睿对行业有独到见解。他认为特斯拉FSD V13在端到端强化学习上取得“巨大进展”,其“丝滑流畅”的体验证明了RL路线的潜力。他承认RL“存在天花板”,但强调“目前尚未触及”。

对激光雷达等传统传感器路线,他持保留态度,认为成本高昂且非长久之计。谈及全球竞争,他肯定中国人形机器人硬件水平“相当可观”(如宇树科技“不逊于波士顿动力”),这也是寻求国内合作的原因之一(“Hugging Face上约40%模型来自中国”)。

然而,他对国内部分企业“名不副实”的开源颇有微词。他观察到美国公司间竞争更侧重运营、策略和执行力,而非技术封锁。

谈及人形机器人在工厂的应用前景,徐睿态度务实:“工厂最适合的还是机械臂和传送带,未必需要人形。”这份清醒,反衬出他聚焦爱好者市场、着眼RL长期适应性的战略定力。

数据、梦想与破晓之路

K-scale Lab正以“新物种”姿态闯入人形机器人领域:一手紧握强化学习利剑,一手高擎开源火炬(ksim库),试图破解“数据诅咒”。小型机器人的2万份意向与社群中的自发复刻,印证了这条道路的魅力。徐睿坚信,美国华人在AI和机器人领域的卓越表现,也预示中国拥有巨大追赶和超越潜力。

前路漫漫:算法优化、全球供应链整合、社区生态拓展,都是巨大考验。因开源工具链“不靠谱”导致的延期,仅是创新长征路上的插曲。

然而,正是这种对强化学习的极致信仰,对“人人皆可参与”开放精神的执着,赋予了这个年轻团队独特张力。正如徐睿所言:“双足行走的仿生学挑战巨大,四足容错率高得多。”这份对挑战的无畏、对学习与适应的极致追求,定义了他们征程的非凡意义。

在人形机器人探索的多元路径中,K-scale Lab凭借对强化学习的专注、软硬件一体化的坚持以及对开源社区的拥抱,展现了一种独特尝试。作为初创团队,他们能否有效结合前沿AI与低成本硬件,为爱好者及早期开发者提供真正可玩、可用的产品,并验证其技术路线的可行性与成长性,是一个值得关注的行业案例。

无论其未来商业版图如何,K-scale Lab在强化学习应用于机器人控制及构建开放式软硬件生态方面的实践,都将为后续创业者和研究者提供宝贵经验或教训。对关注机器人创新与落地的人们而言,这家小公司的每一步尝试,都是观察行业趋势、理解挑战与机遇的鲜活样本。