现在,用 AI 生成一张机器人图片并不难。
输入一句描述,几秒钟后,屏幕上就能出现机械蝎子、狮鹫,甚至一台从游戏里走出来的半人马机器人。
但从画出来到做出来,可以说差了十万八千里吧!
![]()
这中间棘手的事很多。电机装在哪里?关节转动时会不会碰撞?零部件能不能承受扭矩?结构是否适合 3D 打印?打印出来后,又该怎么组装?
最近,上海人工智能实验室、代尔夫特理工大学与上海交通大学团队提出了一套DOA自动设计框架,试图把这条链路向前推进一步。
用户输入文字、图片或3D模型后,系统会从外形网格出发,自动拆分机械部件、选择电机、调整几何结构、优化打印密度,并处理装配细节,最终输出一份电机清单和一套可直接3D打印的机械部件。
为了验证这套方法,研究团队真的造出了一台约15公斤重、能够行走和摆出不同姿态的半人马机器人。
![]()
![]()
相关论文近日以Article in Press 形式上线于Nature合作期刊《npj Robotics》。
![]()
01.
从游戏角色图片,到一台真实机器人
研究团队选择的测试对象来自游戏《塞尔达传说:旷野之息》中的 Lynel。
![]()
它有类似人类的上半身,也有四足动物式的下半身,头顶长角。与常见四足机器人相比,这种形态没有现成模板可以直接套用。
系统先借助图生3D工具生成初始网格。简单来说,就是先把二维图片变成立体外壳。
![]()
由于Lynel的身体结构并不标准,研究人员仍需通过交互界面预先指定关节位置、自由度和运动轴线。此后,机械部件拆分、电机配置、几何结构调整、密度优化和装配处理由系统自动完成。
最终,这台半人马机器人拥有19个自由度。髋关节和肩关节各有两个自由度,膝关节和肘关节各有一个自由度,腰部还有一个自由度。
在一台搭载AMD R9-5900X CPU 的计算机上,自动设计过程耗时约8小时。系统从电机库中选出12个DM6006电机和7个MG4005 电机。研究人员再使用PLA材料打印上下躯干、大腿、小腿和手臂等结构,完成装配和装饰。
![]()
![]()
最终样机总重约15公斤,能够行走,也能活动不同关节,摆出多种姿态。
![]()
不过,这还不是“从图片到机器人全程一键生成”。
这台机器人的初始关节配置仍由研究人员手动设定,运动控制也没有自动生成。下半身使用现有四足机器人控制器 Champ,上半身则由摇杆操作。
02.
AI不只要管外形,还要管电机和强度
这套方法被称为“拆解-优化-组装”,英文简称DOA,即Decomposition-Optimization-Assembling。
![]()
第一步是拆解。系统将初始网格拆成身体、大腿、小腿和手臂等机械部件。与从标准零件库中拼装机器人不同,这种方式保留了更多外形自由度。
第二步是选择电机。系统要决定每个关节使用哪一种电机、放在哪里,同时兼顾位置、轴线、扭矩和相互干涉。电机既要塞得进去,也要带得动。
第三步是几何优化。如果原始外形没有足够空间容纳电机,系统就需要局部调整结构,同时移除关节运动时可能发生碰撞的区域。
为此,研究人员先将网格体素化,也就是切成许多小立方体,再完成网格扩张、关键体素搜索和运动干涉移除,最后重新构建机械结构。
![]()
做到这里,机器人已经可以进入仿真。但要真正打印出来,还差一步:减重和装配。
03.
内部做成镂空骨架,连接方式也要一起算
如果零部件全部打印成实心,重量和成本都会快速上升;如果内部过于空旷,又可能无法承受电机扭矩。
系统因此加入密度优化。研究人员通过有限元分析评估受力情况,在重量与结构强度之间寻找平衡。最终,零部件内部填充六重板晶格结构,同时保留外层表面。
从外面看,它仍然保留游戏角色的轮廓;从内部看,则像一套经过计算的镂空骨架。
![]()
装配方式也被纳入设计。研究团队为电机与机械结构设计了类似燕尾榫的连接结构,系统会根据电机位置,将连接件融合进机械结构,并搜索更合适的滑入方向,减少安装过程中的干涉。
![]()
电机一侧的连接件仍需使用螺丝固定,但电机与打印部件之间不再额外使用螺丝,还可以通过销钉防止连接件沿槽滑动。
这不是一个花哨细节。它决定了系统输出的结构,能否真正完成装配。
04.
随机测试 100 张狗狗图片,条件成功率达到 92%
一台半人马机器人足够吸睛,但还不足以说明系统具备一定通用性。
研究团队又从 Stanford Dogs 数据集中随机选取100张狗狗图片,尝试自动生成不同外形的四足机器人。
狗的身体结构相对标准。系统可以借助3D姿态估计模型生成初始网格和关节位置,再按照标准四足机器人的12自由度模板开展设计。如果一次设计失败,系统会将模型整体放大10%,重新开始下一轮,最多迭代 8 轮。
结果显示,第一轮设计的条件成功率为36%;经过多轮调整后,提升至92%。成功设计平均需要2.39 轮,平均耗时约20.4分钟。
这里所谓的成功,是指设计通过了自动验证,即存在合适的电机,机械结构能够容纳电机,不会出现运动和装配干涉,并且能够通过有限元分析。
失败原因也很现实。59.4% 的失败轮次来自有限元分析约束无法满足,通常是因为初始网格存在过薄部位,或者移除干涉后,局部结构变得太脆弱。
![]()
05.
机器人身体,也开始成为算法的一部分
除了半人马和机器狗,团队还展示了文字、图片和3D 模型输入下生成的多种设计,包括狮鹫、蝎子、霸王龙、台灯和卡通角色等。不同设计耗时约 30分钟至5小时。
![]()
这项研究距离工业级机器人设计仍有明显距离。
系统依赖前端文生3D或图生3D 模型的质量;当前仅支持旋转关节;控制器也没有与机械结构协同生成。半人马机器人可以行走,但距离奔跑、跳跃和自主完成复杂任务还很远。
它暂时不是工业机器人研发的替代品。但在教育、娱乐、文创和个性化原型验证中,这套思路已经提供了一种新的可能性。
过去,机器人行业谈具身智能,更多关注如何训练一个更聪明的“大脑”。现在,身体本身,也开始成为算法的一部分。
论文链接:https://doi.org/10.1038/s44182-026-00101-3