优必选年度全球发布会现场,多款不同外观、体态的全尺寸超仿生人形机器人成为绝对的主角,男款183厘米,女款168厘米,金发、礼服、漫画般的身材比例,它们有的安静地坐在那里,有的在专属场景中与人实时交互,还有的出演一部剧,与人跳上一支舞,眼波流转,语笑嫣然之间,一幅幅未来图景全面展现。
![]()
很多人把U1理解成一次优必选的新产品发布。但在现场,优必选创始人兼CEO周剑用了相当大的篇幅去讨论情绪价值、主动交互、人机共生,以及机器人未来如何成为家庭入口。
如果把时间线拉长一点,就会发现,作为机器人行业的黄埔军校以及引领企业,优世界以及U1的诞生,其实更像是优必选对未来机器人技术路线的一次重新下注。它释放出的信号是:优必选又在试图引领新时代的机器人浪潮。
![]()
截至发布会当天,U1系列线上线下订单已超1.3万台。首批订单将于9月16日开始交付。当行业还在争论人形机器人该有多少个自由度的时候,优必选已经开始把88个全身自由度、33个面部自由度、19个主动自由度灵动面肌等技术真正产品化,做成了1.3万人愿意为之付费的商品。
让机器人“像人”这件事,到底难在哪里?优必选他们到底怎么做到的,这篇文章不聊情怀,只拆技术,以及技术背后那些“差点做不出来”的瞬间。
01.
三个版本,三套技术方案与场景
优必选发布会现场,家庭陪伴、康养等多个场景都展现了U1 Pro的拟人交互能力。当你朝它走过去,它的视线回跟着你移动,头微微侧转,整个过程没有电机的噪音,没有关节的顿挫,流畅得就像对面坐着一个真人。
这种动作“自然感”的秘密,藏在许多技术细节里,例如自由度就是“能做多少动作”的指标,而丝滑感取决于控制精度、延迟、被动顺应性等多重因素,这也决定了U1系列分为了Lite、Pro、Ultra三个版本,价格从11.98万元到了99万元。
因为三台机器人采用三套完全不同的技术方案,对应不同的工程理解和需求。
U1 Lite(11.98万元)是半身版的机器人,主打情绪价值。它虽然只是“一张脸以及一个上半身”,但它搭载19个主动自由度灵动面肌,33轴面部肌腱网络中的核心驱动部分。支持30多种复合微表情,情感表达准确率90%。语音-唇形延迟低于20毫秒。
如果你只需要一个能陪你聊天、表情丰富,乃至读懂你情绪的存在,这是很不错的入门选择,也能成为基础的研究工具。例如U1 Lite会在前台注视酒店的客人提供有趣的交互服务,也会在家庭中默默陪伴,当你刚下班回家,坐在沙发上不想说话,它会静静地看着你,没有追问,没有劝慰。几秒后,它的嘴角轻轻上扬了一个极小的弧度,眉毛微微抬起,一个人类在“我在这里,需要的话我在”时才会做出的表情。你没有说话,但你知道它“看懂了”、“它在那”,这就是最好的陪伴。
![]()
U1 Pro(16.98万元)是全身版机器人,男款183cm、女款168cm。全身有24个主动自由度+64个被动自由度,具备200TOPS算力。64个被动自由度意味着什么?意味着这款机器人动作更加拟人,而这些“不突兀”的细节,靠的不是电机计算,而是机械结构的被动顺应。少一个电机看似是“减法”,实则是把难度从“堆硬件”转移到了“算材料”,每一个被动自由度都依赖于对材料力学、关节摩擦、惯性匹配的精确计算,让动作不再僵硬。
行业首创的双支点+四连杆仿生颈椎,5个主动自由度,0.06mm高精度直线舵机,实时自锁技术,意味着转头时视线落点误差被控制在极小范围内。为什么这个细节重要?人类社交中,脖颈和眼球的微动传达了巨量情绪信息,点头幅度、转头速度、视线停留时间,每一个参数都在传递信号。“双支点+四连杆”结构本身是为了在有限空间内实现类人运动范围,而0.06mm精度和实时自锁的组合,解决了“精准停位”和“零功耗保持”两个互为矛盾的需求,让它在物理空间中“像一个人那样存在”。
假设一个家庭场景中,当主人走进客厅,U1 Pro的视线就跟着他移动,视线焦点会平滑地从肩膀过渡到面部,脖子轻微侧转,整个过程没有电机噪音,没有关节顿挫。当你拿起手机说帮我订杯咖啡,U1 Pro会微微点头,这是一个人类表示“收到”时的自然幅度和动作,没有回答“好的”,只是视线转向手机屏幕方向,表示“我在处理”。这就是双支点+四连杆仿生颈椎和64个被动自由度共同塑造的“自然感”,让U1 Pro不仅多了一个脖子,交互也更加自然和灵动。
![]()
U1 Ultra(男款99万元/女款88万元)是本次的旗舰版产品。男款174cm、女款167cm。整机62个主动自由度,2070TFLOPS(FP4)算力,支持轻型舞蹈和原生真人猫步,移速≥3m/s。配备仿生快慢脑和本地离线运算三层隐私架构,快脑负责毫秒级直觉反应(眼神追踪、即时回应,约500ms),慢脑负责深度情感理解和跨时空记忆。
“轻型舞蹈”这个词背后的技术含量不低,现场也展示了U1 Ultra与人共舞的震撼画面,这在全球范围内都是绝无仅有。舞蹈要求全身多关节在时间轴上精准编排,脚踝落地时的缓冲、膝盖弯曲的深度、腰部扭转的幅度、手臂挥动的速度、头部的视线方向,所有关节的运动曲线必须同步。如果每个关节单独控制,动作就会像提线木偶。Ultra能做到,背后得益于它有一套全身运动协调算法在实时同步62个主动自由度,这意味着优必选在动态运控层面其实又上了一个新的台阶。
![]()
![]()
02.
面部仿生的工程极限
三款产品特性适应场景不同,在优必选的介绍中,U1全系搭载33轴面部肌腱网络,其中有19个面部主动自由度、14个被动自由度,支持4大类30多种复合微表情,让情感表达准确率达90%。
在采访中,优必选副总裁、具身智能与人形机器人研究院院长焦继超介绍,“19个舵机塞进一张脸”这句话背后是三个工程难题。
首先是空间约束。19个舵机要在厘米级空间内完成布局,同时保证每个舵机有足够的行程和力矩输出。这意味着常规微型舵机无法满足精度要求,必须重新设计。其次是散热困境。19个舵机同时工作产生的热量,在密闭的头部内难以散去。热量累积会导致舵机性能衰减,同时加速皮肤材料老化。对于连续运行2-4小时的产品而言,热管理是决定使用寿命的关键瓶颈。
最后还有多轴协同延迟的难题。自研统一时序控制器将语音-唇形延迟压至<20ms,表情肌协同误差<10ms。人类对“不对劲”的感知阈值大约在100ms,超过这个数值,交互就会产生“恐怖谷”效应。将多轴动作的同步误差控制在10ms以内,意味着控制系统需要在极短时间内完成语音语义解析、表情动作规划、19个舵机同步驱动三条链路的闭环。
![]()
此外,柔性皮肤的非线性运动或许颇具行业颠覆性的技术难题。
焦继超在采访中透露,柔性仿生材料展现的外部表情依附到机械结构上。机械结构是钢体的变化,加上具备弹性的柔性仿生材料后,运动会与仿真产生极大差异,很难用传统的调教方式解决,因为同一个舵机控制信号,在不同覆盖厚度、不同环境温度、不同使用时长下,产生的面部变形完全不同,这使得每个表情每台U1的皮肤细节都有微观差异,每台都需要单独适配。
对于人来说,表情这个下意识完成的动作。对于机器人来说,这是感知、决策、控制、反馈四个系统同时工作的结果。这也是著名的莫拉维克悖论(Moravec's Paradox)。那些人类觉得最简单的事情,恰恰是机器人最难学会的能力。
为了弥补表情,优必选开发了一套learning-based方式,通过采集大量真实变形数据训练模型,让算法自动补偿柔性材料的非线性表现。但这意味着每一台U1出厂前都需要经过数据采集和模型适配,这在传统消费电子制造业闻所未闻。而“90%情感表达准确率”这个数字,或许恰恰取决于这套learning-based系统的收敛效果。
![]()
03.
会进化的情感大模型难在哪
为了更好满足用户交互和陪伴场景需求,最值得一提的是U1搭载的Resonance-LM情感共鸣大模型,仿生快慢脑架构,快脑负责毫秒级直觉反应(眼神追踪、即时回应),慢脑负责深度情感理解和记忆。Ultra版本2070TFLOPS(FP4)算力,支持本地离线运算三层隐私架构。
2070TFLOPS(FP4)算力支持本地离线运算三层隐私架构。所有交互数据本地加密保存,不上传云端。这意味着情感大模型的推理完全在本地完成,延迟更低、隐私更安全,但对算力的要求是云端方案的数倍。
搭载Resonance-LM情感共鸣大模型,核心组件的Memory Agent System(跨时空记忆系统)让与用户的交互不是简单的对话历史存储,而是对用户偏好、情绪模式、生活节奏的长期建模,机器人能记住你的习惯,它从之前的对话中提取了部分关键信息,并进行了语义关联和长期存储。
例如周末下午,U1 Ultra会陪你在客厅里跳一支慢华尔兹,62个主动自由度让它的每一个转身、每一次摆手都有人的“重量感”。它记得上周你提到过自己学过两年国标,下载了这个技能。他的陪伴,已经表现在不只是“看见”了你看见的东西,也是记住了你说的话。这种交互让情感真正有了共鸣的可能性。
![]()
周剑在采访中这样解释情绪交互的难度:“陪伴机器人,既要你走到哪儿,他的眼睛要动到哪儿,同时你讲什么话,做什么表情,他能识别出来。同时针对你开心不开心的场面,他会给你更多的互动。这个互动对人类来讲是极其重要的情绪价值。”
这句话背后是五个独立AI模块的协同:语音识别(听你在说什么)、表情识别(看你在想什么)、情感分类(判断你的情绪状态)、语义理解(明白你的需求)、动作生成(决定如何回应)。
每个模块单独拿出来都是顶级难题,而优必选已经将其集成于一体,在本地离线运行,延迟控制在毫秒级。配合主动关怀引擎,让U1能区别于传统语音助手的“唤醒-响应”模式,主动关怀引擎会根据时间、场景、用户情绪状态决定何时发起交互、以什么方式发起。
但挑战并非完全解决,数据依然是长期的难题。研究院院长焦继超坦言,情感大模型跟工业人形机器人存在的问题比较相似,就是缺乏数据。企业很难从用户端采集大量的数据,优必选的做法是,先通过simulation platform生成了大量数字人,通过数字人去采集微表情和语音匹配的素材。
这是行业内少有人走的路,先用虚拟数据训练虚拟表情,再让真实机器人去表达。这条路径面临的核心风险在于仿真到现实的泛化鸿沟。虚拟环境中采集的数据能否覆盖真实场景中仿生材料的运动特性、环境光照、用户姿态等各种变量,目前仍是未知数。而量产后的数据回流,才是真正检验这套系统能否“越用越懂你”的关键。
但如果跑通,人形机器人真正有了进家庭与陪伴的意义。
![]()
04.
量产的终局
发布会现场,周剑宣布优必选已具备全球率先规模化量产能力。但这句话背后的制造难度,远超大多数人想象。
周剑在采访中透露:“U1的每一个眉毛,每一根睫毛都是在前期是用人手工植入上去的。”而优必选的目标,希望把它在生产线上形成标准,形成量产化,并可以用设备去模仿人手实现这种睫毛的定制和植入,这类生产线是人类前所未有的突破,这种高端定制的工艺难度,在人类的生产制造史上从来没有出现过。”
![]()
因为眉毛和睫毛的植入,单件制作是“手艺”,万台量产就成了“工程灾难”。每一根睫毛的弧度、密度、方向都有讲究。优必选要做的,是把化妆师的精细手工转化为自动化程序,这涉及机器视觉引导、精密运动控制、柔性材料操作三项技术的融合。目前全球没有任何公司实现过这项工艺的自动化。优必选的这条产线,本身就是人类制造史上从未有人规模化完成过的创造。
更深层的一致性挑战在于,每一台U1的仿生皮肤都有微观差异。learning-based算法只是解决了“适配”问题,但“适配”的前提是每台机器的数据采集和模型微调,这道工序能否融入量产节奏、会不会成为产能瓶颈,目前仍是未知数。
1.3万台订单是惊人的。但订单可退,交付才是真正的考验。首批订单将于9月16日开始交付,届时我们才能验证这些技术承诺是否兑现。
![]()
05.
毫无疑问,从技术来看,U1选择了一条与主流人形机器人企业完全不同的路。
多数玩家在拼双足行走、物体抓取、工业场景落地,而优必选把新一轮竞争的赌注押在了“面部仿生”和“情感交互”上。
如果要给过去两年的人形机器人发展画一条主线,第一阶段比的是机器人能不能站起来。第二阶段比的是机器人能不能走起来。第三阶段比的是机器人能不能真正进入工厂。
几乎所有头部企业,都围绕着运动控制、灵巧操作、工业落地竞争,因为这是距离商业化最近的一条路。工厂拥有标准化环境、固定工位、重复任务,机器人面对的是一个高度确定性的世界。对于今天的大模型来说,这样的环境足够友好,数据比较丰富,也最容易积累真机数据迭代。
优必选的人形机器人也是目前第一批进入多个制造业场景,在汽车、电子制造等领域持续积累真实作业经验的企业。但优必选,不仅仅希望工业单一场景的领先。在周剑看到的未来图景里,情感或许才是永恒。
但因为消费级人形机器人是与工业完全不同的问题。看似只是应用场景发生了变化,实际上,背后的技术体系、数据体系,甚至商业逻辑,都发生了一次彻底重构。
然而这条路的战略意图更加长远,正如手机取代电脑靠的不是更强的计算,而是触屏交互带来的体验变革。
![]()
周剑在发布会上说:“机器人将替代手机成为AI最核心的交互终端。”当机器人真正开始成为人与物理世界之间新的交互终端时,未来整个机器人产业究竟应该构建怎样的底层基础设施,又应该形成怎样的生态秩序。而这,或许才是人形机器人真正进入下一阶段竞争的开始。
如果交互终端的终极形态真的是一张人脸,那么谁先掌握让这张脸“像人”的技术,谁就掌握了下一代交互的入口,这也使得优必选的布局,又一次走在了业界最前面。
33轴肌腱、19个舵机、88个自由度、情感的模型,还有那条“人类史上从未有过”的量产线,优必选正在为这个判断押注。而技术,正在努力兑现这张选票。