6月8日,工业和信息化部办公厅、国务院国资委办公厅发布关于联合开展2026年度人形机器人与具身智能实景实训专项行动的通知。
![]()
按照通知要求,两部门将围绕打造实景实训空间等开展相关工作。到2026年底,人形机器人等重点产品将在一批代表性场景中率先完成应用验证和常态部署,正式开启“作业模式”;凝练形成百个以上高价值应用场景,进一步丰富具身智能应用谱系,带动形成万台级规模落地能力。
实际上早在今年初,包括京东在内的一些企业就围绕机器人的数据采集、场景训练开启了相关工作。
回过头来看,人形机器人做训练的逻辑是,其要想无限接近拟人本体,就需要变得更加智能,而实现智能化的核心路径,就是不断录入动作记忆。所有训练动作,本质上都属于数据训练范畴。
人形机器人训练平台已成为新质生产力的核心载体,掌握数据训练话语权,就能主导这一万亿级产业的未来。当然,这一切都是为了让人形机器人变得更加智能。
01.
数据是机器人上位的智能燃料
人形机器人训练平台是一种新式基建平台,如今备受各地重视。
位于湖北某地的人形机器人训练中心,是全国规模最大、场景最丰富的人形机器人专业训练平台,集动作训练、数据采集、场景应用于一体,每天都在上演机器人“从笨拙到灵巧”的蜕变过程。
公开资料显示,该中心已实现上百台机器人同步训练,年采集数据能力超千万条,部分训练数据实现商业化交易。此前,全国首家人形机器人7S店已在武汉开业,涵盖工业制造、文旅导览、康养护理、特种作业等十余个应用场景。
传统基建依靠钢筋水泥拉动经济增长的时代已经落幕,以数据为核心的新基建正在成为经济发展的新引擎。
对人形机器人产业而言,训练平台就是最重要的新基建。它不仅决定了机器人的智能上限与迭代速度,也重塑了整个行业的竞争格局。
坦率地讲,早期机器人行业比拼的是电机、减速器、控制器等硬件部件的精度与成本。谁能造出更便宜、更耐用的机器人本体,谁就能占领市场。
但随着硬件技术的成熟与产业链的完善,硬件差异正在快速缩小。采用同款关节电机、减速器、控制器的不同厂商,造出的机器人本体性能差距已经不大。
真正拉开差距的,是机器人的“大脑”——也就是经过海量数据训练的智能模型。
横向对比来看,智驾与人形机器人的发展路径惊人相似。十年前,自动驾驶行业主打比拼激光雷达数量、摄像头分辨率等硬件参数。如今业内已形成共识:决定自动驾驶水平的并非硬件,而是海量真实道路数据与千亿参数大模型。
我们判断,人形机器人正在重走智驾的发展道路。一个机器人能做什么、做得好不好,不再取决于它有多少个自由度,而是取决于它见过多少场景、学习过多少动作、积累了多少经验。
可以梳理出这样一套逻辑:数据是智能的燃料。没有海量高质量数据,再先进的算法也只是空中楼阁。大语言模型之所以能取得突破,是因为它学习了互联网上几乎全部文本内容。而人形机器人需要学习的是物理世界里各类动作与交互逻辑。
这所需的数据规模,远超大型语言模型,巨大的数据缺口也由此催生了全新行业风口。
尤其是从数据采集、清洗、标注,到模型训练、验证、部署,一个万亿级的训练新基建市场正在快速形成,并逐步构建起完整的社会化分工体系,各类市场主体纷纷入局这一赛道。
今年3月,“京东黑板报”宣布启动“人类历史上规模最大的数据采集行动”。整个项目计划发动内部超10万名各类职业员工,以及外部50万各行业人员,两年内采集超1000万小时的人类真实场景视频数据,目标是建成“全球最大具身数据采集中心”。
![]()
从京东的布局放眼整个行业,训练平台将会像当年的电力基础设施一样,成为所有机器人企业的公共服务。谁能率先建成这类基础设施,谁就能如同昔日的电力企业一般,向全行业输出“智力能源”。
人形机器人训练新基建的崛起,标志着行业已经从“造身体”的阶段进入“教大脑”的新阶段。更直白地说,这不仅是技术路线的转变,更是商业模式与竞争格局的彻底重构。理解了这一点,才能看懂当下机器人行业的发展态势。
02.
机器人训练到底如何运作?
机器人训练是一个复杂的系统工程,涵盖数据采集、仿真训练、真机验证、模型迭代等多个环节,形成了完整的闭环产业体系。
每个环节都有不同的技术要求与商业机会,也催生了不同类型的市场参与者。
训练平台的核心逻辑,是让机器人效仿人类的学习方式。人类依靠观察、模仿、实践掌握技能,机器人亦是如此。一个完整的训练流程通常分为三个阶段:第一阶段是数据采集,通过各类方式获取人类动作与场景交互的原始数据;第二阶段是仿真训练,在虚拟环境中让机器人反复练习相关动作,快速积累经验;第三阶段是真机验证,将训练完成的模型部署到实体机器人上,在真实场景中测试并收集反馈数据,用于模型的进一步优化。这套闭环循环往复,机器人的能力也会持续提升。
全球主流的数据采集方式分为多种,形成了清晰的金字塔结构。塔尖为真人遥操作数据,这类数据质量最高,但成本也最为昂贵。
例如,操作员佩戴VR设备和动作捕捉手套,远程操控机器人完成各类任务。机器人运行过程中产生的关节角度、力觉、视觉等多模态数据会被完整记录。
![]()
采集过程会留存完整的物理交互信息,训练效果最佳,但成本高昂,一小时有效数据的采集成本可达数百元。上海智元机器人的数据工厂配备200台机器人,每台设备前都配有操作人员,如同操控游戏一般指挥机器人作业。即便是熟练的数据采集人员,工作8小时也仅能产出2至3小时的有效数据。
第二层是仿真合成数据。在虚拟环境中批量生成海量训练数据,效率高、成本低,能让机器人在短时间内于数百万个不同场景中重复练习同一动作。
第三层为动作捕捉数据。这类方式依靠传感器记录人体动作,单人每小时可生成数十万帧运动数据。但由于人体与机器人骨骼结构存在差异,动作匹配度偏低,需投入大量人力做后期处理。最底层是互联网视频数据,这类数据体量庞大,但无效信息较多,可直接用于机器人训练的有效内容十分有限。
![]()
相较而言,中国在大规模数据采集领域形成了独有的发展优势。不同于欧美国家采用小团队精细化采集的模式,中国正在探索“大数采”的工业化路径。全国各地纷纷兴建大型机器人训练基地,采用标准化、流水线式的数据采集模式,打造出“大规模、大场地、大平台、多场景训练”的特色模式。
例如,国家地方共建人形机器人创新中心依托国地中心具身智能训练场,搭建实体场景开展真机数据采集。该中心打造了面积超5000平方米的人形机器人训练场,搭建工业制造、民生服务、特种作业等数十个真实应用场景;同时投入100台以上、多种构型的机器人,在真实场景中完成各类任务与技能的数据采集。
![]()
其采集的数据包含机器人本体关节位姿、图像、文本等多模态数据,目前已累计形成超100万条、2.5PB的高质量真机数据。
再以北京石景山训练场为例,场地面积超万平方米,按照1:1比例还原工业制造、智慧家庭、康养服务等16个真实场景。上百台机器人同步开展数据采集工作,年产出高质量数据超600万条。
![]()
这些训练平台正在深刻改变机器人产品的研发与定义模式。过去,机器人的功能在设计阶段就已确定,工程师编写固定程序后,机器人只能执行预设动作。如今,产品定义的主导权正从工程师转向数据与用户。机器人不再是出厂即定型的设备,而是能够持续学习、不断迭代进化的智能体。
宇树科技的UniStore应用商店就是典型案例。2026年5月该平台正式全面开放,用户可以像给手机安装App一样,为机器人部署全新技能。开发者能够上传自主训练的动作模型,用户下载后,机器人便可立即掌握新能力。这种模式彻底打破了传统机器人功能固化的局限,大幅延长了产品的生命周期。
NVIDIA的Isaac GR00T平台则代表了另一种发展方向。它搭建起完整的全栈开发环境,集成仿真、训练、评估和部署等各类工具。机器人厂商可直接依托该平台研发自有模型,无需从零搭建基础设施。宇树科技最新发布的H2 Plus人形机器人,便是基于NVIDIA Isaac GR00T平台打造的标杆产品。这种平台化开发模式,大幅降低了机器人行业的研发门槛,让更多中小企业得以入局。
以上种种现象都表明,数据已然成为机器人产业最宝贵的资产。一旦数据能够像商品一样完成生产、交易与变现,整个行业的价值分配体系也将迎来根本性变革。
03.
每个玩家都需要新的训练平台
过去几年,人形机器人行业的竞争焦点集中在硬件技术层面。各大企业接连发布新款机型,比拼设备自由度、行走速度、负载能力等硬件参数。
但随着产品逐步迈入量产阶段,行业竞争重心正在快速转移。未来,未能搭建专属训练体系的企业,将难以在行业内立足。
此前行业内的主流工作是攻坚技术、推出新品。2023年到2025年,是人形机器人硬件技术集中爆发的三年。特斯拉Optimus、波士顿动力Atlas、小米CyberOne、宇树H1等多款机型相继亮相,硬件性能纪录被不断刷新。
可当硬件技术逐步走向成熟,行业也暴露出一个现实问题:机器人能够正常行走运转,却难以落地实际工作。它们可以在实验室里完成各类演示动作,但投入真实复杂场景后便故障频发,核心原因就是数据训练不足,模型泛化能力较弱。
想要在行业中脱颖而出,企业就必须搭建专属的训练体系。
硬件可外购、算法可开源,唯独核心数据只能依靠企业自主积累。不同应用场景、不同构型的机器人,所适配的训练数据也各不相同。通用大模型可解决基础认知问题,若想让机器人在特定场景中高效作业,还需开展针对性微调训练。
这就要求每家企业都必须建立专属的数据采集与训练能力。就像如今各大车企都配有独立的智能驾驶数据中心一样,未来的机器人厂商,也势必需要打造自有训练平台。
搭建训练体系的方式十分多元,企业不必完全从零开始自建平台。第一种方式,是以宇树科技为代表,依托开发者生态实现数据与技能众包。UniStore平台面向全球开发者开放上传通道,任何人都可以上传自主训练的动作模型和数据集。
平台通过收益分成机制激励开发者贡献内容,形成“数据—模型—能力—再数据”的正向循环。这种模式不仅缓解了数据短缺的难题,更构建起坚固的生态壁垒。生态一旦成型,用户与开发者会形成黏性,后来者很难实现追赶。
第二种方式,是依托国家级公共训练平台发展。
国内正加速布局国家级机器人训练基础设施。2026年5月16日,国家人工智能应用中试基地(具身智能)在杭州正式挂牌启用。这座国家级训练场设有30多个职业技能训练场景,上百台机器人同步开展作业。例如,浙江灵巧智能科技有限公司的技术人员,就在该基地开展灵巧手相关中试工作。
![]()
广大中小企业可借助这类公共平台完成数据采集与模型训练,有效降低研发成本。
企业层面,智元机器人于去年推出全球首个零代码、零门槛的机器人内容创作平台——“灵创”平台。平台秉持“让创作更简单,让表达更灵动”的核心理念,深度融合AI动作捕捉、云端模仿学习与多模态编排能力,面向普通用户开放人形机器人内容创作功能。
使用者无需掌握编程知识,也无需配备专业设备,仅需上传一段人类动作视频,就能借助“灵创”平台,实现从真人动作展示到机器人精准复刻的全流程转化。
无论选择何种发展路径,训练平台都将成为未来机器人企业的核心竞争力。