机器人“数据饥渴”怎么解?江苏工业具身智能数据集联合体正式启动

2026-06-171000具身智能

具身智能大讲堂获悉,近日江苏工业具身高质量数据集联合体在苏州正式启动。该联合体由苏州核数聚信息科技有限公司牵头,联合苏州职业技术大学、东南大学、赛迪工业和信息化研究院,以及苏州汇川技术、乐聚智能、苏州智能机器人科技发展等企业共同组建。这是江苏省工信厅“工业数据筑基行动”的重要落地项目,核数聚牵头的具身智能机器人行业工业调试与检测场景高质量数据集建设项目入选全省先行先试项目并位列首位。

Image
 
图片
 

会上同步启动人工智能数据工厂,数据智能产业学院、OPC培育基地、校外实习基地、行业数据技术库等配套平台揭牌。苏州职业技术大学与核数聚联合发布“具身智能人才培养”订单班项目,首批46名学员已进驻企业实习。

 

PART 01

为什么机器人“看得见”却“做不好”?

 

具身智能指能够感知环境、自主决策并执行物理操作的智能系统,包括人形机器人和工业机器人等。与处理文本数据的大语言模型不同,具身智能需要处理视觉、触觉、力反馈等多模态数据,并在真实物理世界中完成精细操作。

Image
 

当前行业面临的核心矛盾是:算法模型能力提升了,但训练所需的高质量数据严重不足。工业场景下的数据采集面临多重挑战,真实产线环境复杂,采集设备成本较高,数据标注标准不统一,涉及力控、视觉、运动轨迹等多模态信息融合。相比互联网文本数据,具身智能所需的真实物理交互数据获取难度更大。

江苏此次启动的联合体,针对数据存量不足、多模态标注标准不统一、场景数据采集难度大等问题展开攻关。项目聚焦工业调试与检测两大场景,计划建设大规模、多模态、标准化的专用数据集,服务于机器人灵巧操作、精密检测等AI模型训练。

联合体依托核数聚的“采-标-训”一体化平台,整合真机数据采集、多模态标注、力控视觉融合、工业仿真场景等技术能力。这套平台兼容遥操作、UMI、Ego、仿真合成等多种数据采集方式,构建了“真实场景采集+仿真场景生成”的双路径数据体系,打通从数据采集、标注处理、模型训练到效果评估的全流程。

 

PART 02

产学研怎样才能不“各干各的”?

 

联合体的组织架构体现了明确的分工协作。核数聚作为AI数据服务企业负责平台搭建和项目统筹,苏州职业技术大学、东南大学提供人才培养和科研支撑,赛迪研究院参与标准制定,汇川技术、乐聚智能等企业提供真实应用场景。这种组合覆盖了数据研发、硬件制造、场景应用、学术研究、行业标准制定等全环节。

Image
 

依托苏州职业技术大学全国首批具身智能机器人产教融合基地平台,联合体将企业真实产线转化为实训课堂,推进技术攻关、标准研制与人才培养同步进行。赛迪研究院的参与为数据标准制定提供了智库支撑,有助于推动行业标准的统一。

人工智能数据工厂的启动与联合体形成“数据研发+产业应用”联动格局。数据智能产业学院、OPC培育基地、校外实习基地、行业数据技术库等配套平台同步启用,形成“数据建设—技术研发—人才培养—产业落地”的完整闭环。

Image
 

分工协作的关键在于将各方优势转化为实际产出。核数聚在全国多地布局的具身智能训练场,为数据采集提供了基础设施保障;高校提供的不仅是理论支撑,更是将产业数据需求转化为科研课题与教学内容的能力;企业开放的真实产线场景,则保证了数据集的实用性和针对性。

 

PART 03

订单班能否真正培养出“即插即用”的人才?

 

苏州职业技术大学与核数聚联合推出的“具身智能人才培养”订单班,采用“理论+平台+项目实战”模式,推行双导师制教学,由校内专业教师与企业资深工程师共同开展教学、实训与职业指导。

首批46名学员已进驻企业,参与多模态数据采集、标注、大模型训练等工作。课程体系围绕多模态数据采集、智能数据标注、工业数据集治理、大模型辅助训练等企业核心业务打造,将企业真实项目、行业技术标准、工作流程融入日常教学。

项目设置了灵活的学分认定机制,学生实习满三个月且考核合格可直接置换校内课程学分,同时享受实习薪资与专项奖学金。表现优异的学员可优先录用,或推荐至联合体产业链内合作企业就业,打通“在校实训—企业实习—就业”的通道。

Image
 

核数聚向学校捐赠价值200万元的教科研仪器设备与专业软件,并设立10万元专项企业奖学金。这些设备将补充实践教学资源,让课堂教学与行业技术保持同步。

具身智能数据服务涉及多模态数据采集、力控视觉融合标注、AI模型训练辅助等专业技能,传统课程体系难以完全覆盖。订单班将产业岗位需求直接引入教学体系,学生在真实项目中掌握行业标准和工作流程。从培养模式看,这种“边学边做”的方式确实有助于缩短从学生到从业者的过渡期。

 

PART 04

统一标准能否让数据“互通互用”?

 

数据标准化是联合体建设的重要内容。不同机器人厂商使用不同的控制协议、传感器配置和数据格式,导致数据难以跨平台使用。联合体引入赛迪研究院参与标准制定,从源头推动数据采集规范、标注标准、质量评估体系的统一。

项目聚焦的工业调试与检测场景,是工业机器人应用的核心领域。工业调试涉及零部件装配、设备调试、生产线配置等操作,需要机器人具备精细操作能力;工业检测涉及视觉识别、缺陷判定、质量评估,需要多模态感知和决策能力。这两个场景的数据集建成后,将直接服务于汽车制造、电子装配、精密仪器等江苏优势产业。

联合体建设的数据集将应用于机器人灵巧操作、精密检测、自适应装配等AI模型训练,提升国产具身智能机器人在工业环境下的适应性、精准度与智能化水平。通过标准化建设,一家企业采集的数据可被多家下游企业使用,提升数据利用效率,降低行业整体成本。

Image
 

标准化的价值不仅在于降低重复建设成本,更在于建立统一的技术评价体系。当数据采集规范、标注标准统一后,不同企业的模型性能可以在同一基准上进行对比,这有助于行业技术水平的整体提升。

江苏此次启动的联合体和数据工厂,是在构建具身智能产业的数据基础设施。从项目启动到形成产业应用,还需要在数据采集规模、标准推广、人才培养实效、商业模式可持续性等方面持续推进。项目能否如期建成高质量数据集,标准能否在行业内获得认可,订单班能否持续输送合格人才,这些都需要时间检验。但从组织架构和资源投入来看,江苏在具身智能数据服务领域的布局具有一定前瞻性,为本地制造业智能化转型提供了数据支撑的可能路径。