时薪1美元,印度头戴式数据采集模式火热

Jack2026-06-051368机器人技术及应用



 

“1美元/时的数据采集你会做吗?

大约一个月前,一段视频在全球疯传,视频中大量服装工人在“肯印度(Ken India)”公司位于马哈拉施特拉邦的纺织制造厂工作时,头上戴着Egolab AI的微型摄像头设备。人们普遍猜测,这是一种所谓的“以自我为中心的数据采集”系统,主要负责收集人们工作时的第一视角影像,用于训练具身智能模型。

Egolab AI于2026年1月由印度两名青少年创立,自称为“印度最大的第一人称视角(POV)数据聚合商”。但该公司创立仅两个月,就被美国一家公司收购,据称交易金额达到七位数。

不久前,一家名为Human Archive的初创公司再次在科技圈引发轰动。这家由四位20岁斯坦福和伯克利辍学生创办的公司,拿到了820万美元的种子轮融资。领投方是Wing Venture Capital和NVP Capital,跟投名单里挤满了来自OpenAI、英伟达、谷歌、Meta、DoorDash AI Research的天使投资人。



 

他们所做的事情,同样就是把视频这套模式变成了现实,在印度班加罗尔和旧金山之间架起了一条新的数据管道。商业模式也很简单,就是把印度工人采集的数据,以高价卖给了美国具身智能企业。

这套影子数据采集通道背后,一端是家政工人的头戴式摄像头,另一端连着具身智能实验室的训练队列。

01.

他们赌的是什么?

为什么具身智能需要“看人干活”?你可能已经听说过,大语言模型是靠从互联网上抓取数万亿个词条训练出来的。视觉模型是靠从数十亿张公开图片中学习成长起来的。但机器人没法从网上“下载”怎么拧螺丝、怎么叠被子、怎么把一杯水稳稳端到老人面前。这些操作数据,无法通过爬虫获取,仿真数据还不太靠谱,最快的还是只能在真实世界中采集。

过去,机器人实验室的做法是,让研究人员在实验室或者数采工厂里,一遍又一遍地做同一个动作,用昂贵的动捕设备记录下来。问题是,实验室和数采工厂太干净了。真实的家庭、餐馆、建筑工地,充满了杂乱、意外和不确定性。一张歪了的椅子、一个反光的桌面、一只突然跳出来的猫,都可能让机器人“死机”。

Human Archive的创始人们发现了一个更聪明、也更冷酷的解决方案,那就是直接去正在干活的人头上装摄像头。



 

一句话:让印度零工工人的双手,成为训练下一代具身智能和物理AI的“石油”。

而这些“人”,在印度有数百万。他们是每天穿梭在德里、班加罗尔、孟买的家政工、外卖员、餐厅服务员、工厂装配工,但他们又可以很快、很大规模采集到第一人称视角数据。

02.

1美元的时薪换来什么?

Human Archive的模式并不复杂,甚至可以说非常直接。

他们通过与工厂、家政服务、酒店、餐饮、建筑等行业的公司合作,给工人配备头戴式设备,上面有一个向下拍摄的4K摄像头(30帧/秒),外加深度感知摄像头、广角镜头、触觉手套、腕部摄像头、惯性测量单元。

工人只需要正常干活,分拣物品、擦桌子、拖地、叠衣服、端盘子、切菜,所有动作被头顶的相机录下来,经过匿名化、标注、处理,打包卖给机器人公司和AI实验室

工人可以每小时获得1美元的基本工资。目前,印度蓝领工人的平均月薪在15000到35000卢比之间(约180-420美元)。1美元时薪听起来不高,但对许多工人来说,这是“额外收入”。

目前,Human Archive已经在印度部署了超过1000套活跃设备,收集了数万小时的数据。他们的目标是每天稳定采集数百万小时可用数据



 

这类模式在全球并不算稀奇,今年3月,美国外卖巨头DoorDash推出一款名为Tasks(任务)的独立应用。根据该公司公告,Tasks允许其美国800万名零工从业者通过记录自己执行各种任务的视频来赚钱。这些数据随后将被应用于训练AI和机器人。
 

其他机器人开发商也开发了类似的数据收集策略。总部位于美国加州的机器人公司Sunday Robotics向全国各地邮寄一种“技能捕捉手套”,人们通过戴着这种机械手套做家务来收集运动数据,数据随后会被用来训练该公司正在研发的AI驱动家用机器人。

在中国,鹿明机器人也采取了一种背包版UMI数采设备,并同步启动真实场景数据采集计划。2026年,鹿明机器人计划在多个城市投放1万台背包版FastUMI Pro,目标为百万小时级数据产能。

03.

为什么是印度?

你可能会问:为什么选择在印度,而不去美国做这件事?硅谷不是离客户更近吗?Human Archive的联合创始人Rushil Agarwal给出了三个非常“硬核”的理由。

第一,印度拥有极其丰富的产业类型。从珠宝、纺织、煤炭、钢铁到其他所有行业都有,这句话不是随便说的。机器人最终要进入的不是单一场景,而是成千上万种不同的中低端工作环境。印度几乎什么都有。

第二,印度拥有美国所不具备的劳动力经济。翻译一下就是更便宜,且数量大。1美元时薪在加州连一杯咖啡都买不到,但在印度,这个价格仍然有大量工人愿意参与。

第三,印度工人每天做的事,恰好就是机器人最想学的事。清洁、整理、搬运、装配、服务,这些是具身智能最核心的应用场景,也是印度零工经济每天在重复的动作。

目前,全球前沿的具身智能公司例如Figure AI、Covariant、Tesla、Google DeepMind都在争分夺秒地开发能够执行真实任务的具身智能系统。它们共同的瓶颈不是算法,不是算力,而是高质量的真实世界操作数据



 

根据MarketsandMarkets的报告,2026年到2032年间,物理人工智能市场的复合年增长率将超过47%,达到152.4亿美元。因此Human Archive赌的是谁掌握了最大、最多样化、最干净的人类操作数据集,谁就能在这场竞赛中占据上游。

因为他们甚至不只是在卖数据。他们还在训练自己的模型,用这些数据微调AI系统,并在真实机器人上测试。这让他们能够向客户证明:我们的数据,真的能让机器人学得更快。

04.

争议、拒绝与一场不可避免的摩擦

当然,这条路并不平坦。Human Archive接触过印度多家主流家政服务平台,包括Urban Company和Pronto。结果几乎全部被拒

Urban Company的CEO公开表示:不会参与这种数据收集。Human Archive的联合创始人Raj Patel立刻回怼:“他们最终会重新考虑,否则将面临失去市场地位的风险。”

Pronto则承认确实聊过,但最后选择不继续。那Human Archive怎么办?他们换了个打法。他们与一些规模较小的初创公司合作,并且给终端消费者提供两个选项:

 

  • 折扣价:同意工作人员在服务过程中进行数据采集。
  • 全价:不录像,正常服务。

 

Patel说,很多客户选择了折扣价。原因有点意外:因为录像可以用来解决服务质量纠纷,比如你说保洁没擦桌子,录像一看,确实擦了。

有趣的是,这个“副作用”在印度反而成了一种卖点。



 

但争议不仅来自商业、同行,也来自监管机构。Human Archive的核心商业模式,建立在“在别人家中录像”的基础上。

虽然公司表示:

 

  • 摄像头角度朝下,很少拍到人脸。
  • 任何意外拍到的面部信息,会在后期处理中模糊掉。
  • 合同符合印度《数字个人数据保护法》。

 

但上周,印度电子和信息技术部已经开始调查一些初创公司通过家政服务人员收集数据的同意机制和做法。这件事的最终走向,将直接影响Human Archive能否继续规模化扩张。

然而,很多人忽略了一点,那就是除了扩大规模搞数据采集,Human Archive正在开发自己的硬件。

从早期的iPhone+现成设备,到现在拥有50多种定制硬件,包括触觉手套、全身动捕服、腕部摄像头、胸部IMU。

为什么自己做硬件?联合创始人Rahil Agarwal解释得很清楚,因为只靠视频,价值有限。但如果你能把视频、触觉力反馈、全身动捕数据同步采集下来,这套数据集的价值就会指数级上升。



 

换句话说,他们不是在卖“人类数据录像”,而是在卖解决方案。

因为单纯数据采集的赛道太过于拥挤,以及低门槛。例如印度公司阿维格(Awign)企业有限公司也在收集类似数据,用于实现切黄瓜或整理玩具等家务活的自动化。另一家总部位于旧金山的初创公司Humyn AI也正试图建立类似的业务。

05.

结语与未来

Human Archive的故事,让人既兴奋又不安。
 

兴奋的是,它展示了一种极具想象力、甚至可以说“天才”的商业模式:利用现存的、规模庞大的零工经济,为具身智能提供最稀缺的训练燃料。因为科技公司的具身智能目前算下来,大概至少需要来自多个地区的数十亿小时的高质量数据。

不安的是,它触碰了太多敏感的边界:劳动者的报酬是否合理?他们是否真正理解自己交出了什么?客户的隐私如何保障?当一家公司掌握了数百万小时的家庭内部录像,权力边界在哪里?

创始人今年20岁。他们可能是下一代科技巨头的缔造者,也可能成为一个关于“数据殖民”的警示案例。

但无论如何,有一件事是确定的,在硅谷的机器人学会擦桌子之前,印度的家政工人已经用手上的动作,写下了第一行代码。

而这行代码的代价,是时薪1美元。