当前位置: 首页 > news >正文

具身智能数据采集成“铲子生意”:新创公司与大厂纷纷入局,2026年或迎规模化元年

1. 具身智能数据采集火热,新创公司融资订单双丰收

2023年开始火热的“百模大战”,让算力硬件商赚得盆满钵满。如今,类似的情况正在具身智能产业“情景再现”,数据采集从业者正在密集融资且收获大量订单。3月,光轮智能完成10亿元融资,成为全球第一个具身数据独角兽,并透露今年第一季度拿下5.5亿元订单;4月,无问智科完成超亿元融资,并透露今年第一季度签下的订单金额达到数亿元量级;4月,弈人科技‌完成Pre - A+轮及Pre - A++轮连续两轮亿元级融资,同时宣布2025年收入破亿并盈利,2026年Q1具身订单超去年全年营收;智元也已分拆成立觅蜂科技。

2. 互联网大厂盯上具身智能数据采集“肥肉”

不只是新创公司,互联网大厂也盯上了这块肥肉。京东‌发布具身智能数据全链路基础设施,计划发动60万人众包采集(如快递员、骑手佩戴设备),目标两年内积累1000万小时人类真实场景视频数据;百度选择了“数据超市”的模式。

3. 具身智能数据来源与采集赛道流派

具身智能的数据来源主要包含四类:位于金字塔顶层的是遥控真机(即遥操作)获得“真机数据”,数据质量最精准成本也最贵,但却是人形机器人落地的关键;仿真数据/合成数据处于中层,成本低、可规模化,能够弥补当前真机数据的不足;人类视频包含互联网视频、人类行为数据,处于金字塔底层,来源广泛、泛化性强;UMI(Universal Manipulation Interface,通用操作接口)协议,是具身智能领域的一种‌低成本、无本体‌的数据采集范式与技术标准。发展至今,数据采集赛道大致也可以分为四大流派:“真机数据”对应的如智元等头部机器人公司,“本体 + 数据”闭环运作,数据业务是内部能力的自然外溢;仿真数据/合成数据对应的则是定位为数据基础设施服务商的初创公司,比如光轮智能;跨界平台型巨头如京东、中国移动等,依靠产业场景等优势入局,采用混合采集模式;“UMI型公司”,如鹿明机器人、松灵机器人等,则专注于提供标准化、模块化的采集硬件。

4. 2026年:具身智能数据规模化元年

不难发现,2026年,已然成为“具身智能数据规模化元年”,‌各类厂商正依靠“数据服务商”的新定位,凭借刚性需求、高壁垒和可复制的商业模式,在具身智能产业攫取利益。具身智能大模型(VLA/世界模型)的训练需要海量、多模态、高保真的物理交互数据。然而,截至2026年初,全球高质量真实物理交互数据总量仅约50万小时,而行业共识认为训练通用具身模型至少需要千万小时级数据,‌缺口超过99%‌。这种供需失衡导致数据成为稀缺资源,买方处于“有多少买多少”的状态。于是数据采集,便成为了具身智能产业细分赛道的新型“铲子”‌,也再一次印证“数据先行、铲子先富”的逻辑。

5. 新创公司发展历程与成果

需要注意的是,光轮智能、无问智科、弈人科技‌等明星初创公司,并非全部诞生在具身智能产业发展期,更多则是成立于智能驾驶浪潮中,且多选择走“仿真数据/合成数据”路线,并逐步向“真机数据”扩展走上融合发展新道路。光轮智能成立于2023年1月,定位于合成数据公司,致力于为企业落地AI提供合成数据解决方案。2026年3月,该公司官宣完成10亿元A++及A+++轮融资,本轮融资完成后,该公司也成为了全球首个具身数据领域的独角兽企业;5月,光轮智能又获得由蚂蚁集团领投的新一轮融资,投后估值超过20亿美元,在短短两个月内实现估值翻倍。无问智科成立于2022年11月,2023年5月正式启动运营。在其官网介绍中,无问智科多次提及智能驾驶,主要是应用AI驱动的大模型仿真技术,为智能驾驶汽车上路保驾护航。2024年,具身智能产业热度持续攀升,明星独角兽中的智元、宇树科技均在这一年接连获得2轮投资。于是乘着具身智能热潮,无问智科在2024年8月官宣天使轮融资时,适时提到,“公司立足和深耕于智能驾驶/自动驾驶赛道,将逐渐拓展到机器人及具身智能赛道”。2026年4月,无问智科官宣超亿元新融资时,公司定位已更新为“物理AI数据基座企业”。据介绍,基于全国首个虚实融合闭环的长三角(德清)具身智能数据采集训练场,无问智科日产数据上千小时,形成万级规模化合成数据与千万次仿真验证能力。长期合作客户包括星动纪元、它石智航、灵心巧手、零次方等头部企业,2026年Q1更与字节跳动、无界动力、章鱼动力等签署订单,目前在手订单数亿元,本年度营收将突破超亿元。光轮智能则已经将人类数据与仿真打造成一套闭环的基础设施,并且人类数据交付量全球第一。它的人类视频数据产品,覆盖2.5万 + 环境节点、10万 + 任务种类,累计交付超150万小时高质量人类数据。2025年,该公司全年营收实现10倍增长;4月份官宣公司2026年Q1单季预计收入超过25年全年总和,5月份官宣2026年Q1新增5.5亿元订单。弈人科技成立于2013年3月,利用自动驾驶积累的车辆感知网络,适时转型采集具身智能数据,于2025年实现AI数据业务收入过亿元,在国内率先完成AI数据正向盈利。同时,公司在具身智能领域已落地多场景应用,并斩获头部客户订单,仅2026年一季度就获得了具身智能数据新增订单超亿元。宇树科技成立于2016年,招股书显示,2022年,该公司用时6年实现约1.23亿元营业收入,但2024年方才“扭亏为盈”实现约9547.47万元净利润。作为对比,光轮智能、无问智科等新创公司,成立仅3年,便在2026年实现过亿营收,已然成为“卖数据的先赚钱”的例证之一。

6. 智元及大厂在具身智能数据领域的布局

随着硬件本体的逐步成熟,高质量数据已被产业界和学术界公认为跨越通用精细操作鸿沟的核心要素。如何低成本、规模化地获取具备物理真实性的多模态数据,成为了未来五年决定具身智能商业化落地的胜负手。智元合伙人、高级副总裁、具身业务部总裁姚卯青,早在2004年5月就牵头建成行业规模最大(4000平米)、场景最丰富的数采超级工厂——部署近百台远征A2 - D专机,实现单机单日千条数据的极速采集,也是当前“真机数据”的代表性玩家。仅仅半年后,智元就联合上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思共同开源了全球首个基于全域真实场景的百万真机数据集AgiBot World。凭借于此,选择“本体 - 数据 - 模型 - 场景”重度耦合战略闭环的智元,作为整机厂商代表,在2026年4月的评选中,与独立数据提供商——光轮智能、国家级公共平台——国家地方共建人形机器人创新中心,成为国内具身智能数据赛道的Top 3。姚卯青不止一次地强调:当前机器人行业的瓶颈不是算力而是数据,“高质量的真机数据是实现智能涌现的关键前提”。他还指出,当前行业中存在大量仿真模拟数据,但仿真模拟数据无法替代真实物理交互中产生的细粒度感知信息。智元的策略是“以真机数据为主,仿真模拟为辅”,只有真实场景中采集的数据,才能真正驱动机器人智能的质变。公司内部也有一个清晰的量化目标:两年内积累千万小时级别的真实场景数据。2026年2月,姚卯青推动智元业务拆分出觅蜂科技,并出任董事长兼CEO。该公司聚焦具身智能数据基础设施赛道,‌深度应用并推广UMI技术(但并非单一的“UMI型公司”)‌,打造独立开放的一站式物理AI数据服务平台。成立仅10天,觅蜂科技就完成了数亿元种子轮与天使轮‌融资‌。据澎湃科技消息,具身智能数据当前总体定价区间在200 - 500元/小时。其中,机器人在现实场景中实际操作采集的真机数据,因最适合训练落地模型,需求最旺盛,价格也最贵,当前国内市场价格在500 - 1000元/小时。另据姚卯青透露,随着产能逐步稳定,不依赖特定机器人本体的无本体数据价格最终会收敛到真机数据的二分之一到三分之一左右。比如真机数据如果卖到每小时1000元,无本体数据未来可能稳定在300 - 400元。数据稀缺、价格处于“高点”,于是在具身智能玩家之外,嗅觉灵敏的互联网大厂、工业巨头步调一致地快速行为,今年以来接连下场,盯上数据采集“这块肥肉”,强势跻身具身智能产业链。其中,互联网大厂如百度,走上了“数据超市”模式。4月10日,百度智能云联合零次方、灵生、傅利叶、纬钛科技、拓元智慧、枢途科技、松应科技等多家具身智能企业,推出“具身智能数据超市(Beta版)”,首创层级化、可扩展的数据标签体系,加速具身智能规模化落地。值得一提的是,尽管以“UMI协议”数据为主,鹿明机器人同样选择了“数据超市”这一模式,该公司于2026年3月推出了行业首个“FastUMI Pro数据超市”。以京东为例,今年3月16日,其宣布建设一个具身智能数据采集中心,计划覆盖物流仓储、工业制造、健康医疗、家庭服务、城市运维五大核心场景,记录视觉、触觉、空间轨迹等多维度数据。将发动包括内部超10万员工及外部最多50万人员在内的数十万人参与采集,计划于一年内积累500万小时人类真实场景视频数据,两年内总时长突破1000万小时,并同步采集100万小时机器人本体数据。据悉,京东具身智能数据采集中心,主要采用‌基于可穿戴设备的人类第一视角(Egocentric)真实场景数据采集‌方式,并辅以‌真机遥操作‌采集,属于‌无本体数据(No - Body Data)‌与‌多模态真实交互数据‌相结合的混合采集模式。中国移动同样如此,5月8日,其宣布围绕家庭生活场景推出1200平米的“灵犀数霄”具身智能训练场,核心是一套覆盖数据采集、数据合成、数据处理、数据应用全链路的数据闭环,是融合了‌真机遥操作‌与‌无本体轻量化采集‌的混合数据采集体系,并辅以仿真合成数据。不难发现,在具身智能产业链上,数据采集这个“铲子生意”已经成为具身智能数据从“分散采集”走向“平台化供给”。它不再是某家机器人公司的附属业务,而是正在独立跑出一套商业逻辑,成为被资本市场单独定价、被产业巨头系统性押注的重要赛道。需要提醒读者关注具身智能数据的信任问题,在数据采集和使用过程中,确保数据的真实性和可靠性至关重要。

http://www.rkmt.cn/news/1536555.html

相关文章:

  • 2026济南黄金回收实测:六家机构PK,添价收全程透明领先 - 薛定谔的梨花猫
  • 选非标自动化设备的三大认知误区:为什么便宜反而更贵?
  • 如何5分钟完成VRChat模型优化:Blender插件的完整指南
  • 2026年宁波二手设备回收排行榜TOP5,推荐这5家靠谱电话 - 资讯纵览
  • MAA明日方舟自动化助手:全日常一键完成的终极解决方案
  • 2026年山东超高分子量聚乙烯板材源头厂家选型指南 - 优质企业观察收录
  • 珠三角跨境电商合规服务实测:企智慧财税体验全记录 - 奔跑123
  • 2026年河北政府采购全流程投标服务机构值得关注名单 - 资讯报道
  • 手把手教你安装Dism++系统优化工具 Dism++下载安装及空间回收使用教程
  • 2026雅思哥课程怎么选?一份帮你精准避坑、高效提分的完整指南 - 品牌2026
  • 免检木箱源头厂家:破除跨境物流合规难题的专业方案 - 资讯焦点
  • macOS组件直连下载解决方案:跨平台获取官方系统文件实践指南
  • 2026海南企业专利申请攻略,39天快速授权通道+费用补贴全解析,附专业代办推荐 - GrowthUME
  • 高位行情下昆明卖金攻略,不同渠道变现差异解析 - 奢侈品回收测评
  • Python模板匹配识别计算题验证码:固定场景下的轻量OCR识别方案
  • 2026珠海装修公司调研:报价透明度与增项管控五大品牌实测 - 品牌评测研究中心
  • 高中毕业证的公证费用解析?高中毕业证的公证费用有哪些? - 指上通
  • 2026 年江津区防水补漏、屋顶、卫生间免砸砖、外墙、暗管检测专用公司推荐(2026年6月江津区最新调研方案) - 资讯纵览
  • 5分钟掌握Forza Mods AIO:免费解锁地平线4/5的终极游戏体验
  • 一杯好茶的是如何来到您身边的 - 速递信息
  • 2026年起名大师排行:正统古法服务实力盘点 - 真知灼见33
  • 华为 FreeClip 2版本升级丨Mac用户狂喜!
  • 智算赋能 数实融合:海康存储荣获2026高工AI智算产业峰会“AIDC存储方案标杆供应商奖”
  • 厦门闲置翡翠回收深度横评|岛内岛外6家直营门店全覆盖,闽南专业鉴玉变现首选 - 薛定谔的梨花猫
  • 装修接单平台哪个口碑最好?2026年深度对比:别再问“哪个最好”,先问“哪个最适合你” - 资讯报道
  • Windows和Office激活终极方案:KMS智能脚本5分钟搞定
  • 生物医药厂房管道安装工程服务商推荐:聚焦宏创巨建设等专业企业 - 品牌2026
  • Xournal++:免费开源的跨平台手写笔记软件,让数字笔记体验超越纸质
  • FLOOR函数原理与实战:向下取整的业务安全逻辑
  • 揭阳2026年5月亲测:靠谱车膜品牌店首推揭阳市榕城区东升志明汽车用品经营部 - 资讯纵览