快讯蜂巢
快讯蜂巢

60 万人 1000 万小时!京东超级数据工厂如何破解具身智能数据困局?揭秘硬核突围

快讯蜂巢 0

当下,具身智能这股风潮正猛,迅速吹进了工业制造、物流仓储、家庭服务乃至医疗康复这些核心领域。但咱们得看清一个现实,行业里普遍卡在一个核心瓶颈上——高质量、真实交互数据的严重不足。硬件标准五花八门,数据采集流程分散,标注和训练环节又是割裂的,这就导致了严重的“数据孤岛”现象。采集到的数据杂乱、非标,别说直接用于模型训练了,就连合规流通交易都成问题。业内现在有个共识很清晰:具身智能硬件不够强,根本原因是真实数据不够多、不够好

行业痛点:数据孤岛与质量难题

在这种背景下,京东在 4 月 16 日的具身智能生态发布会上搞了个大动作。他们宣布推出全球首个覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,同时还得同步发布自研超高清采集终端 JoyEgoCam、具身大模型 JoyAI-RA 以及具身智能数据交易平台等一系列产品。这一步棋,标志着京东正依托自身在零售、物流、工业、健康等领域的丰富场景优势,全力推动具身智能从实验室研发迈向规模化商业落地,打造所谓的“具身智能超级供应链”

京东方案:全链路基础设施与超级供应链

这场被业界称为“规模最大的数据采集行动”,计划发动最多 60 万人参与,目标是在两年内积累 1000 万小时人类真实场景视频数据。这些数据可不是普通的视频,它们将成为驱动具身模型进化的高价值“燃料”,能加速真实场景下的模型迭代优化。无论是机器人企业、具身模型研发机构,还是汽车厂商、医疗机构,各行业客户都能从中获得全流程的数据服务。这不仅仅是数量的积累,更是质量的飞跃。

硬件利器:JoyEgoCam 如何重塑采集标准

具身数据链路的第一步是数据采集,本次发布会的一大亮点,就是京东云自研的可穿戴式超高清采集终端 JoyEgoCam。它从清晰度、精准度、便携性、稳定性四个维度保障了源头数据质量,让真实场景数据能够“即戴即采”

• 在清晰度方面,JoyEgoCam 配备4K 高清摄像头,支持 60 帧帧率与 130 度超广角拍摄,可实现毫秒级动作细节捕捉,精准记录各类场景下的细微操作。

• 在精准度方面,重投影误差小于 0.2 像素,搭配京东云自研立体校正技术,能够真实还原操作现场的空间立体感

• 在便携性方面,整机仅重 220 克,轻于普通智能手机,佩戴舒适,确保长时间采集不会影响人员操作。

• 在稳定性方面,内置车规级 6 轴 IMU 与多传感器融合单元,即使在极端抖动场景下也能稳定追踪拍摄

JoyEgoCam 可在物流、零售、医疗、家庭等多种场景下“即戴即采”,让普通人也能完成专业级数据采集,从源头破解数据“不真、不准”的痛点。这不仅解决了数据采集的难题,更为具身智能的规模化落地打下了坚实的基础。

依托这一系列举措,京东正试图构建一个闭环的生态系统,让数据在其中高效流动并产生价值。对于整个具身智能行业而言,这或许意味着一个新时代的开启,从实验室走向真实世界的关键一步,正在由这些底层基础设施的完善而逐步变为现实。

60万人、1000万小时:京东如何用“超级数据工厂”破解具身智能的真实数据困局

京东具身智能全链路解析:效率提升 3.5 倍背后的数据飞轮

咱们今天来聊聊京东在具身智能领域搞的大动作。简单来说,京东搭建了一套全链路处理平台,直接把模型训练效率提升了3.5 倍。这可不是小数目,背后是一套从数据采集到模型落地,再到生态共建的完整打法。

数据怎么处理?全链路可视化管理是关键

数据拿进来之后,怎么走?这是个大问题。京东云的做法是通過任务、人员、设备的全流程可视化管理,加上 SaaS 化部署,实现了视频一键上云。这样做的好处很明显,采集效率上去了,成本却下来了。

数据汇入 AI 数据湖平台后,事情就变得更自动化了。凭借PB 级吞吐能力,系统能自动完成清洗、对齐、转换与预标注,直接变成标准训练集。更有意思的是 JoyBuilder 仿真平台,它能批量生成高逼真仿真数据,一站式实现从人类操作到仿真操作,再到真机操作的数据增值转换。

这一步最关键的价值在于:弥补长尾场景,评测效率提升一倍。治理好的数据汇聚到 JoyBuilder 模型开发平台,实现了数据“开箱即训”、模型“一键部署”。目前,京东日处理数据量已达数十万条,数据有效率高达95%,整体处理成本降低60%

模型怎么强?数据与模型的双向赋能

有了好数据,模型自然要强。依托这套全链路基础设施,京东构建起了“数据采集 - 模型训练 - 数据优化”的生态闭环。以自采数据为核心训练的京东具身大模型 JoyAI-RA,在真机实验上成功率达到73.5%,这个成绩已经超过了 pi0.5 等 SOTA 模型。

这里有个核心逻辑叫“飞轮效应”:

• 模型反哺数据标注与采集,形成“越用越强、成本越优”的正向循环。

• 数据质量越高,模型迭代效率与精度越高。

• 模型越成熟,数据采集、标注的成本越低、质量越高。

这种数据与模型的双向赋能、协同进化,进一步夯实了京东在具身智能领域的技术沉淀与产业洞察力。

生态怎么建?让数据“流得动、用得好”

独乐乐不如众乐乐。此次同步上线的京东具身智能数据交易平台,汇聚了京东丰富业务场景下的多模态数据资源。平台支持数据方、开发者、应用方多方协同,并以全链路安全审计保障合规流通。

首批定向开放2000 小时高精标注数据集,算是打通了具身智能数据合规交易的通道。京东也在呼吁更多产业伙伴加入,共建具身智能数据“朋友圈”。此外,即将上线的技术社区也将汇聚行业优质资源,推动交流创新与产业协同。

商业怎么落?四大板块齐发力

京东集中发布这些产品与基础设施,不仅填补了行业在数据采集、处理、流通环节的空白,更构建起“硬件采集 - 数据处理 - 模型训练 - 仿真测试 - 合规交易 - 生态共建”的完整产业链条。依托数据与模型底座,京东在具身智能领域的布局正迅速展开:

京东 JoyInside 具身智能:已与近 200 个家电家居、机器人、玩具等品牌深度合作,为智能终端注入“智慧和灵魂”。

京东零售:2026 年将助推机器人品牌伙伴累计销售破100 亿

京东物流:持续构建机器人售后维修服务生态,机器人救护车将服务中国及海外市场,专业工程师规模将拓展至超万人

京东工业:打造一站式工业供应链技术与服务,将实现机器人制造物料100% 覆盖

总的来看,京东这套打法不仅仅是技术上的突破,更是产业生态的重构。通过降低研发门槛、提升数据价值、打通交易流通,京东正在让具身智能真正落地生根。