想象一下,当你在家里打扫房间、整理衣物时,其实正在参与一场全球规模空前的 AI 训练。这听起来似乎离科幻电影很遥远,但如今,在江苏宿迁,这样“边做家务边采集数据”的场景,已经每天都在发生。
京东全国首个具身智能数据采集社区已在宿迁正式运行。 这一消息于 5 月 20 日公布,标志着京东在具身智能数据基础设施建设方面迈出了关键一步。这不仅是今年 3 月宣布建设全球最大具身数据采集中心后的延续,更让京东“两年内积累超 1000 万小时人类真实场景视频数据”的战略目标,变得更加触手可及。
这个社区是如何运作的?它打破了传统数据采集的枯燥模式。 社区位于宿迁市湖滨新区,由京东与宿迁市联手打造。今年 4 月试运行以来,社区居民反响热烈。参与其中的采集员,在经过专业技术人员培训后,无需额外花费时间,只需在日常家务劳动中,就能自然地完成数据采集任务。
具体来说,居民在进行以下活动时,数据就会被自动记录:
- 擦桌子:模拟清洁动作的轨迹与力度。
- 叠衣服:捕捉布料折叠的逻辑与手部交互。
- 整理收纳:记录物品归位的空间理解能力。
- 地面清洁:涵盖移动路径与不同材质的交互反馈。
这一切的背后,是京东自研的 JoyEgoCam 采集终端在起作用。 头戴式设备不仅能拍摄视频,更关键的是它能获取上肢轨迹、力度分布、人与家居环境的交互关系等核心参数。这些数据,是训练具身智能机器人理解物理世界、学会像人一样操作的“燃料”。
这一举措的深远意义在于,它让普通人的生活与前沿科技紧密连接。 具身智能的发展,长期受限于真实场景数据的匮乏。通过这种模式,京东不仅解决了数据获取的难题,更重要的是积累了高价值的“人类真实场景”数据。当每一个普通人的动作都能转化为算法的养分时,人工智能离真正走进千家万户,也就更近了一步。

宿迁湖滨社区的一幕,揭开了具身智能数据收集的新篇章。 在这里,居民们边做家务边采集数据,这种“润物细无声”的方式,正在悄然重塑人工智能的底层逻辑。京东推出的 JoyEgoCam 整机仅重 220 克,内置推理单元与车规级 IMU,能够在居家、户外、产线等各种环境下实现毫米级的精准采集。最重要的是,这种数据采集工作不仅不干扰正常生活,反而能为家庭带来可观的收入补贴,特别是对于宝妈等居家群体而言,这简直是一份理想的灵活副业。
从数据到智能,这是一条严密的闭环流水线。 居民采集的数据经过上传、质检、标注等一系列标准化流程,最终转化为优质的“数据燃料”。这些燃料被输入具身智能模型,让 AI 更深刻地理解真实的物理世界。随后,经过训练和优化的模型被植入机器人等智能设备,让机器人变得更聪明、更干练,加速走进家庭发挥实际作用。这正是京东布局具身智能数据基础设施的核心逻辑——构建“采集—标注—训练—验证”的全流程数据流水线。
京东正发动一场人类历史上规模最大的数据采集行动。 依托 20 余年积累的丰富场景优势,京东计划发动内部超 10 万名各类职业员工,以及外部 50 万各行业人员共同参与。目标是在两年内采集超过1000 万小时的高质量数据,并致力成为全球最大的具身智能数据公司。这一战略不仅仅局限于单一场景,而是旨在覆盖全行业的多元需求。
以宿迁为例,这一布局已经深入到了生活的毛细血管。 京东计划在这里发动超 10 万市民参与,覆盖从家庭、办公室、工厂到物流、商店、环卫等超百个细分场景。这种大规模的数据积累,将为具身智能提供坚实的训练底座。以下是几个极具代表性的采集场景:
在养老院,采集员记录的是人类照护的真实细节。 比如协助老人起身、喂药、康复训练等动作。这些珍贵的样本,将成为未来服务机器人模仿人类温情照护的关键依据,让机器真正具备服务弱势群体的能力。
在农田,采集内容关乎农业作业的复杂环境适应性。 内容覆盖了果蔬采摘的手眼协调轨迹、农具握持与操作的力学数据,以及在田间不规则地形下的行走与避障动作。这些数据能帮助机器人适应农业生产的非结构化环境,提升农业自动化水平。
在服装工厂,采集内容聚焦于工业柔性操作的精细度。 采集员在缝纫、裁剪、质检等工位作业,记录手部精细操作、多工位流转等数据。这些为工业柔性操作模型提供了小样本、高精度、可复用的训练素材,有助于推动制造业的智能化转型。
可以说,每一个微小的动作,都是通向通用人工智能的基石。 京东通过这种全民参与的“数据采集社区”,不仅解决了具身智能对真实世界数据的渴求,也为普通劳动者创造了新的价值。当这些数据转化为模型能力,最终反馈给每一个智能设备时,我们离一个人机共存的智慧时代,就已经不远了。这不仅是技术的升级,更是社会协作模式的一次深刻变革。

京东 AI 全面进军物理世界:如何破解具身智能的数据困局
说实话,现在具身智能要想真正从实验室走向产业化,最头疼的问题只有一个,就是高质量实操数据的供给严重不足。行业里有个很明确的测算标准:想要训练出一个具备通用泛化能力的具身模型,起码得有几千万小时的真实场景数据撑腰。可现实情况呢?全球目前手里的高质实操数据加起来,也就几十个小时的量级。这个有效供给的缺口,可以说是目前最大的痛点。
而且不仅仅是数量问题,数据成本高、标准不统一、复用率低,这些老毛病也拖慢了技术迭代和规模化落地的速度。针对这些产业瓶颈,京东给出了自己的解法——建设全球最大具身数据采集中心,目标很明确,就是为了把地基打牢,让 AI 跑得更快。
京东为什么敢接这个活儿?因为在数据基建这块,人家已经跑通了“产业场景”与“技术投入”双轮驱动的模式:
首先是产业场景的厚度。京东 AI 的应用早已覆盖了零售、物流、健康等 3000 多个场景。这不仅仅是数量多,更是让京东成为了全球 AI 应用场景最多、产业厚度最强的企业之一。海量的真实业务,就是训练 AI 最好的“燃料”。
其次是技术投入的强度。京东体系内,AI 相关的研发投入正在持续高速增长。这种高强度的技术支撑,为数据基建提供了最硬核的保障,确保所有的数据采集和处理都能真正落地,而不是停留在概念阶段。
可以说,依托这些丰富的场景和产业厚度,京东 AI 全面进军物理世界只是时间问题。数据有了,底气足了,人工智能的快速发展自然就有了坚实支点。

京东具身智能的数据基石:从真实场景到万亿生态
在京东具身智能数据采集中心,我们看到的不只是机器人在模拟收银或拣货,而是京东对物理世界数字化的一种深度探索。工作人员教机器人成为收银员的过程,本质上是高质量数据采集环节的现场演练。这不仅是技术的展示,更是京东将真实业务场景转化为AI训练数据的核心能力体现。
技术底座与数据处理的高效闭环
数据采集只是第一步,背后的支撑体系才是关键。京东云AI数据湖与JoyBuilder开发平台等系统,构成了强大的数据处理中台。这套体系不仅仅是存储数据,更显著提升了数据处理的质量与效率。通过这套系统,海量的物理世界数据被清洗、标注、结构化,为上层模型提供了优质的“燃料”。
以自采数据为核心训练的京东具身大模型JoyAIRA,其性能在行业内处于领先地位。
真机实验的成功率全球领先,证明了模型在实际操作中的可靠性与鲁棒性。
开放生态:构建产学研协同创新网络
技术的突破往往需要生态的共建。京东并未将高精数据资源封闭在内,而是通过合规数据交易平台,向学术界、第三方开发者和生态企业开放。这一举措打破了数据孤岛,推动了产学研的深度协同创新。2026年4月,随着首批高精数据集的定向开放,国内具身智能与多模态大模型领域的领军企业迅速展开合作。这些数据集已被广泛应用于各类复杂场景的研发中,真正实现了技术共享与价值共创。
底层逻辑:从真实场景中来,到真实场景中去
京东二十多年的技术研发与应用,始终遵循着一个底层逻辑:回归真实。无论是数据采集,还是模型训练,真实场景都是检验技术有效性的唯一标准。这种务实的基因,确保了京东在具身智能领域的每一步都走得扎实稳健。
未来展望:打造全球最大物理世界运营中心
展望未来,京东具身数采基础设施将持续扩容。这一战略不仅仅是技术升级,更是推动京东“全球最大物理世界运营中心”打造的关键一步。通过基础设施的完善,京东将有效带动各地经济发展和社会就业,助力实现万亿人工智能生态的宏伟目标。这不仅是商业布局,更是对社会生产力变革的深远贡献。
