快讯蜂巢
快讯蜂巢

原力灵机:机器人狂潮之下,谁才是真正的“大脑”?深度探寻智能革命背后核心驱动力真相

快讯蜂巢 0

原力灵机唐文斌:跨越 AI 两个时代的信仰与实战

在正和岛的这场深度访谈中,我们对话了原力灵机 CEO 唐文斌。作为行业内的资深玩家,唐文斌的视角非常独特。他不谈虚的,只谈技术如何真正落地。这次对话,让我们看到了一个技术理想主义者的务实一面。

一、技术信仰:从人脸到具身,始终相信技术能改变物理世界

唐文斌的创业之路,其实就是一部 AI 进化的缩影。从最早的人脸识别,到现在火热的具身智能,他跨越了 AI 的两个时代。很多人问,为什么一直做这个?他的回答很简单:因为相信,所以看见,也因为信仰,所以能够抵达。 这不是口号,而是他坚持下来的核心动力。在他看来,技术的终极使命不是停留在屏幕里,而是要去改变我们身处的物理世界。

二、价值务实:拒绝让机器人跳舞,要赋予它解决问题的能力

现在的机器人市场很热闹,但唐文斌对此很冷静。他明确表示,不满足于让机器人跳舞,而是赋予它在真实世界里解决问题的能力。 说白了,就是给机器人装上真正的“大脑”。我们的目标很明确,从替代人类“不想干的活”开始。 这才是技术存在的最大价值,不是表演,而是实用。

三、斜率思维:第一不重要,重要的是那一阶导

在竞争激烈的 AI 赛道,大家都在争排名。但唐文斌有一套自己的“斜率思维”。他认为,当前模型第一不重要,重要的是那一阶导。 什么意思呢?就是保持极高的迭代效率,让技术飞轮快速旋转。比任何一个静态节点的排名都更具意义。 速度比位置更重要,进化比现状更关键。

这场访谈让我们明白,真正的技术领袖,既要有仰望星空的信仰,也要有脚踏实地的执行。唐文斌和他的原力灵机,正在用这种方式,书写 AI 落地的新篇章。

从虞姬到工位:唐文斌的“去繁就简”哲学

在《王者荣耀》的英雄池里,虞姬是一个非常有代表性的存在。她不需要复杂繁琐的操作,也不需要花里胡哨的技能连招,核心逻辑非常清晰:前期坚定发育,后期爆发极强。这种“去繁就简、直奔本质”的游戏体验,恰好击中了唐文斌的偏好。对他而言,选择虞姬不仅仅是因为强度,更是因为这种风格与他个人的行事哲学高度契合。

现实中的工位:拒绝****的务实态度

视线从虚拟的游戏世界移回现实的办公室,你会发现唐文斌的作风与他在游戏中选择的英雄如出一辙。他的工位并没有安排在独立的办公室里,而是和普通员工一样,身处大开间之中。这种看似“不讲究”的安排,实则蕴含了深刻的管理智慧和个人风格。

这不仅仅是一个座位的选择,更体现了他直奔本质、拒绝****的价值观。具体体现在以下几个方面:

- 效率优先:没有物理隔断,沟通成本更低,信息流转更顺畅。

- 平等务实:与团队同处一个空间,拉近了距离,消除了层级隔阂。

- 专注核心:像虞姬一样,剥离掉不必要的装饰,只保留最核心的战斗力。

无论是游戏里的虞姬,还是现实中的开放工位,唐文斌都在践行同一种逻辑:剔除冗余,聚焦本质。这种风格让他在复杂的职场环境中,始终保持清醒的头脑和高效的执行力,正如虞姬在团战中那份冷静而致命的爆发力。这种内外一致的作风,或许正是他能够持续保持竞争力的关键所在。

一、杯子里的“X”:不只是致敬,更是野心

唐文斌坐在会议室里,面前放着一个印有“Dexmal X”Logo的杯子。说实话,这很容易让人产生联想——毕竟马斯克对“X”有着近乎执念的偏爱,SpaceX、xAI、X平台,无一不带着这种强烈的个人印记。但唐文斌直接打破了这种猜测,这并非刻意模仿,X代表的是更科技、更多可能性的东西。 这是2026年4月的一个下午,正和岛“新质企业家”栏目走进了原力灵机,我们试图透过这个符号,去理解一家新公司的野心。

二、从旷视到原力:横跨两个时代的创业路

从旷视科技到原力灵机,唐文斌的创业轨迹,横跨了中国AI产业的两个时代。 具体来说,这一路走来有几个关键节点:

1. AI 1.0时代:14年前 他和印奇、杨沐创办旷视,是AI 1.0时代的标志性人物,用计算机视觉定义了智能的初步形态。

2. 具身智能时代:14年后 他带着一群“旷视老将”重新出发,闯入具身智能这片更复杂的战场。 这种跨越,不仅仅是时间的流逝,更是技术范式的根本性转移,从“看”世界到“进入”世界。

三、终极拷问:具身智能的“ChatGPT时刻”何时到来

这家成立仅一年多的机器人公司,正在试图回答一个所有人都想知道的问题:当大模型撞上物理世界,具身智能的“ChatGPT时刻”,还有多远? 这不仅是原力灵机的课题,也是整个行业面临的挑战。唐文斌和他的团队,正站在新的风口上,准备迎接这场硬仗,试图在物理世界中,复刻大模型的奇迹。

2026 年的中国机器人赛道,那叫一个热火朝天,简直就像是被扔进了一锅沸水。你看,仿生蔡明在春晚上演小品,特斯拉的 Optimus 隔三差五就放个大招,马斯克更是直接放话,说未来人形机器人的数量要超过人类。各大车企、互联网巨头、创业公司全都挤了进来,投资人拿着钱到处找项目,猎头更是疯狂挖角。

就在前几天,2026 北京亦庄半程马拉松上,人形机器人与人类跑者同场竞技,这一幕直接把“机器人何时真正融入现实世界”的讨论推向了高潮。据不完全统计,光是 2025 年,中国机器人领域的融资事件就超过了 600 起,总金额更是突破了 500 亿元。

资本追逐的焦点与创始人的冷思考

在这股热浪中,原力灵机(Dexmal)无疑是资本最追逐的标的之一。这家成立不到一年的公司,三轮融资累计近 12 亿元,势头迅猛:

  • 2025 年 3 月天使轮,融资 2 亿元;
  • A 轮由蔚来资本领投;
  • A+ 轮阿里巴巴独家注资数亿元。

但面对这泼天的富贵,唐文斌却出奇地冷静。他说了一句很扎心的话:“今天大家的水平其实都挺差的。” 这句话背后,藏着他从旷视科技一路走来的深刻洞察。

从旷视基因到机器人之眼

时间倒回 2011 年,唐文斌和清华同学印奇、杨沐一起创办了旷视科技。那时候深度学习还是个学术圈的小众话题,人脸识别的准确率惨不忍睹。他们从一款手机体感游戏起步,误打误撞杀进了金融级身份认证领域,成了支付宝刷脸支付背后的技术供应商。

唐文斌回忆道:“我们其实先做的是偏技术的东西,然后想这个技术哪里用。”当时 iPhone 4 刚出前置摄像头,他们觉得可以把 Kinect 那种体感交互搬到手机上,于是做了一款人脸追踪小游戏。游戏火了,创业的念头也从此落地。

公司取名“旷视”——旷,就是大的视觉。“我们认为未来一定会有很多机器人,机器人就像人一样需要眼睛。人的信息输入百分之九十几都靠眼睛,所以我们觉得眼睛是走向机器人的第一步。” 从人脸识别到物流机器人,旷视的机器人梦一直在水面下流淌。

落地之痛:算法与物理世界的鸿沟

2018 年,旷视正式切入物流场景,给仓库做自动化方案。最出名的一仗是优衣库上海仓库——超过 1000 台不同类型机器人协同作业,单体项目接近 3 亿元,是当年国内物流自动化领域最大的一单。但也是一场“噩梦”。

唐文斌回忆,投标过程像“超女选秀”,所有供应商被一轮轮筛选,大家互相“左脚踩右脚上天”,不断 over promise。拿下来之后才发现,实际能力只达到目标的百分之三四十,项目濒临失败。 于是他带着团队在仓库里蹲了三个月。推倒代码重来,主动承担赔偿,向客户要了半年时间。项目最后跑通了,效率远超优衣库其他自动化仓库。

因为这个项目,他被邀请去日本见了迅销集团社长柳井正。在仓库里与物理世界贴身肉搏的经历,让他比很多人都更早地看清:软件算法与硬件落地之间,存在着巨大鸿沟。

新起点:打造机器人的“大脑”

2025 年,唐文斌拉上旷视时期的核心团队成员,创办了原力灵机(Dexmal)。方向很明确:做机器人的“大脑”。在经历了从视觉感知到物流落地的完整闭环后,他深知,仅仅有“眼睛”是不够的,机器人还需要一个能处理复杂物理交互的“大脑”。

这不仅仅是一次创业,更是对过去十年技术积累的一次深度复盘。在资本狂欢的表象下,唐文斌和他的团队选择了一条更难走的路——不拼概念,拼落地;不拼速度,拼深度。 毕竟,只有真正能走进现实世界的机器人,才配得上“智能”二字。

从“旷视”到“原力灵机”,从“大的视觉”到“原生的灵巧”,如果说旷视时代是让机器“看懂世界”,那么原力灵机则想让机器“改变世界”。而这个改变的前提,是为机器造一个真正能思考、会判断的“大脑”。为什么大脑如此重要?“你看今天的机器人,运动控制已经做得很好了,跳舞跳得比人都帅。但它没有在操作这个世界,没有在改变这个世界。”唐文斌一语道破。机器人行业内一个心照不宣的共识是,硬件本体的进化速度远快于智能水平的进化。即便是以运动控制闻名的宇树科技,也在IPO时明确表示,募资的近一半的资金——约20.22亿元,就是要用来攻克机器人的“大脑”问题。“你让它去炒个菜,成功率能有多少?切个水果呢?”在唐文斌看来,现在机器人“智商的缺失”,使得它面对真实世界的复杂任务时,几乎寸步难行。硬件已经备好,但缺少一个能指挥它的“司令部”。这个“大脑”到底难在哪儿?他一一列出。首先,模型本身该长什么样,架构怎么设计,业界还没形成共识。其次,给机器人“喂”什么数据去学习,是纯机器人数据还是加上人类数据,也没定论。再者,训练方法是什么,流程怎么搭,没人清楚。并且,即使有了一个六七十分的模型,怎么让它在干活儿的过程中自己发现错误、收集数据,再通过一个“数据飞轮”越转越快,变成八九十分?这条链条上的每一环,现在都是问题。此前在旷视做计算机视觉(CV),面对的是一个相对确定的数字游戏,评测指标清晰,数据集固定。但机器人是一个与物理世界充分交互的闭环系统。“任务没成功,天知道中间发生了什么。”原力灵机联合创始人范浩强感慨。所以唐文斌的思考并没有停留在做模型这一层,他有很务实的商业推演逻辑,然后给团队定了一个选择应用场景的标准:第一,错误容忍度高的场景。现在做不到百分百成功,场景本身要有兜底机制;第二,节拍容忍度高。不能要求机器人像自动化设备一样精准卡点,要允许它节奏有快慢;第三,泛化性的作业需求。任务不能太单一,否则非标自动化就能解决,用不上通用机器人;第四,长时间作业。让机器人持续工作,才能把价值卷出来,覆盖掉成本。按照这个标准反推,他认为家庭场景现在还不成熟。“你买个人形机器人回家,挺贵的,能干的活还很少。而且用户的容忍度极低,1%的概率把碗摔了,你收拾都不知道谁去收拾。”相比之下,仓储物流、工业制造等B端场景,才是现阶段验证技术、积累数据、打磨迭代能力的真实场景。“需求就在那里”他说,“阿姨干的活能不能让机器人干,大街上扫地能不能让机器人好好扫,我们不是在创造需求,我们是在创造解决方案。而创造解决方案的第一步,是先回答一个更底层的问题:这个“大脑”,到底该怎么造?03 第一不重要,重要的是“迭代的斜率”2026年2月,原力灵机发布了第一个具身原生大模型DM0(DexModel 0)。在真实机器人操作的开源评测平台RoboChallenge上,DM0的成绩拿下双项世界第一。但唐文斌认为“这个第一也没那么重要”。他关心的不是当前这个点的数值f(x),而是曲线的导数。他把公司内部的文化总结为两个词:技术信仰,价值务实。而支撑这两个词落地的,是他笃信的一个更本质的竞争力——迭代的效率。“我们要的不是今天f(x)的值,我们要的是那个一阶导。”唐文斌说,创业公司和大厂竞争,拼的不是存量,是谁迭代得更快。“idea是廉价的。大家都很聪明,你知道的东西,三个月后别人也知道了。别人知道的东西,我们大概三个月后也知道了。所以真正重要的是迭代的斜率。”为了保持这个高斜率,技术路线的选择就变得至关重要。现在业内做VLA(视觉-语言-动作)模型的主流做法,是在一个现成的多模态大模型(VLM)上“嫁接”一个动作模块。这个VLM,通常是用海量互联网图文视频数据训练出来的开源模型。唐文斌打了个比方:这就像一个九年制义务教育的初中生,刚上完初中就被拉去体校狂练体育。后果有两个:一是“根骨不扎实”,因为它从没见过物理世界的数据,相当于“没有从小练体育”,体能上限不高。二是“光练体育不练文化课”,原来在互联网数据上积累的理解能力,在专攻体育三年后,也退化得差不多了。原力灵机的思路截然不同。他们要搞“原生”训练:从模型训练的第一天起,就让它同时接触互联网多模态数据和物理世界数据——视频、机器人操作数据、导航数据、力触觉数据——并且把“理解世界、操作世界、预测世界”三个目标联合训练。“我们希望打造一个德智体美劳更全面发展的模型。”这其中有一个更深层的技术分野:为什么不直接买一个现成的“世界模型”,然后在上面训练机器人?这听起来更直接。唐文斌的解释是,逻辑不对。“世界模型比机器人的操作模型要复杂得多。如果说我们都能够非常好地去模拟这个世界,那它里面几乎已经蕴含了世界的所有知识。你想,先解决一个更难的问题,然后你就能解决那个简单的问题了?”也就是说,这相当于为了教机器人拧螺丝,先去把整个工厂的物理法则都复刻一遍,代价太大,也不现实。原力灵机的做法很巧妙:他们也有一个世界模型,但它不是被当作一个完美的“模拟器”来直接驱动决策,而是在训练过程中,被当成一个“陪练”和“强化监督信号”。简单说,就是在训练机器人操作能力时,让它在那个“虽不完美但够用”的世界模型里先“演练”一遍,用这个虚拟结果作为反馈,持续修正操作模型。但在机器人真正干活时,并不需要一边预测世界一边行动,只需要跑那一小部分执行模块,干脆利落。这套技术路线,没有追逐“世界模型”的风口,而是基于他们对问题本质的判断:先让机器人能干活,同时在训练中引入对世界的理解作为辅助。

在人工智能研发的硬核圈子里,原力灵机团队有个独特的内部黑话,他们把模型训练的过程戏称为“炼丹”。

这词儿不是现在才有的,早在 2012、2013 年旷视训练深度学习模型时,大家就开始说了。“你不知道最后炖出来是什么效果,东西先丢进去,但炼丹也是个手艺活。” 十几年过去,这个词从一个内部玩笑变成了技术人的自嘲。

在原力灵机的代码库里,有一个项目名字就叫“铁锅炖”,这是联合创始人汪天才他们起的。唐文斌第一次看到 TGD 这个缩写时问是什么意思,答曰:铁锅炖。他觉得挺逗,就保留了。这种扁平化、略带极客幽默感的氛围,是唐文斌刻意维持的。

04 务实的理想主义者

在金隅智造工场的两层楼里,唐文斌没有独立办公室,工位和普通员工在一起。联合创始人也是同样待遇,散落在团队中间,像没有特殊标记的 NPC。如果你想找他们,直接走过去就好。整个办公区通透而简单,一如他们的沟通方式。

这种布局背后,体现的是一种务实的理想主义。如果你仔细看会议室的标牌,会发现它们各有来头,充满了极客文化的彩蛋:

- Flow:来自《心灵奇旅》

- Matrix:是《黑客帝国》

- Red Queen:《爱丽丝梦游仙境》里那个叫嚷着“砍掉他们的脑袋”的红桃皇后

- Jarvis:钢铁侠的 AI 管家

这些命名不仅仅是装饰,它们映射出团队对科技与人文结合的热爱,也暗示了在这个充满不确定性的行业里,他们试图寻找属于自己的秩序与灵感。

原力灵机办公区在经历了行业起伏、从巅峰到低谷的完整周期后,再次出发的唐文斌和他身边的“新三剑客”——范浩强、周而进、汪天才——选择了一条更安静、也更tough的路。核心团队颇为年轻:唐文斌1987年出生,范浩强1994年,周而进1992年,汪天才1994年。汪天才的名字的确名副其实——他曾在某一年入选过全球前2%科学家榜单。这四个人都是旷视的老员工,一起经历过从计算机视觉到具身智能的范式转移。他们为什么愿意再次聚到唐文斌身边?联合创始人范浩强最直观的感受是“太拼了”。他说唐文斌可能是公司里工作时长最长的人,没有之一。“各个大大小小、内内外外的事情都能一把挑起来,并且哪怕非常忙,依然在做每件事的时候还能倾注百分百的热情。”他觉得,是唐文斌对机器人这件事心里有足够强的信念,所以才能驱动自己像个“铁人”一样。周而进用的词是“真诚且务实”。共事多年,他认为唐文斌的风格是实事求是,事情是怎样就怎样,该怎么解决就怎么解决。“大家也不是第一次创业,都知道创业过程中要经历哪些坎,哪些东西该扎实完成,哪些东西该给客户创造价值。文斌在这些事情上非常务实。”汪天才则认为唐文斌是“开放且务实”的。他解释说,开放在于“什么都可以聊”,员工的意见和看法都能直接提,唐文斌会从不同视角去吸收和讨论。而务实的一体两面则体现在赛道选择上,“不是一个纯讲故事的心态。投资人想听什么就讲什么,他不搞花里胡哨那一套。”这群人聚在一起的底层原因,范浩强用了一个词总结:信仰。在采访中,团队反复提到这个词。“2020年,那个时候讲端到端是很困难的,不管是研发层面还是让别人相信。我们被拒绝了很多次,paper被拒,方案被质疑。但你内心不信,你是无法坚持的。”汪天才把这种逻辑迁移到了机器人上:“从数字世界到物理世界,从开环走向闭环。自驾并不会直接改变物理世界,除非发生车祸。但具身智能时时刻刻都在与物理世界交互,导航也好,操作也好,闭环程度远超自驾。”范浩强把团队的凝聚力,归为一个很纯粹的理由:“一群有情有义的人,去干一件有意义的事情。”他说,强的同学都更喜欢跟强的同学合作,而具身智能这件事本身就足够有挑战性,也足够让人兴奋。一个人能让一群比他只年轻几岁的天才心甘情愿地跟随,没有靠职位、画饼,靠的是他们说的这些——拼、真诚、开放。还有最重要的:他自己的信念。唐文斌给自己的定义是:一个务实的理想主义者。“我自己是个比较简单的人,不太能讲很多我不信的话,”他说,“团队内部也崇尚一种简单直接的沟通文化,这其实是一帮技术同学想要追求的环境。”05 100万台机器人打开原力灵机官网,很显眼的一行字跳了出来:Build Intelligent, Useful, and Trustworthy Robots for A Better Life(打造智能的、有用的、可信赖的机器人,让生活更美好)。三个形容词,对应三个维度:智能,是大脑能力;有用,是生产力价值;可信赖,是安全性和可靠性。对于未来,唐文斌的目标明确:十年内,至少打造一个县城级别的生产能力。他的老家在浙江新昌,40万人口。“假设三个机器人能产生一个人的生产力,我们希望至少打造100万台机器人在持续被使用的状态。”他特意强调,“不是卖出去100万台,是100万台真正在被使用。”卖出去和用起来,就像demo和产品,是两回事。唐文斌了解这之间的距离。他经历过旷视从实验室到产业的完整周期,知道一个技术从“能work”到“能用”再到“好用”之间,存在很多次推倒重来。公司名字Dexmal,Dex来自Dexterity(灵巧),mal来自Animal(生物),他希望机器人能像生物一样灵巧和多形态。会议室Baymax的名字,取自电影《超能陆战队》里的大白——一个充气机器人,笨拙、柔软、可靠、温暖。电影主题曲里有句歌词:我将忠诚守护,你那炽热的梦想。

一、核心愿景:让机器人真正关心人类

在 Baymax 会议室里,这群人心里装着一个挺宏大的梦想。他们想做的东西其实很纯粹:打造智能、有用且可信赖的机器人。这些机器人不是冷冰冰的机器,而是要真正关心人类的生活,去解决那些繁琐的、危险的,甚至是人类根本不想碰的事情。

他们的终极愿景,是让人类从重复劳动中解放出来,进入一个生产力极大富足的时代。到时候,人类才能腾出手来,去探索更广阔的星辰大海。这种情怀,听起来有点科幻,但正在一步步变成现实。

二、直面恐惧:终结者时代的阴影与曙光

当被问到“机器人融入现实世界,是否预示着终结者时代的来临”时,唐文斌笑了。他承认说:“有可能。”但这并不是终点,而是一个转折点。他补充道:整个技术发展的斜率越来越陡。我们身处局中,但它的发展依然超出我们的预期。这是一个非常令人兴奋的时代,我们很感谢能生在这样一个时代。

面对技术的狂奔,他们保持着清醒与敬畏:

  • 变化速度超乎我们的预期
  • 我们身处局中,却也能见证历史的进程
  • 这是一个令人兴奋的时代,感恩能参与其中。

三、当下时刻:代码与春天的交响

窗外,北京的春天正在发生,生机盎然。会议室 Red Queen 隔壁,程序员们对着屏幕敲代码,键盘声是这里最动听的节奏。DM0 的下一个版本即将发布,评测榜单上的排名会被再次刷新。这不仅是产品的迭代,更是技术实力的见证。

在这个充满希望的季节,技术正在悄然改变世界,而我们,正是那个改变者。

没有头衔的工位,只有流动的方向

在原力灵机办公区,唐文斌的工位铭牌很特别。名字下面只有一行邮箱:twb@dexmal.com。没有 Title,没有成就展示。但这恰恰说明了问题:在这里,不需要额外的标注,工位本身就是一种证明

Flow:不止是一个会议室的名字

Flow,既是他们会议室的名字,更是一种核心概念:流动、变化、持续向前。这大概就是他们坚信的底层逻辑。重要的不是你此刻站在哪里,而是你正在向哪里流动,以及流动的速度有多快。

从自行车到机器人的物理世界

北京金隅智造工场外,几个背着双肩包的年轻工程师骑车呼啸而过。阳光下的物理世界真实而复杂,亟待新技术去改变。也许未来某天,这条路上会有机器人在清扫街道,或是驾驶货车驶过。那时的它,会如何看待眼前的一切?

是单纯计算路面摩擦力、评估风阻对能耗的影响,还是能像人类一样,感受一阵风穿过树叶的轻柔

一场漫长而耐心的“翻译”

屋内这群人正在做的,本质上是一种漫长而耐心的翻译工作。他们将人类关于智慧与行动的朦胧想象,翻译成机器能读取并执行的代码。这过程有点像当年的“炼丹”,东西丢进去,不知出来的是什么,但有人愿意一直守在炉子旁边。

他们不知道自己最终会翻译出什么。但当这些代码最终苏醒,理解杯子不只是像素和力矩的组合,而是某种可以被递出的善意时——它会如何描述这个春天?

或许它什么都不会说。只是安静地,把一杯水端稳

(注:绿岛邻事业部北京区域经理赵珊珊对此文亦有贡献。排版:木棉;审校:豆汁儿;主编:孙允广)