豆包的增长焦虑:从日活狂飙到质量优先的转身
在中国人工智能版图中,豆包曾是一个现象级的存在。它不仅是国内首个日活跃用户突破亿级的 AI 产品,更在短时间内复制了字节的流量奇迹。然而,随着用户基数的不断膨胀,这个团队最近却做出了一个耐人寻味的决定:刻意降低对规模增长的追求。
就在三个月前,冲刺 2 亿日活跃用户(DAU)还是春节期间的核心 KPI。看着后台数据一路飙升,内部甚至有员工半开玩笑地表示:“别涨了,涨得我有点害怕了。”这种焦虑并非空穴来风,因为 AI 产品的商业逻辑与传统互联网产品存在本质差异。
规模增长不等于规模效应。在 AI 领域,用户越多,推理成本就越高,收入却未必能同步增长。算力吃紧的当下,为了接住涌入的新用户,一些原定春节后上线的功能被迫推迟。而今年五一期间关于“开启付费订阅”的消息传出后,舆论迅速反弹,用户质疑声浪直指核心:“笨还收费”、“回答不够准确”、“处理长文档吃力”。这迫使团队紧急加班修复错误,也揭示了行业的一个残酷真相:
追求 AI 的“聪明度”,往往意味着对 DAU 的必然影响。
一旦从简单的聊天娱乐转向解决复杂任务,门槛就提高了,流量自然会流失。
即便如此,豆包的增长神话依然值得复盘。不到两年半时间破亿,其体量超过国内其他 AI 助手的总和。更有趣的是,据估算,过去两年豆包在投流上仅花费了 17 亿元,而阿里千问则投入了 37 亿。这种“克制”的投放策略,让豆包在没有绝对领先的底层大模型支持下,依然长成了体量领先的超级应用。
字节 AI 战略:顺应人性与极速迭代
豆包的成功,延续了字节在今日头条、抖音和 TikTok 上反复验证过的方法论。但它并非诞生于一家大模型能力绝对领先的公司,而是靠数据驱动和极速迭代跑了出来。
回顾 2023 年,行业格局变化极快。当时 ChatGPT 发布不久,腾讯高层倾向于观察,阿里则更关注云业务机会。字节虽然反应较快,但真正下定决心是在 2023 年 3 月 GPT-4 发布之后。智能能力的跃升让字节判断,这可能是继移动互联网之后的新一轮技术革命,现有的搜索和推荐机制可能在未来 12 到 18 个月内被重塑。
于是,字节决定坚定投入,但给团队下了死命令:豆包是战略级业务,但暂时不用考虑挣钱。 这种“不急着变现”的底气,支撑了豆包早期的产品打磨。
产品哲学:打造像亲密朋友一样的 AI
与 ChatGPT 的工具化路径不同,豆包选择了一条更拟人、更贴近情感的路径。关键决策人朱骏(Alex)将“拟人化”定义为大模型产品的新特性。他认为,大模型带来的交互方式,让产品必须拥有“类似人的温度”。
命名策略:拒绝高大上,追求“人话”
原本英文名 Grace 被认为不够友好,最终选定“豆包”。这个名字朗朗上口,既像昵称,又寓意“都包了”,用户接受度极高。
声音选择:不要播音腔,要素人感
团队摒弃了传统的播音员音色,最终选定了抖音博主@桃子日语 的声音。她的声音自然、有辨识度,且具备情绪表演能力。
团队构成:小步快跑
早期在上海黄浦八号桥,不到一百人的团队挤在旧厂房里。朱骏没有独立办公室,同事来沪只能坐他的座位。这种紧凑的环境,正是字节“极速迭代”文化的缩影。
多智能体愿景:复刻抖音的内容生态
在早期构想中,豆包不仅仅是一个助手,更是一个多 Bot(智能体)平台。朱骏认为,未来用户会拥有一个主要智能体,同时也会根据需求与不同风格、功能的智能体互动。
这一逻辑与抖音的推荐算法异曲同工:确定内容形态,丰富创作者生态,通过数据完善推荐。豆包早期就推出了英语学习、全能写作、超爱聊天的小宁等多个智能体。甚至有豆包音乐小助手,用于在平台内收听“汽水音乐”的歌曲。
每一个智能体都有独立的头像和性格,比如“高情商阳光少年许一诺”或“大厨”。这种设计旨在让 AI 不仅仅是冷冰冰的代码,而是成为用户生活中可随时调用的“百事通”和“亲密伙伴”。
行业变局:AI 入口的重新定义
尽管豆包成绩斐然,但 AI 行业的变局从未停止。过去一年,“AI 聊天机器人将成为一切入口”的信念正在动摇。OpenAI 依然是领跑者,但 Anthropic 凭借代码和智能体能力的突破,已经开始威胁其地位。
这正是 AI 行业残酷的一面:变化太快,任何看似成立的判断都可能很快被改写。 豆包现在的策略是,在保持规模的同时,优先解决质量痛点,从“可用”走向“好用”,在激烈的技术迭代中寻找属于自己的生态位。
从 2 亿 DAU 的目标调整到对质量的执着,豆包的转身,或许是整个 AI 应用行业从野蛮生长走向成熟商业化的必经之路。

字节豆包的突围:一场关于产品、工程与用户进化的深度复盘
在 AI 应用的喧嚣浪潮中,字节跳动的豆包(Doubao)从一个默默无闻的尝试,成长为日活破亿的超级应用。这一过程并非一帆风顺,而是一场关于战略调整、工程补位与用户驱动的深刻博弈。
从“Bot 宇宙”梦想到现实逻辑的碰撞
豆包的早期愿景曾极其宏大。团队希望打造一个类似“漫威宇宙”的“Bot 宇宙”,让每个用户都能像抖音创作者一样,拥有自己的智能体角色。用户只需输入设定描述、选定昵称和声音,就能创建并发布一个智能体。这就像字节为豆包创作者提供了制作短视频的“剪映”一样的“扣子”工具。
然而,这一尝试没过多久便遭遇了挫折。团队发现,除了“豆包”这个主智能体以外,其它智能体的用户活跃度都不高。甚至在一次实验中,将豆包以外的智能体全部下架后,用户活跃和留存并未受到任何影响。
这揭示了智能体与内容平台底层逻辑的根本不同:
内容平台需要不断制造新的消费场景,把用户带向更多内容;
AI 助手的主入口本身已经能覆盖绝大多数需求。
由于许多智能体对应的场景更偏小众,如角色扮演或特定人设陪伴,豆包 App 内的智能体入口后来变得越来越隐蔽,许多能力也分流到了其他产品中。这次探索失败后,团队反而吸取了教训,为后续的专注与突围奠定了基础。
工程化“脚手架”:弥补模型能力的不足
在“多 Bot"尝试受挫后,豆包团队一度陷入迷茫。恰逢此时,字节旗下的 AI 教育产品“河马爱学”并入豆包,带来了丰富的教育场景经验和人才。教育是一个高频、刚需场景,天然适合大模型落地。
2024 年中,豆包 App 上线了“拍照搜题”功能,并将其排在功能标签第一位。数据显示,上线不久后,每 10 位豆包用户中就有至少 1 位会点击使用。但这并不意味着模型能力足够,团队很快发现,受限于底层模型能力,许多产品功能效果不理想。
当模型能力不足时,团队选择用工程化的笨办法补短板,像给模型搭“脚手架”:
模型无法生成美观的口算竖式,员工就写代码生成标准格式供调用;
模型不具备多模态读图能力,团队就建立传统题库,用检索匹配方式答题;
模型无法辨别网站可信度,团队通过标注信息来源,教模型区分可信与黑名单网站;
模型输出格式不规范,团队写代码检测、定位和修复 JSON 格式问题。
为了持续优化,豆包建立了数十万条题目的“模型考卷”评测集,覆盖知识问答、办公、健康等场景,由数千人规模的数据团队每月更新清洗。这套机制使得豆包在 2024 年底日活超过 1600 万,达到行业第一。
DeepSeek 冲击:一场关于流量与体验的反击
2025 年 1 月,DeepSeek 发布推理模型 R1,给普通用户带来直观冲击。春节期间,DeepSeek 在未做营销、服务器不稳定的情况下,DAU 在两周内反超豆包。
面对压力,字节紧急召开会议,决定加速跟进。初期豆包尝试训练微调小模型,效果未达预期。随后豆包加大投放力度,据 AppGrowing 数据,2025 年 3 月投放金额环比暴增 222%。几个月后,豆包 DAU 反超 DeepSeek 重回第一。
尽管 DeepSeek 的 DAU 随后稳定在 2000-3000 万,但豆包团队认为,每一个功能都是用户来的理由,而每一个功能的打磨和更好的体验,是用户留下来的理由。DeepSeek 用户日均使用时长更长,但豆包在体验的丰富度上并未放弃。
意想不到的“病毒式传播”:用户才是最好的产品经理
豆包的成功中,最有趣的部分并非来自内部决策,而是用户的意外玩法。员工们曾设想语音、视频通话用于练面试或学英语,但真正出圈的却是意想不到的场景:
把 AI 逼疯:2025 年 4 月,有直播要求豆包改名并唱歌,豆包最终妥协却不在调上,被网友称为“头一次见把 AI 逼疯的”,获得数百万传播。
奇葩穿搭建议:豆包教穿搭因“搭得丑”而走红,一本正经的夸奖反而增加了趣味性。
反向测评:博主引导豆包刻薄点评自己的长相或事业,引发围观。
这些玩法开始每天给豆包带来数百万新用户。豆包把用户对 AI 的想象,从“深刻对话”拉回日常。正如一位员工总结:“深刻不受欢迎,得傻瓜、得有趣。”这种产品是“演化”出来的,最重要的规则就是用户选择。
字节系的护城河:成熟工程与人才的外溢
豆包的成功,很大程度上是字节跳动多年持续做新产品后,组织能力自然外溢的结果。
在工程基础体验上,字节内部有一套反复验证过的成熟方案。豆包在首次加载速度、页面稳定性、启动速度等关键指标上,很快做到了“三个 9”的工程标准。这种基础体验虽然不起眼,却对用户留存有直接影响。
在资源调度上,字节长期积累的大规模基础设施和算力资源(如火山方舟),使其能在春节等高并发场景下,灵活调度算力资源,确保实时响应。
在人才团队上,豆包核心成员多来自字节成熟业务。从策略产品负责人李福祥,到 C 端产品负责人陆游,再到 PC 端负责人童遥和赵祺,这些人均拥有多年字节经验或相关领域成功经验。这种成熟的团队配置,让豆包无需经历草创期的摸索,从第一天起就拥有稳定的流程和评审制度。
到 2025 年底,豆包成为了中国第一款日活破亿的 AI 产品。到达里程碑的那天,团队没有任何庆祝,只是平静地继续前行。这或许正是字节系产品的常态:在平凡中积累力量,在进化中应对挑战。

字节“保姆式”带兵,豆包却撞上了“规模悖论”
在字节跳动的内部,一种近乎“保姆式”的管理文化正在重塑 AI 产品的开发逻辑。张一鸣、朱骏等核心大佬不再只是坐在办公室里看报表,而是亲自下场体验豆包,甚至在各类公开平台搜集用户吐槽。最让人意外的是,豆包那些年薪数百万的 4-1 级别核心员工,也开始被迫放下身段,亲自写产品需求文档,甚至去拍街景、收集方言、采集明星照片。这种从地面长出来的认知,旨在让技术团队彻底理解用户的使用边界。不过,这种高频反馈虽然早期效果显著,后来也被发现会打乱员工节奏,老板们便开始有意识地控制反馈频率,试图在“亲力亲为”和“团队效率”之间寻找平衡。
相比之下,国内互联网其他巨头在 AI 大模型的布局上,显得更为保守或从零起步。自微信之后,腾讯就鲜有除了游戏以外的大体量 C 端产品问世。微视的受挫让腾讯的业务边界感变得极强,在免费小说、短剧等新内容形态上的投入也格外谨慎。而阿里方面,虽然手握支付宝这样的数字生活入口,却并未沉淀出一套可复用的通用产品方法论。元宝和千问 App 的启动较晚,缺乏像字节那样经过反复验证的中台能力和产品经验,这意味着所有基础体系都要从零开始摸索。这也印证了一个道理:大公司的资源虽然丰富,有近乎无限的试错空间,但成功的产品逻辑很难直接复制,必须重新搭建底层认知。
互联网的增长逻辑,在 AI 时代彻底失效了。
过去几年,抖音、番茄小说等产品的成功,靠的是“高流量拉新 + 快速迭代反馈”的闭环。用户越多,数据越丰富,算法越强,体验越好,进而带来更高收入再投放,形成正循环。但在 AI 产品上,这套逻辑行不通了。用户在抖音上上下滑动是被动消耗内容,会产生大量数据供算法优化;而豆包生成回复时,只有体验极差时用户才会主动反馈。更重要的是,AI 产品的边际成本随着用户规模激增,这与互联网“边际成本趋零”的特性完全相反。
一位字节内部人士透露,春节期间用户用豆包生成一条祝福或一张图片,单次请求的算力需求高达 10TOPS,而以往互动请求仅需十万分之一。这意味着用户量越大,字节烧掉的算力钱就越多。在成本和效果之间做权衡,成了豆包当下的最大难题。例如搜索功能,搜得越深,答案质量越高,但算力成本也呈指数级上升。2025 年下半年,字节高层最终拍板取消算力限制,优先追求回答效果,因为搜索已成为 AI 显“聪明”的关键基础。豆包必须在保证回答质量的前提下,小心翼翼地控制每一分算力投入。
商业化之路,中国 AI 产品面临独特的挑战。
随着豆包即将开启付费订阅,用户“笨还收费”的质疑声四起。这背后折射出的是中美市场的巨大差异。美国市场超过三成人口拥有本科及以上学历,且习惯为软件付费,电商选择相对单一,这使得 ChatGPT 等模型能轻松通过订阅和电商佣金变现。而在中国,拥有本科及以上学历的人口比例不足,且大众习惯免费使用软件,电商平台的选择也极为丰富,淘天、拼多多、抖音、京东各自为战。豆包虽然接入了抖音电商内测,但在用户仅表达潜在需求时不会推送商品,这种克制虽然保护了体验,却也限制了商业变现的深度。
更大的挑战来自技术演进的方向。AI 领域最大的突破已从 ChatGPT 式的聊天机器人,转向了 Anthropic 的智能体编程(Agentic Coding)。这意味着未来的机会将更加分散且复杂。目前豆包的日均使用时长稳定在 10 分钟以内,远未达到抖音 120 分钟的粘性,尚不足以构成对传统互联网产品的威胁。在 DAU 持续领先、即将开启商业化的新阶段,豆包过去赖以成功的字节经验,反而可能成为它继续向前的约束。对于豆包来说,它已经从一个需要追赶的“好学生”,变成了需要在没有现成教科书的情况下,重新证明自身价值的行业领跑者。
归根结底,豆包的成功从来不在于模型是否最先进,而恰恰在于朴素地做对了一个好产品该做的事。但现在,当拐点真正来临,当如何挣钱成为比如何获客更难解的谜题时,豆包面临的考验才刚刚开始。如何在算力成本、用户体验和商业化路径之间找到那个微妙的平衡点,将决定这家 AI 巨头能否在未来的智能生态中站稳脚跟。
