腾讯 Hy3 狂飙，调用量超前代 10 倍，编程智能体场景暴涨 16.5 倍，引爆 AI 新纪元

快讯蜂巢 2026-05-09 0

5 月 7 日，腾讯公司公关总监张军释放了一个重磅信号。Hy3 preview 上线后，Token 调用量持续飙升，目前的总量已经是上一代版本模型 Hy2 的十倍之多。这一数据不仅直观地展示了模型性能的跃升，更揭示了市场对于新一代大模型的迫切需求。

在海量数据的增长中，有几个关键场景值得特别关注。其中，代码开发和智能体类场景的 Token 调用量增长尤为明显。具体落实到腾讯内部的应用，如WorkBuddy、Codebuddy 以及 QClaw等工具，其增长幅度甚至超过了16.5 倍。这充分说明，生产力工具与 AI 的结合正在加速落地，并产生实实在在的效能。

深度解析：为何是代码与智能体？

基于上述数据，我们不妨深入剖析一下这背后的行业逻辑：

1. 模型迭代速度加快：从 Hy2 到 Hy3，不仅仅是参数量的变化，更是实际调用量的爆发，证明了技术路线的正确性。

2. 垂直场景成为突破口：代码和智能体场景的高频使用，表明大模型正在从通用聊天转向解决具体工作问题。

3. 内部应用先行：腾讯自身业务率先大规模承接流量，为后续商业化推广积累了宝贵经验。

综合来看，腾讯 Hy3 preview 的强劲表现，标志着大模型应用正在从实验走向实战。随着更多内部场景的打磨和外部环境的成熟，AI 技术将在企业办公和开发领域发挥更加深远的影响。

腾讯混元最新推出的 Hy3 preview 版本，最近在开发者群体中引起了不小的轰动。为了广泛收集反馈，该模型通过 OpenRouter 平台提供了免费试用机会。结果怎么样？根据 OpenRouter 公开的周榜数据，在过去的一周里，Hy3 preview 以约 3.66 万亿 Token 的调用量位居平台总调用量周榜第一，同时在市场占有率榜单上也位列榜首，真正实现了“双第一”的傲人战绩。

细分场景表现同样强劲。Hy3 preview 并没有因为是通用模型而显得平庸，在分场景排名中，无论是编程类场景还是工具调用类场景，该模型的调用量都牢牢占据了第一位。这说明它不仅在理论测试上得分高，在实际的复杂任务执行上，也是业界领先的“实干家”。

技术架构：快慢思考融合。作为腾讯混元技术重构后推出的首个模型，Hy3 preview 采用了混合专家（MoE）架构。其总参数量高达2950 亿，但激活参数量仅为210 亿，激活占比约7.1%。这种设计在保证了强大算力的同时，极大提升了推理效率，是性能突破的关键所在。

核心机制：双思考模式自动切换。模型能根据任务难度在速度和能力之间找到最优平衡，具体分为两种模式：

1. 快思考模式：专门用于简单问答、事实查询等低难度任务，确保响应速度快。

2. 慢思考模式：针对复杂推理、代码生成、多步任务等高难度场景，确保输出质量更高。

这种智能调度机制，意味着模型不再是一刀切，而是能灵活应对不同类型的业务需求，在速度和能力之间实现了动态平衡。

落地应用：全面接入腾讯生态。在落地应用方面，腾讯这次是动真格了，Hy3 preview 已全面接入腾讯多款主流产品，主要覆盖范围包括：

- 核心办公与云服务：腾讯云、腾讯文档、腾讯乐享；

- AI 助手类应用：元宝、ima、CodeBuddy、WorkBuddy；

- 大众用户产品：QQ、QQ 浏览器。

此外，微信公众号、和平精英、腾讯新闻、微信读书等多个主线产品也在陆续上线中，生态融合度非常高。

开源支持与未来潜力。对于开发者和企业用户来说，接入门槛也降低了。模型支持接入OpenClaw、OpenCode、KiloCode等流行的开源智能体框架，并且已经上架了腾讯云大模型服务平台 TokenHub。这意味着用户不仅能在腾讯系产品内体验，还能通过更广泛的开源框架进行二次开发和集成，未来潜力不可估量。