5 月 7 日,腾讯公司公关总监张军释放了一个重磅信号。Hy3 preview 上线后,Token 调用量持续飙升,目前的总量已经是上一代版本模型 Hy2 的十倍之多。这一数据不仅直观地展示了模型性能的跃升,更揭示了市场对于新一代大模型的迫切需求。
在海量数据的增长中,有几个关键场景值得特别关注。其中,代码开发和智能体类场景的 Token 调用量增长尤为明显。具体落实到腾讯内部的应用,如WorkBuddy、Codebuddy 以及 QClaw等工具,其增长幅度甚至超过了16.5 倍。这充分说明,生产力工具与 AI 的结合正在加速落地,并产生实实在在的效能。
深度解析:为何是代码与智能体?
基于上述数据,我们不妨深入剖析一下这背后的行业逻辑:
1. 模型迭代速度加快:从 Hy2 到 Hy3,不仅仅是参数量的变化,更是实际调用量的爆发,证明了技术路线的正确性。
2. 垂直场景成为突破口:代码和智能体场景的高频使用,表明大模型正在从通用聊天转向解决具体工作问题。
3. 内部应用先行:腾讯自身业务率先大规模承接流量,为后续商业化推广积累了宝贵经验。
综合来看,腾讯 Hy3 preview 的强劲表现,标志着大模型应用正在从实验走向实战。随着更多内部场景的打磨和外部环境的成熟,AI 技术将在企业办公和开发领域发挥更加深远的影响。

腾讯混元最新推出的 Hy3 preview 版本,最近在开发者群体中引起了不小的轰动。为了广泛收集反馈,该模型通过 OpenRouter 平台提供了免费试用机会。结果怎么样?根据 OpenRouter 公开的周榜数据,在过去的一周里,Hy3 preview 以约 3.66 万亿 Token 的调用量位居平台总调用量周榜第一,同时在市场占有率榜单上也位列榜首,真正实现了“双第一”的傲人战绩。
细分场景表现同样强劲。Hy3 preview 并没有因为是通用模型而显得平庸,在分场景排名中,无论是编程类场景还是工具调用类场景,该模型的调用量都牢牢占据了第一位。这说明它不仅在理论测试上得分高,在实际的复杂任务执行上,也是业界领先的“实干家”。
技术架构:快慢思考融合。作为腾讯混元技术重构后推出的首个模型,Hy3 preview 采用了混合专家(MoE)架构。其总参数量高达2950 亿,但激活参数量仅为210 亿,激活占比约7.1%。这种设计在保证了强大算力的同时,极大提升了推理效率,是性能突破的关键所在。
核心机制:双思考模式自动切换。模型能根据任务难度在速度和能力之间找到最优平衡,具体分为两种模式:
1. 快思考模式:专门用于简单问答、事实查询等低难度任务,确保响应速度快。
2. 慢思考模式:针对复杂推理、代码生成、多步任务等高难度场景,确保输出质量更高。
这种智能调度机制,意味着模型不再是一刀切,而是能灵活应对不同类型的业务需求,在速度和能力之间实现了动态平衡。
落地应用:全面接入腾讯生态。在落地应用方面,腾讯这次是动真格了,Hy3 preview 已全面接入腾讯多款主流产品,主要覆盖范围包括:
- 核心办公与云服务:腾讯云、腾讯文档、腾讯乐享;
- AI 助手类应用:元宝、ima、CodeBuddy、WorkBuddy;
- 大众用户产品:QQ、QQ 浏览器。
此外,微信公众号、和平精英、腾讯新闻、微信读书等多个主线产品也在陆续上线中,生态融合度非常高。
开源支持与未来潜力。对于开发者和企业用户来说,接入门槛也降低了。模型支持接入OpenClaw、OpenCode、KiloCode等流行的开源智能体框架,并且已经上架了腾讯云大模型服务平台 TokenHub。这意味着用户不仅能在腾讯系产品内体验,还能通过更广泛的开源框架进行二次开发和集成,未来潜力不可估量。
