9月24日,阿里巴巴·汤蒂(Alibaba Tongyi Qwen3-Max)的旗舰车型在云Qi会议上发布。报道说,他们的表现超过了GPT5,Claude Opus 4,并且是世界前三名。 Qwen3-Max包括两个主要版本:指令和思想。它的预览版在聊天机器人体育馆的排名中排名第三,预计官方版本将取得另一个进步。报道说,Qwen3-Max是Tongyi Qianwen家族的最大,最强大的基础模型。该模型具有36吨以前训练的数据量的标记,总参数超过10亿,并且具有非常强大的编码编程功能和代理工具。在SWE银行验证测试中,使用编码来解决大型模型的真实问题,定向版本获得了69.6分,在世界范围内首先分类。在TAU2银行测试中,侧重于代理工具的能力,QWEN3-MAX获得了74.8分的前进,超过了Claude Opus4和deEpseek-V3.1。推理扩展版本QWEN3-MAX QWEN3-MAX-BENEFICE浓度在AIME 25和HMMT测试中获得了100分的全部得分,在中国实现了第一个专注于数学推断的HMMT测试。如报道,QWEN3-MAX推理模型能够取得良好结果的原因是,在解决数学问题时如何动员工具,这使您可以编写代码并提出问题,同时在测试过程中增加计算机资源并改善模型的性能。据了解,Tongyi Qianwen系列的模型已达到50亿至10亿元的全尺寸覆盖范围,其中包括300多个可以满足几种情况需求的大型型号。从现在开始,用户可以使用Tongyi Qianwen Qwencha或Alibaba Cloud尝试使用Ilian平台来调用API服务。 (dingxi)本文来自NetEase Technology的报告。关注我们以获取更多详细信息和详细内容。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注