关闭广告

阿里巴巴正式推出Qwen3-Max,稳居全球顶尖模型之列

财闻88人阅读

9月24日,据“通义千问Qwen”微信公众号消息,阿里巴巴推出Qwen3-Max——迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准Tau2-Bench上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米总裁卢伟冰:尚未看到人形机器人商业闭环的时间点

南方都市报 浏览 74

坦克400预售:新增激光雷达,支持高阶辅助驾驶

IT之家 浏览 58

以色列爆发开战以来"规模最大抗议" 100万人走上街头

澎湃新闻 浏览 89

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 26

美股芯片股全线大跌,希捷科技盘后猛涨17%,国际油价涨超3%

21世纪经济报道 浏览 4

834只偏股基金净值创新高!

一地基毛 浏览 98

西安市委书记方红卫任上落马 7月刚表态韩松被查

鲁中晨报 浏览 35

多只明星基金减仓茅台,为啥茅台不被资本欢迎了?

江瀚视野 浏览 8

恒大系崩溃,恒大冰泉没有

斑马消费 浏览 102

今日热点:迪士尼OpenAI合作;JENNIE和DEX将出演新综艺……

伊周潮流 浏览 22

郭德纲没想到,郭汾阳一句话,让郭麒麟放弃继承

律便利 浏览 90

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 24

荀玉根:如何理解股强经弱?

首席经济学家论坛 浏览 88

王曼昱3-0战胜迪亚兹,晋级欧洲大满贯瑞典站女单16强

直播吧 浏览 68

英伟达学徒遍地,他偏要另起炉灶

虎嗅APP 浏览 95

机器人奥运会开幕!宇树“肇事逃逸”,可惜马斯克机器人缺席了

雷科技 浏览 84

开拓者7人上双114-95轻取篮网,阿夫迪亚18+6+5,克林根14+11

懂球帝 浏览 17

女子新房装玫红色入户门贴大花壁纸 称总花费近100万

极目新闻 浏览 29

美国USAID大量资金被冻结 反华组织都慌了

环球网资讯 浏览 305

87岁画家范曾被指失联 友人:已和妻子乔迁新居

澎湃新闻 浏览 79

15亿库存压顶,曾经的“国潮顶流”卖不动了

深蓝财经 浏览 86
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12