关闭广告

阿里巴巴正式推出Qwen3-Max,稳居全球顶尖模型之列

财闻84人阅读

9月24日,据“通义千问Qwen”微信公众号消息,阿里巴巴推出Qwen3-Max——迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准Tau2-Bench上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男子因鸡蛋被侄儿吃掉抱怨致妻崩溃摔碗 女方:会离婚

极目新闻 浏览 76

宁德时代:钠新乘用车动力电池正在与客户推进开发、落地中

IT之家 浏览 59

舒淇,东亚女孩的恨海情天

时尚COSMO 浏览 27

吊打比亚迪、用“老头乐”狂割美国人,这家车企要赴港上市了

钛媒体APP 浏览 64

工信部曝光9台“狠角色”新车:A6L 3.0T功率提升,奇瑞五菱新作

蜗牛车志V 浏览 25

德云社董事长王惠凌晨发文,郭汾阳长大,触景生情

动物奇奇怪怪 浏览 750

财经调查丨全靠“吹”!年销量超30万件的“木棉皱皱纱”是纯化纤

央视财经 浏览 73

从溥仪脸到横店邀约:历史人物形象的符号化困境

纪百事 浏览 81

郭碧婷自曝和向佐两地分居

萌神木木 浏览 41

与718同平台打造 奥迪全新纯电概念车曝光

车质网 浏览 85

马斯克Grok 4.2炒股收益率夺冠

财闻 浏览 18

印度裔的黑利不安好心:为了应对中国 美印必须联手

澎湃新闻 浏览 76

伊姐周六热推:电视剧《即刻上场》;电视剧《暗影侦探》......

伊周潮流 浏览 23

俄放话"不再谈"后 泽连斯基服软:愿无条件会面

博览历史 浏览 87

这些穿搭真有质感,大方高级不老气,适合40岁左右的女性

静儿时尚达人 浏览 137

新年的“一抹红”,这样穿惊艳全场

Yuki女人故事 浏览 21

官方:斯特拉斯堡中场帕普-迪奥普租借加盟图卢兹

懂球帝 浏览 25

西芒杜铁矿石准备装船,榨取中国钢企利益的时代该结束了

北向财经 浏览 26

20万内的特斯拉要来了?廉价版Model Y大曝光

爱驾天下 浏览 96

炎热的夏天,火热的牛市,能否持续?

木禾投研 浏览 77

苹果预计今年不会发布标准版 iPhone 18 推迟到 2027 年

威锋网 浏览 29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12