关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西39人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

浙江大学最新突破:AI换脸技术迎来电影级质量革命

科技行者 浏览 21

曝卡塞米罗续约曼联条款,一条件可保35万周薪!卖齐尔克泽恐已定

罗米的曼联博客 浏览 27

以色列爆发开战以来"规模最大抗议" 100万人走上街头

澎湃新闻 浏览 89

“大家都是无冕的人”

无冕财经 浏览 89

铁威马推出雷电5移动固态硬盘盒D1 SSD Pro

IT之家 浏览 27

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 54

许利民:曾凡博确实非常优秀,祝贺他回归首秀奉献如此精彩表现

懂球帝 浏览 25

R.I.P.,24岁塔希提国脚卡斯帕德因摩托车事故离世

懂球帝 浏览 93

智己LS9申报图曝光 或将于四季度正式上市

车质网 浏览 83

特朗普:我可能不会参与泽连斯基与普京的最初会面

红星新闻 浏览 81

羊绒专场 || 被大家问了无数次的经典款,终于回来了!

黎贝卡的异想世界 浏览 30

告别93岁时尚传奇Valentino:他留下了全世界最美的“红”

LinkFashion 浏览 28

精读季报丨好气!姜诚管理规模掉到115亿元,相较巅峰缩水1/4

一地基毛 浏览 25

长城汽车取消大小周,员工感慨:工作11年,终于等到全面双休了

红星资本局 浏览 32

她每月给婆婆生活费 如今她活出了自己想要的样子

阿校谈史 浏览 90

芦哲:美国CPI势弱,联储10月降息几无悬念

首席经济学家论坛 浏览 57

娃哈哈被指将换标"娃小宗" 官网公布对外总机已成空号

极目新闻 浏览 1502

吉利全球全域安全中心发布 领克900完成碰撞测试

太平洋汽车 浏览 30

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 91

赵伟:8月PMI——涨价的预期与现实

首席经济学家论坛 浏览 66

牛弹琴:委内瑞拉面临三场较量 美国将更加狂妄

北京日报客户端 浏览 34
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12