关闭广告

Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一

AI寒武纪33人阅读


根据著名AI分析机构Artificial Analysis的评估,Kimi K2 Thinking在智能体(agentic)相关任务中表现非常突出,但在完成评测时生成了所有模型中最多的token,表现出非常“话痨”的特性

以下是其核心要点:

智能指数67分,登顶开源榜首

Kimi K2 Thinking在Artificial Analysis智能指数中获得67分。

这一成绩使其明确领先于所有其他开源权重模型,包括最近发布的MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),在所有模型中仅次于GPT-5

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

海南封关首日:30克金饰省近万元 居民排长队买榴莲

极目新闻 浏览 24

毕节两名少年骑车失联21天 遗体在20公里外村中被发现

极目新闻 浏览 36

娃哈哈宗氏家族纷争带来哪些启示?清华大学高皓:民营企业真正完成有序传承大体要10年

时代周报 浏览 91

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 62

警惕特朗普TACO交易割韭菜

尺度商业 浏览 87

上海81岁外公卖房还债租房照顾2个未成年外籍外孙女

大风新闻 浏览 19

美军使用6枚钻地弹、30枚"战斧"导弹轰炸福尔多核设施

CCTV国际时讯 浏览 92

上汽销量反超比亚迪,真实“含金量”如何

经济观察报 浏览 56

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 33

许凯前女友再爆料,牵涉7位大明星,杨幂谭松韵檀健次均被点名!

娱圈小愚 浏览 90

沙特被指已下单50架超30亿美金的ch7无人机 官方回应

澎湃新闻 浏览 67

美国国会的监督机构对联邦住房金融管理局局长Pulte展开调查

华尔街见闻官方 浏览 29

港中深突破:AI推理模型实现自我纠错能力

科技行者 浏览 64

国内首部沉浸式XR影视作品《木兰2125》发布

网易科技报道 浏览 84

赵心童:第一场比赛比较紧张,尽量去享受压力,让自己发挥到更好

直播吧 浏览 85

吉利银河 A7 逆袭称王 单周狂甩 4195 辆

大象新闻 浏览 93

17岁女子将19岁男友10万卖到缅甸未涉拐卖罪 律师解读

潇湘晨报 浏览 79

戴伟浚:我肯定憋着一股劲,要在深圳新鹏城证明自己

懂球帝 浏览 24

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 30

事实证明,女人到了五六十岁别再去扮嫩!这样穿又优雅又显贵

静儿时尚达人 浏览 70

"分割顿巴斯"提议遇阻 北约秘书长赴美会谈

环球网资讯 浏览 63
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12