关闭广告

Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一

AI寒武纪31人阅读


根据著名AI分析机构Artificial Analysis的评估,Kimi K2 Thinking在智能体(agentic)相关任务中表现非常突出,但在完成评测时生成了所有模型中最多的token,表现出非常“话痨”的特性

以下是其核心要点:

智能指数67分,登顶开源榜首

Kimi K2 Thinking在Artificial Analysis智能指数中获得67分。

这一成绩使其明确领先于所有其他开源权重模型,包括最近发布的MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),在所有模型中仅次于GPT-5

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

传祺第80万台MPV下线 向往M8鸿蒙座舱版上市 售32.99万元

网易汽车 浏览 74

最新锐超绝的北美电影组合,即将首访北京!

幕味儿 浏览 260

5000点?可能吗

博闻财经 浏览 68

“假发第一股”瑞贝卡的双重压力

斑马消费 浏览 90

探访争议中的百果园:价格差了三倍多 口感差异不明显

人民日报健康客户端 浏览 87

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

澎湃新闻 浏览 28

东风与华为探索新渠道合作模式

第一财经资讯 浏览 84

英媒:美在芯片货物中安追踪器 以发现是否转运至中国

环球时报 浏览 78

同比增长89.61% 鸿蒙智行11月交付新车81864台

网易汽车 浏览 26

你觉得美,可能是大脑在偷偷节能|光锥读论文

未来光锥 浏览 19

徐静蕾美国超市现身,黄立行白发相伴

墨语家 浏览 28

科创板主题基金规模突破三千亿元 “上新”的指数如何参与创新和成长?

金证研 浏览 48

安帅批评国际足联:比赛过多,导致质量下降与球员受伤增多

懂球帝 浏览 87

官宣!国足3月参加FIFA系列赛,过招两大世界杯劲旅+非洲杯5冠王

我爱英超 浏览 20

人民币汇率破7,“6时代”下对我们带来哪些影响?

郭施亮 浏览 17

刚刚,大模型装上「鹰眼」!首创高刷视频理解,谷歌Gemini 2.5完败

新智元 浏览 77

追觅进军衣物护理市场,推出首款产品 P7 蒸汽挂烫机

IT之家 浏览 39

上年纪的女人,建议衣服松一点,颜色淡一些,更高级大方!

静儿时尚达人 浏览 86

影翎Antigravity A1全景无人机开启公测 明年1月发售

网易科技报道 浏览 93

豆包手机助手调整AI操作能力,刷分、金融类应用、部分游戏等三大场景将限制使用

澎湃新闻 浏览 17

普京指挥俄军战略核力量综合演习

环球网资讯 浏览 66
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12