关闭广告

美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

AI寒武纪91人阅读


美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能看起来还是很不错的,尤其在智能体(Agentic)任务方面表现突出


一大看点是模型采用了 shortcut-connected 架构,扩展了计算与通信的重叠窗口,使推理能够在成本可控的情况下达到每秒100 Token 以上,我刚试了一下速度真的超快

体验地址:

https://longcat.ai

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

工信部征求车门把手国标意见 隐藏式设计被明确禁止

太平洋汽车 浏览 90

不分油电,梅赛德斯-奔驰将统一旗下所有车型设计语言

IT之家 浏览 285

六座版特斯拉SUV来了!Model Y L 上市,33.9万起,预计9月交付

红星资本局 浏览 74

猫狗双全且绿植环绕的好日子是谁在过?

时尚COSMO 浏览 82

东北大学团队突破人类移动预测难题:让AI像人类一样理解出行规律

科技行者 浏览 71

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 24

29岁女孩感谢蔡磊:使用其团队研发药物后病情没再发展

鲁中晨报 浏览 25

二季度招聘职位增速近400% 人形机器人人才缺口如何补

北京商报 浏览 90

曾押中马云的他,再次豪赌

创业家 浏览 61

搭华为乾崑ADS 4 猛士M817预售32.99万元起

网易汽车 浏览 105

鹿晗演唱会上秀恩爱?佩戴关晓彤同款情侣挂件

小seven的囧囧啊 浏览 91

麦琳从120斤减到88斤,直播哭诉过得并不好

娱乐故事 浏览 111

媒体:在美国对华政策调整刺激下 欧洲三大国都要访华

南风窗 浏览 25

国际乒联世界排名:王楚钦、孙颖莎男女单第一,国乒包揽女单前五

直播吧 浏览 74

中央网信办:就数字虚拟人信息服务管理办法面向全社会公开征求意见

红星新闻 浏览 5

股价五年涨五倍,“老股王”汇丰控股重现风光

达摩财经 浏览 59

河南"妻儿三人被发小杀害案"宣判:被告人获死刑

红星新闻 浏览 24

外媒:普京访美着装低调 表情和动作进行了精心设计

上观新闻 浏览 73

纯电续航520km 深蓝S05纯电版七夕甜蜜上市11.99万元起

网易汽车 浏览 85

探展2025世界制造业大会:解锁“人机共融”新图景

中国商报 浏览 65

天呐!汇丰银行一主任为了1.3万,获刑半年

财通社 浏览 27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12