关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者84人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天马推出高端 OLED 技术品牌“天马天工屏”

IT之家 浏览 96

以色列强调人质释放 加沙停火第一阶段协议达成

环球网资讯 浏览 61

赵少康为何不参选国民党主席 陈文茜:他怕妻女怕得要死

海峡导报社 浏览 57

鲁比奥宣布任命新任美"西藏特别事务协调员" 中方回应

扬子晚报 浏览 13

65岁钟楚红近况曝光!老公去世18年未再嫁

代军哥哥谈娱乐 浏览 20

美国“最先进”驱逐舰停靠日本时被拍到锈迹斑斑

环球网资讯 浏览 95

熊园:7月经济数据多数放缓的背后

首席经济学家论坛 浏览 92

朱媛媛离世7个月后遗作定档,辛柏青状态令人担忧

林雁飞 浏览 23

中年女人穿对了才显气质!不穿花不穿紧,舒适好看还高级

静儿时尚达人 浏览 24

AI带货“躺赚”陷阱重出江湖:缴纳3000元会费,半年却仅卖出13元

蓝鲸新闻 浏览 22

媒体:国际贸易格局变了 美国影响力正在逐渐减弱

极目新闻 浏览 148

飞行学员与十几名女子发生关系发下体照 怀孕女友崩溃

社会酱 浏览 74

让毛孩子吃口放心粮,咋这么难?

虎嗅APP 浏览 92

大S离去一周年:爱她的人仍在经历一场漫长的告别

仙女事件簿 浏览 32

给央视《小城大事》演技最好10位演员排名,赵丽颖第5,第1无争议

皮皮电影 浏览 20

勇士3老还能争冠吗?库里:我认为可以 上赛季末段我们是联盟前3

直播吧 浏览 103

17.98万元起!大平层/云辇-C/无人机 方程豹钛7上市

网易汽车 浏览 78

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 87

欧洲提交修改版和平计划 涵盖乌克兰安全保障方式

上观新闻 浏览 21

外媒:特朗普看起来正在准备大规模出卖乌克兰

环球网资讯 浏览 292

政策拐点已现,医用高值耗材投资窗口开启

证券市场周刊 浏览 88
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12