关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者95人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

独特艺术理解 宾利Batur定制车型官图发布

车质网 浏览 23

好起来了!王楚钦连夺世乒赛、美国大满贯两项重要赛事男单冠军

直播吧 浏览 127

汪小菲终于拎清了

小娱乐悠悠 浏览 85

金莲花奖女配提名 85花顶流之争再升级

桑葚爱动画 浏览 57

俄美总统会晤 欧洲官员"焦虑注视"泽连斯基"等待电话"

环球网资讯 浏览 84

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 36

半年净赚25.9亿,刘强东的医药生意,大爆发!

侃见财经 浏览 80

74岁张纪中与年轻妻子结婚,真的过得幸福吗

丹妮观 浏览 785

北京现代EO 羿欧将于10月16日正式开启预售

车质网 浏览 65

岳阳开放大学建全国首家烧烤学院 副校长:想认真做好

红星新闻 浏览 89

44岁李小璐参加公开活动!怼脸拍真实状态曝光,网友态度两极分化

萌神木木 浏览 457

沪指站上3800点 芯片股爆发 寒武纪涨停

网易财经 浏览 102

余承东展示鸿蒙智行门锁安全设计:安全是最大的豪华

三言科技 浏览 62

国电高科新专利可提高卫星设备的工作可靠性

财闻 浏览 16

纪念戴安基顿,伍迪艾伦最高杰作告别放映❤️

幕味儿 浏览 25

VOGUE大合照太势利:影后只能站角落?

娱乐圈笔娱君 浏览 895

太阳报:法国帕尔默酒庄在与科尔-帕尔默的商标纠纷中获胜

直播吧 浏览 80

“纳斯达克白酒第一股”来了,参保员工多年为0

深蓝财经 浏览 90

45胜联盟第一队!骑士三杀篮网力压雷霆 米切尔26分阿伦16+20

醉卧浮生 浏览 316

天岳先进在港交所上市,创始人是“济南前首富”

红星资本局 浏览 86

时隔34年维京队再夺挪超冠军,球迷冲入球场内疯狂庆祝

懂球帝 浏览 28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12