关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技85人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

罗永浩,九年熬出一碗泡面

豹变 浏览 69

巴基斯坦夜袭阿富汗边境地区 打死至少70名武装人员

新华社 浏览 59

普京向特朗普提出俄乌停火四项条件

界面新闻 浏览 76

OpenAI周活跃用户突破4亿

环球网资讯 浏览 316

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 23

26岁男子从杭州徒步回重庆过年 途经湖北获邀吃杀猪饭

极目新闻 浏览 18

小米汽车 10 月交付量超过 40000 台

IT之家 浏览 32

“小黑靴”今年冬天又火了!这4组搭配照着搭就很时髦

LinkFashion 浏览 25

欧洲催更特朗普:赶紧在乌克兰邻国部署F-35

澎湃新闻 浏览 69

铠侠开始提供新一代UFS 4.1闪存样品,随机读取速度提升90%

IT之家 浏览 17

女孩性侵的案子你都敢盖?!

电影最TOP 浏览 30

消失8年,她一回归又是王炸

独立鱼 浏览 548

马丁·厄德高:阿森纳英超近失球经历是“动力”

绿茵情报局 浏览 19

同杨颖分手多年,黄晓明的体面被自己孩子撕了

桑葚爱动画 浏览 77

上海老教授花600万借孙女名字买房 结果要不回来了

都市快报橙柿互动 浏览 24

AI泡沫争议再起!多位顶尖大咖PK,这次有何不同?

21世纪经济报道 浏览 37

AI闭环交易再引争议:OpenAI入股Thrive Holdings,或瞄准更多私募

华尔街见闻官方 浏览 17

外套里面穿什么?这4款内搭时髦又显瘦!

Yuki女人故事 浏览 78

黑龙江知名央企,选举80后董事长,去年人均薪酬20万元

华美财经 浏览 80

视界大会短剧演员好尴尬!走红毯扎堆不给镜头,后台跟明星分开坐

萌神木木 浏览 848

财经调查丨“高端四件套”以次充好,电商虚标床上用品支数成公开秘密

央视财经 浏览 81
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12